E@H na GPU
Moderátoři: zdespi, Moderátoři
E@H na GPU
Ahojte,
dnes rano som narazil na gpugrid.net webe spravu, ze Einstein uz rata aj na GPU
http://www.nvidia.com/object/io_1229516081227.html
skoro ma prekotilo od radosti, upgradol som BOINC, zahlasil sa do E // jasne, ze som si nevedel spomenut na heslo..
BOINC v spravach napisal, ze CUDA device found - NVIDIA 9800GT aaaale, rataju sa len dve WU - asi na CPU - odhady na doratanie su rovnake :-/
toto nechapem - ved sa maju rata 3 nie? ci to co sa rata na GPU vytazuje jedno jadro CPU?
pozeral som jedno forum, a tam mam taky dojem, ze zaver bol taky, ze to roste nefunguje.
http://einstein.phys.uwm.edu/forum_thread.php?id=7145
ak je to tak, nechapem, preco daju offic.spravu, jak to facha a ono to pritom nefacha :-/
mate s tym nejake skusenosti?
dik za info
P.
dnes rano som narazil na gpugrid.net webe spravu, ze Einstein uz rata aj na GPU
http://www.nvidia.com/object/io_1229516081227.html
skoro ma prekotilo od radosti, upgradol som BOINC, zahlasil sa do E // jasne, ze som si nevedel spomenut na heslo..
BOINC v spravach napisal, ze CUDA device found - NVIDIA 9800GT aaaale, rataju sa len dve WU - asi na CPU - odhady na doratanie su rovnake :-/
toto nechapem - ved sa maju rata 3 nie? ci to co sa rata na GPU vytazuje jedno jadro CPU?
pozeral som jedno forum, a tam mam taky dojem, ze zaver bol taky, ze to roste nefunguje.
http://einstein.phys.uwm.edu/forum_thread.php?id=7145
ak je to tak, nechapem, preco daju offic.spravu, jak to facha a ono to pritom nefacha :-/
mate s tym nejake skusenosti?
dik za info
P.
- FordPrefect
- BOINC Guru

- Příspěvky: 1266
- Registrován: stř pro 15, 2004 12:02 pm
- Bydliště: Zlate Mesto
- Kontaktovat uživatele:
Re: E@H na GPU
Kazdy zacatek je tezky. Casem se to urcite spravi.
Re: E@H na GPU
Do stroje jsem pred par dny narval GTS250, 1GB a s jednotkami pocitanymi pres grafiku (BRP3cuda) a procak to vypada nasledovne.
PC:
Athlon II 4jadro @ 2.5GHz
4GB RAM
GPU GTS250 @740MHz, 1GB, Accelero TT, Proprietalni drivery 270.29 (nejsou v repozitarich, je nutne doinstalit pres PPA)
Ubuntu 10.04 32bit
Vytizeni CPU
3jadra bezi naplno pro CPU jednotky, posledni jadro bere cca 20-25% pro GPU jednotku, zbytek pro cpu jednotku.

Vytizeni GPU
Celkove zabrana pamet karty i s 1 jednotkou je 312MB

Kredit na CPU jednotky
Jednotka se pocita cca 6-6,5 hodky prideleny kredit je 251bodu

Kredit na GPU jednotky
Jednotka se pocita cca 2 (!) hodky prideleny kredit je 500bodu

Par veci, ktere v tuto chvili jeste nevim jak vyresit, ale rad bych to dal dohromady.
- jak zjistit vytizeni GPU?
- jak nastavit prioritu procesu na GPU?
- jak presne nastavit a kam nakopirovat app_info.xml pro muj system, aby karta pocitala 2, nebo 3 jednotky soucasne?
PC:
Athlon II 4jadro @ 2.5GHz
4GB RAM
GPU GTS250 @740MHz, 1GB, Accelero TT, Proprietalni drivery 270.29 (nejsou v repozitarich, je nutne doinstalit pres PPA)
Ubuntu 10.04 32bit
Vytizeni CPU
3jadra bezi naplno pro CPU jednotky, posledni jadro bere cca 20-25% pro GPU jednotku, zbytek pro cpu jednotku.

Vytizeni GPU
Celkove zabrana pamet karty i s 1 jednotkou je 312MB

Kredit na CPU jednotky
Jednotka se pocita cca 6-6,5 hodky prideleny kredit je 251bodu

Kredit na GPU jednotky
Jednotka se pocita cca 2 (!) hodky prideleny kredit je 500bodu

Par veci, ktere v tuto chvili jeste nevim jak vyresit, ale rad bych to dal dohromady.
- jak zjistit vytizeni GPU?
- jak nastavit prioritu procesu na GPU?
- jak presne nastavit a kam nakopirovat app_info.xml pro muj system, aby karta pocitala 2, nebo 3 jednotky soucasne?
If someone asked me to choose between Metallica and Megadeth, I would say SLAYER...
- dejvidek
- Administrator

- Příspěvky: 2256
- Registrován: pát srp 27, 2004 12:24 pm
- Kontaktovat uživatele:
Re: E@H na GPU
Vytížení GPU zjistíš třeba utilitou GPU-Z.
dejv
dejv
Re: E@H na GPU
Jasne, ve voknech jsem to taky pouzival 
Jenze uz jich bylo dost, tak sly...
Jenze uz jich bylo dost, tak sly...
If someone asked me to choose between Metallica and Megadeth, I would say SLAYER...
Re: E@H na GPU
Tak par dalsich informaci...
Pri pocitani Binary radio pulsar search 1.08 (BRP3cuda32nv270) na GTS250 1GB mi vychazi :
1 jednotka za cca 1:50-2:00 hodin (cca 320MB RAM grafiky)
2 jednotky paralelne za cca 2:10-2:15 hodin (cca 570MB)
3 jednotky paralelne za cca 3:00-3:15 hodin (cca 860MB)
Je idealni nechat pocitat paralelne jen 2 jednotky, protoze vytizeni grafarny pri 3 jednotkach pocitanych soubezne uz je na beznem provozu hodne znat. Navic tam uz neni videt zrychleni oproti vypoctu 2 jednotek.
Kdyby nekdo vedel jak spravne nastavit app_info.xml pro dalsi serii vypoctu S6 Bucket (pro linux), byl bych vdecny za male postrceni vpred...
Pri pocitani Binary radio pulsar search 1.08 (BRP3cuda32nv270) na GTS250 1GB mi vychazi :
1 jednotka za cca 1:50-2:00 hodin (cca 320MB RAM grafiky)
2 jednotky paralelne za cca 2:10-2:15 hodin (cca 570MB)
3 jednotky paralelne za cca 3:00-3:15 hodin (cca 860MB)
Je idealni nechat pocitat paralelne jen 2 jednotky, protoze vytizeni grafarny pri 3 jednotkach pocitanych soubezne uz je na beznem provozu hodne znat. Navic tam uz neni videt zrychleni oproti vypoctu 2 jednotek.
Kdyby nekdo vedel jak spravne nastavit app_info.xml pro dalsi serii vypoctu S6 Bucket (pro linux), byl bych vdecny za male postrceni vpred...
If someone asked me to choose between Metallica and Megadeth, I would say SLAYER...
Re: E@H na GPU
Takze... jednotky BRP3cuda pro GPU konci/skoncily.
Kazdym dnem/hodinou by mela prijit nova rada - BRPP4.
Je pak samozrejme potreba adekvatne prepsat informace v app_info.xml, pokud ho pouzivate.
Kazdym dnem/hodinou by mela prijit nova rada - BRPP4.
Je pak samozrejme potreba adekvatne prepsat informace v app_info.xml, pokud ho pouzivate.
If someone asked me to choose between Metallica and Megadeth, I would say SLAYER...
Re: E@H na GPU
Nove jednotky pro grafarny, BRP4, uz jsou v obehu.
Na linuxu a GTS250 1GB mi to zatim dle par spoctenych jednotek vychazi cca:
1h35min - 1 jednotka
2h18min - 2 jednotky soucasne
3 jednotky soucasne jsem ani nezkousel.
Plati to co drive - na tomto typu karty je 2 a vice jednotek pocitanych soucasne znat, video neni plynule i kdyz se akcelerace pres gpu zakaze. To same plati pro flash (youtube a spol).
Mozne reseni je v cc_config vypsat aplikace, pri kterych grafika nebude pocitat.
Na linuxu a GTS250 1GB mi to zatim dle par spoctenych jednotek vychazi cca:
1h35min - 1 jednotka
2h18min - 2 jednotky soucasne
3 jednotky soucasne jsem ani nezkousel.
Plati to co drive - na tomto typu karty je 2 a vice jednotek pocitanych soucasne znat, video neni plynule i kdyz se akcelerace pres gpu zakaze. To same plati pro flash (youtube a spol).
Mozne reseni je v cc_config vypsat aplikace, pri kterych grafika nebude pocitat.
If someone asked me to choose between Metallica and Megadeth, I would say SLAYER...
Re: E@H na GPU
S jednotkami pro GPU - BRP4, jsou stale trable - ve smyslu vydavani novych a jejich distribuce ze serveru.
GTS250 mi jednotku pocita za cca 1,5h , tzn. je to cca o 20% rychlejsi nez BRP3.
S app_info.xml prozatim nema cenu si moc hrat, uloh se rozdava opravdu poskromnu, grafarna je vetsinu casu nevytizena.
Ono to ostatne lehounce pokulhava i u jednotek pro CPU, ale ne zas tak, aby primo nebylo nic k pocitani, narozdil od GPU.
GTS250 mi jednotku pocita za cca 1,5h , tzn. je to cca o 20% rychlejsi nez BRP3.
S app_info.xml prozatim nema cenu si moc hrat, uloh se rozdava opravdu poskromnu, grafarna je vetsinu casu nevytizena.
Ono to ostatne lehounce pokulhava i u jednotek pro CPU, ale ne zas tak, aby primo nebylo nic k pocitani, narozdil od GPU.
If someone asked me to choose between Metallica and Megadeth, I would say SLAYER...
Re: E@H na GPU
Po prepracovani systemu na vydavani jednotek BRP4 ze zda, ze vse zacina fungovat dobre a zasobeni jednotkami se zlepsilo.
Zacinam si zase hrat s paralelizaci vypoctu na gpu, uvidime jestli bude zasobovani jednotkami dostatecne.
Jinak to vypada, ze pomerne dobry zpusob jak zrychlit vypocet na GPU je v app_info omezit pocet jader procaku na pocitani uloh pro CPU a vysledovat si, jak se tim zrychli vypocty na GPU.
Vypnuti jednoho jadra v magoru se mi tolik neosvedcilo, ale mozna to zase vyzkousim, jaky v tom bude rozdil.
V mem pripade bezi jen 3 cpu ulohy misto ctyr a zrychleni na gpu uloze je cca z 1,5h na 1,25h.
Vzhledem k rychlostem vypoctu na gpu a cpu a kreditovemu ohodnoceni je to vyhodnejsi nez jet cpu jednotky na vsechna 4 jadra a gpu jednotku spolu s tim.
Za 24h provozu to je na moji konfiguraci teoreticky kreditovy rozdil 11669-10998=671
Zacinam si zase hrat s paralelizaci vypoctu na gpu, uvidime jestli bude zasobovani jednotkami dostatecne.
Jinak to vypada, ze pomerne dobry zpusob jak zrychlit vypocet na GPU je v app_info omezit pocet jader procaku na pocitani uloh pro CPU a vysledovat si, jak se tim zrychli vypocty na GPU.
Vypnuti jednoho jadra v magoru se mi tolik neosvedcilo, ale mozna to zase vyzkousim, jaky v tom bude rozdil.
V mem pripade bezi jen 3 cpu ulohy misto ctyr a zrychleni na gpu uloze je cca z 1,5h na 1,25h.
Vzhledem k rychlostem vypoctu na gpu a cpu a kreditovemu ohodnoceni je to vyhodnejsi nez jet cpu jednotky na vsechna 4 jadra a gpu jednotku spolu s tim.
Za 24h provozu to je na moji konfiguraci teoreticky kreditovy rozdil 11669-10998=671
If someone asked me to choose between Metallica and Megadeth, I would say SLAYER...
Re: E@H na GPU
Po par dnech zkouseni to vypada tak, ze s paralelizaci a vyuzitim app_info to zatim stale neni uplne v pohode.
Nekde na foru projektu se probiralo to, ze pri detekovani anonymous platform planovac a servery neprideli takovou porci jednotek, jako klientovi bez app_info.
To vesmes stale plati - opakovane dochazi k tomu ze jednotky pro grafiku dojdou a ceka se na planovany kontakt ze serverem (nezavisle na nastaveni v magoru).
Jinak bez app_info to jede velmi dobre, ale zkratka jen s jednou ulohou.
Nekde na foru projektu se probiralo to, ze pri detekovani anonymous platform planovac a servery neprideli takovou porci jednotek, jako klientovi bez app_info.
To vesmes stale plati - opakovane dochazi k tomu ze jednotky pro grafiku dojdou a ceka se na planovany kontakt ze serverem (nezavisle na nastaveni v magoru).
Jinak bez app_info to jede velmi dobre, ale zkratka jen s jednou ulohou.
If someone asked me to choose between Metallica and Megadeth, I would say SLAYER...
Re: E@H na GPU
Trosku jsem experimentoval s vytizenim vsech jader procesoru a dvemi paralelnimi vypocty na GPU.
Pokud budete chtit pro GPU procesy nastavit vyssi prioritu, bude potreba to do crontab naplanovat treba temito 2 moznymi zpusoby/skripty:
1) pouze jeden proces pro GPU lze treba i takto (autor nenym):
2) dva a vice procesu pro GPU (autor finn):
Do samotneho crontab mam pridany radek, ktery kazdou minutu tento skript znovu spousti.
Pokud budete chtit pro GPU procesy nastavit vyssi prioritu, bude potreba to do crontab naplanovat treba temito 2 moznymi zpusoby/skripty:
1) pouze jeden proces pro GPU lze treba i takto (autor nenym):
Kód: Vybrat vše
#!/bin/bash
PROCESS_NAME=einsteinbinary_BRP4_1.00_i686-pc-linux-gnu__BRP3cuda32nv270
PID=`ps -C $PROCESS_NAME -o pid=`
if [ $PID>0 ];
then renice -19 $PID;
fi
Kód: Vybrat vše
#!/bin/sh
PROCESS_NAME=einsteinbinary_BRP4_1.00_i686-pc-linux-gnu__BRP3cuda32nv270
PIDS=`ps -C $PROCESS_NAME -o pid=`
for PID in $PIDS; do
renice -19 $PID
doneIf someone asked me to choose between Metallica and Megadeth, I would say SLAYER...
- dejvidek
- Administrator

- Příspěvky: 2256
- Registrován: pát srp 27, 2004 12:24 pm
- Kontaktovat uživatele:
Re: E@H na GPU
Bych rád věděl, jestli by mi to přežila grafika 
dejv
dejv
Re: E@H na GPU
S tim problem neni...
Ono ani ty skripty, ktere jsem uvadel neurychli vypocty nejakym zasadnim zpusobem - konkretne v mojem pripade je na 4jadru lepsi proste nechat jedno jadro volne, at se venuje grafice a "zbytku sveta"...
Ono ani ty skripty, ktere jsem uvadel neurychli vypocty nejakym zasadnim zpusobem - konkretne v mojem pripade je na 4jadru lepsi proste nechat jedno jadro volne, at se venuje grafice a "zbytku sveta"...
If someone asked me to choose between Metallica and Megadeth, I would say SLAYER...
