Optimalizovaná aplikace Einstein@Home I
Moderátoři: zdespi, Moderátoři
- LiborA
- BOINC Guru

- Příspěvky: 1298
- Registrován: čtv pro 08, 2005 10:11 am
- Bydliště: Chomutov, Praha, Moldava
- Kontaktovat uživatele:
Nová verze S38
Tak Akosf připravil další verzi S38. Zatím jde snad pouze o testování, ale obsahuje SSE optimalizaci. Bohužel jsem zatím nenašel odkaz, takže předpokládám, že ji Aksof asi zatím zveřejnit nechce. sám říká, že nění dokonalá. Jinak ještě uvažuje o upravená verzi pro SSE2 takže doufám, že se máme na co těšit 
Moje statistika: http://boinc.mundayweb.com/one/stats.ph ... :6082/.png
- LiborA
- BOINC Guru

- Příspěvky: 1298
- Registrován: čtv pro 08, 2005 10:11 am
- Bydliště: Chomutov, Praha, Moldava
- Kontaktovat uživatele:
Kritická chyba ve verzi C37
Podle poslední zprávy byla zjištěna kritická chyba ve verzi C37, která způsobuje odchylku od originálních výsledků a v některých případech nezvalidiování výsledků.
Thanks for these infos!So far I've had 2 failures on one K6-2 with C37, and 1 success on the other K6-2 and a second in progress.
The K6/300 has had 2 go through OK, 1 pending and one in progress, but they were shorties.
Alinator
I hoped that C37 will be much faster on your K6 machines...
I tried to find the reason of the validation problem.
I know that the precision of C37 has to be very near to the original.
I made a code that gave poor results, but the validator accepted them!
So, I examined the codes again and I saw there is a critical point.
Sometimes the exponent of the number format is not enough.
Probably this is the reason of the validation problem of SSE based linux application too.
edit:
exponent size of SSE -> 8 bit
exponent size of SSE2 -> 11 bit
exponent size of FPU -> 15 bit
Naposledy upravil(a) LiborA dne ned bře 19, 2006 12:03 pm, celkem upraveno 1 x.
Moje statistika: http://boinc.mundayweb.com/one/stats.ph ... :6082/.png
Ja nevim, jestli se tomu dat primo rict kriticka chyba - skoro mi to pripada, ze to je proste vlastnost toho, jestli to pocita FPU (klasicky a-la 386) nebo se to znazi urychlit pres SSE (ktere maji mensi presnost vypoctu). A ze by to resil Conroe procak, ktery us pocitat SSE2 z dostatecnou presnosti...
Pro me neni otazka, zda-li akosf doporucuju C37 nebo ne, ale jak se na to tvarej u Einsteinu - hlavne Bruce. Zatim to nebylo ani doporuceno, ani nedoporuceno, takze mozna sami zatim nevi.
Nezbyva nez doufat, ze se ta optimalizace zapracuje do oficialni verze. Jak si poradi s Linuxem je zatim asi ve hvezdach...
Pro me neni otazka, zda-li akosf doporucuju C37 nebo ne, ale jak se na to tvarej u Einsteinu - hlavne Bruce. Zatim to nebylo ani doporuceno, ani nedoporuceno, takze mozna sami zatim nevi.
Nezbyva nez doufat, ze se ta optimalizace zapracuje do oficialni verze. Jak si poradi s Linuxem je zatim asi ve hvezdach...
- LiborA
- BOINC Guru

- Příspěvky: 1298
- Registrován: čtv pro 08, 2005 10:11 am
- Bydliště: Chomutov, Praha, Moldava
- Kontaktovat uživatele:
Připravovaná verze S38 by snad měla tyto nedostatky řešit - a měla by se objevit během několika hodin až dní 
Moje statistika: http://boinc.mundayweb.com/one/stats.ph ... :6082/.png
- Higgi
- BOINC Guru

- Příspěvky: 603
- Registrován: stř čer 01, 2005 1:32 am
- Bydliště: Klánovice
- Kontaktovat uživatele:
Jsem na ni zvědav. Upřimně,teď sám nevím, kterou verzí počítámLiborA píše:Připravovaná verze S38 by snad měla tyto nedostatky řešit - a měla by se objevit během několika hodin až dní
Není důležité jak rychle počítáte, ale to, že počítáte.
- LiborA
- BOINC Guru

- Příspěvky: 1298
- Registrován: čtv pro 08, 2005 10:11 am
- Bydliště: Chomutov, Praha, Moldava
- Kontaktovat uživatele:
Také zatím žádný erorr nemám, jak jsem to sledoval, tak snad zatím jediné errory se objevily na AMD K6 řadě.Higgi píše:Upřimně,teď sám nevím, kterou verzí počítám. Ale žádný error z mého kompu nevyšel. Na ostatních je ta první optimalizace a v pohodě.
Moje statistika: http://boinc.mundayweb.com/one/stats.ph ... :6082/.png
- Higgi
- BOINC Guru

- Příspěvky: 603
- Registrován: stř čer 01, 2005 1:32 am
- Bydliště: Klánovice
- Kontaktovat uživatele:
Hned jdu na ní.
..:úprava:..
Souhlasím s tím, co napsal Libor výše. Ale předpokládám, že na Opteronu to poběží ok.
Naposledy upravil(a) Higgi dne pon bře 20, 2006 2:59 pm, celkem upraveno 1 x.
Není důležité jak rychle počítáte, ale to, že počítáte.
- Higgi
- BOINC Guru

- Příspěvky: 603
- Registrován: stř čer 01, 2005 1:32 am
- Bydliště: Klánovice
- Kontaktovat uživatele:
A první výsledek je tu:Higgi píše:Hned jdu na ní.
S38 - 4,651.69 sekund (první jednotka)
A36 - 6,500.00 sekund (průměr víc jednotek)
437 - 16,500.00 sek - původní aplikace
Hustý. Uvidíme, co bude dál.
Naposledy upravil(a) Higgi dne pon bře 20, 2006 11:33 pm, celkem upraveno 1 x.
Není důležité jak rychle počítáte, ale to, že počítáte.
@ Higgi - tohle mereni moc nerika, kdyz nevis delku vypoctu podle standardniho nebo jinak neni s cim srovnavat.
Nejlepsi je stejnou WU pocitat ruznymi aplikacemi. Nebo pockat, az ju spocitaji jini a porovnat (a standardizovat skalu, rekl by statistik - tj. vzit v uvahu ruzny vykon jednotlivych masin). Opravdu dobry napad se mi zda udavat rychlosti tim koeficintem zrychleni, kde napriklad 0.5 znamena, ze staci pouze 50% casu proti puvodnimu vypoctu.
Kuprikladu tuhle WU jsem spocital na Pentiu D 820 za nejakych 9k1 sec, a jiny manik na Pentiu D 830 ji delal standardni verzi 17k3 tudiz koeficient zrychleni je 9100/17300/2.8*3.0 = 0.56
Kdybych chtel rikat husty, tak poukazi na vysledek treti masiny (FX-55), ktera to delala 11k7 sec - takze by D 820 stacila udelat 2WU a jeste by sloupla nejake SETI WU.
Mozna jsi s S38 narazil na jinak WU nez s verzi C37, mozna ne.
Jen takova doporuceni. Jinak S38 by mela byt povedena.
Nejlepsi je stejnou WU pocitat ruznymi aplikacemi. Nebo pockat, az ju spocitaji jini a porovnat (a standardizovat skalu, rekl by statistik - tj. vzit v uvahu ruzny vykon jednotlivych masin). Opravdu dobry napad se mi zda udavat rychlosti tim koeficintem zrychleni, kde napriklad 0.5 znamena, ze staci pouze 50% casu proti puvodnimu vypoctu.
Kuprikladu tuhle WU jsem spocital na Pentiu D 820 za nejakych 9k1 sec, a jiny manik na Pentiu D 830 ji delal standardni verzi 17k3 tudiz koeficient zrychleni je 9100/17300/2.8*3.0 = 0.56
Kdybych chtel rikat husty, tak poukazi na vysledek treti masiny (FX-55), ktera to delala 11k7 sec - takze by D 820 stacila udelat 2WU a jeste by sloupla nejake SETI WU.
Mozna jsi s S38 narazil na jinak WU nez s verzi C37, mozna ne.
Jen takova doporuceni. Jinak S38 by mela byt povedena.
- Higgi
- BOINC Guru

- Příspěvky: 603
- Registrován: stř čer 01, 2005 1:32 am
- Bydliště: Klánovice
- Kontaktovat uživatele:
((upraveno))
Kdybych to přepočítal na koeficient, tak je to cca 1/4 času. Tamto je jen hrubej odhad. A myslím sí, že ty výpočty bych musel, aby byly přesný, dělat na svý mašině pro každou optimalizaci s identickými jednotkami a stejnými podmínkami při počítání. Toho ale dosáhnout nelze.
Kdybych to přepočítal na koeficient, tak je to cca 1/4 času. Tamto je jen hrubej odhad. A myslím sí, že ty výpočty bych musel, aby byly přesný, dělat na svý mašině pro každou optimalizaci s identickými jednotkami a stejnými podmínkami při počítání. Toho ale dosáhnout nelze.
Naposledy upravil(a) Higgi dne pon bře 20, 2006 11:32 pm, celkem upraveno 1 x.
Není důležité jak rychle počítáte, ale to, že počítáte.
No estli si to s S38 pocita za 1/5 casu, tak je to skoro tak dobry, jako forestovi neco pocitalo 6x rychleji 
Je to vazne tak? Top ti predtim slusne pretakteny Opeteron pocital se standardni aplikaci Einsteina skorem 8 hodin
Docilit toho mereni se da, ale vyzaduje to cas (pripravit si BOINC tak, aby napriklad mel v zasobe pouze 1 nerozpocitanou WU) a je treba pocitat off-line. Uznavam, ze efektivnejsi to proste nechat bezet a pozorovat, ackoli je to mene presne.
akosf odvadi fakt dobrou praci. Klidne by si mohl nahodit donation page a prislep bych mu. A jestli ma chut zkusit podobne veci i na jinych projektech, tak snad ano. Hlavne aby to nemelo negativni vliv na kvalitu vysledku...
Je to vazne tak? Top ti predtim slusne pretakteny Opeteron pocital se standardni aplikaci Einsteina skorem 8 hodin
Docilit toho mereni se da, ale vyzaduje to cas (pripravit si BOINC tak, aby napriklad mel v zasobe pouze 1 nerozpocitanou WU) a je treba pocitat off-line. Uznavam, ze efektivnejsi to proste nechat bezet a pozorovat, ackoli je to mene presne.
akosf odvadi fakt dobrou praci. Klidne by si mohl nahodit donation page a prislep bych mu. A jestli ma chut zkusit podobne veci i na jinych projektech, tak snad ano. Hlavne aby to nemelo negativni vliv na kvalitu vysledku...
