Optimalizovaná aplikace Einstein@Home I

Smetiště aneb propadliště dějin pro neaktuální příspěvky. Po pár dnech bude ručně smazáno, pokud nebudou hlasy pro zachovaní

Moderátoři: zdespi, Moderátoři

Zamčeno
Uživatelský avatar
LiborA
BOINC Guru
BOINC Guru
Příspěvky: 1298
Registrován: čtv pro 08, 2005 10:11 am
Bydliště: Chomutov, Praha, Moldava
Kontaktovat uživatele:

AMD a 3D!Now

Příspěvek od LiborA »

Pro majitele AMDček dobrá zpráva, Akosf se věnuje i optimalizaci pro 3D!Now

Další verze by měly být: C40 (387 compatible) -> D40 (3DNow! compatible) -> S40 (SSE compatible) -> S240 (SSE2 compatible)

Ale pozor, z důvodů daných konstrukcí obou rozšíření (3D!Now vs. SSE) bude verze S40 mnohem rychlejší než D40, takže D40 je volba pro ty, jejichž AMDčka nepodporují intelácké SSE. Cílem vývoje D40 je zrychlit výpočet na starších AMD procesorech oproti verzi C40.

Jinak nová oficiální aplikace Einsteina má mýt stejný algoritmus jako Cxx optimalizace. Bude zajímavé sledovat, která implementace bude rychlejší :)
Uživatelský avatar
Nevyn
Začatečník
Začatečník
Příspěvky: 56
Registrován: ned kvě 22, 2005 6:24 pm
Bydliště: u compu
Kontaktovat uživatele:

Příspěvek od Nevyn »

Derryk píše:Jaké nyní dostáváte jednotky ? Mně teď chodí samý krátký :( Denní limit 32 výsledků je tak spočtenej ani ne za 11 hodin. Sice mám jako 2. projekt CPDN, ale raději bych počítal Einsteina.
JJ taky mám samý krátký jednotky, no v záloze mám rossetu a seti :wink:
Obrázek
Uživatelský avatar
LiborA
BOINC Guru
BOINC Guru
Příspěvky: 1298
Registrován: čtv pro 08, 2005 10:11 am
Bydliště: Chomutov, Praha, Moldava
Kontaktovat uživatele:

Příspěvek od LiborA »

Derryk píše:Jaké nyní dostáváte jednotky ? Mně teď chodí samý krátký :( Denní limit 32 výsledků je tak spočtenej ani ne za 11 hodin. Sice mám jako 2. projekt CPDN, ale raději bych počítal Einsteina.
Také mám teď samé krátké, aspoň se mi pohne pořádně CPDN a Lieden :)
Tom.CZ.73
Nováček
Příspěvky: 29
Registrován: pát črc 01, 2005 10:43 pm
Bydliště: Praha
Kontaktovat uživatele:

Příspěvek od Tom.CZ.73 »

Zdarec,

Chtel bych se zeptat jaka optimalizace je dobra pro Athlon 64 3500+. Opravdu se mi nechce procitat 15 stran fora abych nasel odpoved, kterou vim ze tam nekde bude, laetakovej fanda zas nejsem. Nebylo by od veci napsat uz do navodu konkretnec pro, ktery rady CPU je jaka optimalizace nejlepsi nebo jedna z nejlepsich. Srovnani verze S39 je pro lepsi CPU nez verze S38 je trochu mimo kdyz se tam nepise na jaky CPU je S38 .....
Obrázek
Velda
Nováček
Příspěvky: 39
Registrován: pon led 16, 2006 9:38 pm
Bydliště: Praha
Kontaktovat uživatele:

Příspěvek od Velda »

Pouzij S39L, je pro vsechny procesory se SSE.
Tom.CZ.73
Nováček
Příspěvky: 29
Registrován: pát črc 01, 2005 10:43 pm
Bydliště: Praha
Kontaktovat uživatele:

Příspěvek od Tom.CZ.73 »

Dejvidek píše:23.03.2006 - Verze S39L, má nižší nároky na L1 cache - vhodnější pro lowend procesory jako je Duron, Sempron a Celeron. Stahujte tady.
Oki beru ze mam nizsi cache jako vsechny CPU od AMD, ale low end to zrovna neni teda pokud jesem se nepresunul v case o 2 roky dopredu :lol: . Jinak dik
Obrázek
Uživatelský avatar
M1.LaN
Expert
Expert
Příspěvky: 349
Registrován: ned srp 14, 2005 3:13 pm
Bydliště: Pohořelice
Kontaktovat uživatele:

Příspěvek od M1.LaN »

Dobra zprava je tu, verze C40 vypustena do sveta :lol:

C40 - optimised x86 compatible windows executable

Changes: sin/cos interpolator, AGI optimisations
Speedup: ~10% faster than C37
...:::Člověk jako já je buď bohem, nebo ďáblem:::...
Uživatelský avatar
Duro Kotulic Bunta
Banánová odměna
Banánová odměna
Příspěvky: 702
Registrován: sob úno 26, 2005 4:25 pm
Bydliště: Stupava, SK
Kontaktovat uživatele:

Příspěvek od Duro Kotulic Bunta »

C40 vyzera byt overena, cca 10-13% narast oproti C37.

Dejv, bolo by asi dobre aktualizovat/modifikovat Navod na optimalizaciu Einsteina. Moje navrhy:

1. Nahradit C37 verziu C40 verziou.
2. Vyskrtnut stare verzie S38, S39, kedze najnovsia je S39L a rychlejsia ako obe predchodzie prakticky na vsetkych strojoch (s SSE samozrejme).
3. Zmenit text k verzii S39L, napr. na nieco ako "vhodná pro procesory podporující SSE", pretoze text "pro vsechny procesory" nezodpoveda pravde.
4. Vyskrtnut text "vhodnejsi pro low-end procesory", pretoze sa ukazalo, ze verzia S39L vyrazne urychli (aj o 10%) vypocet aj na novych procikoch (napr. P4 3.4 GHz atd).
Podpis
Is it by logic that we prove, but by intuition that we discover. [J. H. Poincaré, mathematician (1854-1912)]
Duha
Začatečník
Začatečník
Příspěvky: 85
Registrován: pon lis 01, 2004 3:54 pm
Bydliště: Strakonice
Kontaktovat uživatele:

Příspěvek od Duha »

Duro Kotulic Bunta píše:Vyskrtnut stare verzie S38, S39, kedze najnovsia je S39L a rychlejsia ako obe predchodzie prakticky na vsetkych strojoch (s SSE samozrejme)
...bych si dovolil nesouhlasit, bohužel. Stará S37 jela Z-jednotku za cca 28min, nová S39L za 1:04hod !!! :?
Uživatelský avatar
Higgi
BOINC Guru
BOINC Guru
Příspěvky: 603
Registrován: stř čer 01, 2005 1:32 am
Bydliště: Klánovice
Kontaktovat uživatele:

Příspěvek od Higgi »

Duha píše: ...bych si dovolil nesouhlasit, bohužel. Stará S37 jela Z-jednotku za cca 28min, nová S39L za 1:04hod !!! :?
Já taky, ale s tebou. Sám jsem se mylně domníval, že pokud se jednotka jmenuje z_,je automaticky kratší. Není to tak, je to vysvětleno o několik příspěvků zpět.

..:úprava 2002:..
Ale možná to jde, podle pohledu, fakt pomalejc,uvidíme.
Není důležité jak rychle počítáte, ale to, že počítáte.

Uživatelský avatar
dejvidek
Administrator
Administrator
Příspěvky: 2256
Registrován: pát srp 27, 2004 12:24 pm
Kontaktovat uživatele:

Příspěvek od dejvidek »

Návod je upraven, co se týče verze C40, tak je na mém Athlonu XP2000+ pomalejší než C39, u C40 se nedostanu pod 7200s (2hod), u C39 sem se pohyboval okolo 6400s.
dejv
Uživatelský avatar
Duro Kotulic Bunta
Banánová odměna
Banánová odměna
Příspěvky: 702
Registrován: sob úno 26, 2005 4:25 pm
Bydliště: Stupava, SK
Kontaktovat uživatele:

Příspěvek od Duro Kotulic Bunta »

dejvidek píše:Návod je upraven, co se týče verze C40, tak je na mém Athlonu XP2000+ pomalejší než C39, u C40 se nedostanu pod 7200s (2hod), u C39 sem se pohyboval okolo 6400s.
dejv
Dejve, mas v tom trosku chaos asi.

Akosf robi tri druhy optimalizacii naraz:
Cxx - urcena pre procesory nepodporujuce SSE instrukcnu sadu (zalozena len na 80386 instrukcnej sade). Z nich je teraz najrychlejsia C40. Na novych procikoch teda tiez pojde, ale pomalsie ako dalsie verzie, ktore optimalizoval s podporou SSE.
Sxx - urcena pre prociky, ktore podporuju SSE - tieto verzie na stasrcyh procikoch bez SSE nepojdu. Najnovsia a najrychlejsia z nich je teraz S39L so znizenymi narokmi na L1 cache.
Dxx - z tejto verzie este nevydal nic oficialne, len ju chysta, bude optimalizaovana pre AMD prociky s instrukcnou sadou 3D Now!


Cize - ak mas Athlon XP2000+, ten pokial pozeram na webe tak ten uz podporuje SSE. Cize pojdu ti na nom verzie Cxx aj Sxx, ale Sxx budu rychlejsie.

Mam dojem ze aj v navode je to tak nejak stale nie celkom jasne a clovek ktory nevie o co ide pri optimalizaciach moze byt z toho navodu stale tak trocha neisty...
Podpis
Is it by logic that we prove, but by intuition that we discover. [J. H. Poincaré, mathematician (1854-1912)]
Uživatelský avatar
Howard
Expert
Expert
Příspěvky: 356
Registrován: ned lis 28, 2004 9:25 pm
Bydliště: Plzeň
Kontaktovat uživatele:

Příspěvek od Howard »

A nepripravuje se neco extra pro procesory podporujici SSE2 a SSE3?
Have you tried to turn it off and on again?
Uživatelský avatar
Duro Kotulic Bunta
Banánová odměna
Banánová odměna
Příspěvky: 702
Registrován: sob úno 26, 2005 4:25 pm
Bydliště: Stupava, SK
Kontaktovat uživatele:

Příspěvek od Duro Kotulic Bunta »

Howard píše:A nepripravuje se neco extra pro procesory podporujici SSE2 a SSE3?
Pripravuje, ale zatial este nic take nie je. Myslim, ze tu o tom pisal par prispevkov naspat aj LiborA...
Podpis
Is it by logic that we prove, but by intuition that we discover. [J. H. Poincaré, mathematician (1854-1912)]
Velda
Nováček
Příspěvky: 39
Registrován: pon led 16, 2006 9:38 pm
Bydliště: Praha
Kontaktovat uživatele:

Příspěvek od Velda »

Akosf vydal optimalizovanou verzi pro 3DNow! :lol:

D40 - 3DNow! optimised windows executable

Comment: 3DNow! supported on these cpus:
K6-2,K6-III,Athlon,Duron,AthlonXP,Sempron,Athlon64,C3,Samuel-II,Ezra,Nehemiah,Winchip2
Zamčeno