Stránka 5 z 16
Napsal: stř srp 02, 2006 8:14 am
od Bubak
Honza píše:Carl vydal novou verzi CPDN cislovanou jako 5.15.
Mela by byt robusnejsi ve chvilych, kdy model padne (restart), osetrenejsi pripady, kdy dojde k rewindu o 1 den/mesic/rok) a bude umoznovat kratsi Coupled modely (80 nebo i jenom 40 let), o kterych jsem se jiz drive zminoval.
Novejsi aplikaci dostanete po dokonceni soucasnych vypoctu nebo pri padu modelu; kratsi modely az budou pripraveny.
Sqela zprava. Tak snad ubyde nedopocitanych modelu.
Jeste otazky: Jak se chova scheduler? Je natolik inteligentni, ze dava kratsi modely na slabsi stroje prip. na ty, ktery jedou BOINC jen zlomek dne? A co deadline u tech kratsich modelu?
Napsal: čtv srp 03, 2006 2:00 pm
od Honza
Kratsi modely nejsou jeste pripravene; pripravena je na ne nova aplikace.
Narozdil od vetsiny projektu neni primitivni pripravit nove modely k pocitani - nejde o to proste jenom naporcovat nejaka "data" nebo zmenit jeden parametr.
Kratsi modely mohou vychazet z castecnych vysledku "dlouhych" modelu (tj. byt jejich pokracovanim), mohou byt delenim delsich modelu na mensi porce, muhou se odvozovat od speficickych pozadavku vyzkumniku (kombinace parametru v ramci soucasne studie, tedy nejaka parcialni zjisteni a jejich overene nebo dalsich studii).
Kazda volba ma sve dalsi konsekvence pro dalsi zpracovani, mozna pujde o jejich kombinaci...nevim.
Take je dosti pravdepodobne, ze bude venovana zvysena pozornost priprave novych modelu, aby nedoslo k nejake chybe ve vstupnich parametrech, jako se jiz jednou stalo.
Napsal: pát srp 11, 2006 5:15 pm
od Pav Lucistnik
Napsal: pát srp 18, 2006 6:34 pm
od Honza
Zde jsou prehledne statistiky CPDN ve smyslu vysledku - pocty
kompletnich modelu jednotlivych typu.
Uz nekdo z CNT spocital 160-lety Coupled Model?
Napsal: pát srp 18, 2006 6:51 pm
od Bubak
Honza píše:Uz nekdo z CNT spocital 160-lety Coupled Model?
Ja si na ten
svuj 1. jeste cca. 2 tydny pockam.... pokud nespadne.
Napsal: pát srp 18, 2006 7:03 pm
od Honza
Pekne, pekne.
Kvuli ruznym experimentum a presouvanim na jiny pocitac mi model trva trochu dele a jsem v nem
o neco pozadu, ale Conroe to snad dozene - "pokud nespadne"...
Napsal: stř srp 23, 2006 4:25 pm
od IQE
Napsal: stř srp 23, 2006 5:03 pm
od Pav Lucistnik
Pentium III na 866 MHz, evidentne...
Napsal: stř srp 23, 2006 5:53 pm
od Bubak
Na tom PIII to nejspis jen odesila trickle. Pocitat se to bude nejspis na nejakym dualcore bez netu, soude podle
trickles a
trickles za 2 modely za mesic a pul.

To by PIII tezko zvladla, leda ze ji chladi k absolutni nule a zaktuje nekam nad 10GHz

Napsal: čtv srp 24, 2006 8:40 am
od JardaM
No ony by stačily 3 GHz, ale i to je na PIII moc. Drobná korekce: 5,124mil sec. je 59 dní = 2 měsíce.
Napsal: čtv srp 24, 2006 9:18 am
od Honza
Proc brutalni? Zase se nekdo nachytal na RAC?
Kolem 3 sec/TS je spis nejake Intel siditko HT..nebo nejpomalejsi D805 a pomalou pameti.
Brutalni je tak Opteron 875...teda v tom, ze hroupe vic modelu nazar a mel by realne vysoky RAC, ale 1.25 sec/TS na Coupled Modelu urcite neudela...
Aktuální stav projektu: pres 12 tisic hotovych Sulphur modelu a pres 5 tisic masin je jeste pocita.
Kompletni coupled modely take narustaji...
Napsal: pát zář 01, 2006 11:16 am
od Bubak
Verze 5.15 je opravdu stabilni jak uz psal Honza.
Dnes mi kleknul disk na NFS serveru kdyz na nem bezelo 9WU. Uz jsem se s nima rozloucil, protoze BS u vsech hlasilo computation error. Nahodil jsem server a hle:
Kód: Vybrat vše
01/09/2006 06:23:07| |Can't get task disk usage: system opendir
01/09/2006 06:23:07| |Can't open temporary state file: client_state_next.xml system fopen
01/09/2006 06:23:07| |Couldn't write state file: system fopen
01/09/2006 07:43:10| |Can't get task disk usage: system opendir
01/09/2006 08:41:05|climateprediction.net|Task hadcm3lbm_blar_25310086_1 exited with zero status but no 'finished' file
01/09/2006 08:41:05|climateprediction.net|If this happens repeatedly you may need to reset the project.
01/09/2006 08:41:05| |Rescheduling CPU: application exited
01/09/2006 08:41:05|climateprediction.net|Restarting task hadcm3lbm_blar_25310086_1 using hadcm3lb version 515
01/09/2006 08:41:06|climateprediction.net|Task hadcm3lbm_c3s1_25334036_0 exited with zero status but no 'finished' file
01/09/2006 08:41:06|climateprediction.net|If this happens repeatedly you may need to reset the project.
01/09/2006 08:41:06| |Rescheduling CPU: application exited
01/09/2006 08:41:06|climateprediction.net|Restarting task hadcm3lbm_c3s1_25334036_0 using hadcm3lb version 515
Nasledoval restart vsech WU a pocita se dal !!!od posledniho checkpointu!!!. Tak myslim ze konecne rapidne ubyde nedopocitanych modelu!
Carl odvedl fakt sqelou praci. Tohle jsem necekal.
EDIT: Tak jsem to prechvalil. Prvni model z tech restartnutych spadnul po 3 hodinach pocitani. Takze 5.15 je znacne blbovzdorna, ale kazdou blbost jakou udelam nezkousne.

Napsal: pát zář 01, 2006 3:15 pm
od Honza
Diky za zpravu - svym zpusobem je dobre vedet, ze je 5.15 stabilnejsi nebo blbuvzdornejsi. Carl se na zkusenosti s 5.15 nedavno ptal...
Skoda, ze Carl asi bude koncem roku odchazet z CPDN - je to zkuseny a zapaleny programator, ktery je s projektem od jeho zacatku. Tezko za nej hledat odpovidajici nahradu...doufam, ze tim projekt nebude moc tratit. Trebas s nim jeste stacim skocit znovu na pivko...

Napsal: pát zář 01, 2006 3:58 pm
od Bubak
2 Honza: Az se poslou trickle ze vsech restartlych modelu, tak to sem jeste napisu. zatim to vypada 4modely dal odesilaj trickle a 1 spadnul. To je imho sqelej vysledek.

Kdyby to Carla tajimalo, tak ten spadlej je
tenhle.
Mimochodem predtim mi na tech 4 diskless Preslerech bezel E@H a pri restartu padal kazdy 2. WU!! Takze CPDN si nevede vubec spatne, az na vetsi traffic po ethernetu.
Napsal: pát zář 01, 2006 5:58 pm
od Honza
Smarja...ty jedes CPDN pres LAN?
