Stránka 5 z 16

Napsal: stř srp 02, 2006 8:14 am
od Bubak
Honza píše:Carl vydal novou verzi CPDN cislovanou jako 5.15.

Mela by byt robusnejsi ve chvilych, kdy model padne (restart), osetrenejsi pripady, kdy dojde k rewindu o 1 den/mesic/rok) a bude umoznovat kratsi Coupled modely (80 nebo i jenom 40 let), o kterych jsem se jiz drive zminoval.

Novejsi aplikaci dostanete po dokonceni soucasnych vypoctu nebo pri padu modelu; kratsi modely az budou pripraveny.
Sqela zprava. Tak snad ubyde nedopocitanych modelu.
Jeste otazky: Jak se chova scheduler? Je natolik inteligentni, ze dava kratsi modely na slabsi stroje prip. na ty, ktery jedou BOINC jen zlomek dne? A co deadline u tech kratsich modelu?

Napsal: čtv srp 03, 2006 2:00 pm
od Honza
Kratsi modely nejsou jeste pripravene; pripravena je na ne nova aplikace.

Narozdil od vetsiny projektu neni primitivni pripravit nove modely k pocitani - nejde o to proste jenom naporcovat nejaka "data" nebo zmenit jeden parametr.
Kratsi modely mohou vychazet z castecnych vysledku "dlouhych" modelu (tj. byt jejich pokracovanim), mohou byt delenim delsich modelu na mensi porce, muhou se odvozovat od speficickych pozadavku vyzkumniku (kombinace parametru v ramci soucasne studie, tedy nejaka parcialni zjisteni a jejich overene nebo dalsich studii).
Kazda volba ma sve dalsi konsekvence pro dalsi zpracovani, mozna pujde o jejich kombinaci...nevim.

Take je dosti pravdepodobne, ze bude venovana zvysena pozornost priprave novych modelu, aby nedoslo k nejake chybe ve vstupnich parametrech, jako se jiz jednou stalo.

Napsal: pát srp 11, 2006 5:15 pm
od Pav Lucistnik

Napsal: pát srp 18, 2006 6:34 pm
od Honza
Zde jsou prehledne statistiky CPDN ve smyslu vysledku - pocty kompletnich modelu jednotlivych typu.
Uz nekdo z CNT spocital 160-lety Coupled Model?

Napsal: pát srp 18, 2006 6:51 pm
od Bubak
Honza píše:Uz nekdo z CNT spocital 160-lety Coupled Model?
Ja si na ten svuj 1. jeste cca. 2 tydny pockam.... pokud nespadne.

Napsal: pát srp 18, 2006 7:03 pm
od Honza
Pekne, pekne.
Kvuli ruznym experimentum a presouvanim na jiny pocitac mi model trva trochu dele a jsem v nem o neco pozadu, ale Conroe to snad dozene - "pokud nespadne"...

Napsal: stř srp 23, 2006 4:25 pm
od IQE
Co to je za brutální stroj :?:

Napsal: stř srp 23, 2006 5:03 pm
od Pav Lucistnik
Pentium III na 866 MHz, evidentne...

Napsal: stř srp 23, 2006 5:53 pm
od Bubak
Na tom PIII to nejspis jen odesila trickle. Pocitat se to bude nejspis na nejakym dualcore bez netu, soude podle trickles a trickles za 2 modely za mesic a pul. ;-)
To by PIII tezko zvladla, leda ze ji chladi k absolutni nule a zaktuje nekam nad 10GHz :-D

Napsal: čtv srp 24, 2006 8:40 am
od JardaM
No ony by stačily 3 GHz, ale i to je na PIII moc. Drobná korekce: 5,124mil sec. je 59 dní = 2 měsíce.

Napsal: čtv srp 24, 2006 9:18 am
od Honza
IQE píše:Co to je za brutální stroj :?:
Proc brutalni? Zase se nekdo nachytal na RAC?
Kolem 3 sec/TS je spis nejake Intel siditko HT..nebo nejpomalejsi D805 a pomalou pameti.

Brutalni je tak Opteron 875...teda v tom, ze hroupe vic modelu nazar a mel by realne vysoky RAC, ale 1.25 sec/TS na Coupled Modelu urcite neudela...

Aktuální stav projektu: pres 12 tisic hotovych Sulphur modelu a pres 5 tisic masin je jeste pocita.
Kompletni coupled modely take narustaji...

Napsal: pát zář 01, 2006 11:16 am
od Bubak
Verze 5.15 je opravdu stabilni jak uz psal Honza.
Dnes mi kleknul disk na NFS serveru kdyz na nem bezelo 9WU. Uz jsem se s nima rozloucil, protoze BS u vsech hlasilo computation error. Nahodil jsem server a hle:

Kód: Vybrat vše

01/09/2006 06:23:07|                     |Can't get task disk usage: system opendir
01/09/2006 06:23:07|                     |Can't open temporary state file: client_state_next.xml system fopen
01/09/2006 06:23:07|                     |Couldn't write state file: system fopen
01/09/2006 07:43:10|                     |Can't get task disk usage: system opendir
01/09/2006 08:41:05|climateprediction.net|Task hadcm3lbm_blar_25310086_1 exited with zero status but no 'finished' file
01/09/2006 08:41:05|climateprediction.net|If this happens repeatedly you may need to reset the project.
01/09/2006 08:41:05|                     |Rescheduling CPU: application exited
01/09/2006 08:41:05|climateprediction.net|Restarting task hadcm3lbm_blar_25310086_1 using hadcm3lb version 515
01/09/2006 08:41:06|climateprediction.net|Task hadcm3lbm_c3s1_25334036_0 exited with zero status but no 'finished' file
01/09/2006 08:41:06|climateprediction.net|If this happens repeatedly you may need to reset the project.
01/09/2006 08:41:06|                     |Rescheduling CPU: application exited
01/09/2006 08:41:06|climateprediction.net|Restarting task hadcm3lbm_c3s1_25334036_0 using hadcm3lb version 515
Nasledoval restart vsech WU a pocita se dal !!!od posledniho checkpointu!!!. Tak myslim ze konecne rapidne ubyde nedopocitanych modelu!
Carl odvedl fakt sqelou praci. Tohle jsem necekal.

EDIT: Tak jsem to prechvalil. Prvni model z tech restartnutych spadnul po 3 hodinach pocitani. Takze 5.15 je znacne blbovzdorna, ale kazdou blbost jakou udelam nezkousne. :oops:

Napsal: pát zář 01, 2006 3:15 pm
od Honza
Diky za zpravu - svym zpusobem je dobre vedet, ze je 5.15 stabilnejsi nebo blbuvzdornejsi. Carl se na zkusenosti s 5.15 nedavno ptal...

Skoda, ze Carl asi bude koncem roku odchazet z CPDN - je to zkuseny a zapaleny programator, ktery je s projektem od jeho zacatku. Tezko za nej hledat odpovidajici nahradu...doufam, ze tim projekt nebude moc tratit. Trebas s nim jeste stacim skocit znovu na pivko... :Honza_pray

Napsal: pát zář 01, 2006 3:58 pm
od Bubak
2 Honza: Az se poslou trickle ze vsech restartlych modelu, tak to sem jeste napisu. zatim to vypada 4modely dal odesilaj trickle a 1 spadnul. To je imho sqelej vysledek. ;-)
Kdyby to Carla tajimalo, tak ten spadlej je tenhle.

Mimochodem predtim mi na tech 4 diskless Preslerech bezel E@H a pri restartu padal kazdy 2. WU!! Takze CPDN si nevede vubec spatne, az na vetsi traffic po ethernetu.

Napsal: pát zář 01, 2006 5:58 pm
od Honza
Smarja...ty jedes CPDN pres LAN? :roll: