Chyba ve výpočtu

Fórum o projektu Climateprediction

Moderátoři: zdespi, Moderátoři

Odpovědět
Uživatelský avatar
LiborA
BOINC Guru
BOINC Guru
Příspěvky: 1298
Registrován: čtv pro 08, 2005 10:11 am
Bydliště: Chomutov, Praha, Moldava
Kontaktovat uživatele:

Chyba ve výpočtu

Příspěvek od LiborA »

Zdravíčko lidičky,
najednou mi BOINC po 133 hodinách počítání WU Climatpredictionu nahlásil chybu ve výpočtu a výpočet ukončil. Dá se s tím něco dělat? Je podle mne škoda zahodit 133 hodin práce.
Honza
 
Příspěvky: 4322
Registrován: úte lis 30, 2004 10:50 am

Re: Chyba ve výpoètu

Příspěvek od Honza »

LiborA píše:Zdravíèko lidièky,
najednou mi BOINC po 133 hodinách poèítání WU Climatpredictionu nahlásil chybu ve výpoètu a výpoèet ukonèil. Dá se s tím nìco dìlat? Je podle mne škoda zahodit 133 hodin práce.
Pokud se model ukonci, uz to nejde vzit zpatky. Ne kuvli statusu na serveru, ale kvuli aplikaci.
Pokud delas pravidelne zalohy, tak je mozne zkusit pustit model ze zalohy - byt byl jiz trebas odeslany na server.

Zalohy se obecne doporucuji a u CPDN to plati dvojnasob. Me to SpinUp model na AMD X2 bude pocitat zhruba 3.000 hodin, takze take zalohuji.
Uživatelský avatar
LiborA
BOINC Guru
BOINC Guru
Příspěvky: 1298
Registrován: čtv pro 08, 2005 10:11 am
Bydliště: Chomutov, Praha, Moldava
Kontaktovat uživatele:

Záloha

Příspěvek od LiborA »

Bohužel, záloha není, moje chyba :(
Radas
Nováček
Příspěvky: 37
Registrován: úte zář 21, 2004 11:46 am
Bydliště: Prostějov

Re: Chyba ve výpočtu

Příspěvek od Radas »

LiborA píše:Zdravíčko lidičky,
najednou mi BOINC po 133 hodinách počítání WU Climatpredictionu nahlásil chybu ve výpočtu a výpočet ukončil. Dá se s tím něco dělat? Je podle mne škoda zahodit 133 hodin práce.
To se mě stávalo celkem pravidelně. Ještě se mi nestalo dopočítat něco z CPDN až do konce. A už jsem nebyl od výsledku daleko - třeba chybělo 10 %. S tím souvisí další věc, že se mi objem adresáře BOINC díky CPDN nafoukl na téměr 4 GB. To mělo taky důvod, že jsem počítání na měsíc ukončil. Prostě nebylo místo a čas se s tím drbat.

Nevím co vše mohu bez problému smazat. Vzhledem k tomu, že se všechny CPDN ukončili s chybou ve výpočtu, tak to asi smáznu vše a dám čistou instalaci poslední verze klienta (zatím jsem tam měl 4.19). Jinak LHC a Predictor se dopočítaly.
Honza
 
Příspěvky: 4322
Registrován: úte lis 30, 2004 10:50 am

Re: Chyba ve výpoètu

Příspěvek od Honza »

Radas píše:S tím souvisí další vìc, že se mi objem adresáøe BOINC díky CPDN nafoukl na témìr 4 GB. To mìlo taky dùvod, že jsem poèítání na mìsíc ukonèil. Prostì nebylo místo a èas se s tím drbat.
Logicky - jakmile se model ukonci, nejsou jeho data potreba. Bud je lze smazat nebo (hlavne kdyz je kompletni) nekam zazalohovat pro pozdejsi analyzu.
Data modelu najdes je v project\climateoerdiction\jmeno_modelu - prubezne pri vypoctu maji nejakou strukturu (nebudu ted rozepisovat), po ukonceni modelu je post-processing zapakuje a datain (vstupni data) smaze. Tim lze celkem snadno docilit snizeni datoveho objemu.
Radas
Nováček
Příspěvky: 37
Registrován: úte zář 21, 2004 11:46 am
Bydliště: Prostějov

Re: Chyba ve výpočtu

Příspěvek od Radas »

Honza píše:nekam zazalohovat pro pozdejsi analyzu.
Co z toho analyzuješ? To nemyslím nijak jízlivě.
Honza
 
Příspěvky: 4322
Registrován: úte lis 30, 2004 10:50 am

Re: Chyba ve výpoètu

Příspěvek od Honza »

Radas píše:Co z toho analyzuješ? To nemyslím nijak jízlivì.
Data lze dale analyzovat pomoci CPView nebo Advanced Visualisation. Lze si vynest teploty na grafy nebo koukat na teplotni mapy sezonnich rozdilu v Evrope, nekdo kouka na pokryti ledem/snehem, nekoho zajima oblacnost, jiny si srovnava vysledky s jinymi jiz spocitanymi modely, nekdo z toho dela animaci, jiny to pouzije jako bitmapu na desktopu ci potisk termohrnicku...tech moznosti je spousty; jen an to mit cas...
Uživatelský avatar
Honasss
Mírně pokročilý
Mírně pokročilý
Příspěvky: 138
Registrován: pát črc 29, 2005 11:25 am
Kontaktovat uživatele:

Příspěvek od Honasss »

Nevěděl sem kam, proto se ptám tady.

Nevím jestli to je OK, ale u jednotky kterou zrovna počítám (sulphur, cca 200hod) se u server state objevilo OVER. Zbývá nějakých 950hodin, není to nějaká chyba? Obrázek
Honza
 
Příspěvky: 4322
Registrován: úte lis 30, 2004 10:50 am

Příspěvek od Honza »

Server state je u CPDN spise kosmeticka zalezitost - server prijme vysledek bez ohledu na status WU. Mozna mas ale jeste jednotku z chybne varky, ale to poznas pri prechodu do druhe faze modelu...
Uživatelský avatar
Fran
Mírně pokročilý
Mírně pokročilý
Příspěvky: 163
Registrován: sob zář 09, 2006 6:29 pm
Bydliště: Děčín

Příspěvek od Fran »

Můžete se prosím někdo podívat na tuhle jednotku a napsat mi sem, jestli ji mám dopočítat? Děkuji předem
Uživatelský avatar
Merlin
Mírně pokročilý
Mírně pokročilý
Příspěvky: 184
Registrován: úte led 09, 2007 9:28 am

Příspěvek od Merlin »

Fran píše:Můžete se prosím někdo podívat na tuhle jednotku a napsat mi sem, jestli ji mám dopočítat? Děkuji předem
Mně se podařilo dopočítat pouze jednu WU z pěti. V problematice samotného výpočtu jsem naprostý laik, ale domnívám se, že možná příčina padání jednotek může být v dílčí analýze jednotlivých výsledků: pokud např. 5 různých CPU pošle částečný výsledek, a porovnání zjistí neshodu mimo toleranci, shodí další výpočet sám. Ale je to jen domněnka. Já se tím vcelku přestal zabývat v okamžiku, kdy mi spadl výpočet i na druhém stroji. V současnosti mám rozdělány dvě WU, jedna 63 % a druhá 18 %, každá jinde. Je možné, že náročnost výpočtu může násobit matematickou chybu CPU v řádu 10-42, a nevím jakou přesnost požaduje porovnání odchylek. A pokud uvádím nesmysl, odborníci to jistě uvedou na pravou míru :Honza_shifty
" Vše je pomíjivé, kredit zůstává "
Honza
 
Příspěvky: 4322
Registrován: úte lis 30, 2004 10:50 am

Příspěvek od Honza »

Nejak jsem se neproklikal, ktery je tvuj stroj. Ten anonym?
Pokud je tam tolik chyb, tak to asi bude zpusobene parametry modelu. Spise bych se klonil k tomu nedopocitavat.

Merlin,
pokud vim, castecne vysledky (dilci uploady) se neporovnavaji. Tedy ne tim zpusobem, ze by se pak na zaklade toho trebas ukoncovaly rozpocitane modely.
Z hlediska uzivatele to vypada, ze by to prispelo vyssi efektivite. Jenze jak porovnavat takove mnozstvi modelu a dat? To by se musel vyhradit minimalne jeden poradny server pouze na tuto ulohu, ktery by navic musel replikovat vsechna ulozena data (protoze jinak by svou zatezi uplne zasekal databazy pouzivanou i na jine ucely). A ze uz je ted problem s mistem...

Dopocitani pouze jedne WU z 5 je spise problemem masin, ktere pocitaji.
Pokud se na tech masinach gamesi, je lepsi BOINC pred hranim ukoncit...a nezapomenout jej pak zase nahodit :-)
Uživatelský avatar
Fran
Mírně pokročilý
Mírně pokročilý
Příspěvky: 163
Registrován: sob zář 09, 2006 6:29 pm
Bydliště: Děčín

Příspěvek od Fran »

Ne, je to čislo 734381.
Zeptal jsem se i přímo na fóru clima a dostal jsem odpověď, že na straně serveru je vše OK, takže není důvod výpočet zrušit. Mně se to nezdá(lo) protože je tam "Too many total results", ale neumím anglicky natolik, abych dokázal vysvětlit podrobněji, co se mi nezdá.
Ten model je stejně na 90%, měl by se dopočítat za 1,5 dne, takže ho dojedu.
Honza
 
Příspěvky: 4322
Registrován: úte lis 30, 2004 10:50 am

Příspěvek od Honza »

No jestli je na 90%, tak vo tom zadna - zkusit dopocitat :wink:
Uživatelský avatar
Fran
Mírně pokročilý
Mírně pokročilý
Příspěvky: 163
Registrován: sob zář 09, 2006 6:29 pm
Bydliště: Děčín

Příspěvek od Fran »

Honza píše:No jestli je na 90%, tak vo tom zadna - zkusit dopocitat :wink:
Kdyby to řekl někdo jinej, tak bych možná váhal..
Dopočítám. A díky.
Odpovědět