Zase pád výpočtu

Smetiště aneb propadliště dějin pro neaktuální příspěvky. Po pár dnech bude ručně smazáno, pokud nebudou hlasy pro zachovaní

Moderátoři: zdespi, Moderátoři

Zamčeno
Uživatelský avatar
LiborA
BOINC Guru
BOINC Guru
Příspěvky: 1298
Registrován: čtv pro 08, 2005 10:11 am
Bydliště: Chomutov, Praha, Moldava
Kontaktovat uživatele:

Zase pád výpočtu

Příspěvek od LiborA »

Nevím čím to je, ale nejsem schopen dokončit žádnou jednotku CPDN, poradí mi, někdo proč? Všechny výpočty zkončí hláškou <core_client_version>5.2.13</core_client_version>
<message> - exit code -1073741819 (0xc0000005)
</message>
Bližší informace o výpočtech http://climateapps2.oucs.ox.ac.uk/cpdnb ... tid=258259
Jinak mám pracovní stanici HP xw8000 s 1 Giga paměti a 2 xeonama na 2,4 MHz bez OC takže horší mašinou by to být nemělo.
Honza
 
Příspěvky: 4322
Registrován: úte lis 30, 2004 10:50 am

Příspěvek od Honza »

Co na tech masinach jeste bezi?
Jestli je tam nejaky AV, tak bych zkusil dat BOINC folder do vyjimek na nescanovat jej (shield).
Nejake screensaver?
Stava se na tech masinach, ze by vytizene ze 100% necim jinym?

Asi to nebude spatnym stazenim aplikace, protoze to delalo jak na slab modelech, tak to padlo na sulphur cycle modelu :?

Zadny problem s prehrivanim?
Testy stability a-la memtest a prime jsou OK?
Uživatelský avatar
LiborA
BOINC Guru
BOINC Guru
Příspěvky: 1298
Registrován: čtv pro 08, 2005 10:11 am
Bydliště: Chomutov, Praha, Moldava
Kontaktovat uživatele:

Příspěvek od LiborA »

Stabilní je to bez problémů a AV to nedělá, ten mi beží každý den v poledne a tak by to spadlo hned (CPDN běží 24/7). Napadlo mne, jestli to nemůže být nedostatkem místa na disku, protože to postupně vyžralo pár giga prostoru. Zkusil bych to přenést na nějaký volnější disk - dá se to nějak jednoduše udělat?
Honza
 
Příspěvky: 4322
Registrován: úte lis 30, 2004 10:50 am

Příspěvek od Honza »

Tvrzeni "stabilin je to bez problemu" neni pro CPDN dostatecne. Mnoho lidi se jiz predsvedcilo, ze nepada-li jim SETI, neznamena to, ze CPDN pobezi stabilne.

Nevim, kolik mista na disku tam mas. Pokud to neni instalovane jako sluzba, staci BOINC zastavit, cely adresar nakopirovat jinam a spoustem z noveho mista.
AV to delat muze docela snadno: vetsina dnesnich AV kontroluje otevirane soubory a za nekterych okolnosti muze dojit ke kolizi tim, ze AV i aplikace chteji pristupovat ke stejnemu souboru (AV jej zamkne, aplikace se k nemu nemuze dostat a neceka dostatecne dlouho na uvolneni). Zkus dat, aby ten aktivni stit netestoval soubory v BOINC.

Co k tem dalsim 5 otazakam/typum - viz minuly prispevek?
Uživatelský avatar
LiborA
BOINC Guru
BOINC Guru
Příspěvky: 1298
Registrován: čtv pro 08, 2005 10:11 am
Bydliště: Chomutov, Praha, Moldava
Kontaktovat uživatele:

Příspěvek od LiborA »

Mašina je gisová stanice a dosud při gisových analýzách nikdy nespadla, takže o nestabilitě stanice trochu pochybuji (ale zátěžové testy jsem dosud nedělal, resp. před pár lety jsem jich pár udělal, ale jak podrobné testování to bylo si již nepamatuji). Každopádně k výpadku došlo v době, kdy jsem byl na dovolče a comp seděl sám v kanclu a nikdo u něj nebyl.
Dá se nějak vystopovat, kdy přesně došlo k výpadku? V souboru stdoutdae.txt jsem poslední záznam o práci CPDN našel 29.12. po znovuspuštění výpočtu po banchmarku. Jinak to vyžralo okolo 2 GB na disku, protože další záznam climateprediction.net je až z 1.1., kdy řve, že není dostatek volného místa na disku k ztažení nové úlohy, tj. k výpadku 1 procesu došlo někdy mezi těmito daty, druhý proces předpokládám vypadl již někdy dříve, protože jinak to počítalo oba procesy souběžně (mašina má 2 CPU).
Nastavení antiviru upravím a uvidím
Honza
 
Příspěvky: 4322
Registrován: úte lis 30, 2004 10:50 am

Příspěvek od Honza »

Informace v souboru stdoutdae.txt jsi hledal spravne. Aktivitu je mozne stopovat i aktualnich (podle data) souborech jednotlivych modelu.
Adresare s modely, ktere se nedokoncili muzes klidne smazat...ted jiz nejsou potreba.

Jak jsem jiz rikal - ze bezi nejaka obycejna aplikace neznamena, ze bude behat stabilne CPDN, ktere cely system plne vytezuje.
S odkazem na benchmark bych zkontroloval v global preferences tveho uctu na CPDN, ze mas nastavene 'Leave applications in memory while preempted?' na Yes.

Screensaver?
Teplty CPU?
Kolik tedy zbyva mista na disku?
Uživatelský avatar
LiborA
BOINC Guru
BOINC Guru
Příspěvky: 1298
Registrován: čtv pro 08, 2005 10:11 am
Bydliště: Chomutov, Praha, Moldava
Kontaktovat uživatele:

Příspěvek od LiborA »

Screensaver je Boinc
Teploty jsem nezjišťoval, zítra na to mrknu
Disku bylo opravdu málo - jak jsem říkal postupně vyžral celý zbytek disku až na pár mega volného prostoru - před Vánoci (když jsem odcházel na dovolču) zabíral CPDN okolo 800 MB, teď to dělalo přes 2 GB.
Škoda, že se ty starý výpočty mohou vyhodit, poslední zálohu mám právě než jsem šel na dovolenou a to bylo 16.12., takže hromada dní strojového času je v pytly :cry: ale možná se vyplatí obnovit tu zálohu? Vyplatí se to???
Přesunul jsem to na volnější disk. Bude 6 GB volného prostoru stačit? - počítají se dva projekty najednou

Jinak to nastavení, aby to nechávalo aplikaci v paměti je na YES
Honza
 
Příspěvky: 4322
Registrován: úte lis 30, 2004 10:50 am

Příspěvek od Honza »

V tom, ze je screensaver BOINC, muze byt take zadrhel - nebylo by to poprve.
Teploty omrkni, ale asi to nebude problem.

Potrebne misto na disk a dalsi parametry narocnosti se snazim udrzovat aktualni v Nároènost projektù - souhrná tabulka.
Pocitej az 2.7GB na sulphur cycle model tesne pred jeho dokoncenim (po post-processingu a zazipovani - udela si sam - zustane 1GB). Carl bude do novych modelu pridavat, ze budou po sobe uklizet uplne...
CPDN je mozna pustit ze zalohy - server nove vysledky prijme.

Pokud se napriklad sulphur model spocita do prvni faze, odeslou se vysledky za prvni fazi a nejsou vsechny vypocty ztraceny. Samosebou je pro projekt dulezite mit patricny pocet kompletnich modelu...ale uspesnost nemuze byt 100%.
Uživatelský avatar
LiborA
BOINC Guru
BOINC Guru
Příspěvky: 1298
Registrován: čtv pro 08, 2005 10:11 am
Bydliště: Chomutov, Praha, Moldava
Kontaktovat uživatele:

Teploty

Příspěvek od LiborA »

Tak jsem dokončil výpočty ostatních projektů a znovu spustil ze zálohy CPDN (škoda cca 15 dnů strojového času). Jinak ty teploty CPU se pohybují mezi 57-61 stupni
Uživatelský avatar
LiborA
BOINC Guru
BOINC Guru
Příspěvky: 1298
Registrován: čtv pro 08, 2005 10:11 am
Bydliště: Chomutov, Praha, Moldava
Kontaktovat uživatele:

Jaký spořič?

Příspěvek od LiborA »

Jo jinak bohužel spořič nevypnu, máme v práci takové nařízení, že jej musíme mít nastaven a chráněn heslem. Je tedy nějaký "vyzkoušený bezproblémový" spořič?
Zrušil jsem již pravidelné kontroly antivirem, protože nemám jistotu, že bude akceptovat výjimky nastavené pro ruční kontrolu, tak snad to již nespadne :):
Honza
 
Příspěvky: 4322
Registrován: úte lis 30, 2004 10:50 am

Příspěvek od Honza »

Bezproblemovy sporit je "Blank" ktery jako jediny funguje jako sporic - cerna obrazovaka a navic nebere CPU cycles vypoctum, jak akvarka, trubky a podobne blbosti.
Zrus predevsim kontrolu bOINC adresare v shieldu - tedy te casti, ktera kontroluje soubory vzdy pri otevirani a ne pri pravidelnem scanu.
Uživatelský avatar
LiborA
BOINC Guru
BOINC Guru
Příspěvky: 1298
Registrován: čtv pro 08, 2005 10:11 am
Bydliště: Chomutov, Praha, Moldava
Kontaktovat uživatele:

Příspěvek od LiborA »

Honza píše:Zrus predevsim kontrolu bOINC adresare v shieldu - tedy te casti, ktera kontroluje soubory vzdy pri otevirani a ne pri pravidelnem scanu.
Bohužel, to nemohu, ačkoliv mám adminovská práva ke kompu, tak nemám dostatečné opravnění k nastavení této položky v F-Secure antiviru, to si nějak naši barákoví informatici pohlídali a nastavení vyjímek realtimové kontroly je needitovatelné (pole jsou šedá) :(
Zamčeno