Stránka 1 z 1

Rosetta po 12sec výpočtu vyhodí ukaždé WU "Compute Erro

Napsal: pon říj 02, 2006 10:03 pm
od petr-22
Prosím o pomoc.
U Rosetty mi po 12 vteřinách výpočtu vyhodí každá WU "Compute Error" a ukončí se, takhle mi to udělalo u 20ti WU než jsem si toho všiml a pozastavil to.
Pokud někdo víte co s tím, tak mi prosím poraďte, ještě včera to totiž bylo v pohodě, předem díky. Petr

Napsal: pon říj 02, 2006 10:31 pm
od azor666
a muzes pls poslat link na ty wu a napsat chybove hlasky co to hlasi
takle se to skutecne neda odpovedet muze to byt cokoli: nestabilni OC PC chybna serie WU...

Napsal: úte říj 03, 2006 5:12 pm
od petr-22
azor666 píše:a muzes pls poslat link na ty wu a napsat chybove hlasky co to hlasi
takle se to skutecne neda odpovedet muze to byt cokoli: nestabilni OC PC chybna serie WU...
Ahoj, tak tady je ten loglist:

3.10.2006 17:03:04||Starting BOINC client version 5.4.11 for windows_intelx86
3.10.2006 17:03:04||libcurl/7.15.3 OpenSSL/0.9.8a zlib/1.2.3
3.10.2006 17:03:04||Data directory: C:\Program Files\BOINC
3.10.2006 17:03:04||Processor: 1 AuthenticAMD AMD Athlon(tm) XP 1700+
3.10.2006 17:03:04||Memory: 511.48 MB physical, 1.22 GB virtual
3.10.2006 17:03:04||Disk: 9.41 GB total, 863.00 MB free
3.10.2006 17:03:04|rosetta@home|URL: http://boinc.bakerlab.org/rosetta/; Computer ID: 296267; location: home; project prefs: default
3.10.2006 17:03:04|Einstein@Home|URL: http://einstein.phys.uwm.edu/; Computer ID: 755755; location: ; project prefs: default
3.10.2006 17:03:04|lhcathome|URL: http://lhcathome.cern.ch/; Computer ID: 1636913; location: home; project prefs: default
3.10.2006 17:03:04|SETI@home|URL: http://setiathome.berkeley.edu/; Computer ID: 2713164; location: ; project prefs: default
3.10.2006 17:03:04|World Community Grid|URL: http://www.worldcommunitygrid.org/; Computer ID: 67563; location: ; project prefs: default
3.10.2006 17:03:04||General prefs: from rosetta@home (last modified 2006-09-10 00:52:51)
3.10.2006 17:03:04||General prefs: no separate prefs for home; using your defaults
3.10.2006 17:03:04||Local control only allowed
3.10.2006 17:03:04||Listening on port 31416
3.10.2006 17:03:04||Suspending network activity - user request
3.10.2006 17:04:11|Einstein@Home|Deferring task h1_1127.0_S5R1__979_S5R1a_0
3.10.2006 17:04:11|World Community Grid|Deferring task faah0805_bdb246_mx1mer_dry_05_0
3.10.2006 17:04:11|SETI@home|Deferring task 02jn03aa.23777.12784.790908.3.122_2
3.10.2006 17:04:11||Resuming computation
3.10.2006 17:04:11||Rescheduling CPU: Resuming computation
3.10.2006 17:04:11||Resuming network activity
3.10.2006 17:04:12|SETI@home|Started upload of file 03jn03aa.25896.7217.704834.3.19_2_0
3.10.2006 17:04:16|SETI@home|Finished upload of file 03jn03aa.25896.7217.704834.3.19_2_0
3.10.2006 17:04:16|SETI@home|Throughput 17344 bytes/sec
3.10.2006 17:05:16||Rescheduling CPU: project resumed by user
3.10.2006 17:05:18||Rescheduling CPU: project resumed by user
3.10.2006 17:05:20||Rescheduling CPU: project resumed by user
3.10.2006 17:05:21|lhcathome|Sending scheduler request to http://lhcathome.cern.ch/lhcathome_cgi/cgi
3.10.2006 17:05:21|lhcathome|Reason: To fetch work
3.10.2006 17:05:21|lhcathome|Requesting 43200 seconds of new work
3.10.2006 17:05:22||Rescheduling CPU: project resumed by user
3.10.2006 17:05:24||Rescheduling CPU: project resumed by user
3.10.2006 17:05:27|lhcathome|Scheduler request succeeded
3.10.2006 17:05:27|lhcathome|No work from project
3.10.2006 17:05:27|lhcathome|Deferring scheduler requests for 19 minutes and 14 seconds
3.10.2006 17:05:32|rosetta@home|Sending scheduler request to http://boinc.bakerlab.org/rosetta_cgi/cgi
3.10.2006 17:05:32|rosetta@home|Reason: To fetch work
3.10.2006 17:05:32|rosetta@home|Requesting 43200 seconds of new work
3.10.2006 17:05:38|rosetta@home|Scheduler request succeeded
3.10.2006 17:05:40|rosetta@home|Started download of file frags83_1bq9A.fasta.gz
3.10.2006 17:05:40|rosetta@home|Started download of file frags83_1bq9A.psipred_ss2.gz
3.10.2006 17:05:41|rosetta@home|Finished download of file frags83_1bq9A.fasta.gz
3.10.2006 17:05:41|rosetta@home|Throughput 242 bytes/sec
3.10.2006 17:05:41|rosetta@home|Finished download of file frags83_1bq9A.psipred_ss2.gz
3.10.2006 17:05:41|rosetta@home|Throughput 1590 bytes/sec
3.10.2006 17:05:41|rosetta@home|Started download of file boinc_frags83_aa1bq9A03_05.200_v1_3.gz
3.10.2006 17:05:41|rosetta@home|Started download of file boinc_frags83_aa1bq9A09_05.200_v1_3.gz
3.10.2006 17:05:44|rosetta@home|Finished download of file boinc_frags83_aa1bq9A09_05.200_v1_3.gz
3.10.2006 17:05:44|rosetta@home|Throughput 48555 bytes/sec
3.10.2006 17:05:44|rosetta@home|Started download of file frags83_1bq9.pdb.gz
3.10.2006 17:05:45|rosetta@home|Finished download of file boinc_frags83_aa1bq9A03_05.200_v1_3.gz
3.10.2006 17:05:45|rosetta@home|Throughput 129518 bytes/sec
3.10.2006 17:05:45|rosetta@home|Finished download of file frags83_1bq9.pdb.gz
3.10.2006 17:05:45|rosetta@home|Throughput 8619 bytes/sec
3.10.2006 17:05:45|rosetta@home|Started download of file casp7.description.shorter.txt
3.10.2006 17:05:47|rosetta@home|Finished download of file casp7.description.shorter.txt
3.10.2006 17:05:47|rosetta@home|Throughput 213 bytes/sec
3.10.2006 17:05:48||Rescheduling CPU: files downloaded
3.10.2006 17:05:49|rosetta@home|Starting task 1bq9A_BOINC_FILTERS_ABRELAX_SAVE_ALL_OUT_frags83__1252_6576_0 using rosetta version 525
3.10.2006 17:06:32|rosetta@home|Unrecoverable error for result 1bq9A_BOINC_FILTERS_ABRELAX_SAVE_ALL_OUT_frags83__1252_6576_0 ( - exit code -1073741819 (0xc0000005))
3.10.2006 17:06:32||Rescheduling CPU: application exited
3.10.2006 17:06:32|rosetta@home|Computation for task 1bq9A_BOINC_FILTERS_ABRELAX_SAVE_ALL_OUT_frags83__1252_6576_0 finished
3.10.2006 17:06:34|SETI@home|Sending scheduler request to http://setiboinc.ssl.berkeley.edu/sah_cgi/cgi
3.10.2006 17:06:34|SETI@home|Reason: To fetch work
3.10.2006 17:06:34|SETI@home|Requesting 1 seconds of new work, and reporting 1 completed tasks
3.10.2006 17:06:39|SETI@home|Scheduler request succeeded
3.10.2006 17:06:42|SETI@home|Started download of file 29ap03aa.17414.689.997154.3.164
3.10.2006 17:06:45|SETI@home|Finished download of file 29ap03aa.17414.689.997154.3.164
3.10.2006 17:06:45|SETI@home|Throughput 127436 bytes/sec
3.10.2006 17:06:46||Rescheduling CPU: files downloaded
3.10.2006 17:06:47|SETI@home|Starting task 29ap03aa.17414.689.997154.3.164_2 using setiathome_enhanced version 515
3.10.2006 17:07:09||Rescheduling CPU: result suspended, resumed or aborted by user
3.10.2006 17:07:10|World Community Grid|Restarting task faah0805_bdb246_mx1mer_dry_05_0 using faah version 510
3.10.2006 17:07:10|SETI@home|Pausing task 29ap03aa.17414.689.997154.3.164_2 (removed from memory)
3.10.2006 17:07:15||Rescheduling CPU: result suspended, resumed or aborted by user
3.10.2006 17:07:24|World Community Grid|Unrecoverable error for result faah0805_bdb246_mx1mer_dry_05_0 ( - exit code -1 (0xffffffff))
3.10.2006 17:07:24|World Community Grid|Deferring scheduler requests for 1 minutes and 0 seconds
3.10.2006 17:07:24||Rescheduling CPU: application exited
3.10.2006 17:07:24|World Community Grid|Computation for task faah0805_bdb246_mx1mer_dry_05_0 finished
3.10.2006 17:07:26|World Community Grid|Started upload of file faah0805_bdb246_mx1mer_dry_05_0_0
3.10.2006 17:07:26|World Community Grid|Started upload of file faah0805_bdb246_mx1mer_dry_05_0_1
3.10.2006 17:07:28|Einstein@Home|Sending scheduler request to http://einstein.phys.uwm.edu/EinsteinAtHome_cgi/cgi
3.10.2006 17:07:28|Einstein@Home|Reason: To fetch work
3.10.2006 17:07:28|Einstein@Home|Requesting 1 seconds of new work
3.10.2006 17:07:34|World Community Grid|Finished upload of file faah0805_bdb246_mx1mer_dry_05_0_0
3.10.2006 17:07:34|World Community Grid|Throughput 2081 bytes/sec
3.10.2006 17:07:34|Einstein@Home|Scheduler request succeeded
3.10.2006 17:07:35|World Community Grid|Finished upload of file faah0805_bdb246_mx1mer_dry_05_0_1
3.10.2006 17:07:35|World Community Grid|Throughput 42186 bytes/sec
3.10.2006 17:07:36||Rescheduling CPU: files downloaded
3.10.2006 17:07:37|Einstein@Home|Starting task h1_1127.0_S5R1__967_S5R1a_0 using einstein_S5R1 version 424
3.10.2006 17:09:45|rosetta@home|Sending scheduler request to http://boinc.bakerlab.org/rosetta_cgi/cgi
3.10.2006 17:09:45|rosetta@home|Reason: To fetch work
3.10.2006 17:09:45|rosetta@home|Requesting 43200 seconds of new work, and reporting 1 completed tasks
3.10.2006 17:09:50|rosetta@home|Scheduler request succeeded
3.10.2006 17:09:52||Rescheduling CPU: files downloaded
3.10.2006 17:09:52|Einstein@Home|Pausing task h1_1127.0_S5R1__967_S5R1a_0 (removed from memory)
3.10.2006 17:09:53|rosetta@home|Starting task 1bq9A_BOINC_FILTERS_ABRELAX_SAVE_ALL_OUT_frags83__1252_6584_0 using rosetta version 525
3.10.2006 17:10:04|rosetta@home|Unrecoverable error for result 1bq9A_BOINC_FILTERS_ABRELAX_SAVE_ALL_OUT_frags83__1252_6584_0 ( - exit code -1073741819 (0xc0000005))
3.10.2006 17:10:04||Rescheduling CPU: application exited
3.10.2006 17:10:04|rosetta@home|Computation for task 1bq9A_BOINC_FILTERS_ABRELAX_SAVE_ALL_OUT_frags83__1252_6584_0 finished
3.10.2006 17:10:04|Einstein@Home|Restarting task h1_1127.0_S5R1__967_S5R1a_0 using einstein_S5R1 version 424
3.10.2006 17:10:57||Rescheduling CPU: result suspended, resumed or aborted by user
3.10.2006 17:11:00||Rescheduling CPU: result suspended, resumed or aborted by user
3.10.2006 17:11:00|SETI@home|Restarting task 02jn03aa.23777.12784.790908.3.122_2 using setiathome_enhanced version 515
3.10.2006 17:11:00|Einstein@Home|Pausing task h1_1127.0_S5R1__967_S5R1a_0 (removed from memory)
3.10.2006 17:11:07||Rescheduling CPU: result suspended, resumed or aborted by user
3.10.2006 17:11:08|Einstein@Home|Restarting task h1_1127.0_S5R1__979_S5R1a_0 using einstein_S5R1 version 424
3.10.2006 17:11:08|SETI@home|Pausing task 02jn03aa.23777.12784.790908.3.122_2 (removed from memory)
3.10.2006 17:11:14|Einstein@Home|Unrecoverable error for result h1_1127.0_S5R1__979_S5R1a_0 ( - exit code 99 (0x63))
3.10.2006 17:11:14|Einstein@Home|Deferring scheduler requests for 1 minutes and 0 seconds
3.10.2006 17:11:14||Rescheduling CPU: application exited
3.10.2006 17:11:14|Einstein@Home|Computation for task h1_1127.0_S5R1__979_S5R1a_0 finished
3.10.2006 17:11:15|SETI@home|Resuming task 29ap03aa.17414.689.997154.3.164_2 using setiathome_enhanced version 515
3.10.2006 17:11:17|Einstein@Home|Started upload of file h1_1127.0_S5R1__979_S5R1a_0_0
3.10.2006 17:11:37|Einstein@Home|Finished upload of file h1_1127.0_S5R1__979_S5R1a_0_0
3.10.2006 17:11:37|Einstein@Home|Throughput 94689 bytes/sec

Chyby výpočtů už mám nejen u Rosetty

Napsal: úte říj 03, 2006 5:18 pm
od petr-22
Už mi blbne skoro všechno, chybuje mi
Rosetta
WCG
Einstein
jediné co funguje spolehlivě je Seti@home

Nemůže to náhodou být tím přenášením na flashce a počítáním střídavě na AMD a Intelu?
Mám to kompletně odinstalovat nebo stačí jen ukončit celý projekt a pak se zase přihlásit pod původním nickem?
Předem moc díky za odpovědi. Petr
azor666 píše:a muzes pls poslat link na ty wu a napsat chybove hlasky co to hlasi
takle se to skutecne neda odpovedet muze to byt cokoli: nestabilni OC PC chybna serie WU...

Napsal: úte říj 03, 2006 6:53 pm
od Bubak
petr-22: Kdyz koukam na tvy results, napr. tenhle tak podle hlasky

Kód: Vybrat vše

Reason: Access Violation (0xc0000005) at address 0x006157CA read attempt to address 0x028D2000
bych to tipoval na chybu hardware. Neni ten Athlon pretaktnutej? Zkousel jsi tam spustit memtest? Co chkdsk?

OT: Koukam, ze Rosetta bezi na widlich pod cygwinem. ;-) To by mi zajimalo jak je teda na tom s casama Win conra Lin.

Chyby výpočtů u Rosetty jsou opraveny

Napsal: úte říj 03, 2006 10:49 pm
od petr-22
Díky za odpověď.
Už jsem to spravil nebo se to spíš spravilo samo, dal jsem opustit projekt a pak jsem se k Rosettě zase připojil.
Teď už mi to počítá první WU a tváří se to napohodu.

Jinak s to padání jiných projektů než Rosetty jsem už vyřešil:
Pokud začnu počítat určitou WU (např. WCG nebo Einstein) na PC doma s AMD, tak se taky na AMD musí dopočítat a nesmí se při přenášení na flashce ani na chvíli spustit na Intelu v práci, protože to hned klekne.
Ale pokud si doma danou WU jen stahnu a hned pozastavím na 0,000%, pak ji přenesu a kompletně spočítám v práci na Intelu a výsledek po opětovném přenesení z práce domu jen odešlu, tak je vše v pohodě. (nejsem odborník na systémy ale nemohou to dělat rozdílné instrukční sady (SSE vs 3DNow!))


Bubak píše:petr-22: Kdyz koukam na tvy results, napr. tenhle tak podle hlasky

Kód: Vybrat vše

Reason: Access Violation (0xc0000005) at address 0x006157CA read attempt to address 0x028D2000
bych to tipoval na chybu hardware. Neni ten Athlon pretaktnutej? Zkousel jsi tam spustit memtest? Co chkdsk?

OT: Koukam, ze Rosetta bezi na widlich pod cygwinem. ;-) To by mi zajimalo jak je teda na tom s casama Win conra Lin.

Napsal: stř říj 04, 2006 9:11 am
od Honza
Pokud aplikace uziva nejake optimalizace nebo specificke instrukcni sady napr. 3DNow, tak je pochopitelne, ze to na jine masine hned padne.
Obecne je to vosajslich...ale treba CPDN takto vcelku beha, protoze ma kod univerzalnejsi.

Univerzalně a spolehlivě mám odzkoušeno SETI a CPDN

Napsal: stř říj 04, 2006 9:29 am
od petr-22
Odzkoušeno mám přenášení CPDN a SETI(neoptimalizované), s těma můžu dělat doslova cokoliv a vždy se vše řádně dopočítá a odešle. Škoda, že to tak nejde u Rosetty a WCG, protože bych raději víc času CPU věnoval výzkumu pro zdravotnictví, než počítat klima a filtrovat frekvence.
Zase na druhou stranu body se hodí z jakéhokoliv projetku, hlavně když doženeme Seti@Germany team a natrhneme jim pr...
:D

Honza píše:Pokud aplikace uziva nejake optimalizace nebo specificke instrukcni sady napr. 3DNow, tak je pochopitelne, ze to na jine masine hned padne.
Obecne je to vosajslich...ale treba CPDN takto vcelku beha, protoze ma kod univerzalnejsi.

Re: Univerzalně a spolehlivě mám odzkoušeno SETI a CPDN

Napsal: stř říj 04, 2006 9:37 am
od LiborA
petr-22 píše:Odzkoušeno mám přenášení CPDN a SETI(neoptimalizované), s těma můžu dělat doslova cokoliv a vždy se vše řádně dopočítá a odešle. Škoda, že to tak nejde u Rosetty a WCG, protože bych raději víc času CPU věnoval výzkumu pro zdravotnictví, než počítat klima a filtrovat frekvence.
Zase na druhou stranu body se hodí z jakéhokoliv projetku, hlavně když doženeme Seti@Germany team a natrhneme jim pr...
:D
Tak s zapoj do Malárie, PavolR nedávno nabízel svůj účet. Přenášení z kompu na komp s ní mám vyzkoušené, takže funguje.