BOINC - uFluids (alfa?)
Moderátoři: zdespi, Moderátoři
- Pepino65
- Pokročilý

- Příspěvky: 243
- Registrován: pát kvě 26, 2006 11:25 am
- Bydliště: Sokolov
- Kontaktovat uživatele:
Nedávno se PavolR ptal, jestli mají i ostatní hodně errorových wu. Já jsem věděl, že pokud spadnou widle, rozpočítané jednotky do erroru jdou. Nyní jsem zjistil, když počítám na jednou svém kompu i jiné projekty, které jsou "agresivnější", tak jsem měl spoustu invadiních jednotek. V práci na P4D 2.8 GHz mi s přehledem pozastavuje uFluidsové jednotky PrimeGrid a počítá se přednostně. Tak jsem ho musel pozastavit. Přestože mám nastaven interval pro změnu výpočtu mezi projekty 75 min., PrimeGrid mi shodil uFluids i po 3 minutách.
Zjistil jsem to dnes, tak se na to budu muset o víkendu nebo v pondělí podívat.
Tady je to vidět
Zjistil jsem to dnes, tak se na to budu muset o víkendu nebo v pondělí podívat.
Tady je to vidět
Naposledy upravil(a) Pepino65 dne ned led 14, 2007 1:01 am, celkem upraveno 1 x.
Nihil est impossibile (Nic není nemožné)
2 Pepino65: Nejak te nechapu. Tvrdis, ze ti beh jedne BOINC app. na jednom core zpusobuje, padani druhe app na druhem core? Pokud tomu tak je, tak bych uvazoval o zmene OS.
Spis bych to ale videl na spatne napsanou tu aplikaci ktera ti pada a nedaval bych to do souvislosti se spustenim jine app.
PS: Ten svuj link si oprav. Mam smrtelnikum, ktery nejsou nalogovany pod tvym accountem je nanic.
Spis bych to ale videl na spatne napsanou tu aplikaci ktera ti pada a nedaval bych to do souvislosti se spustenim jine app.
PS: Ten svuj link si oprav. Mam smrtelnikum, ktery nejsou nalogovany pod tvym accountem je nanic.
Private (old) + CCU stats.
- Pepino65
- Pokročilý

- Příspěvky: 243
- Registrován: pát kvě 26, 2006 11:25 am
- Bydliště: Sokolov
- Kontaktovat uživatele:
Link snad opraven.Bubak píše:2 Pepino65: Nejak te nechapu. Tvrdis, ze ti beh jedne BOINC app. na jednom core zpusobuje, padani druhe app na druhem core? Pokud tomu tak je, tak bych uvazoval o zmene OS.
Spis bych to ale videl na spatne napsanou tu aplikaci ktera ti pada a nedaval bych to do souvislosti se spustenim jine app.
PS: Ten svuj link si oprav. Mam smrtelnikum, ktery nejsou nalogovany pod tvym accountem je nanic.
Opravdu, jakmile se natáhly jednotky PrimeGridu, všiml jsem si, že v magorovi byly dočasně pozastaveny wu od uFluidsu a rozjely se na obou core wu od PG. Dočasně pozastavené wu uFluidsu jsou po novém nastartování označeny jako dopočítané, ale v erroru. Nevím proč. Něco budu mít někde blbě nastavený, ale kde? V mašině nebo v Global preference? Jsem z toho trubka.
Nihil est impossibile (Nic není nemožné)
2 Pepino65: Nedostal ses do overcomited modu? Dalsi moznost proc se to stalo je, ze mas u PG nastaveny velky Resource share oproti uFluids. Takze srovnej resource share nebo sniz zasobu WU.
Ten link by mel vypadat nejak takhle nahled na vsechny tvy vysledky jde jen po zalogovani.
Ten link by mel vypadat nejak takhle nahled na vsechny tvy vysledky jde jen po zalogovani.
Private (old) + CCU stats.
Trošku bych se přidal...
Včera mi to uFluids ignorovalo víc než 12 hodin. Počítám Rossetu, Einsteina, Seti, Malarii a uFluids. Share je 20/20/20/20/20.
Pomohlo až když jsem dal na všem kromě uFluids nepřijímat další práci... Nicméně mi to nepadá jako Pepinovi.
EDIT:
Overcommited to nebylo a uFluids měli nejbližší deadline.
Včera mi to uFluids ignorovalo víc než 12 hodin. Počítám Rossetu, Einsteina, Seti, Malarii a uFluids. Share je 20/20/20/20/20.
Pomohlo až když jsem dal na všem kromě uFluids nepřijímat další práci... Nicméně mi to nepadá jako Pepinovi.
EDIT:
Overcommited to nebylo a uFluids měli nejbližší deadline.
- Pepino65
- Pokročilý

- Příspěvky: 243
- Registrován: pát kvě 26, 2006 11:25 am
- Bydliště: Sokolov
- Kontaktovat uživatele:
Tak jsem to chvíli sledoval a snad jsem na to přišel, jednalo se o testovací jednotky Primegridu, které někdo nedopočítal a znovu byly rozeslány. Deadline na ních byl s bídou 12 hod. Začínaly se počítat přednostně na obou core. Pozastavily wu Primegridu s deadlinem 18. 1. a i wu od uFludsu.
Když byly dopočítány ty wu s krátkým deadlinem a spustily se wu, které byly pozastaveny, byla vždy wu od uFluidsu po pár vteřinách "dopočítána" a označena jako compute error.
Když byly dopočítány ty wu s krátkým deadlinem a spustily se wu, které byly pozastaveny, byla vždy wu od uFluidsu po pár vteřinách "dopočítána" a označena jako compute error.
Nihil est impossibile (Nic není nemožné)
2 Pepino65: Jeste mi napada: Nemas nastaveno "Leave applications in memory while suspended?" na "no"? V tom pripade by mohlo pomoci to zmenit.
Private (old) + CCU stats.
- Pepino65
- Pokročilý

- Příspěvky: 243
- Registrován: pát kvě 26, 2006 11:25 am
- Bydliště: Sokolov
- Kontaktovat uživatele:
Tak mám první sidedrop za sebou, wu skončila za téměř 1:27 hod. v erroru, původní předpoklad výpočtu dle BM byl 3:59 min. Nejhorší je, že se mi toho svinstava natahalo vzhledem k předpokladu hned 13 kousků. Další 2 wu už běží také řádně dlouho - 18 a 28 min. Vypadá to, že z dílny uFluidsu zase jednou vyšla pěkná sr...ka.
Jestli to tak půjde dál, tak to radši stopnu. V každém případě, když už jsem si to natáhl domů, tak je aspoň zkusím pozastavit, jestli to čirou náhodou nemá checkpointy.
Tady je výpis z magora u první wu:
BM wrote:
24.1.2007 17:27:34||Starting sidedrop1_13_1.0_0.002_3.79999999999996_0_0_0_1
24.1.2007 17:27:34|uFluids|Starting task sidedrop1_13_1.0_0.002_3.79999999999996_0_0_0_1 using evolver version 410
24.1.2007 18:53:09|uFluids|Computation for task sidedrop1_13_1.0_0.002_3.79999999999996_0_0_0_1 finished
24.1.2007 18:53:10|uFluids|Reason: Unrecoverable error for result sidedrop1_13_1.0_0.002_3.79999999999996_0_0_0_1 (<file_xfer_error> <file_name>sidedrop1_13_1.0_0.002_3.79999999999996_0_0_0_1_0</file_name> <error_code>-161</error_code></file_xfer_error>)
Postupně jsem pozastavoval 3 wu na cca 15sec. a střídal jsem je mezi sebou, běží dál jako když se nechumelí, tak jsem ještě zvědavý na výsledek, zkusím i restart, to jsou většinou všechny wu invadiní.
Tak po restartu nešly wu do erroru, ale výpočet byl opět na úplném začátku. Tak jsem 2 wu stopnul, na to nemám nervy. Ostatní nechám běhat a uvidíme.
Takže kdo spekuloval, že půjde o krátké wu, ať se rozmyslí.
Jestli to tak půjde dál, tak to radši stopnu. V každém případě, když už jsem si to natáhl domů, tak je aspoň zkusím pozastavit, jestli to čirou náhodou nemá checkpointy.
Tady je výpis z magora u první wu:
BM wrote:
24.1.2007 17:27:34||Starting sidedrop1_13_1.0_0.002_3.79999999999996_0_0_0_1
24.1.2007 17:27:34|uFluids|Starting task sidedrop1_13_1.0_0.002_3.79999999999996_0_0_0_1 using evolver version 410
24.1.2007 18:53:09|uFluids|Computation for task sidedrop1_13_1.0_0.002_3.79999999999996_0_0_0_1 finished
24.1.2007 18:53:10|uFluids|Reason: Unrecoverable error for result sidedrop1_13_1.0_0.002_3.79999999999996_0_0_0_1 (<file_xfer_error> <file_name>sidedrop1_13_1.0_0.002_3.79999999999996_0_0_0_1_0</file_name> <error_code>-161</error_code></file_xfer_error>)
Postupně jsem pozastavoval 3 wu na cca 15sec. a střídal jsem je mezi sebou, běží dál jako když se nechumelí, tak jsem ještě zvědavý na výsledek, zkusím i restart, to jsou většinou všechny wu invadiní.
Tak po restartu nešly wu do erroru, ale výpočet byl opět na úplném začátku. Tak jsem 2 wu stopnul, na to nemám nervy. Ostatní nechám běhat a uvidíme.
Takže kdo spekuloval, že půjde o krátké wu, ať se rozmyslí.
Nihil est impossibile (Nic není nemožné)
- LiborA
- BOINC Guru

- Příspěvky: 1298
- Registrován: čtv pro 08, 2005 10:11 am
- Bydliště: Chomutov, Praha, Moldava
- Kontaktovat uživatele:
Mám ztaženo celkem 15 jednotek, některé jsou svelmi dlouhým názvem (např. axi_linear_interface1_0.5_1_28_0_0_-0.279999999999999_1200_-0.279999999999999_0.001_0 ) jiné zase s krátkým názvem (např. axi_linear_interface1_0.5_1_28_0_0_-0.69_1200_-0.69_0.001_0). Co jsem zatím koukal na výsledky ostatních počtářů, tak jsem "chytil" jednu dlouhou jednotku, která skončí nejsíš s chybou.
Moje statistika: http://boinc.mundayweb.com/one/stats.ph ... :6082/.png
- Pepino65
- Pokročilý

- Příspěvky: 243
- Registrován: pát kvě 26, 2006 11:25 am
- Bydliště: Sokolov
- Kontaktovat uživatele:
axi wu (ať už linear nebo tube) jsou dneska víceměně stabilní, problémem jsou chybějící checkpointy. Wu axi po pozastavení nebo po restartu systému skončí v erroru, ale jsou naštěstí krátké. Zato ta novinka Sidedrop je zase nějaký zmetek, poslední mi hlásila, že čeká na uvolnění paměti. Povypínal jsem všechny možné aplikace (nakonec i antivir) a čekali jsme spolu dál a nic. Tak jsem to stopnul taky. Teď počítám další, 4 jsem abortnul já, 1 se pomršila i beze mě.LiborA píše:Mám ztaženo celkem 15 jednotek, některé jsou svelmi dlouhým názvem (např. axi_linear_interface1_0.5_1_28_0_0_-0.279999999999999_1200_-0.279999999999999_0.001_0 ) jiné zase s krátkým názvem (např. axi_linear_interface1_0.5_1_28_0_0_-0.69_1200_-0.69_0.001_0). Co jsem zatím koukal na výsledky ostatních počtářů, tak jsem "chytil" jednu dlouhou jednotku, která skončí nejsíš s chybou.
Nihil est impossibile (Nic není nemožné)
- azor666
- Moderátor II

- Příspěvky: 985
- Registrován: stř led 18, 2006 9:40 pm
- Bydliště: Praha 20 let
- Kontaktovat uživatele:
Nevíte někdo jestli se připravuje aplykace pro linux (alespoň 32B).
I když na tomhle projektu nevidím moc pokrok ani ve win app. Tak pochybuju že připravují něco pro *NIX
I když na tomhle projektu nevidím moc pokrok ani ve win app. Tak pochybuju že připravují něco pro *NIX
Správu původního CNT si přivlasnil forest a podniká s ním na své soukromé doméně jinde.
CZ BOINC WIKI
CZ BOINC WIKI
