Stránka 7 z 8

Napsal: ned pro 31, 2006 2:07 pm
od Pepino65
Měl jsem zhruba 14 hodin pauzu ve stahování jednotek, měl jsem vypnutý comp. Jednotky které mi chodí teď tak jsou všechny validní.

Napsal: stř led 03, 2007 12:29 am
od Pepino65
Magor mi nekomunikuje se serverem a ani nejde najet na stránky uFluidsu, něco se nám pohnojilo. :shock:

Napsal: čtv led 04, 2007 12:31 pm
od Honza
Uz zase bezi - spodlo jim pripojeni k netu.
(mozna bude treba zavrit a znovu otevrit BOINC).

Napsal: pát led 12, 2007 11:04 pm
od Pepino65
Nedávno se PavolR ptal, jestli mají i ostatní hodně errorových wu. Já jsem věděl, že pokud spadnou widle, rozpočítané jednotky do erroru jdou. Nyní jsem zjistil, když počítám na jednou svém kompu i jiné projekty, které jsou "agresivnější", tak jsem měl spoustu invadiních jednotek. V práci na P4D 2.8 GHz mi s přehledem pozastavuje uFluidsové jednotky PrimeGrid a počítá se přednostně. Tak jsem ho musel pozastavit. Přestože mám nastaven interval pro změnu výpočtu mezi projekty 75 min., PrimeGrid mi shodil uFluids i po 3 minutách.

Zjistil jsem to dnes, tak se na to budu muset o víkendu nebo v pondělí podívat.

Tady je to vidět

Napsal: sob led 13, 2007 3:42 pm
od Bubak
2 Pepino65: Nejak te nechapu. Tvrdis, ze ti beh jedne BOINC app. na jednom core zpusobuje, padani druhe app na druhem core? Pokud tomu tak je, tak bych uvazoval o zmene OS.
Spis bych to ale videl na spatne napsanou tu aplikaci ktera ti pada a nedaval bych to do souvislosti se spustenim jine app.

PS: Ten svuj link si oprav. Mam smrtelnikum, ktery nejsou nalogovany pod tvym accountem je nanic.

Napsal: ned led 14, 2007 1:06 am
od Pepino65
Bubak píše:2 Pepino65: Nejak te nechapu. Tvrdis, ze ti beh jedne BOINC app. na jednom core zpusobuje, padani druhe app na druhem core? Pokud tomu tak je, tak bych uvazoval o zmene OS.
Spis bych to ale videl na spatne napsanou tu aplikaci ktera ti pada a nedaval bych to do souvislosti se spustenim jine app.

PS: Ten svuj link si oprav. Mam smrtelnikum, ktery nejsou nalogovany pod tvym accountem je nanic.
Link snad opraven.

Opravdu, jakmile se natáhly jednotky PrimeGridu, všiml jsem si, že v magorovi byly dočasně pozastaveny wu od uFluidsu a rozjely se na obou core wu od PG. Dočasně pozastavené wu uFluidsu jsou po novém nastartování označeny jako dopočítané, ale v erroru. Nevím proč. Něco budu mít někde blbě nastavený, ale kde? V mašině nebo v Global preference? Jsem z toho trubka.

Napsal: ned led 14, 2007 11:12 am
od Bubak
2 Pepino65: Nedostal ses do overcomited modu? Dalsi moznost proc se to stalo je, ze mas u PG nastaveny velky Resource share oproti uFluids. Takze srovnej resource share nebo sniz zasobu WU.

Ten link by mel vypadat nejak takhle nahled na vsechny tvy vysledky jde jen po zalogovani.

Napsal: ned led 14, 2007 1:24 pm
od Fran
Trošku bych se přidal...
Včera mi to uFluids ignorovalo víc než 12 hodin. Počítám Rossetu, Einsteina, Seti, Malarii a uFluids. Share je 20/20/20/20/20.
Pomohlo až když jsem dal na všem kromě uFluids nepřijímat další práci... Nicméně mi to nepadá jako Pepinovi.

EDIT:
Overcommited to nebylo a uFluids měli nejbližší deadline.

Napsal: ned led 14, 2007 9:25 pm
od Pepino65
Tak jsem to chvíli sledoval a snad jsem na to přišel, jednalo se o testovací jednotky Primegridu, které někdo nedopočítal a znovu byly rozeslány. Deadline na ních byl s bídou 12 hod. Začínaly se počítat přednostně na obou core. Pozastavily wu Primegridu s deadlinem 18. 1. a i wu od uFludsu.
Když byly dopočítány ty wu s krátkým deadlinem a spustily se wu, které byly pozastaveny, byla vždy wu od uFluidsu po pár vteřinách "dopočítána" a označena jako compute error.

Napsal: pon led 15, 2007 9:12 am
od Bubak
2 Pepino65: Jeste mi napada: Nemas nastaveno "Leave applications in memory while suspended?" na "no"? V tom pripade by mohlo pomoci to zmenit.

Napsal: úte led 23, 2007 10:10 am
od Honza
Po optimalizaci databaze uz uFluids zase jede a dava praci...

Napsal: stř led 24, 2007 9:54 pm
od Pepino65
Tak mám první sidedrop za sebou, wu skončila za téměř 1:27 hod. v erroru, původní předpoklad výpočtu dle BM byl 3:59 min. Nejhorší je, že se mi toho svinstava natahalo vzhledem k předpokladu hned 13 kousků. Další 2 wu už běží také řádně dlouho - 18 a 28 min. Vypadá to, že z dílny uFluidsu zase jednou vyšla pěkná sr...ka.

Jestli to tak půjde dál, tak to radši stopnu. V každém případě, když už jsem si to natáhl domů, tak je aspoň zkusím pozastavit, jestli to čirou náhodou nemá checkpointy.

Tady je výpis z magora u první wu:

BM wrote:
24.1.2007 17:27:34||Starting sidedrop1_13_1.0_0.002_3.79999999999996_0_0_0_1
24.1.2007 17:27:34|uFluids|Starting task sidedrop1_13_1.0_0.002_3.79999999999996_0_0_0_1 using evolver version 410

24.1.2007 18:53:09|uFluids|Computation for task sidedrop1_13_1.0_0.002_3.79999999999996_0_0_0_1 finished

24.1.2007 18:53:10|uFluids|Reason: Unrecoverable error for result sidedrop1_13_1.0_0.002_3.79999999999996_0_0_0_1 (<file_xfer_error> <file_name>sidedrop1_13_1.0_0.002_3.79999999999996_0_0_0_1_0</file_name> <error_code>-161</error_code></file_xfer_error>)

Postupně jsem pozastavoval 3 wu na cca 15sec. a střídal jsem je mezi sebou, běží dál jako když se nechumelí, tak jsem ještě zvědavý na výsledek, zkusím i restart, to jsou většinou všechny wu invadiní.
Tak po restartu nešly wu do erroru, ale výpočet byl opět na úplném začátku. Tak jsem 2 wu stopnul, na to nemám nervy. Ostatní nechám běhat a uvidíme.

Takže kdo spekuloval, že půjde o krátké wu, ať se rozmyslí.

Napsal: stř led 24, 2007 10:06 pm
od LiborA
Mám ztaženo celkem 15 jednotek, některé jsou svelmi dlouhým názvem (např. axi_linear_interface1_0.5_1_28_0_0_-0.279999999999999_1200_-0.279999999999999_0.001_0 ) jiné zase s krátkým názvem (např. axi_linear_interface1_0.5_1_28_0_0_-0.69_1200_-0.69_0.001_0). Co jsem zatím koukal na výsledky ostatních počtářů, tak jsem "chytil" jednu dlouhou jednotku, která skončí nejsíš s chybou.

Napsal: stř led 24, 2007 10:17 pm
od Pepino65
LiborA píše:Mám ztaženo celkem 15 jednotek, některé jsou svelmi dlouhým názvem (např. axi_linear_interface1_0.5_1_28_0_0_-0.279999999999999_1200_-0.279999999999999_0.001_0 ) jiné zase s krátkým názvem (např. axi_linear_interface1_0.5_1_28_0_0_-0.69_1200_-0.69_0.001_0). Co jsem zatím koukal na výsledky ostatních počtářů, tak jsem "chytil" jednu dlouhou jednotku, která skončí nejsíš s chybou.
axi wu (ať už linear nebo tube) jsou dneska víceměně stabilní, problémem jsou chybějící checkpointy. Wu axi po pozastavení nebo po restartu systému skončí v erroru, ale jsou naštěstí krátké. Zato ta novinka Sidedrop je zase nějaký zmetek, poslední mi hlásila, že čeká na uvolnění paměti. Povypínal jsem všechny možné aplikace (nakonec i antivir) a čekali jsme spolu dál a nic. Tak jsem to stopnul taky. Teď počítám další, 4 jsem abortnul já, 1 se pomršila i beze mě.

Napsal: stř led 24, 2007 10:33 pm
od azor666
Nevíte někdo jestli se připravuje aplykace pro linux (alespoň 32B).
I když na tomhle projektu nevidím moc pokrok ani ve win app. Tak pochybuju že připravují něco pro *NIX