Stránka 1 z 3

CPDN Database - problemy a co delat

Napsal: úte kvě 24, 2005 2:46 am
od 'bosh
2Stanley:

Currently your WU 3nlq_200192271_0 is crunching for Menkelebur
http://climateapps2.oucs.ox.ac.uk/cpdnb ... tid=815035

Also, your WU 2yge_300159358_0 is crunching for Winemaster
http://climateapps2.oucs.ox.ac.uk/cpdnb ... tid=853386

Unless you reset CPDN you will not get any credits for you or CNT...:)

Dufam ze to Honza vysvetly lepsie...:)

CPDN Hickup

Napsal: úte kvě 24, 2005 3:10 am
od 'bosh
2Joska:

Currently your WU 2oq7_300146626_0 is crunching for Gianni
http://climateapps2.oucs.ox.ac.uk/cpdnb ... tid=839799

Currently your WU 2wko_300156895_1 is crunching for Anonymous
http://climateapps2.oucs.ox.ac.uk/cpdnb ... tid=867393

Again, to fix this reset CPDN so that the totals will count towards CNT...:)

Well, perhaps you all should check if you are the owner of your WUs...

Napsal: úte kvě 24, 2005 7:19 am
od 'bosh
Taky Marshall a Jan Lomsky pocitaji...for somebody else...:)

Napsal: úte kvě 24, 2005 8:11 am
od Honza
Diky za pripomenuti a pokusim se to vysvetlit a dohnat.

O problemech databaze jsem informaval pred 2 tydny zde.

Popis problemu:
V podstate problem zacal tim, ze 120GB database zaplnila cely disk a nebylo kam zapisovat dalsi zaznamy. Uzivatel to na prvni pohled mohl poznat podle toho, ze se mu nezaznamenavali trickle.
Aby toho nebylo malo, objevila se chyba ve scheduleru, kdy misto vraceni chybove hlasky doslo k tomu, ze byl model omylem zaslan k vypoctu jeste dalsimu uzivateli, resp hostu.
Pokud pocitaji stejny model dve masiny, jedna momentalne nedostane kredit; teoreticky to lze v budoucnu opravit a kredit na zaklade odesilanych tricklu dopocitat. Dulezite je, ze pro vedecke ucely jsou podstatne uploadovane vysledky. Jenze zatim nevime, co na to upload server - druhy upload muze prepsat prvni, byt odmitnut... Pokud budou duplicitne, lze to pouzit i jako kontrolu konzistence vysledku. Tedy chybu lze i konstruktivne vyuzit.

Celou kauzu jsem v te dobe dal moc nerozvadel a nespekuloval, protoze byl Tolu na dovolene a Carl na dalku udelal s databazi co slo.

Zjistit, zda-li se vas problem tyka:
Problem se tyka potencionalne kazdeho ucastnika CPDN, ale je treba to overit.
V podstate jde o to porovnat dva seznamy modelu:
a) modely, ktere mate pod svym accountem v ramci kazdeho pocitace a
b) modely, ktere mate na pocitacit ve Work tab (velmi dobrou pomuckou je BoincView.
S nejvyssi pravdepodobnosti se jedna pouze o modely pridelene od pocatu Dubna a behem Kvetna.

Pripad I.
Pokud najdete na na svych masina (seznam b) modely, ktere nejsou na vasem uctu (seznam a), napiste hostID dane masiny, jmeno modelu (takove to 2uc9_300153972) a pripadne jak daleko mate model rozpocitany. Pokud uz probehl trickle, objevi se i na vasem seznamu tricklu v accountu a muzete tedy napsat i resultID. ResultID pomuze ke snadnemu zjisteni, kteremu hostu byl jeste bysledek zaslan.

Pripad II.
Pokud se na seznamu a objevi model, ktery se nenachazi ve vasem pocitaci (je na seznamu a, ale ne b), tak si tim nelamte hlavu. Pripadne reportujte stav, kdy u dane WU byla udelana nejaka prace, ale ne z vaseho pocitace.

Co delat:
Pripad I - pokud mate z daneho modelu spocitano jen par hodin, muzete dat abort daneho modelu. Pokud uz mate rozpocitano vice, dejte prozatim suspend, nez se problem mozna vyresi na strane serveru.

Davat reset bych nedoporucoval - ztratite nejen rozpocitanou praci CPDN, ale i pripadne vsechny dalsi modely, ktere byly spravne prideleny k pocitani.

Moje zkusenost:
Pokud jsem to neprehledl, tak moje tri masiny pocitajici CPDN nemely zadny spatne prideleny model. Asi mi take pomohlo dat "No more work" nebo disable Network access.
Nejstarsi spatne prideleny model je nekdy zacatkem Dubna, takze vice nazpatek neni treba hledat.

Update:
bude nasledovat, az nastuduji aktualni stav.
OK, nejlepsi je asi odkaz na soucasny thread na CPDN/BOINC foru zde. Obsahuje i reakci a vysvetleni kolegy moderatora (crandles) na 'boshuv navrh na prosty reset projektu. "The last suggestion is very messy...".

Kdyz bude neco nejasne ci zmatene, klidne se ptejte.

Napsal: úte kvě 24, 2005 8:50 am
od Honza
OK, 'bosh to trochu dovysvetlil: dal reset v momente, kdy zjistil, ze ma spatne prideleny model a zadny dalsi rozpocitany ci ve fronte nemel.. a pouzival BOINC 4.19. U vyssi verze stacilo dat "abort WU" a stahnout 10kb noveho modelu, takto bylo treba tahat xx MB. Nouzove reseni starsiho BOINC, ktere vsak v tomto pripade lze uplatnit.
U P4/HT kde bezi vice modelu najednout by to asi byl problem.

Napsal: sob kvě 28, 2005 6:52 pm
od ChluER
Tak jsem pravě zjistil,že mi přibývají kredity za trickly co jsem nespocital ( počítá na mě nějaký švéd ).Co s tim?Mam to nechat být a stahnout si jinou jednotku?Nebo ji mam počítat taky?jak to bude se stejnými trickly co odešlu později než on? :twisted:Poraďte,pls.Dík.

Napsal: sob kvě 28, 2005 7:50 pm
od Honza
Ve tvem profilu vidim trickle pouze za dva vysledky.
Ani podle seznamu masin neni videt, ze by dane WUs byly duplicitne prideleny jeste nekomu jinemu.
Pokud dostavas trickle za WU, kterou nepocitas a pritom ji nemas v seznamu na accountu, tak s tim asi moc neudelas; musis pockat, az to na serveru spravy (a prepocitaji kredit).

Mozna je moc velke vedro a blbe to chapu - napis o krety hostid a resultid nebo workunitid se jedna. Proste jak jsem psal v navodu, at nemusime delat detektivy.

Napsal: sob kvě 28, 2005 11:00 pm
od ChluER
Honza píše:Ve tvem profilu vidim trickle pouze za dva vysledky.
Ani podle seznamu masin neni videt, ze by dane WUs byly duplicitne prideleny jeste nekomu jinemu.
Pokud dostavas trickle za WU, kterou nepocitas a pritom ji nemas v seznamu na accountu, tak s tim asi moc neudelas; musis pockat, az to na serveru spravy (a prepocitaji kredit).

Mozna je moc velke vedro a blbe to chapu - napis o krety hostid a resultid nebo workunitid se jedna. Proste jak jsem psal v navodu, at nemusime delat detektivy.

Ja jsem tu jednotku počítal ( když neběžel Protein ) a mam jí stále v BC.

Promiň,tady to je: Jedna se o WU 566971,muj HOSTID je 172644 RESULTID je 848727.

Tady to je rovnou ( HOSTID 170592 je muj komp sloučený do 172644 ) :

http://climateapps2.oucs.ox.ac.uk/cpdnb ... tid=848727


Teď mi ta jednotka hodila computation error :x .
Jo a ještě koukam,že se mi ta jednotka po computation error přesunula pod HOSTID 172912.Kredit za tuto Wu mi zustal přidělený u 172644,ale jednotka je pod 172912.Nechápu,detach ani attach to project jsem nedal..

Napsal: ned kvě 29, 2005 8:48 am
od Honza
Se mi zda, ze v tom profilu mas nektere masiny duplicitne...jako by se ti nejak vzdy znovu registrovaly.
No estli ja WU ted chcipla, tak uz s tim nic neudelame :?

Napsal: ned kvě 29, 2005 11:17 am
od ChluER
Honza píše:Se mi zda, ze v tom profilu mas nektere masiny duplicitne...jako by se ti nejak vzdy znovu registrovaly.
No estli ja WU ted chcipla, tak uz s tim nic neudelame :?
Jen jednu,a to z duvodu,ze jsem chtel prenest WU na jinej komp...A pak se tam vytvořila ještě jedna duplicita včera večer,a to jsem nepochopil proč...Wu chcipla,už se stahla nova.

Napsal: stř čer 01, 2005 10:02 am
od zod
Dneska jsem dopocital dalsi WU CPDN a chtel jsem prejit z verze 4.19 na 4.43.
PO prihlaseni k projektu to vypada ze problmy s databazi jsou asi dosti vazne. Nelze pridavat dalsi pocitace - bud je databaze plna nebo je pridavani dalsich PC pozastaveno.

1.6.2005 10:01:34|climateprediction.net|Requesting 8640.00 seconds of work
1.6.2005 10:01:34|climateprediction.net|Sending scheduler request to http://climateapps2.oucs.ox.ac.uk/cpdnboinc_cgi/cgi
1.6.2005 10:01:35|climateprediction.net|Scheduler request to http://climateapps2.oucs.ox.ac.uk/cpdnboinc_cgi/cgi succeeded
1.6.2005 10:01:35|climateprediction.net|Message from server: Couldn't create host record in database
1.6.2005 10:01:35|climateprediction.net|No work from project
1.6.2005 10:01:35|climateprediction.net|Deferring communication with project for 5 minutes and 5 seconds


Taky se mi opet potvrdilo ze od verze 4.35 je benchmark asi o tretinu nizsi :(

Napsal: stř čer 01, 2005 10:25 am
od Honza
zode, prave koukam, ze nejsi sam.
Nejak na to zkusim upozornit - mozna plna database, mozna s tim prave Tolu neco dela.
EDIT: Uz mne to prudi, pisu do Oxfordu. Vubec jsem dneska vypruzenej...tak radsi na forum nebudu sahat...

Přihlášení

Napsal: čtv čer 02, 2005 7:03 pm
od JAKU
Nemohu vytvořit account, vyhazuje mě to chybku:
Fatal error: Call to undefined function: is_valid_email_addr() in /websites/boinc/projects/cpdnboinc/html/user/create_account_action.php on line 52

Zadaný E-mail jsem kontroloval několikrát, prostě normálka.

Netušíte někdo v čem může být problém ??

Díky Jarda

Napsal: čtv čer 02, 2005 7:14 pm
od Honza
@ JAKU: problem jsem presunul kam patri - jedna se o CPDN predpokladam.
Myslim, ze problem souvisi s problemy CPDN database, na ktere se momentalne pracuje.
Pres par minutami byl opraven scheduler, toho muze byt jeste dalsi moucha.
Vyckal bycha zkusil si ucet vytvorit pozdeji...

Napsal: čtv čer 02, 2005 7:25 pm
od JAKU
Díky, je to na zlost, vždycky zkoumám než se zeptám, a jen se zeptám, tak o pár screenů dále objevím náznak odpovědi, nebo odpověď samu ;)