Scheduler interval

Obecná diskuse týkající se systému BOINC

Moderátoři: zdespi, Moderátoři

Odpovědět
Uživatelský avatar
Bubak
BOINC Guru
BOINC Guru
Příspěvky: 1029
Registrován: pát pro 09, 2005 8:13 am

Scheduler interval

Příspěvek od Bubak »

Higgi píše:....
Jenom fakt nechápu, proč boinc odkládá komunikaci o tejden :!:. Kdyby o 24 hodin, tak jo, ale tohle je fakt moc.
Souhlas. Mohlo by to byt nastavitelny. Treba to casem pribyde do dalsi verze BS core jako nastavitelny parametr. Nemyslim, ze by to znamenalo moc velkej napor na scheduler kdyby se ho snazil boinc core kontaktovat treba 3x denne. Uvidime, jestli se vubec najde nekdo kdo se vyvoje BS core ujme.
vejpuste
BOINC Guru
BOINC Guru
Příspěvky: 954
Registrován: čtv čer 16, 2005 11:00 am
Bydliště: Praha Zbraslav
Kontaktovat uživatele:

Re: E@H jede

Příspěvek od vejpuste »

Higgi píše:Potvrzuji, o5 běží. Škoda, že se ke 3 kompům, co mám mimo, dostanu až ve středu :(. ale aspoň na jeden jsem se dnes dostal a dal jsem tam RCN, tak zas prospěje jinde :wink:.
Jsme sice dost mimo, ale to nemas k tem pocitacum vzdaleny pristup?
Ja jsem si pro ucebny udelal maly batak, ktery se spousti schedulerem ve woknech. Ten projde vsechny pocitace a da jim update projektu. Co si nastavis, to udela. Nemusis mit na ten pocitac ani pristup a bude to delat sam porad.
Libor
Honza
 
Příspěvky: 4322
Registrován: úte lis 30, 2004 10:50 am

Příspěvek od Honza »

Libore - jednoduche a funkcni :wink:
Bubak - ono by take slo, aby scheduller projektu urcoval, za jak dlouho jej muze masina kontaktovat v pripade vypadku...proste takovy servnicni rezim (pr beznem provozu to funguje a kazdy projekt ma tento interval jiny)
Uživatelský avatar
Bubak
BOINC Guru
BOINC Guru
Příspěvky: 1029
Registrován: pát pro 09, 2005 8:13 am

Příspěvek od Bubak »

Honza píše:Bubak - ono by take slo, aby scheduller projektu urcoval, za jak dlouho jej muze masina kontaktovat v pripade vypadku...proste takovy servnicni rezim (pr beznem provozu to funguje a kazdy projekt ma tento interval jiny)
To ale popisujes nejakou planovanou feature ne? Koukal jsem se do sched_reply*.xml asi 10 projektu a krom tagu <request_delay> jsem tam nic jineho nenasel. Ale to je pri normalnim provozu a je to min. cas za ktery muze core o5 kontaktovat scheduler. To co by chtel Higgi i ja je presne opacny parametr vymezujici opacnou mez toho intervalu. A v tom pripade by bylo asi lepsi, kdyby byl uzivatelsky nastavitelny a scheduler mohl pripadbne jen urcit min. interval pokusu o kontakt v pripade vypadku.
Omlouvam se za OT. Asi by jsme se meli presunout do BS threadu.
Honza
 
Příspěvky: 4322
Registrován: úte lis 30, 2004 10:50 am

Příspěvek od Honza »

Souhlasim s oddelenim tematu od puvodniho E@H aktualni stav.

Chtel jsem rici, ze ten request_delay jde pouzit..aby mel projekt urcenu hodnotu pro bezny provoz (kuprikladu 50 vterin) a jinak nastavnou hodnotu pro pripad vypadku databaze, kdyz se odporoucej disky, projekt je bez prace a podobne pripady, kdy je jasne, ze je zbytecne scheduler kontaktovat drive nez za hodinu.

Reseni, ktere navrhujes - jestli spravne chapu tak min a max intevral je zdanlive elegantnejsi. Asi vyzaduje zasahy do vsech boinc core i serveru vsech projektu, coz je vyvojarum pochopitelne chtit nebude a proto se nejdriv hledaji cesty, jak vystacit s tim, co je k dispozici nez zavadet novinky vyzadujici upgrade vseho mozneho.
Nebo jinak - nevim, jestli je dobre mit moznost overwrite na sched_replay.
Tak nejak mam pocit, ze je lepsi, aby si toto ridit server, protoze vi nejlepe, co je dobre - kolik hostu se na nej obraci, kolik ma max kapacitu, kolik ma prace nebo kdy bude dalsi atp...tohle vsechno boinc core nevi, pokud mu to scheduler nerekne.

Tak jako tak by to fungovalo pouze v pripade, ze scheduler pobezi. Kdyz je project off-line (spadne linka, podela se firewall, spadne sql nebo web server atp.), tak si musi vystacit boinc core se svou 'inteligenci'.

Osobne bych se klonil k max hodnote kontaktu na hodnotu odpovidajici stavu, kdy dojde prace (tj. work cache). Myslim, ze takova hodnota ma urcitou logiku.

btw, nereseruje se ten interval v pripade resetu projektu?
Uživatelský avatar
Bubak
BOINC Guru
BOINC Guru
Příspěvky: 1029
Registrován: pát pro 09, 2005 8:13 am

Příspěvek od Bubak »

2 Honza: Je to nejaky neprehledny (a kdyz k tomu pricteme mou bidnou vyjadrovaci schopnost....). Dal se bavme jen o tom, co by se melo dit v pripade nedostupnosti scheduleru a jak toho dosahnout.
Soucasny stav: Pokud je scheduler nedostupny, tak se odklada komunikace po kazdem pokusu o delsi interval, az naroste na desitky dni. Pokud scheduler bezi, tak neni problem, at si klidne urcuje min. interval pro dalsi request.

Moje idea: Power user by si mohl editaci souboru nastavit kam az muze ten cas odkladu narust. Predstavoval bych si to tak, ze nepujde nastavit min nez 8 hodin. To by nemelo delat problemy provozovatelum jednotlivych projektu. Pokud je scheduler mimo provoz, tak to ani nepoznaji a postupny najezd vsech PC behem 8 hodin po vypadku by mohli zvladnout. Pripadne pokud by se v dalsi verzi BOINCu pridal dalsi tag do komunikace scheduler-> core (napr. <offline_rerequest_min> - urcite ti napadne lepsi nazev) ktery by prepisoval tech mejch navrhovanejch 8 hodin dle prani provozovatele konkretniho projektu tim lepe. Mam za to, ze starsi verze core ignoruji tagy, ktere neznaji, takze s tim by nemel byt problem.

V prvni fazi bych to spis videl jako patch do nejake neoficialni modifikace BOINC core (cti BS, ostatni jsou asi mrtvy). Takze, mas nejake aktualni info jestli uz sehnali nekoho kdo bude pokracovat ve vyvoji?
Honza
 
Příspěvky: 4322
Registrován: úte lis 30, 2004 10:50 am

Příspěvek od Honza »

> co by se melo dit v pripade nedostupnosti scheduleru a jak toho dosahnout
Jednoduse bych zvolil work cache jako max interval.
Kdyz ma nekdo cache na 10 dni, mel by BOINC poznat opetovnou funkcnost serveru drive - pri uploadu souboru.

> V prvni fazi bych to spis videl jako patch do nejake neoficialni modifikace BOINC core (cti BS, ostatni jsou asi mrtvy). Takze, mas nejake aktualni info jestli uz sehnali nekoho kdo bude pokracovat ve vyvoji?
Bohuzel.
Uživatelský avatar
Bubak
BOINC Guru
BOINC Guru
Příspěvky: 1029
Registrován: pát pro 09, 2005 8:13 am

Příspěvek od Bubak »

Honza píše:> co by se melo dit v pripade nedostupnosti scheduleru a jak toho dosahnout
Jednoduse bych zvolil work cache jako max interval.
Kdyz ma nekdo cache na 10 dni, mel by BOINC poznat opetovnou funkcnost serveru drive - pri uploadu souboru.
Vis to jiste? Ja tedy ne. A rekl bych ze pokud je odlozena komunikace se schedulerem, tak core ani neuploaduje soubory.
Co v pripade ze nekdo pocita CPDN?
Honza
 
Příspěvky: 4322
Registrován: úte lis 30, 2004 10:50 am

Příspěvek od Honza »

Jiste to nevim.
Ale usuzuji z toho, ze upload ci download server muze byt (a take byva) uplne jinde nez scheduler - ze se proste jedna o jiny server s jinou konektivitou (trebas zminovane CPDN, ale i Einstein).
Usuzuji z jednani scheduleru a uploadu pri pocitani Proteins - tam jsou uploady velke, navic mi u masiny hrozi "reach daily quota". Pri zapnutem FUP a stahovani obcas neprojde upload nebo download, reach daily quota odlozi komunikaci na dalsi den (spravne), ale uploady se snazi dal (doufam). Jsou uploadovany, ale zustavaji nereportovane, pokud si dobre vzpominam.

S pripade CPDN je scheduler kontaktovan kvuli tricklum, obcas se do toho primota i upload, takze tam pozadavky na komunikaci obcas take jsou. No a kdyby ne - zde potize z prodleni nehrozi...pokud nedojde prace.
Scheduler v novejsich verzich ale dava docela pozor na vybalancovani, aby masina praci mela a pritom nebyla overcommited.

Tedy - neni-li spojeni mezi funkcnosti upload serveru a scheduleru projektu, muze byt triggerem komunikace bud cache size nebo udalost, ze bude s praci na suchu (finished jednotky se do cache nezapocitavaji).

Pak jsou zde jeste moznosti slozitejsich obezlicek.
Napriklad zmenim profil na projektu A a masina 1 jej aktualizuje i na projektu B. Masina 2 ma problem kontaktovat projekt B, ale mohla by v ramci budouci podpory bitorrentu kontaktoval masinu A. Pripadne to muze delat lokalne BS ci BV nebo se to muze dozvedet z AMS (BAM).
O lokalni komunikaci mezi hosty se da uvazovat - at jiz z duvodu setreni trafiku na download nebo scheduleru serveru. Zde by se asi nejaky min_interval (pak staci pouze lokalni synchronizace) a max_interval (expirace profilu) hodil.
Honza
 
Příspěvky: 4322
Registrován: úte lis 30, 2004 10:50 am

Příspěvek od Honza »

Tak jsem udelal takovy pokus - vcera vecer jsem si na jedne masine zakazal pristup na net a dneska po obede zakazal pristup i dalsim 3 masinam. Do te doby se mi nafrontovalo cca 150 mega na upload. Zapnul jsem si FUP, tedy 256/256 ci kolik a k tomu jeste pustil torrent - v tomto stavu mi BOINC nestiha z masin uploadovat...

Doufal jsem take, ze zacne na me masine doplnovat zasobu prace a vycerpam daily quota (nejlepe udelat fake na 1 CPU na dual-core...jenze se tam vmestnal LHC, ktery ma zrovna praci (tam navic diky letitemu bugu generovani stale nove masiny pri kazdem kontaktu daily quota nenastane). Proste jsem si to ne dostatecne osetril, takze jsem se nedostal na nejaky vyssi communitacion deffered.

Presto mi i pri kratkych defferals pripada, ze upload a download bezi nezavisle na stavu scheduleru...a pripadne skonci chybou a bude postupne naskakovat retry interval.
No asi bude lepsi na podobne testy nejaky mene spolehlivy projekt - treba SETI s pravidelnymi vypadky se zda byt dobrou pomuckou.

Alespon jsem si overil, ze BS sice dava prednost uploadu, ale obcas pusti i download, aby nedoslo k tomu, ze nebude prace kdyz nestiha uploadovat.
Honza
 
Příspěvky: 4322
Registrován: úte lis 30, 2004 10:50 am

Příspěvek od Honza »

Hmm, trochu k tematu BOINC client scheduling
Uživatelský avatar
Pav Lucistnik
Mírně pokročilý
Mírně pokročilý
Příspěvky: 144
Registrován: ned črc 16, 2006 1:02 pm
Bydliště: Praha
Kontaktovat uživatele:

Příspěvek od Pav Lucistnik »

Moje pozorovani z behu Einstein@home na jednou denne pripojovanem GPRS:

- file transfers jsou nezavisle na komunikaci se schedulerem
- prenosy jsou provadeny presne v poradi, v jakem "vznikly". tj pokud mas frontu na upload, v ni 40 resultu, pozadas o novou praci a dostanes jeden soubor na download, tak nejdriv projde vsech 40 uploadu a az potom download, bez ohledu na to, ze uz klientu dosla veskera prace
- kdyz prenos selze, zaradi se retry opet na konec fronty
Uživatelský avatar
zdespi
Moderátor II
Moderátor II
Příspěvky: 366
Registrován: ned úno 26, 2006 3:59 pm
Bydliště: Matice

Příspěvek od zdespi »

Počítání není důležité, důležitý je pouze Sulov :twisted:
Honza
 
Příspěvky: 4322
Registrován: úte lis 30, 2004 10:50 am

Příspěvek od Honza »

Pav, s prvnim bodem plne souhlasim, treti souhlasim.
S tim druhym bodem si nejsem jist...budu to muset jeste overit. (zakazu komunikaci, nahodim FUP - cimz se dostatnu na uroven GPRS a uvidime). Take je mozne, ze ten rozdil je dan BS... :?
Honza
 
Příspěvky: 4322
Registrován: úte lis 30, 2004 10:50 am

Příspěvek od Honza »

Stale se mi zda, ze druhy bod plati za predpokladu, ze pri upload nedojde k chybam.

Stala se mi vsak jina kuriozita - nahodil jsem po delsi dobe Leiden...chtelo se mi stahnout cca 30 tasku, ale zrovna projekt vychcipnul. Takze zustaly v downloading...retry atp., ale work tab prazdny.
V takovem pripade backup project nezachrani, protoze o praci nezada.

Stejne tak by se asi delo, pokud mate nastavenu dostupnost site jen na nejake hodiny. Na odesilani se nafrontuji desitky tasku...a pokud se to pri uploadu zabrzdi, scheduler si sice rekne o dalsi praci z non-backup projektu, ale dostane ji jenom, pokud se upload zadari (nebo pri nem dojde k chybe a pritom download pobezi?).
Odpovědět