Statistika a metodologie

Smetiště aneb propadliště dějin pro neaktuální příspěvky. Po pár dnech bude ručně smazáno, pokud nebudou hlasy pro zachovaní

Moderátoři: zdespi, Moderátoři

Zamčeno
Honza
 
Příspěvky: 4322
Registrován: úte lis 30, 2004 10:50 am

Statistika a metodologie

Příspěvek od Honza »

EDIT: Tento thread byl odstrizen od SETI - Optimalizovany klient
forest píše:Je to zajímavé, ale ta nová aplikace SSE2 dìlá na mém Prescottu 2,66 s 256MB 266Mhz pamìtí DDR1 o 2 minuty lepší èasy než SSE3, tady nyní 52minut/WU.
To je odchylka v ramci mereni ne? Preci delka vypoctu WUs se bezne lisi o vic jak nejake 2.5%, nez ktere ti to dava.
ADM X2 3800+ se pohybuje kolem 3000 - 3900 sekund / WU pri pocitani dvou najednou...
Naposledy upravil(a) Honza dne stř lis 02, 2005 12:49 pm, celkem upraveno 1 x.
Uživatelský avatar
forest
Příspěvky: 2573
Registrován: pát srp 27, 2004 12:50 pm
Bydliště: Újezd u Brna 31 let
Kontaktovat uživatele:

Příspěvek od forest »

S každou aplikací jsem udělal 10WU, tek si myslím že pro porovnání to stačí.
Beru vždy ten nejčastější čas, což bývá skoro stejný u 7 z 10 WU.
Toto je původní fórum Czech National Teamu, které se v listopadu 2006 přesunulo na tuto novou adresu.
Miras
Expert
Expert
Příspěvky: 426
Registrován: čtv kvě 12, 2005 2:49 pm

Příspěvek od Miras »

forest píše:S každou aplikací jsem udělal 10WU, tek si myslím že pro porovnání to stačí.
Beru vždy ten nejčastější čas, což bývá skoro stejný u 7 z 10 WU.
Kdyby mělo bejt srovnání objektivní, musel bys spočítat identickou jednotku. Taky si spíš myslím že při tvým způsobu měření se jedná o odchylku v měření. Nikdy nevíš co ti zrovna seti pošle...
Všichni tady vaříme z vody, jediný pořádný srovnání provedl zatím JVc. Zrychlení o 50% je identifikovatelný poměrně snadno, ale tvrdit že tohle je o minutu rychlejší než něco jinýho, je bez přesnýho měření tvrzení poměrně odvážný.
Honza
 
Příspěvky: 4322
Registrován: úte lis 30, 2004 10:50 am

Příspěvek od Honza »

@ Miras - ano. Lze take argumentovat beznymi statistikymi metodami. Napriklad srovnani prumeru dvou skupin o deseti clenech pri T-testu s 95% hladinou vyznamnosti by se nejspis ukazalo jako nevyznamne - vzlastne v momente vetsiho rozptylu casu jednotek.
Pri pocitani prumeru bych se snazil odcistit extremy - alespon horni a dolni decil (coz v pripade 10 mereni predstavuje pouze minimum a maximum), takze spise o horni a dolni kvartil; zbyde tedy polovina kolem prumeru z ktere ma smysl delat prumer.
No nic, to jenom takova metodologicka odbocka :wink:
Uživatelský avatar
FordPrefect
BOINC Guru
BOINC Guru
Příspěvky: 1266
Registrován: stř pro 15, 2004 12:02 pm
Bydliště: Zlate Mesto
Kontaktovat uživatele:

Příspěvek od FordPrefect »

Nas profesor v Analyze dat mel nekolik prupovidek. Tahle se mi libila nejvice.

Jake jsou tri stupne lzi?

3. lez
2. jeste vetsi lez
1. statistika
Honza
 
Příspěvky: 4322
Registrován: úte lis 30, 2004 10:50 am

Příspěvek od Honza »

No, jak bych ty stupne lzi obsadil jinak a na jedne by velmi pravdepodobne (vidite tu statistickou hantyrku?) byl jeden cowboy z Texasu, co je ted napraskach kvuli alkoholismu atp.

Zpet k veci: statistika je dost propracovana veda...veda o neurcitosti.
Jak reprezentativne zobrazit udaje mensim poctem cisel je dobry cil - a nemusi jit pouze o faktorovou analyzu ci podobne.

Chtel jsem v podstate jenom rici, ze udaj o prumeru s malym poctem mereni bez udani rozplytu nemusi byt vypovidajici.

Kdyz vezmu 10 vysledku z meho AMD X2, mam prumer 3642.95 a smerodatnou odchylku 434.6
Kdyz vezmu 20 vysledku z meho Pentia D, mam prumer 2236.89 a smerodatnou odchylku 417.66 (kdyz odstranim jednu WU o 136.2 sekundach, jinak by byla odchylka pres 621).

Je jasne, ze Pentium D pocita rychleji, ale je take jasne, ze casy jednotlivych WU litaji vice nez u AMDcka - prave kvuli vyssimu poctu mereni a presto stale vysokemu rozptylu (smerodatne odchylce); vsechny WU jsou 'Success' cimz by statistik rekl, ze nejsou chybejici hodnoty a data jsou vycistena.
Konkretne: AMD ma hodnoty mezi 3029 az 4121; tedy casi se lisi maximalne o 36%. Naproti tomu Pentium D ma hodnoty od 1625 (kdyz nepocitam jednu succes se 136 sec) do 2612, coz dela 61% rozdilu.

Zaver pro mne je, ze ani 10 - a v tomto pripade ani 20 - WU neni dostatecne k tomu, aby byla odchylka 2 nebo 3% povazovana za statisticky vyznamnou :idea:
Vid-li to nekdo jinak, nahodim asi SPSS a ukazi pomoci T-testu na srovnani dvou nahodne vybranych skupin vysledku (kazdy 10 nahodne vybranych WUs), ze nejspis rozdil ani 5 a mozna ani 10% nebude statisticky vyznamny - prave vzhledem k rozmanitosti vyslednych casu.

Pokud ma forest vysledne casy velmi stabilni (napriklad se neodchyluji o vice jak 1%), tak to by byla jina. Jenze z jeho uctu to na webu nelze zjistit a tak vychazim se svych pozorovani, ktera jsou dost odlisna a ukazuji spise zdrzenlivost pri posuzovani zlepseni casu...
Uživatelský avatar
Duro Kotulic Bunta
Banánová odměna
Banánová odměna
Příspěvky: 702
Registrován: sob úno 26, 2005 4:25 pm
Bydliště: Stupava, SK
Kontaktovat uživatele:

Příspěvek od Duro Kotulic Bunta »

Ja len malu poznamku: som rad, ze Honza spomenul, ze statiatika je prepracovana veda. Vela ludi si mysli, ze statistika konci niekde pri predvolebnych preferenciach, ale je to naozaj depp science ktora ma velku hodnotu ak je pouzivana vhodne a korektne.

Castokrat ma obchadzaju mrakoty ked vidim co ludia robia a prezentuju ako statisticky signifikantne vysledky. NApr. rozne medicinske a psychologicke vyskumy. Uff, nebudem rozoberat, lebo je to off topic, len ako malu poznamku by som este uviedol, ze zaklad kvantovej mechaniky je statisticka pravdepodobnost. Svet je v jadre len statistika.
Podpis
Is it by logic that we prove, but by intuition that we discover. [J. H. Poincaré, mathematician (1854-1912)]
Uživatelský avatar
FordPrefect
BOINC Guru
BOINC Guru
Příspěvky: 1266
Registrován: stř pro 15, 2004 12:02 pm
Bydliště: Zlate Mesto
Kontaktovat uživatele:

Příspěvek od FordPrefect »

Obvykly nazor lidi na statistiku vetsinou konci u prumeru. Nekteri snad i slyseli o vazenem prumeru. Priznam se, ze i ja po 6ti semestrech statistiky a analyzy dat se kroutim jak had, kdyz slysim slova jako kvantil nebo t-test :D
Zamčeno