Statistika a metodologie

Příspěvek od **Honza** » stř lis 02, 2005 9:26 am

EDIT: Tento thread byl odstrizen od SETI - Optimalizovany klient

forest píše:Je to zajímavé, ale ta nová aplikace SSE2 dìlá na mém Prescottu 2,66 s 256MB 266Mhz pamìtí DDR1 o 2 minuty lepší èasy než SSE3, tady nyní 52minut/WU.

To je odchylka v ramci mereni ne? Preci delka vypoctu WUs se bezne lisi o vic jak nejake 2.5%, nez ktere ti to dava.
ADM X2 3800+ se pohybuje kolem 3000 - 3900 sekund / WU pri pocitani dvou najednou...

forest · Příspěvek od **forest** » stř lis 02, 2005 10:39 am

S každou aplikací jsem udělal 10WU, tek si myslím že pro porovnání to stačí.
Beru vždy ten nejčastější čas, což bývá skoro stejný u 7 z 10 WU.

Miras · Příspěvek od **Miras** » stř lis 02, 2005 10:57 am

forest píše:S každou aplikací jsem udělal 10WU, tek si myslím že pro porovnání to stačí.
Beru vždy ten nejčastější čas, což bývá skoro stejný u 7 z 10 WU.

Kdyby mělo bejt srovnání objektivní, musel bys spočítat identickou jednotku. Taky si spíš myslím že při tvým způsobu měření se jedná o odchylku v měření. Nikdy nevíš co ti zrovna seti pošle...
Všichni tady vaříme z vody, jediný pořádný srovnání provedl zatím JVc. Zrychlení o 50% je identifikovatelný poměrně snadno, ale tvrdit že tohle je o minutu rychlejší než něco jinýho, je bez přesnýho měření tvrzení poměrně odvážný.

Příspěvek od **Honza** » stř lis 02, 2005 11:09 am

@ Miras - ano. Lze take argumentovat beznymi statistikymi metodami. Napriklad srovnani prumeru dvou skupin o deseti clenech pri T-testu s 95% hladinou vyznamnosti by se nejspis ukazalo jako nevyznamne - vzlastne v momente vetsiho rozptylu casu jednotek.
Pri pocitani prumeru bych se snazil odcistit extremy - alespon horni a dolni decil (coz v pripade 10 mereni predstavuje pouze minimum a maximum), takze spise o horni a dolni kvartil; zbyde tedy polovina kolem prumeru z ktere ma smysl delat prumer.
No nic, to jenom takova metodologicka odbocka

FordPrefect · stř lis 02, 2005 11:58 am

Nas profesor v Analyze dat mel nekolik prupovidek. Tahle se mi libila nejvice.

Jake jsou tri stupne lzi?

3. lez
2. jeste vetsi lez
1. statistika

Příspěvek od **Honza** » stř lis 02, 2005 12:37 pm

No, jak bych ty stupne lzi obsadil jinak a na jedne by velmi pravdepodobne (vidite tu statistickou hantyrku?) byl jeden cowboy z Texasu, co je ted napraskach kvuli alkoholismu atp.

Zpet k veci: statistika je dost propracovana veda...veda o neurcitosti.
Jak reprezentativne zobrazit udaje mensim poctem cisel je dobry cil - a nemusi jit pouze o faktorovou analyzu ci podobne.

Chtel jsem v podstate jenom rici, ze udaj o prumeru s malym poctem mereni bez udani rozplytu nemusi byt vypovidajici.

Kdyz vezmu 10 vysledku z meho AMD X2, mam prumer 3642.95 a smerodatnou odchylku 434.6
Kdyz vezmu 20 vysledku z meho Pentia D, mam prumer 2236.89 a smerodatnou odchylku 417.66 (kdyz odstranim jednu WU o 136.2 sekundach, jinak by byla odchylka pres 621).

Je jasne, ze Pentium D pocita rychleji, ale je take jasne, ze casy jednotlivych WU litaji vice nez u AMDcka - prave kvuli vyssimu poctu mereni a presto stale vysokemu rozptylu (smerodatne odchylce); vsechny WU jsou 'Success' cimz by statistik rekl, ze nejsou chybejici hodnoty a data jsou vycistena.
Konkretne: AMD ma hodnoty mezi 3029 az 4121; tedy casi se lisi maximalne o 36%. Naproti tomu Pentium D ma hodnoty od 1625 (kdyz nepocitam jednu succes se 136 sec) do 2612, coz dela 61% rozdilu.

Zaver pro mne je, ze ani 10 - a v tomto pripade ani 20 - WU neni dostatecne k tomu, aby byla odchylka 2 nebo 3% povazovana za statisticky vyznamnou

Vid-li to nekdo jinak, nahodim asi SPSS a ukazi pomoci T-testu na srovnani dvou nahodne vybranych skupin vysledku (kazdy 10 nahodne vybranych WUs), ze nejspis rozdil ani 5 a mozna ani 10% nebude statisticky vyznamny - prave vzhledem k rozmanitosti vyslednych casu.

Pokud ma forest vysledne casy velmi stabilni (napriklad se neodchyluji o vice jak 1%), tak to by byla jina. Jenze z jeho uctu to na webu nelze zjistit a tak vychazim se svych pozorovani, ktera jsou dost odlisna a ukazuji spise zdrzenlivost pri posuzovani zlepseni casu...

Duro Kotulic Bunta · stř lis 02, 2005 3:43 pm

Ja len malu poznamku: som rad, ze Honza spomenul, ze statiatika je prepracovana veda. Vela ludi si mysli, ze statistika konci niekde pri predvolebnych preferenciach, ale je to naozaj depp science ktora ma velku hodnotu ak je pouzivana vhodne a korektne.

Castokrat ma obchadzaju mrakoty ked vidim co ludia robia a prezentuju ako statisticky signifikantne vysledky. NApr. rozne medicinske a psychologicke vyskumy. Uff, nebudem rozoberat, lebo je to off topic, len ako malu poznamku by som este uviedol, ze zaklad kvantovej mechaniky je statisticka pravdepodobnost. Svet je v jadre len statistika.

FordPrefect · stř lis 02, 2005 4:28 pm

Obvykly nazor lidi na statistiku vetsinou konci u prumeru. Nekteri snad i slyseli o vazenem prumeru. Priznam se, ze i ja po 6ti semestrech statistiky a analyzy dat se kroutim jak had, kdyz slysim slova jako kvantil nebo t-test