Statistika ir tikimybės…

Statistika ir tikimybės…

Vidutiniškai kiekvienas žmogus turi vieną vyrišką kiaušidę ir vieną moterišką krūtį

- Des McHale

Turbūt kasdien kiekvieną iš mūsų pasiekia labai įdomus reiškinys pavadinimu “statistika”. Apklausos, tyrimai ir visokio panašaus plauko skaičiavimai yra tapę dideliu verslu. Ir reiktų tikėti, jog tai jau tampa besaikiu per dideliu verslu.

Kodėl?

Visų pirma, reikia suprasti kas yra statistika. Statistika - tai matematinė tam tikrų žmonių grupių, procesų ar eksperimentų stebėjimų išraiška. Ji naudojama įvairiose gyvenimo, pramonės bei ekonomikos srityse. Ja dažnai naudojamasi archyvų kūrimui, istoriniams stebėjimams, praeities analizei ir panašiai.

Visgi, statistika pastaruoju metu gana smarkiai žengia žingsnius į pinigų pasaulį. Pastaruoju metu vis daugiau ir daugiau kompanijų gavę skaičius iš statistinių stebėjimų pradeda jais manipuliuoti. Pavyzdžiui: tokiais skaičiais dažnai manipuliuoja televizijos, kurių reklamų įkainiai dažnai priklauso nuo to, kiek žmonių jų kanalą stebėjo tam tikru momentu. Tais paprasčiausiais skaičiais naudojasi bankai, įvairios žiniasklaidos priemonės (internetiniai portalai, laikraščiai), net valstybės.

O sakyti, jog skaičiais manipuliuojama galima dėl paprasto dalyko – reikia išmokti skaičiuoti kaip skaičiuoja statistikos tyrinėtojai. Tam reikės paprasto pavyzdžio. Situacija: “Lietuvoje gyvena 3 000 000 žmonių (populiacija). Reikia apskaičiuoti kiek iš jų statistiškai kasdien geria kavą”. Atsiranda problema: Kaip apklausti visus šalies gyventojus? Juk tam reikėtų be galo daug resursų ir laiko. Čia mokslininkai sugalvojo šį veiksmą apžaisti: Apklausti tik tam tikrą skaičių gyventojų (pavyzdžiui 1000, – imtis) ir taip sutaupyti labai daug laiko bei resursų, o toliau naudojant tam tikrus matematinės statistikos metodus ir formules apskaičiuoti, kaip galėtų elgtis visa populiacija. Išryškėja pirmosios problemos. Kuo didesnė populiacija ir kuo mažesnė imtis – juo didesnė skaičiavimo paklaida. Tačiau paklaida išlieka net kai imtis yra lygi populiacijai (3% – žmogiškasis faktorius). Tačiau atsirandant papildomiems faktoriams ar skaičiams (ypač, jeigu pastarieji yra statistiniai skaičiai), paklaida dar labiau padidėja. Pačios didžiausios paklaidos yra televizijos reitinguose. Žinoma, jos apskaičiuoja pagrindines tendencijas, tačiau skaičiuoti naudojant vien papildomus 900 priedelių ir esant be galo daug kintamųjų, paklaida gali siekti iki 50%, o gal net ir daugiau. Kažkodėl nesu matęs, jog pateikdamos tyrimų ataskaitas kompanijos pateiktų paklaidas. O derėtų…

Žinoma, daug kas pasakys – “O kam čia dabar prisikabinėti? Juk formules ir iš vis statistinius metodus sugalvojo mokslininkai. Straipsnio autorius yra  anoks mokslininkas”. Bet mokslininkai sugalvojo statistinius metodus tam, kad būtų paprasčiau rinkti informaciją apie istoriją, istorines tendencijas bei jų pačių eksperimentus.

Kurti kainas, paslaugas, ateities tendencijas ar apskritai ateitį vien iš statistikos yra tas pats, kas burti iš kavos tirščių.

Ir taip yra todėl, jog daugelis teigia, jog taip kaip buvo vakar – bus ir rytoj, tik prie visko yra naudojamos tikimybės. Tikimybė – matematiškai apskaičiuota tam tikro reiškinio įvykimo galimybė. Tačiau tai tėra tik skaičius, nors juo remiasi bei manipuliuoja daugelis. Tarkim kazino: žmogus stovi prie ruletės stalo ir stato tik ant spalvų. Vadinasi tikimybė laimėti yra apie 49% (49 – kitai spalvai ir apie 1 – nuliui). Tačiau ji taip pat sukuria iliuziją, kad kiekvieną kartą iškritus netinkamai spalvai, tikimybė laimėti didėja, o žmogui tiek ir tereikia, jeigu jis įsitikinęs, jog kilnodamas “čipsus” laimės daug pinigų. Tokia pat statistika naudojosi NASA savo “kvailumo” laikais, kai vykstant projektui “GEMINI” (Dvyniai), kiekvieną kartą astronautui pakilus į kosmosą, tikimybė, jog jis sekančioje misijoje žus – padidėdavo. Šiuo metu, dažnos įmonės naudoja tokią logiką: Tikimybė, jog tai kas nutiko vakar, bus rytoj yra didžiausia, todėl veiklos kryptis kreipti reikia būtent į tas vietas. Be to, geriausias pavyzdys kaip apjungiama statistika ir tikimybės – orų prognozė. Ar dažnai tiksliai pasitvirtina orų prognozės vienai dienai? Dviems dienoms? Savaitei? Mėnesiui? ir t.t.

Tačiau pažvelkime į tikimybes kiek kitaip. Jeigu žaidžiant kortomis jums iškrito tam tikra kortų kombinacija, tai jai jum iškristi buvo labai nedidelė tikimybė. Tačiau ji įvyko. Sekančiai kortų kombinacijai iškristi yra lygiai taip pat maža tikimybė, kuri įvyksta. Žinoma, kad pasikartos ta pati kombinacija tikimybė maža, tačiau vis dėl to egzistuoja. Kitaip pasitikėti vien tikimybėmis yra pragaištinga.

Šioje vietoje labai tiktų anekdotas:

- Kokia tikimybė, jog meteoritas nukris į žemę? – klausia laidos vedėjas blondinės ir mokslininko.

Mokslininkas:

- Na pagal statistiką, meteoritas nukrenta žemėn kas kelis šimtus tūkstančių metų, danguje objektų pavojingų žemėj yra… …na sakyčiau 1/700000.

Blondinė:

- 50/50.

Vedėjas:

- O kodėl jūs taip manote?

- Arba nukris arba nenukris…

Visgi statistikos nuvertinti nereikėtų ir siūlau pasižiūrėti, kaip statistiką galima kartais padaryti įdomia:

http://www.ted.com/talks/lang/eng/hans_rosling_shows_the_best_stats_you_ve_ever_seen.html

bei siūlau apsilankyti:

http://www.gapminder.org/

Apie autorių

Save vadina Literatūriniu Huliganu be C raidės, nors galbūt vieną dieną reiktų ir nusileisti ant žemės ir pridėti pagaliau tą C raidę prie H... Ir jeigu rimtai, nėra ko bloge atskleidinėt biografinės informacijos. Norit sužinoti kas yra Kęstutis Armalis? Paklauskite jo.