Tulemuste olulisuse määramine omavahel. Statistiline olulisus: definitsioon, mõiste, olulisus, regressioonivõrrandid ja hüpoteeside testimine

Vaatame mõningaid trendijoone praktilise kasutamise peensusi. Kõigepealt peame välja selgitama, mis määrab selle rea olulisuse. Vastus sellele küsimusele on kahekordne: ühelt poolt sõltub trendijoone olulisus selle kehtivusajast, teisalt aga sellest, mitu korda on seda kontrollitud. Kui näiteks trendijoon on läbinud kaheksa testi, millest igaüks on oma tõesust kinnitanud, siis on see kahtlemata märgilisem kui joon, mida hinnad on puudutanud vaid kolm korda. Pealegi on üheksa kuud oma tõhusust tõestanud sari palju olulisem kui see, mis on olnud kasutusel üheksa nädalat või päeva. Mida suurem on trendijoone olulisus, seda rohkem saab seda usaldada ja seda olulisem on selle katkemine.

Trendijooned peaksid sisaldama kogu päeva hinnavahemikku

Lintdiagrammidel olevad trendijooned tuleks tõmmata tulpade alla või kohale, mis esindavad kogu päevaseid hinnakõikumisi. Mõned eksperdid eelistavad ehitada trendijooni, ühendades ainult sulgemishinnad, kuid see lähenemine pole täiesti piisav. Loomulikult on sulgemishind kogu päeva kõige olulisem hinnaväärtus, kuid sellegipoolest kujutab see ainult erijuhtu hinnadünaamikast kogu kauplemispäeva jooksul. Seetõttu on trendijoone koostamisel tavaks arvestada kogu hinnakõikumiste vahemikku päevas (vt joonis 4.8).

Riis. 4.8 Õigesti tõmmatud trendijoon peaks hõlmama kogu kauplemispäeva jooksul toimunud hinnakõikumiste vahemikku.

Mida teha väiksemate trendijoone purunemisega?

Mõnikord murravad hinnad päeva jooksul trendijoonest läbi, kuid sulgemise hetkel normaliseerub kõik. Nii et analüütik peab oma aju raputama: kas toimus läbimurre? (vt joonis 4.9). Kas uute andmete arvessevõtmiseks on vaja tõmmata uus trendijoon, kui trendijoone kerge rikkumine oli ilmselt ajutine või juhuslik? Joonis 4.9 kujutab just sellist olukorda. Päeva jooksul sukeldusid hinnad allapoole tõusvat trendijoont, kuid sulgemisel olid nad taas sellest kõrgemal. Kas sellisel juhul on vaja trendijoont ümber tõmmata?

Kahjuks on vaevalt võimalik anda igaks juhuks ühemõttelist nõu. Mõnikord võib sellist läbimurret ignoreerida, eriti kui järgnev turu liikumine kinnitab algse trendijoone paikapidavust. Mõnel juhul on vaja kompromissi, kui analüütik tõmbab lisaks algsele ka uue, testtrendi joone, mis kantakse graafikule punktiirjoonega (vt joonis 4.9). Sel juhul on analüütiku käsutuses kaks rida: originaal (tahke) ja uus (kriips). Reeglina näitab praktika, et kui trendijoone väljamurdmine oli suhteliselt väike ja toimus vaid ühe päeva jooksul ning sulgemise hetkel hinnad ühtlustusid ja jõudsid taas trendijoonest kõrgemale, siis võib analüütik seda ignoreerida. läbimurre ja jätkake algse trendijoone kasutamist. Nagu paljudes teistes turuanalüüsi valdkondades, on kõige parem tugineda kogemustele ja instinktidele. Sellistes vastuolulistes küsimustes on nemad teie parimad nõuandjad.

Riis. 4.9 Mõnikord paneb trendijoone väljamurdmine ühe päeva jooksul analüütiku dilemma ette: kas säilitada algne trendijoon, kui see on ikka õige, või tõmmata uus? Võimalik on kompromiss, kus algne trendijoon säilitatakse, kuid graafikule tõmmatakse uus joon punktiirjoonega. Aeg näitab, kumb on tõesem.

Olulisuse näitajate määramine gradiendi abil

Kahekordne toimiv närvivõrk suudab sisendsignaalide ja võrgu treenitavate parameetrite põhjal arvutada hindamisfunktsiooni gradiendi.

Parameetri olulisuse indikaatoriks q-o näite lahendamisel on väärtus, mis näitab, kui palju muutub q-o näite võrgu poolt lahenduse hindamise funktsiooni väärtus, kui parameetri w p praegune väärtus asendatakse valitud väärtusega. väärtus w p . Selle täpse väärtuse saab määrata asenduste tegemise ja võrgu hinnangu arvutamise teel. Arvestades võrguparameetrite suurt hulka, võtab kõigi parameetrite olulisuse näitajate arvutamine aga palju aega. Olulisuse parameetrite hindamise protsessi kiirendamiseks kasutatakse täpsete väärtuste asemel erinevaid hinnanguid. Vaatleme kõige lihtsamat ja enimkasutatavat olulisuse näitajate lineaarset hindamist. Laiendame hindamisfunktsiooni Taylori seeriaks kuni esimest järku terminiteni:

kus H 0 q on hindamisfunktsiooni väärtus q-o näite lahendusel w =w. Seega määratakse p-o parameetri olulisuse indikaator q-o näite lahendamisel järgmise valemiga:

Olulisuse indikaatorit (1) saab arvutada erinevate objektide jaoks. Kõige sagedamini arvutatakse see koolitatavate võrguparameetrite jaoks. Tüüpi (1) olulisuse indikaator on aga rakendatav ka signaalide puhul. Nagu peatükis juba märgitud, arvutab võrk tagurpidi töötades alati kaks gradiendivektorit - hindamisfunktsiooni gradiendi koolitatud võrguparameetrite ja kõigi võrgusignaalide põhjal. Kui olulisuse skoor arvutatakse kõige vähem olulise neuroni tuvastamiseks, tuleks arvutada neuroni väljundi olulisuse skoor. Samamoodi on vähima tähtsusega sisendsignaali määramise ülesandes vaja arvutada selle signaali olulisus, mitte nende ühenduste kaalude olulisuse summa, millele see signaal rakendatakse.

Treeningkomplekti keskmine

Parameetri X q p olulisuse indikaator sõltub parameetriruumi punktist, kus see arvutatakse, ja näitest treeningkomplektist. Näitest mittesõltuva parameetri olulisuse indikaatori saamiseks on kaks põhimõtteliselt erinevat lähenemist. Esimese lähenemisviisi puhul eeldatakse, et koolituskomplekt sisaldab täielikku teavet kõigi võimalike näidete kohta. Sel juhul mõistetakse olulisuse indikaatori all väärtust, mis näitab, kui palju muutub koolituskomplekti hindamisfunktsiooni väärtus, kui parameetri w p praegune väärtus asendatakse valitud väärtusega w p . See väärtus arvutatakse järgmise valemi abil:

Teise lähenemisviisi korral käsitletakse treeningkomplekti juhusliku valimina sisendparameetrite ruumis. Sel juhul on kogu treeningkomplekti olulisuse näitaja treeningkomplekti mõningase keskmistamise tulemus.

Keskmistamise meetodeid on palju. Vaatame neist kahte. Kui keskmistamise tulemusena peaks olulisuse näitaja andma keskmise olulisuse, arvutatakse selline näitaja järgmise valemi abil:

Kui keskmistamise tulemusena peaks olulisuse näitaja andma väärtuse, mis ei ületa üksikute näidete olulisuse näitajaid (selle parameetri olulisus üksiknäite puhul ei ületa O§ p), siis selline näitaja arvutatakse. kasutades järgmist valemit:

Olulisuse näitajate kogunemine

Kõik olulisuse indikaatorid sõltuvad võrgu parameetrite ruumi punktist, kus neid arvutatakse, ja võivad ühest punktist teise liikumisel oluliselt erineda. Gradiendi abil arvutatud olulisusindeksite puhul on see sõltuvus veelgi tugevam, kuna järseima laskumise meetodil (vt jaotist ) treenimisel parameetriruumi kahes kõrvuti asetsevas punktis, kus gradient arvutati, on gradiendid ortogonaalsed. Ruumipunktist sõltuvuse eemaldamiseks kasutatakse mitmes punktis arvutatud olulisuse näitajaid. Järgmisena arvutatakse need keskmised, kasutades valemeid (3) ja (4). Parameetriruumi punktide valimise küsimus olulisuse näitajate arvutamiseks lahendatakse tavaliselt lihtsalt. Mis tahes gradiendimeetodi mitme koolitusetapi jooksul arvutatakse iga kord, kui gradient arvutatakse, ka olulisuse hinded. Õppesammude arv, mille jooksul olulisuse näitajaid kogutakse, ei tohiks olla liiga suur, kuna suure õppesammude arvu korral muutuvad esimesed arvutatud olulisuse näitajad mõttetuks, eriti kui kasutada keskmistamist valemi (4) järgi.

Kirjanduse analüüsi ja NeuroComp grupi kogemuste põhjal saame sõnastada järgmised ülesanded, mida saab lahendada kontrastsete närvivõrkude abil.

1. Närvivõrgu arhitektuuri lihtsustamine.

2. Sisendsignaalide arvu vähendamine.

3. Närvivõrgu parameetrite taandamine väikesele valitud väärtuste hulgale.

4. Vähendatud nõuded sisendsignaalide täpsusele.

5. Andmete põhjal selgesõnaliste teadmiste saamine.

Selles peatükis käsitletud kontrasti algoritmid võimaldavad meil valida minimaalse nõutava sisendsignaalide komplekti. Minimaalse sisendsignaalide komplekti kasutamine võimaldab säästlikumalt korraldada närviarvuti tööd. Kuid minimaalsel komplektil on oma puudused. Kuna komplekt on minimaalne, siis ühe signaali poolt edastatavat teavet reeglina teised sisendsignaalid ei toeta. See toob kaasa asjaolu, et kui ühes sisendsignaalis on viga, eksib võrk suure tõenäosusega. Liigse sisendsignaalide komplekti korral seda tavaliselt ei juhtu, kuna iga signaali teavet tugevdavad (dubleerivad) teised signaalid.

Seega tekib vastuolu - esialgse üleliigse signaalikomplekti kasutamine on ebaökonoomne ja minimaalse signaalikomplekti kasutamine toob kaasa suurenenud vigade riski. Sellises olukorras on õige kompromisslahendus - on vaja leida minimaalne komplekt, milles kogu teave dubleeritakse. Selles jaotises käsitletakse meetodeid selliste suurema usaldusväärsusega komplektide koostamiseks. Lisaks võimaldab teist tüüpi duplikaatide ehitamine määrata, millistel sisendsignaalidel pole algses signaalikomplektis duplikaate. Sellise "unikaalse" signaali kaasamine miinimumkomplekti on signaal, et kui kasutate selle probleemi lahendamiseks närvivõrku, peaksite hoolikalt jälgima selle signaali väärtuse õigsust.

Kontrastimisprotseduure on kahte tüüpi – parameetrite olulisusel põhinev kontrastimine ja mittealandav kontrastimine. Selles jaotises kirjeldatakse mõlemat tüüpi kontrastaineprotseduure.

Selles jaotises kirjeldatakse meetodit parameetrite ja signaalide olulisuse näitajate määramiseks. Järgmisena räägime parameetrite olulisuse määramisest. Võrgusignaalide olulisuse näitajad määratakse samade valemite abil, mille parameetrid on asendatud signaalidega.

Statistika on juba ammu muutunud elu lahutamatuks osaks. Inimesed kohtavad seda kõikjal. Statistika põhjal tehakse järeldused selle kohta, kus ja millised haigused on levinud, mille järele on konkreetses piirkonnas või teatud elanikkonnarühmas suurem nõudlus. Sellel põhinevad isegi valitsuskandidaatide poliitilised programmid. Neid kasutavad kaupade ostmisel ka jaeketid ning nendest andmetest juhinduvad ka tootjad oma pakkumistes.

Statistika mängib ühiskonnaelus olulist rolli ja mõjutab iga üksikut liiget ka pisiasjades. Näiteks kui enamik inimesi eelistab teatud linnas või piirkonnas riietuses tumedaid värve, siis lillelise trükiga erkkollase vihmamantli leidmine kohalikest jaemüügipunktidest on äärmiselt keeruline. Kuid millised kogused moodustavad need andmed, millel on selline mõju? Näiteks, mida kujutab endast „statistiline olulisus”? Mida see definitsioon täpselt tähendab?

Mis see on?

Statistika kui teadus koosneb erinevate suuruste ja mõistete kombinatsioonist. Üks neist on mõiste "statistiline tähtsus". See on muutujate väärtuse nimi, mille puhul teiste näitajate ilmnemise tõenäosus on tühine.

Näiteks 9 inimest kümnest paneb hommikusel jalutuskäigul pärast vihmast ööd sügismetsa seeni korjama kummikingad jalga. Tõenäosus, et ühel hetkel kannavad 8 neist lõuendist mokassiine, on tühine. Seega on selles konkreetses näites number 9 väärtus, mida nimetatakse statistiliseks olulisuseks.

Vastavalt sellele, kui arendada välja järgmine praktiline näide, ostavad kingapoed suvehooaja lõpupoole kummikuid suuremas koguses kui muul aastaajal. Seega mõjutab statistilise väärtuse suurus igapäevaelu.

Muidugi, keerulistes arvutustes, näiteks viiruste leviku ennustamisel, võetakse arvesse suurt hulka muutujaid. Kuid statistiliste andmete olulise näitaja määramise olemus on sarnane, sõltumata arvutuste keerukusest ja mittekonstantsete väärtuste arvust.

Kuidas seda arvutatakse?

Neid kasutatakse võrrandi „statistilise olulisuse“ indikaatori väärtuse arvutamisel. See tähendab, et võib väita, et antud juhul otsustab kõik matemaatika. Lihtsaim arvutusvõimalus on matemaatiliste toimingute ahel, mis hõlmab järgmisi parameetreid:

  • kahte tüüpi uuringutest või objektiivsete andmete uurimisest saadud tulemusi, näiteks summad, mille eest oste tehakse, tähistatud a ja b;
  • mõlema rühma näitaja - n;
  • koondvalimi osa väärtus - p;
  • "standardvea" mõiste - SE.

Järgmise sammuna määratakse üldine testinäitaja - t, selle väärtust võrreldakse numbriga 1,96. 1,96 on keskmine väärtus, mis esindab 95% vahemikku vastavalt Studenti t-jaotuse funktsioonile.

Sageli tekib küsimus, mis vahe on n ja p väärtustel. Selle nüansi saab näite abil lihtsalt selgeks teha. Oletame, et arvutame meeste ja naiste jaoks tootele või kaubamärgile lojaalsuse statistilist olulisust.

Sel juhul järgneb tähtede tähistele järgmine:

  • n - vastajate arv;
  • p - tootega rahulolevate inimeste arv.

Sel juhul küsitletud naiste arvuks märgitakse n1. Vastavalt on n2 meest. P-sümboli numbritel “1” ja “2” on sama tähendus.

Testindikaatori võrdlus Studenti arvutustabelite keskmiste väärtustega muutub nn statistiliseks olulisuseks.

Mida tähendab kontrollimine?

Iga matemaatilise arvutuse tulemusi saab alati kontrollida, lastele õpetatakse seda algkoolis. Loogiline on eeldada, et kuna statistilised näitajad määratakse arvutusahela abil, siis neid kontrollitakse.

Statistilise olulisuse testimine ei puuduta aga ainult matemaatikat. Statistika käsitleb suurt hulka muutujaid ja erinevaid tõenäosusi, mis pole alati arvutatavad. See tähendab, et kui pöördume tagasi artikli alguses toodud kummikingade näite juurde, siis võib statistiliste andmete loogilist ülesehitust, millele kaupluste kaupade ostjad loodavad, segada kuiv ja kuum ilm, mis ei ole tüüpiline. sügis. Selle nähtuse tulemusena väheneb kummikuid ostvate inimeste arv ning jaemüügipunktid kannavad kahju. Matemaatiline valem ei suuda mõistagi ilmaanomaaliat ennustada. Seda hetke nimetatakse "veaks".

Arvutatud olulisuse taseme kontrollimisel võetakse arvesse just selliste vigade tõenäosust. See võtab arvesse nii arvutatud näitajaid kui ka aktsepteeritud olulisuse tasemeid, aga ka väärtusi, mida tavaliselt nimetatakse hüpoteesideks.

Mis on olulisuse tase?

Mõiste "tase" sisaldub statistilise olulisuse peamistes kriteeriumides. Seda kasutatakse rakendus- ja praktilises statistikas. See on teatud tüüpi väärtus, mis võtab arvesse võimalike kõrvalekallete või vigade tõenäosust.

Tase põhineb valmisproovide erinevuste tuvastamisel ja võimaldab tuvastada nende olulisust või vastupidi juhuslikkust. Sellel kontseptsioonil pole mitte ainult digitaalset tähendust, vaid ka nende ainulaadset dekodeerimist. Nad selgitavad, kuidas väärtust tuleb mõista, ja tase ise määratakse tulemuse võrdlemisel keskmise indeksiga, see näitab erinevuste usaldusväärsust.

Seega võime taseme mõistet ette kujutada lihtsalt – see on vastuvõetava, tõenäolise vea või vea näitaja saadud statistiliste andmete põhjal tehtud järeldustes.

Milliseid olulisuse tasemeid kasutatakse?

Vea tõenäosuskoefitsientide statistiline olulisus praktikas põhineb kolmel põhitasandil.

Esimeseks tasemeks loetakse läve, mille juures väärtus on 5%. See tähendab, et vea tõenäosus ei ületa 5% olulisuse taset. See tähendab, et kindlus statistiliste uuringute andmete põhjal tehtud laitmatuse ja vigadeta järelduste suhtes on 95%.

Teine tase on 1% künnis. Seega tähendab see arv, et statistiliste arvutuste käigus saadud andmetest saab juhinduda 99% kindlusega.

Kolmas tase on 0,1%. Selle väärtuse korral on vea tõenäosus võrdne protsendi murdosaga, see tähendab, et vead on praktiliselt välistatud.

Mis on hüpotees statistikas?

Vead kui mõiste jagunevad kahte suunda, mis puudutavad nullhüpoteesi aktsepteerimist või tagasilükkamist. Hüpotees on mõiste, mille taga peitub definitsiooni kohaselt hulk muid andmeid või väiteid. See tähendab statistilise arvestuse ainega seotud millegi tõenäosusliku jaotuse kirjeldust.

Lihtsates arvutustes on kaks hüpoteesi – null ja alternatiiv. Nende erinevus seisneb selles, et nullhüpotees põhineb ideel, et statistilise olulisuse määramisel osalevate valimite vahel pole põhimõttelisi erinevusi ning alternatiivne hüpotees on täiesti vastupidine. See tähendab, et alternatiivne hüpotees põhineb valimiandmete olulise erinevuse olemasolul.

Millised on vead?

Vead kui mõiste statistikas sõltuvad otseselt ühe või teise hüpoteesi tõeseks tunnistamisest. Neid saab jagada kahte suunda või tüüpi:

  • esimene tüüp on tingitud nullhüpoteesi aktsepteerimisest, mis osutub valeks;
  • teine ​​on põhjustatud alternatiivi järgimisest.

Esimest tüüpi vigu nimetatakse valepositiivseks ja see esineb üsna sageli kõigis valdkondades, kus kasutatakse statistilisi andmeid. Sellest lähtuvalt nimetatakse teist tüüpi viga valenegatiivseks.

Milleks kasutatakse statistikas regressiooni?

Regressiooni statistiline olulisus seisneb selles, et selle abil saab määrata, kui hästi vastab andmete põhjal arvutatud erinevate sõltuvuste mudel tegelikkusele; võimaldab tuvastada arvestatavate tegurite piisavust või puudumist ja teha järeldusi.

Regressiooniväärtus määratakse tulemuste võrdlemisel Fisheri tabelites loetletud andmetega. Või dispersioonanalüüsi kasutades. Regressiooninäitajad on olulised keeruliste statistiliste uuringute ja arvutuste jaoks, mis hõlmavad suurt hulka muutujaid, juhuslikke andmeid ja tõenäolisi muutusi.

Millal võtate teaduslikku avastust tõsiselt? Millal on see "tähenduslik"?

Paranormaalsed sündmused on definitsiooni järgi erakordsed ja väljaspool tavateaduse valdkonda. Kui järeldate ekslikult, et tulemus ei ole juhuslik, vaid sellel on konkreetne põhjus, siis on tegemist I tüüpi veaga. (Eksist järeldust, et tõeline mittejuhuslik efekt on vaid juhuse tulemus, nimetatakse II tüübi veaks.) Lihtsamalt öeldes on I tüübi viga see, kui arvate, et "toimub midagi ebatavalist", kuigi tegelikult kõik toimub. omal moel. Selles tekstis käsitleme tegelikkuse kontrollimise protseduuri, mis on loodud I tüüpi vigade tuvastamiseks.

Laske teadlasel teha eksperiment, et teha kindlaks, kas teatud nähtuse taga on konkreetne põhjus – näiteks erakordne võime loteriil võita, mõtteid lugeda või valimistulemust ennustada – või on see puhas juhus. Las meie teadlane saab edaspidi mitu positiivset tulemust järjest. Pokkerimängija võib ju vahel ka õnnekaarte saada, selles pole midagi müstilist. Ja mõnikord võidavad inimesed loterii.

Õnneks on olemas statistilised protseduurid I tüüpi vea tõenäosuse hindamiseks. Näiteks usume, et lotovõidud jagatakse täiesti juhuslikult ja õiglaselt, nii et iga inimese võit sõltub ainult õnnest. Mõned inimesed siiski võidavad. Kui võite on oodatust rohkem, võime kahtlustada, et loterii ei toimi täiesti juhuslikult. Võib-olla keegi petab või siin mõjuvad paranormaalsed jõud. Et aru saada, mis toimub, arvutavad statistikud välja, kui palju võidupileteid tuleb esitada, et saaksime järeldada, et midagi kummalist on toimumas. Võib-olla peaks juhuse seaduste kohaselt miljoni osaleja kohta olema 10, 100 või isegi 1000 võitu. Mis tahes arv, mis on suurem kui 10, 100 või 1000, tekitab kahtlust. Aga kuidas valida vastuvõetav võitude arv? Kõik sõltub sellest, millega olete valmis riskima. Kui kardate teha I tüüpi viga?

I tüüpi vea sooritamise riskitaset nimetatakse a-tase. Traditsiooniliselt keskenduvad paljud teadlased a-tasemele 5% (0,05), kuid mõnikord kasutatakse ka teisi tasemeid (1% (0,01) ja 0,1% (0,001)). Seega tähendab a-tase 5%, et loterii muutub tõeliselt kahtlaseks. Kui usaldusnivoo ei ületa 5%, see tähendab, et vea tõenäosus ei ületa 1/20. Mõnikord nimetatakse tõenäosustaset lühidalt p-väärtuseks. Teaduslikes aruannetes võite sageli leida järgmisi väiteid (ärge unustage, et sel juhul on p parem, st väiksem kui 0,05, ja vastavalt sellele on katse tulemused märkimisväärsed):



Võrdlesime viiekümne selgeltnägija ja viiekümne inimese, kellel ei olnud deklareeritud paranormaalseid võimeid, ennustuste õnnestumise määra. Selgeltnägijate ennustused olid õigustatud 45% juhtudest, tavainimeste ennustused - 41% juhtudest.

Selgeltnägijate ennustused olid oluliselt täpsemad kui tavainimeste ennustused (p = 0,02). Järeldus: eksperimendi tulemused näitavad, et selgeltnägijad suudavad tulevikku ennustada.

Kui katse ei kinnita selgeltnägijate ennustuste täpsust, võib aruanne välja näha umbes selline:

Võrdlesime viiekümne selgeltnägija ja viiekümne inimese, kellel ei olnud deklareeritud paranormaalseid võimeid, ennustuste õnnestumise määra. Selgeltnägijate ennustused olid õigustatud 44% juhtudest, tavainimeste ennustused - 43% juhtudest. Selgeltnägijate ennustuste liigne edu võrreldes tavainimeste ennustustega ei olnud statistiliselt oluline (p = 0,12). Järeldus: eksperimendi tulemused ei toeta järeldust, et selgeltnägijad suudavad tulevikku ennustada.

Pange tähele: teadlased räägivad nähtuse "statistilisest olulisusest", kui "katse käigus saadud väärtus ei ületa katses aktsepteeritud olulisuse taset (a-taset)." Väide "See tulemus on statistiliselt oluline" p = 0,02" võib tõlkida umbes nii: "Oleme kindlad, et see tulemus pole ainult õnn või juhus. Meie statistika näitab, et vea tõenäosus on vaid 2 100-st, mis on parem kui enamiku teadlaste poolt aktsepteeritud määr 5/100.

Statistiliste andmete a-taseme arvutamise viis jääb selle raamatu käsitlusalast välja. Pange tähele, et see ülesanne võib olla üsna keeruline. Näiteks võib sama katse ikka ja jälle kordamine tekitada väga erilise probleemi, mille paranormaalsete nähtuste uurijad vahel unustavad. Iga katse iseenesest on nagu mündi viskamine. Aja jooksul võite korduvate kordamiste korral saada soovitud tulemuse puhta juhuse tõttu. Selgeltnägijate ja tavainimeste vaheliste ennustuste hüpoteetilises uuringus, mida me eespool käsitlesime, võisid mõned osalejad (nii selgeltnägijad kui ka mitte-selgeltnägijad) teha eduka ennustuse juhuslikult. Oleme juba selgitanud, et statistikud oskavad hinnata tõenäosuse taset ja seda tulemuste töötlemisel arvesse võtta. Samamoodi, kui seda katset korratakse sadu kordi, iga kord uurides 50 selgeltnägijat ja mitte-selgeltnägijat, on mõnel juhul selgeltnägijate edukate ennustuste protsent paratamatult suurem - puhta juhuse tõttu. Minimaalne, mida peaksite tegema, on a-taseme muutmine, et võtta arvesse valepositiivse otsuse suurenenud riski.



Teadlased, kes kordavad sama katset mitu korda (või võtavad veekatses arvesse suurt hulka parameetreid), on sunnitud võtma lisameetmeid, et välistada valepositiivne otsus. Mõned neist kasutavad Carlo Emilio Bonferroni (1935) leiutatud testi ja jagavad a-taseme (0,05 või 0,01) katsete (või parameetrite) arvuga, et kompenseerida eksliku tulemuse suurenenud tõenäosust. Uus a-tase peegeldab rangemaid kriteeriume, mille järgi tuleb sel juhul hinnata uuringu usaldusväärsust. Lõppude lõpuks, kui tuua analoogia täringuviskega, siis suure visete arvu tõttu suurendate võidu tõenäosust. Näiteks kui viisite läbi 100 psüühilise tuleviku ennustamise katset (või ühe katse, milles palusite osalejatel ennustada 100 üksikute objektide rühma käitumist, nagu spordivõistlused, loteriipiletite numbrid, loodussündmused jne), uus a- teie tase on 0,0005 (0,05/100). Seega, kui pärast teie uuringu tulemuste statistilist töötlemist selgub, et olulisuse tase on ainult 0,05. Sel juhul tähendab see, et te ei saanud olulisi tulemusi.

Võib-olla pole te statistikas kuigi hea ja teil on raske aru saada, mida öeldakse. Bonferroni on aga varustanud meile väga mugava hindamisvahendi, mille kasutamine pole sugugi keeruline. Seda tööriista kasutades saate alati aru, kas konkreetse uuringu tulemused tekitavad valesid lootusi. Loendage kõnealuste katsete arv. Või uuritud erinevate "väljund" muutujate arv. Uue läviväärtuse saamiseks jagage 0,05 katsete või muutujate arvuga. Kõnealuse uuringu usaldustase ei tohi olla sellest väärtusest kõrgem (st väiksem või sellega võrdne). Alles siis võite olla kindel saadud tulemuste olulisuses. Allpool on rohelise tee hüpoteetiline uurimisaruanne. Kas saate kindlaks teha, miks see lugejat eksitab?

Testisime rohelise tee mõju õppeedukusele. Topeltpimedas platseebouuringus anti 20 õpilasele rohelist teed ja veel 20 õpilasele rohelisele teele sarnast toonitud vett. Eksperimendis osalejad jõid kuu aega iga päev teed. Kontrollisime 5 muutujat: GPA, eksamihinded, kirjaliku ülesande hinded, klassihinded ja kohalolek. Kirjaliku töö eest said rohelise tee joojad keskmise hinde “5”, vett joonud aga “4”. See on oluline erinevus, p = 0,02. Järeldus: roheline tee parandab õppeedukust.

Ja siin on sama aruanne, mis on kohandatud Bonferroni testi jaoks:

Testisime rohelise tee mõju õppeedukusele. Topeltpimedas platseebouuringus anti 20 õpilasele rohelist teed ja veel 20 õpilasele rohelisele teele sarnast toonitud vett. Eksperimendis osalejad jõid kuu aega iga päev teed. Kontrollisime 5 muutujat: GPA, eksamihinded, kirjaliku ülesande hinded, klassihinded ja kohalolek. Kõige paremini mõjus kirjaliku töö kvaliteedile roheline tee. Siin said need, kes jõid rohelist teed, keskmiselt "5", samas kui need, kes jõid vett, said keskmiselt "4". Hinnangute erinevus annab meile p = 0,02. See tulemus ei rahulda aga Bonferroni korrektsiooniga (0,01) a-taset. Järeldus: roheline tee ei paranda õppeedukust.

Tulemuse statistiline olulisus (p-väärtus) on selle „tõe” (“valimi representatiivsuse” tähenduses) usaldusväärsuse hinnanguline mõõt. Tehnilisemalt öeldes on p-väärtus mõõt, mis varieerub vastavalt tulemuse usaldusväärsusele kahanevas suurusjärgus. Kõrgem p-väärtus vastab valimis leitud muutujate vahelise seose madalamale usaldustasemele. Täpsemalt, p-väärtus tähistab vea tõenäosust, mis on seotud vaadeldava tulemuse üldistamisega kogu populatsioonile. Näiteks p-väärtus 0,05 (s.o 1/20) näitab, et 5% tõenäosusega on valimis leitud muutujate vaheline seos vaid valimi juhuslik tunnus. Teisisõnu, kui antud seost populatsioonis ei eksisteeri ja teete sarnaseid katseid mitu korda, siis umbes iga kahekümne katse korduse korral eeldate muutujate vahel sama või tugevamat seost.

Paljudes uuringutes peetakse p-väärtust 0,05 veataseme "vastuvõetavaks marginaaliks".

Ei saa kuidagi vältida meelevaldsust otsustamisel, millist olulisuse taset tuleks tõeliselt „oluliseks” pidada. Teatud olulisuse taseme valik, millest kõrgemad tulemused lükatakse tagasi kui valed, on üsna meelevaldne. Praktikas sõltub lõplik otsus tavaliselt sellest, kas tulemus ennustati a priori (st enne katse läbiviimist) või avastati tagantjärele paljude erinevate andmete analüüside ja võrdluste tulemusena, samuti õppesuuna traditsiooni. Tavaliselt on paljudes valdkondades tulemus p 0,05 statistilise olulisuse vastuvõetav piir, kuid tuleb meeles pidada, et see tase sisaldab siiski üsna suurt veamäära (5%). P 0,01 tasemel olulisi tulemusi peetakse üldiselt statistiliselt olulisteks ja p 0,005 või p 0,001 tasemega tulemusi peetakse üldiselt väga olulisteks. Siiski tuleb mõista, et see olulisuse tasemete klassifikatsioon on üsna meelevaldne ja on lihtsalt mitteametlik kokkulepe, mis on vastu võetud konkreetses uurimisvaldkonnas saadud praktiliste kogemuste põhjal.

Nagu juba mainitud, esindavad seose suurus ja usaldusväärsus muutujatevaheliste seoste kaht erinevat tunnust. Samas ei saa öelda, et nad oleksid täiesti iseseisvad. Üldiselt võib öelda, et mida suurem on muutujate vahelise suhte (seos) suurus normaalsuuruses valimis, seda usaldusväärsem see on.

Kui eeldada, et üldkogumis vastavate muutujate vahel seos puudub, siis kõige tõenäolisemalt eeldatakse, et uuritavas valimis puudub ka seos nende muutujate vahel. Seega, mida tugevam seos valimist leitakse, seda väiksem on tõenäosus, et seost ei eksisteeri populatsioonis, millest see on võetud.


Valimi suurus mõjutab suhte olulisust. Kui vaatlusi on vähe, on nende muutujate jaoks vastavalt vähe võimalikke väärtuskombinatsioone ja seega on tugevat seost näitava väärtuskombinatsiooni kogemata avastamise tõenäosus suhteliselt suur.

Kuidas arvutatakse statistilise olulisuse taset. Oletame, et olete juba arvutanud kahe muutuja vahelise sõltuvuse (nagu eespool selgitatud). Järgmine küsimus, mis teie ees seisab, on: "Kui oluline see suhe on?" Näiteks kas 40% seletatud dispersioon kahe muutuja vahel on piisav, et pidada seost oluliseks? Vastus: "sõltuvalt asjaoludest." Nimelt oleneb olulisus peamiselt valimi suurusest. Nagu juba selgitatud, on väga suurtes valimites isegi väga nõrgad seosed muutujate vahel olulised, samas kui väikestes valimites ei ole isegi väga tugevad seosed usaldusväärsed. Seega on statistilise olulisuse taseme määramiseks vaja funktsiooni, mis esindab iga valimi suuruse muutujate vahelise seose "suuruse" ja "olulisuse" vahelist seost. See funktsioon annab teile täpselt teada, „kui tõenäoline on antud väärtusega (või suurema) seose saamine antud suurusega valimi puhul, eeldades, et populatsioonis sellist seost pole”. Teisisõnu annaks see funktsioon olulisuse taseme (p-väärtuse) ja seega ka tõenäosuse, et lükatakse ekslikult ümber eeldus, et antud seost populatsioonis ei eksisteeri. Seda "alternatiivset" hüpoteesi (et populatsioonis pole seost) nimetatakse tavaliselt nullhüpoteesiks. Ideaalne oleks, kui vea tõenäosust arvutav funktsioon oleks lineaarne ja sellel oleks ainult erinevate valimi suuruste puhul erinevad kalded. Kahjuks on see funktsioon palju keerulisem ega ole alati täpselt sama. Kuid enamikul juhtudel on selle vorm teada ja seda saab kasutada olulisuse taseme määramiseks antud suurusega proovide uuringutes. Enamik neist funktsioonidest on seotud väga olulise jaotuste klassiga, mida nimetatakse normaalseks.

Seotud väljaanded