Ajattelin jakaa täällä blogissa joitakin psykologiaan, markkinointiin ja tilastoteiteisiin liittyviä opiskelemiani asioita. Teen tämän itsekkäistä syistä lähinnä kerratakseni, mutta kuvittelen, jotakuta muutakin kiinnostavan, esimerkiksi tämä pieni ja ilmainen tilastotieteen preppauskurssini blogitekstien muodossa. Lisäilen tekstiin välillä mausteeksi hieman omaperäisempiä esimerkkejä, jotta asiat on helpompi muistaa.

Otantatutkimus

Tutkimus voidaan toteuttaa kokonais- tai otantatutkimuksena. Yleisempää on otantatutkimus. Otantatutkimuksessa perusjoukosta (=populaatiosta), vaikkapa Suomen kaikista koululaisista, valitaan otos. Otantamenetelmän valinta on tutkimuksen onnistumisen ja tulosten ylestettävyyden kannalta olennaista, joten se täytyy tehdä huolellisesti.

Hyvä otos on kuin populaatio pienoiskoossa. Otoksen ja näytteen ero on, että otos edellyttää satunnaistamista, jolloin kaikilla tilastoyksiköillä tulee olla yhtäsuuri todennäköisyys tulla valituksi. Otos on edustava, jos se vastaa ominaisuuksiltaan populaatiota oikeassa suhteessa.

Otos ei koskaan käytännössä ole täysin populaation kaltainen, joten syntyy otantavirhettä, jonka suuruutta tutkimusten myöhemmässä vaiheessa arvioidaan tilastollisten testien avulla.

1. Yksinkertainen satunnaisotanta

Yksinkertainen satunnaisotanta tarkoittaa otantayksiköiden valitsemista sattumanvaraisesti esimerkiksi heittämällä noppaa. Käytännössä usein tutkimuksissa yksinkertainen satunnaisotanta tehdään antamalla populaation tilastoyksiköille numeroarvot ykkösestä ylöspäin, jonka jälkeen päätetään minkä suuruinen otos tarvitaan. Sen jälkeen arvotaan esim. tietokoneella satunnaislukuja otoskoon verran.

Edut

  • Periaatteiltaan yksinkertainen

Ongelmat

  • Ongelmallinen pienille otoksille. Yksinkertainen satunnaisotanta vaatii usein muita otantamenetelmiä isomman otoskoon. Ison otoksen kerääminen on kuitenkin työlästä ja aikaa vievää. Etenkin, jos populaatio on kovin heterogeeninen, mutta sisältää pieniä vähemmistöjä, pienet otokset saattavat poiketa paljon toisistaan.
  • Yksinkertainen satunnaisotanta on mahdollinen vain, jos koko populaation kaikki tilastoyksiköt tunnetaan ja tilastoyksiköt ovat kaikki tavoitettavissa. (Tavoitettavissa olevia tilastoyksiköitä kutsutaan kehikoksi.) Käytännössä et siis voi tehdä kunnollista satunnaisotantatutkimusta vaikkapa Afrikan väestöstä. Jos populaatiosi on kaikki suomalaiset, meidät on ainakin kaikki tilastoitu, mutta jos otantaasi sattuu joku Portugaliin muuttanut eläkeläinen tai Pissinpaskamaan (kyllä, tämä on kaupunki) erakko, niin tutkimusaineiston kerääminen käy haastavaksi ja kalliiksi.

2. Systemaattinen otanta

Systemaattinen otanta toteutetaan (1) päättämällä otoskoko, jonka jälkeen (2) valitaan poimintaväli. Poimintaväli k valitaan jakamalla populaation koko N otoksen koolla n. Sen jälkeen (3) valitaan ensimmäinen otantayksikkö. Tämä valitaan arpomalla luku 1 ja k väliltä.

Edut

  • Systemaattinen otanta peittää tasaisesti koko populaation.
  • Koko perusjoukkoa ei tarvitse kartoittaa etukäteen, kunhan tilastoyksiköiden voidaan odottaa tulevan jonoon jossakin vaiheessa.

Ongelmat

  • Systemaattinen otanta voidaan toteuttaa vain, jos populaation tilastoyksiköt ovat järjestettävissä jonoon.
  • Systemaattisen otannan kanssa on oltava varovainen, jos kyseessä on syklinen tilastoaineisto. Esimerkiksi liikenteen määrä tietyissä paikoissa vaihtelee vuorokauden aikojen mukaan eli syklisesti. Tällöin voisi tuloksiin syntyä harhaa eli systemaattista virhettä. Ongelma on ratkaistavissa tihentämällä otantaväliä siten, että valitaan otokseen otantayksiköitä vaikkapa jokaisena vuorokauden aikana.

3. Ositettu otanta

Ositetussa otannassa tilastoaineisto jaetaan osiin eli ositteisiin (esim. miehet ja naiset) , joiden tulisi olla tutkittavan asian suhteen sisäisesti mahdollisimman homogeenisiä. Ositteisiin jakamisen jälkeen kustakin ositteesta poimitaan otantayksiköitä otokseen jollakin otantamenetelmällä.

Ositteista voidaan valita otantaan esimerkiksi

  • Suhteellisella kiintiöinnillä: Ositteista poimitaan otantayksiköt populaatiota vastaavassa suhteessa.
  • Tasaisella kiintiöinnillä: Jokaisesta ositteesta poimitaan yhtä paljon otantayksiköitä.
  • Parhaalla kiintiöinnillä: Tässä huomioidaan kunkin mitattavan ominaisuuden vaihtelu kussakin ositteessa.
  • Yksinkertaisella satunnaisotannalla: Tällöin saadaan sattumanvarainen määrä otantayksiköitä kustakin ositteesta.

Edut

  • Onnistuessaan ositettu otanta antaa usein yksinkertaista satunnaisotantaa tarkempia tuloksia, koska esim. erilaiset vähemmistöt tulevat huomioiduiksi.

.Ongelmat

  • Populaatio tunnettava etukäteen. Tämä vaatii etukäteistietoja esim. aiempia tutkimustuloksia.

4. Ryväsotanta

Populaatio jaetaan toisensa pois sulkeviin osajoukkoihin eli ryppäisiin, esim. vaalipiirit tai ruokakunnat. Osituksesta tämä eroaa siten, että ryppäiden tulisi olla mahdollisimman heterogeenisia sisäisesti ja heterogeenisiä eri ryppäiden välillä. Ryppäiden tulisi olla ominaisuuksiltaan perusjoukon kaltainen.

Ryppäiden muodostamasta populaatiosta poimitaan satunnaisotos, jonka jälkeen mukaan tulleet ryppäät tutkitaan kokonaisotoksena tai niiden sisältä poimitaan vielä otos.

Edut

  • Joustava ja edullinen menetelmä. Esim. jos tutkitaan Suomen koululaisia, niin on usein helpompi tutkia tiettyjen satunnaistettujen koulujen (ryppäiden) oppilaita kuin oppilaita sieltä täältä ympäri Suomea.

Ongelmat

  • Ryppäiden muodostamisen haastavuus siten, että ryppäät olisivat toistensa kaltaisisia.

Muut menetelmät

Näiden otantamenetelmien lisäksi puhutaan toisinaan myös harkinnanvaraisesta otannasta ja kiintiöotannasta. Nämä menetelmät eivät ole otantamenetelmiä, koska niissä ei tapahdu satunnaistamista. Sen sijaan niiden avulla voidaan valita näyte esimerkiksi esitutkimusta varten.