Registripõhised andmed on usaldusväärsete teadustulemuste saamiseks töökindlamad kui küsitlusuuringute kaudu korjatavad andmed, kirjutab EBSi professor Kaire Põder Arenguseire Keskuse blogis. Haridusvaldkonna näitel võimaldaks registriandmete kvaliteedi arendamine ja nende andmete laiem kättesaadavus teadlaskonnale säästa raha küsitluste pealt.

2013. aastal avaldasid Linthwaite ja Fuller uurimuse, et riikide piimatarbimine ja Nobeli auhinnatute arv (mõõdetuna 1000 elaniku kohta) on omavahel tugevalt positiivselt seotud ning tegid ettepaneku seosemehhanismi kohta – mida enam šokolaadi süüa, seda paremad kognitiivsed võimed – kajastasid seda uudist mitmed (mitte päris kollased) väljaanded.  

 

Miks see teadustulemus teid muigama ajas? 

 

Ilmselt seetõttu, et te olete lugeja, kes saab aru, et korrelatsioon ei ole põhjuslikkus.  Ehk ilmselt on tegelik mehhanism sellise veidra seose taga lihtsalt raha – rikastes riikides süüakse enam šokolaadi ja rahastatakse ka heldemalt teadust ja ülikoole. 

Päris ilmekalt teeb selgeks, kust võib tulla sedalaadi „mõttetu korrelatsioon“ Jim Frosti blogi, – põhjusteks vaadeldavate objektide iseselekteerumine teatud gruppi, vastupidine seos, ühine põhjustaja või väljajäänud muutuja. Kahjuks võib sellest naljaloost välja lugeda, et ka teadus ei ole vigadeta, siiski leiab nn kaaslase-teadus läbi avaldamisesõela sõklad üles ning vabandamist ja eemaldamist on ka tagantjärgi. 

Palju kurvem on lugu riiklike rakendusuuringutega, mida kas konkurentsipõhiselt nn iludusvõistluse  korras riiklikult rahastatakse või läbi riigihanke tellitakse.  Püüdes mitte tendentslik olla, tellitakse tüüpiliselt uus küsitlusuuring koos seda kirjeldava analüüsiga, mis enamikul juhtudel koosneb risttabelitest ehk grupipõhiste keskmiste raporteerimisest ja tulpdiagrammidest. Mõlema tööriista abil saab edukalt näidata seost riigi tasemel keskmiste Nobeli auhinnatute ja keskmise šokolaadi tarbimise vahel.

Üha uutest küsitlusuuringutest päästaksid head registriandmed. Minu valdkond on haridus, seega tean ma võrdlemisi hästi, et tegelikult on meil Eestis olemas täitsa korralikud õpilaste registripõhised andmed, kuigi jah, nendega on sada häda.  Andmekaitse. Koodiraamatute ebatäiuslikkus. Andmetes puuduvad vanemate taustakarakteristikud, ehk lapsed ja vanemad ei ole seotud. Kui haridusanalüüse tehes üldse mingi reegel kehtib, siis see, et haridusnäitajad (ja ka koolide keskmised tulemused) sõltuvad õpilaste vanemate taustast.  Seega on vanemate ja laste sidumine andmebaasis vältimatu.

 

Mis on aga registripõhiste andmete tugevused? 

 

Esiteks, andmed on läbi aja ehk saab analüüsida nn õpilase tasemel toimunud  muutusi, mitte ainult erinevusi õpilaste gruppide vahel.  Teiseks jääb ära kogu möll kuluka andmekorjega, sealjuures on teada madalad vastamise määrad sest koolid ja vanemad on tüdinud uuringutest.  Kolmandaks on ankeetküsitlused kohmakas viis käitumise (valikute) uurimiseks, rääkimata ammu teada subjektiivsuse probleemist, ehk vastatakse sõltuvalt meeleolust.  Lisaks saab registripõhiste andmetega kasutada longituudseid ehk „muutust õpilase endaga võrreldes, mitte õpilaste grupi vahel“  uurimismeetodeid, mis annavad usaldusväärsemaid tulemusi.

Eesti Hariduse Infosüsteemis on lai valik koolide lõikes kättesaadavaid andmeid, mida on kiitnud mitmed rahvusvahelised uurijad ja organisatsioonid. Paraku on meie nõrkuseks õpilaste tasemel andmete kättesaadavus. Kui PISA uuringu puhul saame õpilase tasemel andmeid OECD kodulehelt alla laadida, siis miks peaks andmekaitselised probleemid Eestis olema suuremad?

Alati ei peagi riik tellima, piisab teadlastele andmete kättesaadavaks tegemisest

On veel üks ja väga oluline asi.  Kui teha head (haridus)andmed rahvusvahelistele uurijatele kättesaadavaks (nagu see on Hollandis või Rootsis), siis hakkab rahvusvaheline teaduskogukond neid kasutama.  Uurijate töö on avaldada teadusartikleid, monograafiaid ja doktoritöid.  Teadustöid kirjutatakse ja retsenseeritakse seni tasuta (seda võimaldab Eestis muuhulgas teadusasutuste baasfinantseerimine), ehk konverentside ja avaldamiste läbi peaks teadlaskonna enesekontrollimehhanism puhastama välja sõklad teradest ja valeteaduse tootmise tõenäosus on väiksem. Kas aga teadlased ka ministeeriumite jaoks olulised teemad omal initsiatiivil ära uurivad?  Usun, et ei maksa kahtlustada, konkurents teaduses paneb nad tegema seda ja rohkem veel.     


P.S. Muidugi on vahest vaja ka küsitlus-ankeetuuringuid!