Korona-aikana olen mielenkiinnolla seurannut millaisia tulkintoja ja johtopäätöksiä korona-datoista tehdään. Tämähän on ainutlaatuinen tilaisuus nähdä analysointikyvykkyyttä laajemmassa skaalassa.

Ja ei niin kovin yllättäen, samoja datoja käyttäen näytetään päätyvän hyvinkin erilaisiin johtopäätöksiin. Olen joskus törmännyt samaan yrityksissäkin. 

Tähän varmasti monia syitä, mutta esitän vain yhden, joka on yhteisen viitekehyksen puuttuminen, joka toisi datan analysoijat samalle sivulle perusfaktoista datan käyttökelpoisuuden suhteen. 

Mielestäni data-analyyseissä olisi aina hyvä puntaroida seuraavan nelikentän kohtia.

 

Erityisesti kohdat C ja D tuottavat joskus vaikeuksia, jolloin voi syntyä esim. ylitulkintaa. Eli tehdään tulkintoja, joihin data ei oikeastaan vastannut.

Koronan osalta esimerkiksi on otettu esille, että rajaustoimet ovat aiheuttaneet kuolemia (ei ajoissa hoitoon). Tästä voi olla todisteita datan muodossa, mutta se data ei kerro vaihtoehdosta – eli paljonko kuolemia olisi tullut ilman rajaustoimia. Siksi olemassa oleva data ei välttämättä ole kaksinen peruste rajaustoimia vastaan.

Lopuksi, kannattaa muistaa että data on aina rajallinen kuvaus jostakin ilmiöstä – ei ilmiö itsessään. Maalaisjärjen käytölle on edelleen hyvät perusteet.