Accuscore jälleen tarkin ennustaja

Kuntavaalit on käyty ja tulokset selvillä. On aika tarkastella ennusteiden ja gallupien osumatarkkuutta. Kuntavaalien osalta tehtiin pääosin koko maan kattavia puoluekannatusmittauksia ja -ennusteita. Eduskuntavaaleista tuttuja paikkamääräennusteita tehtiin vain muutama suurimmissa kaupungeissa, joten niihin ei tässä artikkelissa paneuduta.


Valtakunnallisissa mielipidemittauksia julkaisivat ainakin YLE, Helsingin Sanomat ja Iltalehti. Accuscore teki oman ennusteensa käyttäen näitä mittauksia, historiallista äänestyskäyttäytymistä ja viime vaaleihin kehitettyjä algoritmejä. Lisäksi teimme Underhoodin kanssa yhden ennusteen, jossa käytimme myös heidän keräämäänsä ja analysoimaansa sosiaalisen median dataa. Alla näkyvät eri toimijoiden mittausten/ennusteiden virheet %-yksikköinä mitattuna kahdeksan eduskuntapuolueen ja "muut" - ryhmän vaalikannatuksesta:


1) Accuscore 6.2%-yksikköä

​2) HS 6.6%-yksikköä

​3) Iltalehti 7.3%-yksikköä

4) Yle 9.0%-yksikköä


Accuscore + Underhood- ennusteen virhe oli 7.1%-yksikköä, mutta ilman "muut" ryhmän ennustetta. Käytännössä virhe olisi ollut 8-9%-yksikköä.


Kuten näistä luvuista nähdään, Accuscore ennusti viime eduskuntavaalien tapaan tarkimmin kuntavaalien lopputuloksen. Accuscore ja HS olivat myös ainoat, jotka ennustivat puolueiden suuruusjärjestyksen täysin nappiin.


​Yleisellä tasolla kaikki mittaukset ja ennusteet arvioivat kokoomuksen kannatuksen alakanttiin ja keskustan yläkanttiin. Oman ennusteemme osalta keskustan lopputulosta korkeampaan ennusteeseen vaikutti viime kuntavaalien tulos, jossa keskusta peittosi gallupit. Tällä kertaa myös kuntavaaleissa palattiin eduskuntavaalien malliin, jossa vaalitulos keskustan osalta on mielipidemittauksia heikompi.


Ylen mittauksessa vihreät olivat tulosta korkeammalla, muilla vastaavasti matalammalla. Vasemmistoliiton kannatusta taas muut Helsingin Sanomia ja Accuscorea lukuunottamatta ennustivat toteutunutta suuremmaksi. Perussuomalaisten kannatusta on ollut vaikea mitata kuluneen vuosikymmenen aikana. Nytkin mielipidemittaukset näyttivät heille toteutunutta parempaa kannatusta. Vaikka vaalipäivänä puolue hieman kirikin, lopputulos riitti nipin napin vasemmistoliiton edelle. Mielipidemittauksia tekevillä tahoilla on selkeästi vaikeuksia mallintaa perussuomalaisten kannatusta kuntavaaleissa, mikä poikkeaa selkeästi eduskuntavaalikannatuksesta. Kun neljä vuotta sitten mittaukset näyttivät 3%-yksikköä liian suuria lukuja, nyt ero oli keskimäärin vajaan parin prosenttiyksikön luokkaa.


RKP:n kannatuksen ennustamiseen ei suuria simulaatioita tarvita - sen vaihteluväli on marginaalista. Samoin oli laita KD:n mittausten ja ennustusten. Kannatuksen nousu oli havaittavissa lähes kaikissa ennusteissa ja mittauksissa. Ryhmä "muut" on kuntavaaleissa eduskuntavaaleja huomattavasti merkittävämpi toimija kuntavaaleissa, mutta sitä eivät muutamat mielipidemittauksia tekevät tahot noteeranneet. Esim. YLE:n viimeisessä mittauksessa heidän kannatukseksi mitattiin 1.8%-yksikköä, kun lopullinen tulos oli 3.4%-yksikköä.


​Sosiaalisen median data ei kuntavaaleissa ollut kovinkaan hyvä pohja ennustuksille. Underhoodin mainearvon pohjalta Vasemmistoliitto olisi ollut maan suurin puolue. Kun katsottiin viime aikojen mainearvon muutosta, keskusta näytti nostaneen asemiaan eniten. Tämäkään ei pitänyt paikkaansa. Ainoa asia, jota sosiaalisen median data hieman pystyi ennustamaan oli perussuomalaisten kannatuksen kasvu vaalipäivän alla. Vihreiden kasvu ei ollut Underhoodin mainearvossa juurikaan näkyvissä.


Mistä sitten johtuu sosiaalisen median datan heikko käytettävyys ennusteissa? Kuntavaalissa suurin syy lienee keskustelukanavien pirstaleisuus. Kun dataa kerätään vain puolueiden virallisilta tileiltä, eivät korkean some-profiilin omaavat puheenjohtajat, ministerit, mutt näkyvät puolueihmiset tai -ehdokkaat näy näissä luvuissa. Samalla saattaa vääristyä niiden puolueiden mainearvo, joiden ehdokkaat käyttävät puolueen some-kanavia enemmän omiensa sijaan. Tämä lienee osasyy keskustan korkeaan mainearvoon.


Accuscore teki Iltalehden kanssa yhteistyötä myös vaali-iltana. Ennakkoäänten julkistamisen jälkeen tehty ennuste oli hämmentävän tarkka. Sen virhemarginaali oli vain 4.0%-yksikköä. Ja jos otetaan pois pienempien ryhmien (muut 1.0%-yksikön virhe ja KD 1.1 %-yksikön virhe) ennusteet, oli keskimääräinen puolueiden ennustevirhe tässä tapauksessa alle 0.3 %-yksikköä per puolue. 


YLE julkaisi oman ennusteensa puolitoista tuntia myöhemmin äänetenlaskenna edettyä hyvän matkaa, mutta saavutti paremman tarkkuuden ennusteessa vain pienten puolueiden avulla. Seitsemän suurimman puolueen osalla Accuscoren ennuste oli tarkempi ja ennuste myös näytti puolueiden lopullisen järjestyksen oikein, mihin YLE:n ennuste ei lisädatasta huolimatta pystynyt.


Näiden ennusteiden pohjalta voi sanoa, että simulointimalli on edelleen tarkin ennustaja, mutta kokeiluja jatketaan myös sosiaalisen median datan suhteen. Presidentinvaalit voivat olla toimivampi ympäristö, koska silloin keskustelukanavana toimivat pääasiassa ehdokkaiden some-tilit.