Of- og vanmældir flokkar

Þegar fylgiskannanir eru teknar saman, eins og hefur verið gert hér, er oft unnið út frá þeirri forsendu að ekki sé um kerfisbundnar of- eða vanmælingar á tilteknum flokkum að ræða. Ef um ókerfisbundnar of- eða vanmælingar er að ræða ættu slíkar skekkjur að að dreifast með tilviljanakenndum hætti á könnunaraðila og vera í báðar áttir, þ.e. að stundum er einhver flokkur vanmældur og stundum er hann (eða annar) ofmældur. Lykilatriði er að gengið er út frá þeirri forsendu að engar kerfisbundnar skekkjur eigi sér stað. Með því að safna könnunum saman og birta mat á fylgi ættu slíkar ókerfisbundnar bjaganir að jafnast út, þ.e. ofmæling hjá einum aðila ætti að jafnaði að núllast út í könnunum hjá öðrum aðila og í öðrum könnunum hjá sama aðila. Í síðasta mati okkar á fylgi flokkana má segja að við höfum gefið okkur þá forsendu að enginn flokkanna sé kerfisbundið of- eða vanmetin.

Annað atriði sem segja má að gengið sé út frá er að það sé kerfisbundinn munur í nákvæmni á milli könnunaraðila (annar en úrtaksstærð). Þ.e.a.s. að við gerum ekki ráð fyrir því að gæði eða nákvæmni eins könnunaraðila séu meiri eða minni en annarra. Sjá má dæmi um hið gagnstæða hjá kosningaspá.is sem rekin er af Baldri Héðinssyni og Kjarnanum. Þar eru kannanir með mismikið vægi eftir því hver framkvæmir hana.

Því má spyrja sig tveggja spurninga:

  1. Er eitthvað sem bendir til þess að það sé munur á gæðum eða návæmni fylgiskannana eftir því hver framkvæmir?
  2. Bendir eitthvað til þess að einhverjir flokkar séu of- eða vanmældir á kerfisbundinn hátt? Ef svo er, eru einhverjir ákveðnir könnunaðilar sem of/vanmæla einhverja flokka umfram aðra?

Skekkjur mældar

Sú mæling á skekkju könnunaraðila sem er þekktust (þó sjaldnast undir því nafni) er ein af átta mælingum Mostellers. Hún er skilgreind sem meðalfrávik í prósentustigum á mældu fylgi og kosningafylgi fyrir hvern flokk eða kandídat (hvort sem er verið að ræða um) án tillits til í hvora áttina skekkjan er (tölugildið er notað).

Dæmi: Flokkur X er mældur með 26% stuðning í könnun en fær 25% atkvæða í kosningum. Frávikið fyrir þann flokk yrði þá 1. Flokkur Y er mældur með 25% en fær 26% atkvæða í kosningum. Frávikið er er einnig 1. Flokkur Z er mældur með 35% í könnun en fær 32% atkvæða. Frávikið er 3. Síðan er tekið meðaltal af frávikinu og fundin út heildarskekkja. Hér yrði hún \(\frac{1+1+3}{3}=1,67\).

Árið 2005 gáfu Martin, Traugott, & Kennedy út grein þar sem sett var fram ný mæling á kannanaskekkju, kölluð \(A\). Í stuttu máli er túlkunin á A á þann veg að neikvætt A merkir að könnunaraðili hafi vanmetið frambjóðanda og jákvætt A að hann hafi verið ofmetinn. A er sett fram sem lógariðmi af gagnlíkindahlutfalli (Odds Ratio) og er því mælingin samhverf um núll. Þessi mæling á skekkju er nokkur framför frá Mosteller mælingunni sem lýst er hér að ofan.

Hins vegar hentar \(A\) illa þegar kemur að fjölflokka kerfi þar sem ávallt þarf að miða mælinguna við samanburð við annan valkost (flokk eða kandídat), enda sniðin að bandaríska kerfinu þar sem oftast er valið milli demókrata og repúblikana. Til að gera langa sögu stutta útvíkka Arzheimer og Evans þessa mælingu yfir í \(A’\) og \(B\) (og \(B_w\)). Arzheimer og Evans átta sig á tengingu A við logistic líkanið og útvíkka það yfir í nafnbreytu (multinomial) logistic líkan. Skekkju fyrir hvern flokk i er hægt að mæla með \(A_i\) sem er 0 þegar enginn skekkja er og í – þegar flokkur er vanmetinn og + þegar hann er ofmetinn.

Þessar mælingar henta vel því hægt er að nota þær sem fylgibreytur í aðhvarfslíkani (t.a.m.). Án þess að fara um of út í tæknilegar hliðar þessara mælinga eru hér settar fram athuganir úr tveimur seinustu þingkosningum á Íslandi. Hér og hér er hægt að kynna sér nánar rannsóknir þeirra.

Heildarskekkja (\(B\) og \(B_w\))

Á grafinu hér að neðan er að finna \(B_w\) sem er vigtuð heildarskekkja könnunaraðila úr kosningunum 2013 og 2016. Einungis er miðað við eina könnun (seinustu könnun sem birt var). Eins og sjá má var nokkur munur á milli kosninganna.

Vigtuð skekkja fyrir Alþingiskosningar 2013/16 eftir könnunaraðilum.

Vigtuð skekkja fyrir Alþingiskosningar 2013/16 eftir könnunaraðilum.

Kosturinn við \(B_w\) sem mælingu er að hægt er að nota hana sem fylgibreytu í aðhvarfsgreiningarlíkani þar sem við getum athugað hvort það sé munur á milli könnunaraðila með því að hafa kóða könnunaraðila sem dummy breytur í líkaninu. Við nýtum því kannanir sem birtust á seinustu mánuðum fyrir kosningar sem mælingar. Þar sem kannanir verða nákvæmari eftir því sem styttra er til kosninga þá notum við breytu sem mælir tíma til kosninga (í dögum) sem stjórnbreytu. Við stjórnum einnig fyrir úrtaksstærð kannana til að einangra betur mögulega áhrif einstakra könnunaraðila.

Línulegt aðhvarfsgreiningarlíkan fyrir B_w fyrir þingkosningar 2016

Línulegt aðhvarfsgreiningarlíkan fyrir B_w fyrir þingkosningar 2016

Hér að ofan eru niðurstöður úr aðhvarfslíkani þar sem \(B_w\) er (vigtuð) heildarskekkjakönnunaraðila, dtk er stjórnbreyta fyrir tíma til kosninga (í dögum) og n2 er úrtaksstærð (og nei, hún er ekki í öðru veldi, heitir bara n2 í gagnasafninu). Síðan eru dummy breytur fyrir Félagsvísindastofnun, Gallup og MMR. Fréttablaðið er viðmiðunaraðili. Athugaðar eru 24 kannanir. Svipaða niðurstöður er að finna fyrir þingkosningar 2013 (ekki sýnt).

Niðurstaða

Ekki er hægt að álykta um að það sé munur á milli könnunaraðila þegar kemur að skekkju milli kosninga og seinustu kannana í aðdraganda kosninga. Athuga þarf að það þýðir ekki að engin skekkja sé á milli kannana og úrslita (hún er það nánast alltaf), heldur að ekki er hægt að álykta að einn könnunaraðili sé með meiri skekkju en hinn.

Ástæðan fyrir því að við gefum ekki könnunaraðilum mismunandi vægi út frá áreiðanleika í mati okkar á fylgi flokka, eru niðurstöðurnar hér að ofan.

Skekkja í mælingu einstakra flokka

Í samantekt á mælingum \(A_i\) (skekkja fyrir tiltekna flokka á) í kosningum 2013 og 2016 er tvennt sem stendur upp úr: Sjálfstæðisflokkurinn er alla jafna vanmældur í könnunum nokkuð stöðugt seinustu mánuðum fyrir kosningar og flokkur Pírata ofmældur að sama skapi. Þessi of- og vanmæling virðist einnig vera í sömu átt hjá öllum könnunaraðilum, en af mismikilli stærð (þó munurinn á milli þeirra sé innan vikmarka). Aðrir flokkar er ekki of- eða vanmældir að sama skapi, sumir að frekar litlu leyti og aðrir að litlu leyti en skekkjur milli aðila núllast út í heildarskekkju.

Forspágildi fyrir A’
Variable Sjálfstl.fl. VG Píratar framsokn Viðreisn BF Samfylking
A’
2016 -0,2760 -0,0171 0,3639 -0,0858 -0,0124 0,0065 0,1930
2013 -0,2815 -0,2685 0,3858 0,3883 0,3077 -0,0731

 

Af einhverjum ástæðum virðist svo vera, a.m.k í seinustu tveimur þingkosningum, að fylgiskannanir hafi verið að vanmeta fylgi Sjálfstæðisflokksins í aðdraganda kosninga, og ofmeta fylgi Pírata. Hvað það er sem hefur áhrif á þessa skekkju er ekki hægt að sjá út frá þessum gögnum og hafa ber í huga að hér er einungis verið að miða við útkomur í úrvinnslu (þ.e. reiknað fylgi í könnunum, við erum ekki með míkró-/hrágögnin). Líklegt verður að teljast að eitthvað í úrtaksaðferðum könnunaraðilana verði til þess að slíkt mynstur kemur fram. Af einhverjum ástæðum virðist vera erfiðara að fá kjósendur Sjálfstæðisflokks til þess að taka þátt í fylgiskönnunum og (of) auðvelt að fá stuðningsfólk Pírata. Hægt er að velta því fyrir sér hvaða ástæður eru fyrir þessum mun.

Niðurstaða

Vísbendingar eru í þá átt að könnunaraðilar ofmeti kerfisbundið fylgi flokks Pírata og vanmeti kerfisbundið fylgi við Sjálfstæðsflokk.

Í mati okkar á fylgi flokkana hefur ekki verið reynt að meta og vega of- eða vanmat á fylgi flokkana í fylgiskönnunum. Hins vegar benda þessar niðurstöður til þess að það gæti bætt matið og gert það nákvæmara. Augljós ókostur er að við vitum ekki hvaða öfl og gangverk eiga sér stað sem stýra þessari (líklegu) skekkju. Við munum hins vegar í ljósi þessara athugana endurmeta gögn frá könnunaraðilum til þess að reyna að leiðrétta fyrir ofangreindum atriðum.

– Helgi Eiríkur Eyjólfsson

Kosningaætlun landsmanna fyrir þingkosningar 2017

Mat á kosningaætlun 27 sept

Við endurtökum leikinn frá þingkosningum 2013! Þá tókum við saman kannanir sem birtust fyrir kjördag og drógum þær saman og skoðuðum í samhengi. Mögulega fyrst allra á Íslandi? Hver veit. Nú eru nýir og breyttir tímar og aðrar (vonandi betri) aðferðir.

Gengið verður til þingkosninga á Íslandi þann 28. október næstkomandi eftir nokkuð bráð stjórnarslit sem urðu 15. september. Þá sleit Björt framtíð ríkisstjórnarsamstarfi við Sjálfstæðisflokk og Viðreisn. Forseti rauf þing stuttu seinna og boðaði þar með til kosninga.

Hér er markmiðið að auðvelda okkur og öðrum að leggja mat á hvað fylgiskannanir eru að segja okkur og hvernig staðan í fylgi flokkanna í kosningabaráttunni er. Ef hver fylgiskönnun sem birtist er tekin og skoðuð einangruð frá öllum öðrum fylgiskönnunun, getur verið snúið að átta sig á stöðunni. Með því að draga þær allar saman og líta á þær sem gagnapunkta getum við síað út suðið og reynt að átta okkur betur á merkinu.

Eftir því sem kannanir berast munum við uppfæra matið á fylginu og ekki síst mat á óvissunni. Við gerum það með því að mata baysískt tölfræðilíkan á uppfærðum gögnum. Markmiðið er að geta lagt öruggara mat á undirliggjandi fylgið við hvern flokk en einstakar kannanir gefa okkur.

Við munum auk mats á fylgi flokkana á hverjum tíma gera grein fyrir því hvaða flokkur er líklegastur til að fá flest atkvæði á landsvísu, og þar með „sigra“ kosningarnar. Einnig munum við leggja mat á hversu líklegt er að flokkar sem eru við 5% mörkin séu við að fá 5% eða meira fylgi á landsvísu. Það er algengur misskilningur að í íslenska kosningakerfinu sé 5% þröskuldur sem flokkar þurfa að ná til að koma til greina við úthlutun þingsæta. Það er ekki svo. Hin svokallaða „5% regla“ er hins vegar sú regla að til þess að koma til greina við úthlutun jöfnunarsæta verður flokkur að vera með að lágmarki 5% á landsvísu. Flokkur með mikið fylgið í einu kjördæmi getur því alveg fengið kjördæmakjörið þingsæti, en verið undir 5% fylgi á landsvísu. Kjördæmakjörni þingmaður þess flokks fengi að sjálfsögðu sitt sæti þó að flokkurinn kæmi ekki til greina í úthlutun jöfnunarsæta. Þetta er þó ekki algengt, en hefur gerst. Árið 1999 fékk Frjálslyndi flokkurinn 17.7% fylgi á Vestfjörðum, en einungis 4,2% á landsvísu.

Líkanið

Til að meta hvert fylgið er notast við Baysískar tölfræðiaðferðir og Monte Carlo hermanir við gerð líkansins. Líkanið er að mestu leyti byggt á líkani sem Kai Arzheimer notaðist við til að greina fylgiskannanir í þýsku þingkosningunum og má lesa um hér. Okkar líkan byggir á aðferðum hans, vinnu Simon Jackman og bloggins Mark the ballot.

Fylgi við flokka á hverjum tíma (kosningaætlun eða voting intention) er ekki hægt að skoða með beinum hætti. Fylgið er m.ö.o. dulin stærð. Á því er ein undantekning og það eru kosningar, sem er eini tímapunkturinn þar sam fylgið er ekki dulin stærð.

Því er líkan notað til að meta fylgi fyrir hvern dag á tímabilinu sem er verið að skoða. Kosningaætlun breytir því um stöðu á hverjum degi tengjast saman og mynda Markov-ferli. Matið byggir á því að kosningaætlun í dag er sé að mestu leyti eins og hún var í gær og fylgi einhverri líkindadreifingu. Þannig gerir líkanið ráð fyrir að kosningaætlun í dag sé að mestu leyti eins og kosningætlun í gær. Gagnapunktar líkansins eru fylgiskannanir sem birtast með óreglulegu bili og er líkanið uppfært með þeim gögnum.

Til að fá niðurstöður úr líkaninu er beitt aðferð byggðri á Markov keðjum og slembitölum og kallast Markov keðju Monte Carlo aðferðir.

Líkanið er enn í vinnslu og gæti breyst frá því þetta er skrifað (2.okt 2017).

Meira um aðferðafræði þess hvernig fylgið/kosningaætlun er metin kemur síðar (væntanlega/kannski).

Staðan samkvæmt nýjustu könnunum

Á myndinni má sjá niðurstöður líkansins um hvert miðgildi fylgis er ásamt 95% Baysískum öryggisbilum (credible interval).

Mat á kosningaætlun 27 sept

Í töflu:

Mat á fylgi flokka 27. sept 2017
Flokkur lægri efri miðgildi
Sjálfstæðisfl. 21.1 26.9 24.0
Vinstri græn 23.1 28.2 25.7
Píratar 8.9 12.7 10.8
Viðreisn 3.0 5.7 4.3
Framsókn 5.3 8.6 7.0
Samfylkingin 6.9 10.5 8.7
Flokkur fólks 6.7 10.1 8.4
Björt framtíð 2.6 5.0 3.8
Stj.fl. SDG 5.1 7.7 6.4

Þróun stærri flokka (>10%) yfir tíma

Þróun stærri flokka 27 sept

Grafið sýnir hvernig líkanið metur þróun fylgis Sjálfstæðisflokks og VG síðustu vikur. Línurnar tákna matið á fylgi, skyggðu svæðin tákna 95% credible interval, og punktarnir eru einstakar kannanir. Punktalínan sem er dregin 15. sept táknar stjórnarslitin.

Þróun minni flokka (<10%) yfir tíma

Þróun smærri flokka

Grafið sýnir hvernig líkanið metur þróun fylgis annarra helstu flokka (~ 10% fylgi) síðustu vikur. Línurnar tákna hvernig líkanið metur fylgið, og punktarnir eru einstakar kannanir. Punktalíkan sem er dregin 15. sept táknar stjórnarslitin, og rauða punktalínan á y-ásnum táknar lágmarkið til að geta fengið uppbótarþingsæti. Skyggðu svæðunum er sleppt hér til að gera grafið læsilegra. Athugið að matið á nýja Miðflokknum er ónákvæmara en mat á öðrum þar sem hann kom ekki fram fyrr en seint á tímabílinu.

Siguvegari kosninganna

Dreifing fylgis D og V

Niðurstöður úr 60 þúsund hermunum. Myndin sýnir hvernig fylgið dreifist hjá tveimur stærstu flokkunum (Sjálfstæðisflokki og Vinstri grænum). Gæti fallið hvoru megin sem er eins og staðan er 27. sept 2017. Í töflunni hér að neðan má sjá líkurnar (í prósentum) á að VG sigri Sjálfstæðisflokkinn (fleiri atkvæði á landsvísu) annarsvegar og hinsvegar líkurnar á að Sjálfstæðisflokkur sigri VG.

Flokkur Líkindi að sigra hinn
Vinstri græn 77.4%
Sjálfstæðisflokkur 22.6%

Ríkisstjórn með Sjálfstæðisflokki. Koss dauðans?

Líkanið metur líkindi Bjartrar framtíðar að komast á þing frekar lág. Í 60 þúsund hermunum nær BF 5% marki fyrir uppbótarþingmenn í \(\frac{1793}{60000}\) tilfella. Það gerir 3% líkur á að BF komist á þing.

Aðrir sem eru við þröskuldinn eru Viðreisn með punktmat upp á 4.3%. Líkanið metur líkindin á að Viðreisn sé yfir 5% upp á 17.5%. Í töflunni að neðan má sjá líkindin á að vera fyrir ofan 5% eins og staðan er skv. nýjustu fylgiskönnunum.

Flokkur Líkindi að fylgi sé \(\geq 5\%\)
Björt framtíð 3%
Viðreisn 17.5%
Miðflokkur SDG 98.5%
Framsókn 99.2%
Flokkur fólksins 99.2%

Eins og sjá má metur líkanið að Miðflokkur SDG, Framsóknarflokkurinn og Flokkur fólksins yrðu örugg inn. Hins vegar er Björt framtíð með hverfandi líkur en Viðreisn aðeins betri.

Líkanið mun uppfærast eftir því sem gögn bætast við eða líkanasmíð framvindur.

– Helgi Eiríkur Eyjólfsson

 

Frumvörp um kosningar á 146. þingi og afdrif þeirra

kjordagur-0881-1_1

Við hér hjá hinu stafræna samlagi, gogn.in, erum ekki bara áhugafólk um kosningar, heldur störfum við mörg hver við kosningar. Undirritaður hefur t.d. borið ábyrgð á meðferð utankjörfundaratkvæða við allar almennar kosningar í Reykjavík síðan 2011, auk þes að koma að uppgjöri og undirbúningi allra þeirra kosninga í samstarfi við starfsfólk Reykjavíkurborgar og yfirkjörstjórnir.

Á því þingi sem nú var að ljúka komu fram nokkur þingmál sem lúta að kosningum. Förum nú yfir þau.

Byrjum á þeim frumvörpum sem urðu að lögum:

Það er stuttur listi. Ekkert frumvarp sem lýtur að kosningum varð að lögum.

Eitt frumvarp náði alla leið í þriðju umræðu og atkvæðagreiðslu:

Frumvarp til laga um breytingu á lögum um kosningar til sveitarstjórna, nr. 5/1998, með síðari breytingum (kosningarréttur erlendra ríkisborgara)

Frumvarpið, sem er borið fram af þingmönnum Viðreisnar, miðar að því að stytta þann tíma sem erlendir ríkisborgarar þurfa að dvelja hér, áður en þeir fá kosningarétt (og kjörgengi) í sveitarstjórnarkosningum. Með frumvarpinu fylgdi tafla þar sem Norðurlöndin eru borin saman:

Screenshot 2017-06-01 21.58.08

Með frumvarpinu var lagt til að hér yrði staðan sú sama og í Danmörku og Svíþjóð. Stjórnskipunar- og eftirlitsnefnd fjallaði um frumvarpið, sendi 58 aðilum umsagnarbeiðnir og fékk 6. Allar umsagnir voru jákvæðar, nema umsögn lýðræðisfélagsins Öldu, sem vildi ganga enn lengra og afnema öll tímamörk á kosningarétti erlendra ríkisborgara. Eftir umfjöllun nefndarinnar varð það úr að hún lagði til að frumvarpinu yrðir vísað til ríkisstjórnarinnar til frekari meðferðar. Fyrsti flutningsmaður, Pawel Bartoszek lét þess getið í atkvæðagreiðslu um tillögu nefndarinnar (sem var samþykkt) að Dómsmálaráðuneytið mætti eiga von á að finna sinn “hlýja andardrátt á hnakka sínum” til að tryggja framgang málsins.

Þrjú frumvörp voru í nefnd þegar þingfundum var frestað.

Kosningar til sveitarstjórna (kosningaaldur)

Frumvarpið, sem er borið fram af fulltrúm allra flokka, er sett fram til að lækka kosningaaldur í kosningum til sveitarstjórna úr átján árum í sextán. Tuttugu umsagnir bárust allsherjar- og menntamálanefnd, nær allar jákvæðar. Íslenska Þjóðfylkingin sagði í sinni umsögn að “gjörningurinn væri arfa vitlaus”.

Sveitarstjórnarlög (íbúakosningar)

Píratar endurfluttu frumvarp sitt um breytingar á sveitarstjórnarlögum sem kveða á um að hlutfall íbúa sem þarf til að fara fram á íbúakosningu skuli vera 20% eða hærra. Frumvarpið miðar að því að afnema þann þröskuld og gefa sveitarstjórnum sjálfdæmi í því hversu hátt (eða lágt) hlutfallið þarf að vera. Frumvarpið gekk til umhverfis-og samgöngunefndar sem sendi 90 umsagnarbeiðnir en fékk einungis tvær sendar til sín. Önnur frá Fljótsdalshéraði sem tók ekki afstöðu og aðra frá ASÍ sem “gerir ekki athugasemdir við efni málsins”.

Sveitarstjórnarlög (fjöldi fulltrúa í sveitarstjórn)

Samgöngu- og sveitarstjórnarráðherra flutti stjórnarfrumvarp um breytingar á sveitarstjórnalögum þar sem lágmarksfjöldi aðalmann í sveitarstjórn í sveitarfélögum þar sem íbúar eru 100 þúsund eða fleiri skal vera 23. Einungis eitt sveitarfélag uppfyllir það, Reykjavíkurborg, en þar eru nú borgarfulltrúar fimmtán. Við komandi sveitarstjórnarkosningar verður því, samkvæmt núgildandi lögum, borgarfulltrúum fjölgað í 23 að lágmarki (og 31 að hámarki).
Frumvarpið gengur út á að afturkalla þessa fjölgun borgarfulltrúa en hún hefur verið hluti af lögunum allt frá setningu þeirra árið 2011, en þó með því bráðabirgðarákvæði þess efnis að breytingin tæki ekki gildi fyrr en við aðrar kosningar frá setningu. Semsagt í fyrsta lagi við sveitarstjórnarkosningar 2018.
Fjórar umsagnir bárust umhverfis- og samgöngunefnd. Ber þar helst að nefna umsögn forsætisnefndar Reykjavíkurborgar sem lagðist gegn málinu. Þar segir m.a.: “Forsætisnefnd hefur unnið markvisst að fjölgun borgarfulltrúa eftir gildandi lögum allt þetta kjörtímabil og furðar sig á því að undir lok þess kjósi löggjafinn einhliða að setja hlutverk hennar að þessu leyti í óvissu og hundsa með öllu fyrri umsögn hennar.”

Flest þessara frumvarpa fjalla um kosningar til sveitarstjórna sem verða næst haldnar eftir tæpt ár, í lok maí 2018. Ólíklegt verður talið að á haustþingi verði gerð sú breyting sem Samgöngu- og sveitarstjórnarráðherra lagði til (um afturköllun fjölgunar borgarfulltrúa). Markast það af því að þá verður tíminn til sveitarstjórnakosninga of skammur. Önnur frumvörp sem lúta að kosningarétti ungmenna og erlendra ríkisborgara gætu hins vegar vel verið afgreidd þá, enda eru þær breytingar einfaldari, þó þær séu að sjálfsögðu ekki smávægilegar.

Tvö frumvörp komu svo ekki til 1. umræðu, bæði borin fram af Viktori Orra Valgarðssyni, Pírata.
Kosningar til Alþingis (skipting þingsæta) og Kosningar til Alþingis (persónukjör þvert á flokka).

Að lokum er vert að minnast á viðamikið frumvarp um endurskoðun á undirbúningi og framkvæmd kosninga til Alþingis sem forsætisnefnd þingsins lagði fram á síðasta þing (því 145.) en kom ekki til afgreiðslu þá, og ekki heldur á nýafstöðnu þingi. Það frumvarp var samið af vinnuhópi um endurskoðun kosningalaga og inniheldur ýmsar nýjungar við framkvæmd kosninga til Alþingis. Helst má þar nefna ákvæði um að kjörskrá geti verið rafræn sem og að hlutverk Landskjörstjórnar er skýrt og eflt.

– Páll Hilmarsson

Lykilorð í Vodafone lekanum

Hluti af "signup" töflunni í Vodafone lekanum

Hluti af “signup” töflunni í Vodafone lekanum

Þann 30. nóvember 2013 láku gögn af netþjóni Vodafone á netið. Stærstur hluti lekans voru sms-skilaboð sem notendur höfðu sent í gegnum vef fyrirtækisins. Einnig var þar að finna gagnagrunnstöflur með símanúmerum, kennitölum, netföngum og lykilorðum notenda (svo fátt eitt sé nefnt). Lekinn hafði víðtæk áhrif, netöryggissveit Póst- og fjarskiptastofnunar skrifaði skýrslu um málið og nokkrir notendur fengu skaðabætur eftir dómsmál.

Forritarar Vodafone kusu að dulrita öll lykilorð í gagnagrunninum, yfirleitt í dálki nefndum ‘encpasswd’. Alls voru 104.754 lykilorð dulrituð þannig. Af þeim voru 30.140, eða um 29%, einnig ódulrituð í dálki nefndum ‘password’. Það eru þessi lykilorð sem við ætlum að líta aðeins á.

Mismunandi var hvort lykilorðin voru pöruð við netföng. Sumar töflur voru þannig að notendanafn var kennitala eða símanúmer. Það sem hér fer á eftir á við þau lykilorð sem ekki voru dulkóðuð og höfðu viðhengt netfang. Einnig fjarlægðum við tvítekningar. Eftir standa 26.654 lykilorð og netföng.

Byrjum á smá tölfræði.

Ekki er mikið um tvítekningar lykilorða. Hér eru efstu 20:

user@computer:$ cat top_20.txt
123456 = 21 (0.08%)
vodafone = 6 (0.02%)
pjakkur1 = 6 (0.02%)
abc123 = 6 (0.02%)
mamma123 = 6 (0.02%)
asdf1234 = 5 (0.02%)
skuggi = 5 (0.02%)
fokker50 = 5 (0.02%)
mamma1 = 5 (0.02%)
sumar123 = 5 (0.02%)
hekla1 = 5 (0.02%)
1234 = 5 (0.02%)
pjakkur = 5 (0.02%)
alexander1 = 5 (0.02%)
jonas123 = 5 (0.02%)
gaman123 = 5 (0.02%)
perla1 = 4 (0.02%)
voda123 = 4 (0.02%)
sandra = 4 (0.02%)

Ef við skoðum topp 20 þegar búið er að taka tákn og tölur af báðum endum:

user@computer:$ cat top_20_base.txt
mamma = 57 (0.21%)
siggi = 54 (0.2%)
anna = 51 (0.19%)
vodafone = 50 (0.19%)
sumar = 44 (0.17%)
gunnar = 42 (0.16%)
inga = 41 (0.15%)
helga = 37 (0.14%)
hundur = 36 (0.14%)
disa = 36 (0.14%)
nonni = 35 (0.13%)
simi = 33 (0.12%)
hildur = 31 (0.12%)
voda = 31 (0.12%)
sigrun = 31 (0.12%)
gummi = 31 (0.12%)
liverpool = 30 (0.11%)
sigga = 29 (0.11%)
ingi = 28 (0.11%)
vetur = 28 (0.11%)

Dreifing lengdar:

user@computer:$ cat top_length-lenght.txt
1 = 1 (0.0%)
2 = 3 (0.01%)
3 = 10 (0.04%)
4 = 41 (0.15%)
5 = 45 (0.17%)
6 = 3841 (14.41%)
7 = 3691 (13.85%)
8 = 8086 (30.34%)
9 = 4558 (17.1%)
10 = 3081 (11.56%)
11 = 1557 (5.84%)
12 = 927 (3.48%)
13 = 390 (1.46%)
14 = 203 (0.76%)
15 = 103 (0.39%)
16 = 61 (0.23%)
17 = 22 (0.08%)
18 = 11 (0.04%)
19 = 3 (0.01%)
20 = 10 (0.04%)
21 = 4 (0.02%)
23 = 4 (0.02%)
24 = 1 (0.0%)
32 = 1 (0.0%)

Og lengd röðuð eftir fjölda:

user@computer:$ cat top_20_length-count.txt
8 = 8086 (30.34%)
9 = 4558 (17.1%)
6 = 3841 (14.41%)
7 = 3691 (13.85%)
10 = 3081 (11.56%)
11 = 1557 (5.84%)
12 = 927 (3.48%)
13 = 390 (1.46%)
14 = 203 (0.76%)
15 = 103 (0.39%)
16 = 61 (0.23%)
5 = 45 (0.17%)
4 = 41 (0.15%)
17 = 22 (0.08%)
18 = 11 (0.04%)
20 = 10 (0.04%)
3 = 10 (0.04%)
23 = 4 (0.02%)
21 = 4 (0.02%)
2 = 3 (0.01%)
19 = 3 (0.01%)
32 = 1 (0.0%)
1 = 1 (0.0%)
24 = 1 (0.0%)

One to six characters = 3941 (14.79%)
One to eight characters = 15718 (58.97'%)
More than eight characters = 10936 (41.03%)

Samsetning lykilorðanna:

user@computer:$ cat characters.txt
Character sets
loweralphanum: 20084 (75.35%)
mixedalphanum: 3774 (14.16%)
loweralpha: 1498 (5.62%)
numeric: 529 (1.98%)
loweralphaspecialnum: 312 (1.17%)
mixedalphaspecialnum: 226 (0.85%)
mixedalpha: 110 (0.41%)
upperalphanum: 66 (0.25%)
loweralphaspecial: 26 (0.1%)
upperalpha: 15 (0.06%)
mixedalphaspecial: 9 (0.03%)
specialnum: 2 (0.01%)
upperalphaspecial: 1 (0.0%)

Character set ordering
stringdigit: 18207 (68.31%)
stringdigitstring: 2808 (10.54%)
allstring: 1623 (6.09%)
othermask: 1536 (5.76%)
digitstring: 1299 (4.87%)
alldigit: 529 (1.98%)
digitstringdigit: 349 (1.31%)
stringspecialdigit: 268 (1.01%)
stringspecialstring: 28 (0.11%)
stringspecial: 6 (0.02%)
specialstringspecial: 1 (0.0%)

Ok. Hvað vitum við nú?

  • Það er lítið um tvítekningar. Það er: fáir notendur eru að nota sama lykilorðið.
  • Eitthvað er um að notendur noti sömu orðin til að útbúa lykilorð (með viðbótum).
  • Flest lykilorð eru 6-10 stafir að lengd
  • Langflest lykilorð (75%) eru lágstafir+tölustafir
  • Mikill meirihluti (68%) eru strengur+tala/tölur

Skoðum núna hvort einhverjir notendur notuðu hluta af netföngum sínum sem lykilorð:

user@computer:$ cat emails.txt
Exact Matches
-------------
Whole Email Address
No Exact Matches

Just Name
Total: 175

Semsagt: 175 notendur voru með sama lykilorð og fyrri hluti netfangs. Dæmi (tilbúið):

Netfang: helgibest@tolvupostur.is
Lykilorð: helgibest

Ef við notumst við Levenshtein algrímið til að sjá hvort notendur eru að gera (smávægilegar) breytingar á fyrri hluta netfangs og nota það sem lykilorð:

user@computer:$ cat emails-levenshtein_3.txt
Levenshtein Results (max 3)
-------------------
Average distance (email) 16.59
Average distance (name) 8.47

Close Matches
-------------
Whole Email Address
Total: 1

Just Name
Total: 902

902 lykilorð eru þremur breytingum eða færra frá fyrri hluta netfangs notandans. Dæmi (tilbúið)

Netfang: helgibest@tolvupostur.is
Lykilorð: helgi6best

Eins og áður sagði voru öll lykilorð hjá Vodafone geymd dulkóðuð (þó stór hluti þeirra hafi einnig verið geymd ódulkóðuð). Dulkóðunin sem Vodafone valdi er bcrypt með 8 lotum. Ímyndum okkur nú að einhver hafi komist yfir gagnagrunninn og ekkert lykilorð hafi verið ódulkóðað, heldur einungis dulkóðaða útgáfan. Hverjir væru möguleikar hins illa hakkara til að komast í lykilorðin?

Hún gæti prófað allar samsetningar allra stafa, en það tæki óratíma. Til að stytta sér leið væri hægt að notast við orðalista. Einn sá helsti sem auðveldlega er hægt að nálgast er listi með lykilorðum frá bandaríska fyrirtækinu rockyou.

Skoðum hversu mörg lykilorð í rockyou listanum eru í listanum okkar:

user@computer:$ cat rockyou.txt | wc -l
4225

Lykilorð 4224 reikninga í Vodafone lekanum eru stafrétt eins og í rockyou lekanum. Það eru 16% af þeim sem við erum að vinna með.

Eitt helsta tól til að brjóta dulkóðuð lykilorð á þennan hátt (brute-force) er hashcat. Ef við keyrum hashcat á þau lykilorð sem eftir eru og bætum við einum tölustaf aftast í öll lykilorðin í rockyou listanum:

user@computer:$ cat rockyou?d.txt | wc -l
1467

Example:

grettir3:grettir3
gormur13:gormur13

Hér erum við semsagt búin að prófa öll lykilorðin í rockyou listanum og bæta við einni tölu aftast við hvert. Dæmi:

lykilorð: siggi1
prófað: siggi10, siggi11, siggi12, siggi13, siggi14, siggi15, siggi16, siggi17, siggi18, siggi19

En afhverju einn tölustafur? Jú við vitum að 68% lykilorða er strengur + tala/tölustafur.

Prófum að bæta við einni tölu enn (sú aðgerð er mun tímafrekari, en samt sem áður vel framkvæmanleg):

user@computer:$ cat rockyou?d?d.txt | wc -l
2855

Example:

G-striker79:G-striker79
Freyja28:Freyja28

Og þeirri þriðju:

user@computer:$ cat rockyou?d?d?d.txt | wc -l
920

Example:

Element2006:Element2006
Centrino123:Centrino123

Hér erum við semsagt komin með lykilorð 9467 reikninga, eða 36%.

Ímyndum okkur nú að hakkarinn okkar sé nokkuð kunnugur íslensku samfélagi og viti að grunnurinn sem hún er með í höndunum sé frá íslensku fyrirtæki. Mætti kannski hugsa sér að prófa sérsniðinn orðalista?

Notum orðalista Beygingarlýsingar íslensks nútímamáls (BÍN), en síum út orð með íslenskum sértáknum. Það gera um 730.000 orð:

user@computer:$ cat bin.txt | wc -l
106

Example:

stundum:stundum
surtur:surtur

Prófum að bæta við einum tölustaf:

user@computer:$ cat bin?d.txt | wc -l
223

Example:

brussa1:brussa1
Dadda1:Dadda1

Tveimur bætt við:

user@computer:$ cat bin?d?d.txt | wc -l
644

Example:

skepna79:skepna79
skemmtileg64:skemmtileg64

Þrír:

user@computer:$ cat bin?d?d?d.txt | wc -l
171

Example:

folda234:folda234
austur104:austur104

Hér bættust við 500 reikningar.

Prófum einn orðalista enn: Öll samþykkt mannanöfn, fengið héðan.

user@computer:$ cat mannanofn.txt | wc -l
1

Example:

hersir:hersir

Ekki gaf það mikið. Bætum við einum tölustaf:

user@computer:$ cat mannanofn?d.txt | wc -l
35

Example:

Sigurjon2:Sigurjon2
Kristall3:Kristall3

Tveir:

user@computer:$ cat mannanofn?d?d.txt | wc -l
87

Example:

Frosti06:Frosti06
Hafrun28:Hafrun28

Látum staðar numið hér. Með tiltölulega litlum tilkostnaði höfum við fundið lykilorð 10.774 reikninga, eða 40%.

Athugaðu að þegar við segjum “með litlum tilkostnaði”, þá er það ekki allskostar rétt. Það veltur allt á því hverskonar dulkóðun verið er að reyna að brjóta. Í tilfelli Vodafone var sjálf dulkóðunin nokkuð sterk, fyrir utan náttúrulega það ótrúlega verklag að geyma lykilorð ódulkóðuð. Það sem hinsvegar minnkar kostnaðinn er hvernig notendur samsetja lykilorðin sín. Það er mjög fyrirsjáanlegt, eins og við höfum sýnt fram á.

Nú höfum við ekkert til að bera saman við þennan lykilorðalista sem var í Vodafone lekanum, en það hefur sýnt sig erlendis að notendur nota sömu lykilorð á mismunandi stöðum (eins og við reyndar sýndum fram á með samanburðinum við rockyou listann). Það má því leiða líkur að því að í öðrum kerfum, velji íslenskir netnotendur sér lykilorð sem eru af svipuðum (eða jafnvel bara nákvæmlega eins) toga.

En hvað er þá til ráða? Hvernig á að velja lykilorð?

1. Besta lykilorðið er lykilorð sem þú kannt ekki.
Notaðu forrit til að halda utanum lykilorðin þín, og láttu það forrit útbúa þau sjálfkrafa. Hér eru nokkur góð: 1Password, LastPass, KeePass.

2. Ekki nota sama lykilorðið neinstaðar. Ég endurtek: ekki nota sama lykilorðið neinstaðar.
Ef hakkari finnur lykilorðið þitt á einni vefsíðu, og þú hefur notað það víðar, þá ertu búinn að tapa. Þá er allt búið.

3. Ef þú af einhverjum furðulegum ástæðum getur ekki notað eitt af þeim forritum hér að ofan til að halda utanum lykilorð, reyndu þá að útbúa lykilorðin þín þannig að þau séu ekki í líkingu við þau sem meirihluti notenda Vodafone útbjó. Landsbankinn birti nýlega ágætis grein um hvernig gott er að velja lykilorð.

Dæmi:
Skref 1: Búum til lykilorðasetningu:
Hví í ósköpunum þarf ég að muna svona mörg lykilorð?

Skref 2: Fjarlægjum orðabilin:
Hvííósköpunumþarfégaðmunasvonamörglykilorð?

Skref 3: Veljum stuttan bút úr setningunni:
íósköpun

Skref 4: Bætum tölustöfum og a.m.k. einum hástaf einhversstaðar inn:
íósKöpun73 (10 stafir með blöndu af bók- og tölustöfum, há- og lágstöfum).

Við þetta má bæta að ef þessi aðferð er notuð er gott að venja sig á að velja ekki bút úr setningunni sem hefst á orði. Dæmi um það væri t.d.:

unas3voNamö

Sá sem þetta ritar er með 826 lykilorð vistuð í því forriti sem heldur utanum lykilorð. Mögulega er það í hærri kantinum, en það er ljóst að meðal notandi þarf að halda utanum tugi lykilorða. Það er erfitt að muna flókin lykilorð, jafnvel þó hjálparsetningar séu notaðar. Lang, lang best er að nota forrit til að hjálpa sér við það.

20140205_141029

Rafrænar íbúakosningar og öryggi

Vorið 2013 voru samþykktar breytingar á sveitarstjórnarlögum, sérstaklega til að auðvelda framkvæmd rafrænna íbúakosninga. Þjóðskrá var falið að framfylgja því, þróa og reka kosningakerfi. Ári síðar var kynntur samningur Þjóðskrár og spænska fyrirtækisins Scytl um kaup á kerfi. Jafnframt var tilkynnt að stefnt væri að tilraunakosningum í tveimur sveitarfélögum á haustdögum 2014. Það gekk ekki eftir, en í samningnum er tilgreint að prufukeyrsla geti farið fram allt þar til 30. júní á þessu ári rennur upp.

Samhliða kynningunni á samningnum hélt þáverandi innanríkisráðherra, Hanna Birna Kristjánsdóttirfund fyrir sveitarfélög (varúð: PDF). Ég komst ekki á sjálfan fundinn, en fylgdist með netútsendingu og sendi inn svohljóðandi spurningu:

Það kom fram að kóði kerfis Scytl væri alfarið opinn og aðgengilegur.

Hvar er sá kóði? Það er, hvar er hægt að nálgast hann?

Nú man ég ekki nákvæmlega svarið, en það var eitthvað á það leið að verið væri að vinna í þessu öllu og fljótlega yrði þetta gert opinbert. Það er margt erfitt við framkvæmd á rafrænum kosningum, bæði tæknilega og félagslega, en ég ætla ekki að fara út í það hér. Geri það kannski seinna, en almennt get ég sagt að hrifning mín á kosningum yfir internet er ekki mikil. En ef á að fara slíka leið, þá er það eiginlega frumforsenda að hægt verði að fullvissa sig um að kerfið geri það sem það segist gera, ef traust á því og framkvæmd kosninganna á að vera eitthvert. Að öðrum kosti er tæknikerfið eins og einhverskonar svartur töfrakassi sem enginn/fáir vita hvort eða hvernig virkar.

Í júní í fyrra birtist svo grein á vef Þjóðskrár undir liðnum ‘Tíðindi af verkefninu’. Þar segir:

Rætt hefur verið um mikilvægi þess að kóði kosningakerfisins sé aðgengilegur til rýni, m.a. með það að markmiði að stuðla að gagnsæi og auka traust. Í samningi Þjóðskrár Íslands um notkun á kosningakerfi Scytl í tvennum tilraunakosningum er Þjóðskrá Íslands veittur aðgangur að frumkóða kerfisins ásamt heimild til að afhenda óháðum úttektaraðilum frumkóða til rýni. Í þeim tilraunakosningum sem framundan eru rýnir óháður íslenskur úttektaraðili frumkóðann og tekur út lykilþætti kerfisins.

Þannig er nú það. Ég hvet þig til að kynna þér efni um framkvæmd þessara ætluðu íbúakosninga og senda Þjóðskrá athugasemdir. Þar sýnist mér vera mikill vilji til að gera sem best.

Ekki síst hvet ég Þjóðskrá til að endurskoða þennan hluta framkvæmdarinnar, gera frumkóða kerfisins aðgengilegan til skoðunar.