Íslenska fyrirtækjaskráin

Fyrir rúmlega ári síðan tók ég það að mér að sjá þá nýstofnuðum gagnagrunni, Opencorporates, fyrir gögnum úr íslensku fyrirtækjaskránni. Opencorporates hefur einfaldan tilgang:

What is OpenCorporates?OpenCorporates aims to do a straightforward (though big) thing: have a URL for every company in the world.

Afhverju?

OpenCorporates exists to make information about companies and the corporate world more accessible, more discoverable, and more usable, and thus give citizens, community groups, journalists, other companies, and society as a whole the ability to understand, monitor and regulate them.

Staðreyndin er sú að í flestum löndum er aðgengi að fyrirtækjaskrám langt frá því að vera gott. Nýlega gerði Opencorporates könnun á aðgengi að þessum upplýsingum í þeim 41 ríki sem eru aðilar að “The Open Government Partnership” (sem fundaði í þessari viku í Brasilíu. Um þann fund má fræðast hér).

A score of 100 means that the company register is an open data register, making detailed information free for reuse under an open licence, and also makes the information available as open data. A score of zero means the central register can not even be search without payment or registration.

Meðalskor þeirra ríkja sem könnunin náði til var 21 (á skalanum 1-100) og nokkur ríki skoruðu 0 (svo sem Spánn, Brasilía og Rúmenía). Nánari niðurstöður má finna hér.

Ísland er ekki aðili að The Open Government Partnership og var því ekki með í könnuninni en hefði skorað 25 (sem er t.d. það sama og Danmörk):

Free and open search for a company (20 pts): 20
Licensing: (Explicit open licence = 30, no licence info = 5, explicit closed licence/no data = 0): 5
Data: (Openly licensed data dump available or open api = 20 points): 0
Detailed data available: (Directors = 10 pts): 0
Detailed data available: (Statutory Filings =10 pts): 0
Detailed data available: (Shareholders = 10 pts): 0
Total (out of max 100 points): 25

 

En semsagt: Í rúmt ár hef ég skrapað fyrirtækjaskrána svo að Opencorporates geti birt upplýsingar um íslensk fyrirtæki í sinni skrá. Þar er hægt að leita að fyrirtækjum og sækja nánari upplýsingar. Hér er t.d. einföld leit að “Landsbanki” . Það skilar okkur 25 niðurstöðum sem er síðan hægt að skoða nánar og sía úr á ýmsan hátt. Ég notast við síðuna Scraperwiki til að skrapa skrána og Opencorporates sækir daglega breytingar þangað. Síðar ætla ég að skrifa meira um Scraperwiki en einn af kostum þess að notast við Scraperwiki er að því fylgir sjálfkrafa leið til að sækja gögnin í heild sinni (sem csv skrá, sqlite3 grunn eða json) sem og að við getum skoðað gögnin með einföldum SQL skipunum í gegnum nokkuð þægilega vefþjónustu. Það gefur okkur möguleika á að smíða  allskonar þónustur fyrir framan gögnin og notað Scraperwiki sem bakenda. Það mætti t.d. hugsa sér að útbúa betri leitarvél heldur en Ríkisskattstjóri býður upp á… En lítum aðeins á hvað við getum séð út úr gögnunum þegar búið er að opna aðgengi okkar að þeim.

Í grunninum eru núna 83625 færslur, en þó nokkrar eru fyrirtæki sem eru ekki lengur starfandi. Ef við síum þau frá þá standa eftir 81699. Eitt af því sem RSK gerir opinbert er ISAT2008 kóði hvers fyrirtækis (hér má lesa um ISAT2008 hjá RSK og hér er enn skemtilegra ítarefni um málið eftir undiritaðan) og með það að vopni getum við áttað okkur á fjölda fyrirtækja eftir flokkum. Þetta eru þeir 10 fjölmennustu:

Starfsemi húsfélaga íbúðareigenda 8750
Starfsemi annarra ótalinna félagasamtaka 8478
Leiga atvinnuhúsnæðis 3400
Starfsemi eignarhaldsfélaga 2993
Bygging íbúðar- og atvinnuhúsnæðis 2882
Óþekkt starfsemi 1920
Sauðfjár- og geitarækt 1499
Útgerð smábáta 1404
Starfsemi íþróttafélaga 1298
Viðskiptaráðgjöf og önnur rekstrarráðgjöf 1204

Hér er allur listinn í gegnum vefþjónustu Scraperwiki á töfluformi.

Hér eru svo 10 fjölmennustu póstnúmerin:

101 7077
105 5828
108 4887
220 3588
200 3553
110 3540
112 2976
104 2559
600 2501
210 2391

Allur listinn

Og eftir heimilisföngum:

Suðurlandsbraut 18 151
Bíldshöfða 14 148
Kringlunni 7 135
Smáratorgi 3 135
Noregi 124
Suðurlandsbraut 30 102
Höfðabakka 9 98
Engjavegi 6 93
Nóatúni 17 93
Höfðatúni 2 87

Allur listinn

Ef þú vilt skoða þessi gögn betur þá geturðu sótt þau hérna eða skoðað þau í gegnum vefþjónustu Scraperwiki.

Langar þig að vinna frekar með þessi gögn en ert ekki alveg viss um hvernig? Eða þarftu að nálgast gögn en veist ekki hvernig? Hafðu samband!