About pallih

Posts by pallih:

Afbrotatölfræði lögreglunnar á Suðurnesjum

Afbrotatölfræði er gríðarlega mikilvæg. Það er reyndar mín skoðun að öll tölfræði sé gríðarlega mikilvæg, en það deila henni kannski ekki allir. En við getum verið sammála um að afbrotatölfræði sé mikilvæg. Með aðgangi að tölfræði um afbrot má meta forvarnastarf, átta sig á því í hvaða átt samfélagið er að fara, svo dæmi séu tekin.

(more…)

Tenglalisti á PDF sniði

(ó)nytsamlegar vefslóðir fyrir gagnablaðamennsku

PDF skjöl eru uppfinning djöfulsins. Eða öllu heldur: PDF skjöl eru óvinir þeirra sem vinna með gögn. Einu “réttu” notin fyrir PDF skjöl er þegar útlit skjals þarf að halda sér, t.d. þegar efni er sent í prentun. Ég endurtek: PDF skjöl eru uppfinning djöfulsins [1. Hér er ágæt færsla frá Sunlight Labs um ömurleika PDF sniðsins fyrir gögn ].

Allir búnir að ná því?

Ok. Þá höldum við áfram.

Fyrir rétt rúmu ári var stofnuð við Háskóla Íslands Miðstöð rannsóknarblaðamennsku á Íslandi (ICIJ-Icelandic Center for Investigative Journalism). Þann 31. maí síðastliðinn birtist frétt á heimasíðu miðstöðvarinnar undir fyrirsögninni “Nytsamlegar vefslóðir fyrir gagnablaðamennsku“. Þar er greint frá því að Margot Williams hafi dreift lista með gagnlegum tenglum fyrir gagnablaðamenn á SKUP ráðstefnunni í Tönsberg. Og svo er listinn birtur. Sem PDF skjal.

Listinn er hérna. Smelltu á tengilinn til að opna skjalið. Prófaðu svo að smella á einhvern tengil í skjalinu.

Magnað, ekki satt?

Hversu nothæfur er tenglalisti á PDF sniði?  Vægt til orða tekið, ekki svo mjög.

Nú eru PDF skjöl mismunandi. Sum eru vistuð út úr forritum og kerfum þar sem innihaldið er í raun texti (sem má t.d. velja í Adobe Reader eða Preview). Þau skjöl má vinna með (en það er ekki þægilegt, er bæði tímafrekt og flókið [2. Hér er dæmi um hvernig má ná efni út úr slíkum PDF skjölum]. Sum eru hinsvegar bara myndir. Þetta er eitt þeirra.

En það er ekki allt tapað.

Stundum má ná gögnum út úr PDF skjölum með því notast við OCR (Optical character recognition). Fullt af vefþjónustum bjóða upp á slíkt, þó yfirleitt aðeins fyrir smá skjöl. Fyrir lengri skjöl og flóknari eru þó til ágætis forrit. Hér er listi sem ber saman OCR forrit og lausnir.

Ég tók þetta gagnslausa PDF skjal og renndi því í gegnum Online OCR þjónustuna. Útkoman var ágæt. Að mestu vegna þess að textinn er á ensku (laus við íslenska stafi) og frekar einfaldur. Einhverjar breytingar þurfti ég að gera (g var t.d. oft lesið sem a). Svo setti ég textann á gist.github.com hér. Smelltu á tengilinn og prófaðu svo að smella á einhvern tengil í listanum.

Magnað, ekki satt?

Listinn sjálfur er ágætur, en það má auðveldlega bæta hann til muna. Það bíður betri tíma.

En nú geturðu að minnsta kosti skoðað tenglana sem Miðstöð rannsóknarblaðamennsku á Íslandi vildi deila með þér.

 

Umferðin við Landspítalann

[style-my-gallery options=’animation: “fade”, controlsContainer: “.flex-container”, controlNav: false’]

 

Landspítalinn er einn stærsti vinnustaður landsins. Fjöldi starfsmanna í upphafi árs 2011 var 4.590. Slíkur fjöldi kallar á allskonar umferðarmannvirki. Eins og sjá má á loftmyndunum hér að ofan (sem allar eru fengnar frá Borgarvefsjá) hefur bílastæðum við spítalann fjölgað verulega. Árið 1984 eru skilgreind stæði fyrir framan aðalinngang og við kvennadeild en 1990 er búið að útbúa stæði á svæðinu milli Hringbrautar og geðdeildarhúsanna. Árið 2008, þegar Hringbraut var flutt, var svo stæðum bætt við milli Gömlu-Hringbrautar og kvennadeildar.

Í samgöngustefnu spítalans frá 2011 er tiltekið að bílastæði við spítalann séu 1.140 og í drögum að deiliskipulagi fyrir nýjan Landspítala er gert ráð fyrir 1.600 stæðum í fyrsta áfanga (þar af 1.260 ofanjarðar) og 2.000 alls þegar byggingu verður lokið (þar af 500 ofanjarðar).

En hvenær er mesta umferðarálagið við Landspítalann?

Á heimasíðu spítalans eru uppfærðar staðtölur á 15 mínútna fresti um nokkrar lykiltölur. Ein þeirra er hversu margir eru við vinnu:

 

Með því að safna þessum tölum saman með reglulegu millibili má átta sig á því hvenær umferðarálagið við spítalann er sem mest [1. Ég safna sömu tölum til notkunar í twitter þjarkinn @landspitali, sem tvítar þessum tölum á klukkustundar fresti. Þú getur skoðað aðra þjarka sem ég rek hér.] Hér má sjá graf fyrir seinustu tvo sólarhringa.

Á hádegi á sunnudegi um hásumar voru um 400 starfsmenn við vinnu og fer fækkandi fram til 7 á mánudagsmorgni. Þá fjölgar þeim gríðarlega hratt fram til 9 og fjöldinn nær loks hámarki um hádegi þegar rúmlega 1.500 manns eru við vinnu. Klukkan 16 fer þeim svo að fækka og kl. 17 eru um 500 manns við vinnu.

Af þessu má sjá að álagið á gatnakerfið í kringum spítalann er langmest milli 7 og 8 árla morguns og svo milli 16 og 17 síðdegis.

Hinir kapítalísku Ólympíuleikar

Ólympíuleikarnir eru merkilegt fyrirbæri. Íþróttafólk frá yfir 200 löndum kemur saman. Það eru ekki margir viðburðir sem draga til sín fulltrúa frá eins mörgum þjóðlöndum. Umstangið í kringum leikana hefur aukist í hvert sinn og þeir Ólympíuleikar sem við sjáum í dag eiga fátt sameiginlegt (eðlilega) með leikunum á fyrri hluta tuttugustu aldar.

Með hverjum leikum eykst markaðssetningin, brjálsemin og sölumennskan í kringum þá. Leikarnir sem nú standa fyrir dyrum í London eru þar engin undantekning. Sólveig Anna Jónsdóttir fjallar aðeins um það hér. Ég ætla hinsvegar að benda ykkur á hvernig gagnablaðamennska getur flett ofan af því sem sumir vilja halda leyndu.

(more…)

Alþingisvefurinn bættur

Það er eins algild skoðun og getur verið að vefur Alþingis þarfnist stórkostlegra endurbóta. Hlutar vefsins eru, að mér sýnist, keyrðir á perl skriftum frá 1995 og framsetning efnis (sem og aðgengi að því) er fyrir neðan allar hellur.

Eitt sem truflar mig er útlit á ræðum og lagasafni. Engar spássíur eru í texta, sem gerir hann ill-læsilegan. Letur er í smærra lagi og fjöldi neðanmálsgreina gerir línubil ójafnt.

(more…)

Hundar í Reykjavík

Hundar í nágrenninu

Hvað ætli séu margir hundar í Reykjavík?

16. maí síðastliðinn tók gildi ný samþykkt um hundahald í borginni. Þar er kveðið á um að skrá yfir veitt leyfi til hundahalds skuli birt á heimasíðu umhverfis- og samgöngusviðs Reykjavíkurborgar. Og nú er listinn kominn á netið hér.

Þarna má leita eftir heimilisföngum. Það er svosem ágætt. En væri ekki gaman að sjá þetta á korti? Jú, það væri það einmitt.

Þessvegna tók ég gögnin saman og útbjó kort sem er hér: gogn.in/hundar. Þar má sjá hversu mörg hundaleyfi eru í næsta nágrenni við hvaða punkt sem er í borgarlandinu.

(more…)

Dead Negro Hollow

Hvern hefði grunað að örnefni í Bandaríkjunum innihéldu kynþáttaníð? Kannski flesta. En hversu mörg örnefni?

Um daginn barst á póstlista sem ég er á, beiðni um að komast að nákvæmlega því. Og þar sem ég hafði ekkert annað að gera þá beit ég á agnið.

(more…)

Hvað kostar að vera í NATÓ?

NATÓ er hernaðarbandalag 28 ríkja. Íslendingar eru stofnmeðlimir, hafa verið með frá upphafi, eða í 63 ár. Fjármál NATÓ eru ekkert sérstaklega gegnsæ. Það er erfitt að afla sér upplýsinga um heildarkostnað þessara 28 ríkja við að reka hernaðarbandalagið. Þó eru reglulega gefnar út hlutfallstölur um framlag einstakra ríkja. Þannig greiddu Íslendingar fyrir árin 2010 og 2011 0,0658% af hinum borgaralega kostnaði NATÓ. Sameiginlegum kostnaði bandalagsins er skipt í þrjá hluta: borgaralegur, hernaðarlegur og framlög til „NATO Security Investment Programme.“ Hlutföll eru yfirleitt eins (eða mjög svipuð) innan þessara þriggja hluta og því skulum við bara fást við borgaralega hlutann hér.

(more…)