Knattspyrnudagatal

Það styttist í að knattspyrnan fari í gang af einhverri alvöru. Pepsí deild karla hefst sunnudaginn 6. maí og kvenna sunnudaginn 13. maí.

KSÍ heldur úti ágætum vef með úrslitum og dagskrá leikja, en það er ýmislegt sem mætti setja betur fram. Það hefur t.a.m. alltaf pirrað mig að ég skuli ekki geta fært dagskrá Íslandsmótsins inn í Google Calendar eða iCal. Þannig að í dag ákvað ég að leysa það.

(more…)

Ruslafötur í Reykjavík

Ruslastampar í Reykjavík | Heimild: Borgarvefsjá

Það er mikil umræða um rusl í borginni þessa daga. Það mætti halda að engin borg sé eins útötuð í drasli eins og Reykjavík.

Samkvæmt Borgarvefjsá þá eru 1069 ruslastampar í borginni. Það gerir eina ruslafötu á hverja 111 borgara (miðað við 118.814 íbúa). Nú hef ég ekki leitað vel að tölum fyrir aðrar borgir, en hér er frétt frá 2011 um fjöldann í Vancouver, Kanada. Þar var hlutfallið 1 fata á hverja 535 borgara.

Kannski erum við best í heimi í þessu, eins og flestu öðru?

Ruslafötur á íbúa

Reykjavík: 1 fyrir hverja 111 

Vancouver: 1 fyrir hverja 535

Það er næstum allt á internetinu en ekki alveg allt

Nýlega vann ég verkefni fyrir bandarískan fræðimann (post-doc) sem er að vinna að rannsókn á orðanotkun í vinsælum lagatextum. Nánar tiltekið er hann að byggja á rannsókn sem birt var í fyrra og náði til 10 vinsælustu laganna á Billboard listanum á árunum 1980-2007 (grein í New York Times um niðurstöðurnar). Útdrátturinn í þeirri rannsókn:

American culture is filled with cultural products. Yet few studies have investigated how changes in cultural products correspond to changes in psychological traits and emotions. The current research fills this gap by testing the hypothesis that one cultural product—word use in popular song lyrics—changes over time in harmony with cultural changes in individualistic traits. Linguistic analyses of the most popular songs from 1980–2007 demonstrated changes in word use that mirror psychological change. Over time, use of words related to self-focus and antisocial behavior increased, whereas words related to other-focus, social interactions, and positive emotion decreased. These findings offer novel evidence regarding the need to investigate how changes in the tangible artifacts of the sociocultural environment can provide a window into understanding cultural changes in psychological processes.

Tuning in to psychological change: Linguistic markers of psychological traits and emotions over time in popular U.S. song lyrics

Í þeirri rannsókn voru lagatextarnir um 270 en í þeirri sem ég vann fyrir er ætlunin að safna 100 vinsælustu textum hvers árs frá 1950-2011, eða 6200 textum.

Það er einfalt mál að finna titlana á þessum textum og það er í sjálfu sér ekki mikill skortur á vefsvæðum sem sérhæfa sig í að birta lagatexta, enda er áhugi netnotenda á söngtextum sá sami og á kynlífi (eða svona hér um bil). Eftir stuttar prófanir sýndist mér lyrics.wikia.com vera sú síða sem innihéldi hvað flesta texta. Í framhaldinu var einfalt að sækja textana með lítilli Python skriftu.

[youtube http://www.youtube.com/watch?v=1zqQGLQlCyo?rel=0&w=420&h=315]En það er ekki allt á internetinu. Og það á sérstaklega við um það sem er á einhvern hátt utan áhugasviðs þeirra sem nota internetið. Og eldra fólk notar ekki internetið. Og lyrics.wikia.com er síða þar sem hver sem er getur sett inn texta með uppáhaldsflytjandanum sínum. Og af því leiðir að textinn við T-99 Blues með Jimmy Nelson, sem var í 35. sæti á Top-100 Billboard listanum árið 1951, er ekki á lyrics.wikia.com.

Niðurstaðan varð sú, eftir að hafa sótt textana vélrænt, að það vantaði 969 eða 15.6%. Flesta frá árunum 1950-1960.

Langflesta þá texta sem vantaði eftir 1960 var hægt að finna handvirkt og um 33% þeirra sem eru frá árunum 1950-1960.

En T-99 Blues textann hef ég ekki fundið enn.

Íslenska fyrirtækjaskráin

Fyrir rúmlega ári síðan tók ég það að mér að sjá þá nýstofnuðum gagnagrunni, Opencorporates, fyrir gögnum úr íslensku fyrirtækjaskránni. Opencorporates hefur einfaldan tilgang:

What is OpenCorporates?OpenCorporates aims to do a straightforward (though big) thing: have a URL for every company in the world.

Afhverju?

OpenCorporates exists to make information about companies and the corporate world more accessible, more discoverable, and more usable, and thus give citizens, community groups, journalists, other companies, and society as a whole the ability to understand, monitor and regulate them.

(more…)