Blogg / Datajournalistik

Ett forsknings- och utvecklingsprojekt i samverkan

Vad som driver trafik på Facebook

En konferens som CAR 2014 innehåller naturligtvis en massa intressanta och nyttiga seminarier, workshops och föredrag. Men den samlar också en massa intressanta människor, och mötet med dem är lika mycket en anledning att delta.

I går sprang jag till exempel på Sonya Song, som gjort super-intressanta undersökningar av vad som driver trafik på Facebook och hur människor agerar när de besöker sociala medier.
Jag har skrivit om hennes arbete på min blogg på HD.se: http://hd.se/blogg/karlsson/2013/11/20/facebook-ar-var-digitala-lopsedel/ Här finns också länkar till Songs egen blogg, där hela hennes arbete finns. Är du det minsta intresserad av hur Facebook fungerar är det måste-läsning!
Sören Karlsson, Helsingborgs Dagblad

Hatade matematik, älskade statistik

SPSS

I datajournalistikbranschen lär man sig snabbt att slänga sig med vissa identitetsskapande floskler. Som att muttra ”Jag är så trött på alla journalister som säger att de inte kan matte” och himla lite med ögonen.

Och visst är det fascinerande hur ofta det på redaktionerna närmast koketteras med dåliga matematikkunskaper. Vi är ju samhällsvetare gudbevars.

Men tillämpad matematik finns faktiskt också inom samhällsvetenskapen. Då kallar vi den statistik. Och sådan älskar journalister.

Kanske skulle ett större mått av ödmjukhet i journalistkåren vara på sin plats här. För att tala klarspråk: Är man dålig på matematik ska man inte rapportera om statistik.

Lika vanliga som pinsamma fel i nyhetsrapporteringen är statistik gjord på populationer där urvalet är okontrollerat (i allmänhet webbformulär på den egna sajten) och tal om ökningar och minskningar av partisympatier från en månad till en annan när förändringarna ligger inom felmarginalen.

På en yvig konferens av den typ som Nicar är – väldigt mycket ryms inom begreppet datajournalistik – gäller det att försöka hitta någon sorts linje i kryssandet mellan olika seminarier.

Själv har jag främst två mål med min USA-vecka. Den ena är att lära mig programspråket SQL för databashantering. Mer om det här på bloggen senare förhoppningsvis, om jag får plats på de träningssessioner jag hoppas gå på.

Det andra är att lära mig mer om statistik. På Nicar har jag under en förmiddag provat på statistikprogrammet SPSS, standard i universitetsvärlden. Förmodligen var det enda gången i mitt liv eftersom licensavgifterna på SPSS är fullkomligt hiskeliga. Men jag har också lärt mig att mycket går att göra i Excel, eller i gratisprogrammen PSPP och R.

En annan fras att svänga sig med om man vill verka hemmastad inom datajournalistiken är ”Använd för guds skull inte begrepp som p-värde eller linjär regression i en nyhetstext”. Då slutar nämligen en garanterat statistiskt signifikant andel av läsarna att läsa. Däremot måste vi som journalister själva förstå vad vi har gjort med våra siffror.

Bästa rådet för statistikbaserad journalistik kommer från Steven Rich, databasredaktör på The New York Times: Fråga alltid någon som är smartare än du. Och det är faktiskt en väldigt bra sammanfattning av essensen i hela den journalistiska yrkesutövningen.

Tobias Brandel/SvD

 

 

Kan algoritmer vara rasistiska?

Ett av dagens första seminarier – Holding algorithms accountable – väckte en del udda frågeställningar. Som namnet antyder handlade sessionen om vem som har ansvaret för maskiners beteende. Det intuitiva svaret är givetvis: programmeraren, eller programmet/algoritmens skapare. Men hur översätts det svaret till en situation där algoritmer skapar andra algoritmer? När mjukvaran blir så komplex att skaparen av programmet aldrig kunnat förutse vad utfallet skulle bli?

I Chicago har polisen tydligen en lista över potentiella brottslingar. Listan genereras av en algoritm som tar ett antal variabler om enskilda individer som input. Polisen bedyrar att ras inte är en av variablerna. Problemet är att algoritmen är skriven på ett sätt som gör att ras ändå blir en faktor i beräkningen. Den obesvarade frågan är: Om vi går med på att det finns ett rasistiskt element i processen, utan att det var skaparens avsikt, vem ska då hållas ansvarig?

Tung start på dagen. Efter algoritm-seminariet begav jag mig till Grand Ballroom East och lyssnade på panelen Brian Boyer, John Perry, Ben Welsh och Kevin Schaul. Temat var Proper workflows for data projects. För att citera Ben Welsh: ”Om det är någonting du ska ta med dig från den här diskussionen så är det att använda versionshantering”. Paneldeltagarna var rörande överens om nyttan med tjänster som Github, både för att versionshantera kod och för att samarbeta med icke-programmerare. Det var en ganska teknisk session som kanske kan sammanfattas med följande lista:

  • Automatisera alla processer som kan automatiseras.
  • Skriv informativa felmeddelanden.
  • Logga allting.
  • All kod behöver inte testas, men om du påstår något som ingen annan har påstått förut, så är det klokt att testa koden som gör beräkningen.

Den mest konkreta delen av dagen var nog seminariet om sociala medier. Robert Hernandez från USC Annenberg och Mandy Jenkins från Inside Thunderdome gick igenom en rad olika tjänster som kan hjälpa journalister i det dagliga nyhetsarbetet. Ett exempel är Linkedins grupp för journalister. Den som går med i gruppen och deltar på ett av deras ”webinars” får ett gratis premium-konto som ger en flera avancerade sök- och notifieringsfunktioner. Man kan bland annat prenumerera på händelser från specifika företag och få mejl när någon lämnar eller börjar jobba på företaget. Det verkar fiffigt. Jag har precis ansökt om att gå med, men tydligen är söktrycket så hårt att det kan ta upp till två veckor innan ansökan godkänns.

Jag hann skriva ner fyra av fem råd gällande crowdsourcing innan de bytte slide. En sista lista får avsluta det här blogginlägget:

    • Var konkret om vad du vill ha.
    • Se till att ditt insamlingsformulär är lätt att hitta.
    • Förklara hur du kommer att använda läsarnas bidrag (anonymitet kan vara viktigt).
    • Ge incitament, som tuggumin…

/Robin Linderborg

Hur mycket är en karta värd?

Jag var på en mycket intressant föreläsning idag med representanter från ArcGIS ett onlinebaserat verktyg för att bygga interaktiva kartor redo för publicering. Verktyget har många likheter med Google Fusion Tables, men jag skulle vilja påstå att ArcGIS är lite som Fusion Tables på steroider. Mer om det strax.

Det var en grej jag fastnade för på föreläsningen när en av männen från ArcGIS berättade att man gjort studier på hur en interaktiv karta påverkar läsarens beteende. Enligt dem var snittiden en läsare tillbringade på en vanlig artikel två minuter, medan i de fall där det fanns en interaktiv karta så hade det ökat till sex och en halv minut.

Såna studier vill jag (och förmodligen väldigt många med mig) se på svenska läsare. Det är precis den frågan: hur påverkar våra kartor/diagram/webappar läsarna egentligen?

Det är en fråga som vi diskuterat vid flera tillfällen under projektets gång och något som är av största vikt när vi börjar fundera på vad vi ska lägga vår energi och satsa på i framtiden.

Jag hade en väldigt intressant diskussion med en interaktionsdesigner i vår utvecklingsgrupp på Mittmedia. Han menade att vi som journalister borde sikta efter att göra det så enkelt som möjligt för våra läsare och verkligen fundera på om interaktivitet verkligen är något att eftersträva. Enligt honom kan det vara lika bra att använda statisk grafik eller bilder för att förklara saker eftersom för många val kan göra det krångligt och rörigt för läsaren samt att man på så sätt snabbare får läsaren att förstå än om hen ska klicka sig fram ett par steg först.

Jag håller inte riktigt med honom dock. Jag tycker att det kan finnas flera fördelar med att ha grafik som är interaktiv. Jag tror att man kan få läsarna att första grejen lika snabbt med interaktiva visualiseringar, det handlar helt enkelt om att göra det bra. Interaktivitet ger dessutom möjlighet till en djupare förståelse.

Hoppas att någon hänger med i vad jag menar även om det blir lite flummigt.

I alla fall, tillbaka till ArcGIS. Jag blev riktigt imponerad det verktyget faktiskt. Valmöjligheter för utseende med mera kändes betydligt bättre än på Fusion Tables och väldigt enkelt att förstå. Det finns även översatt till svenska ser det ut som men jag har inte testat det ännu.

Det som återstår att utvärdera är vilka begränsningar man kan stöta på. Det finns en radbegränsning i den fria versionen så det kan påverka en del och sen vet man aldrig om man stöter på något mer. Vi som var på sessionen fick dock lämna in våra mailadresser för att få ta del av deras desktopversion av programmet gratis (kostar i vanliga fall) så jag ser verkligen fram emot att få testa det när jag kommer hem.

Mikael Tjernström, Mittmedia

1 2