Blogg / Datajournalistik

Ett forsknings- och utvecklingsprojekt i samverkan

Helsingborgs Dagblad på roadtrip

Starten på Helsingborgs Dagblads resa till USA blev inte enligt plan – men spännande och rolig.

När vi landade i Chicago hade det snöat 20 inch, mest i år, och landningsbanorna gick inte att hålla fria vilket innebar att anslutningsflyget till Louisville var inställt. American Airlines ville inte hjälpa oss och inte SAS heller. Men en trött grupp av HD-resenärer lät sig inte nedslås utan tog in på – Hilton.

Efter lång telefonkö stod det också klart att alla flyg dagen efter var fullbokade. Möjligen kunde vi få flyga till Atlanta, vänta tre timmar och flyga vidare till Louisville. Möjligen.

Vi bestämde oss därför att transporera oss the American way – med bil. Ett fordon  införskaffades och nu är vi på väg genom Indiana söderut – och vi tänker på datajournalistik hela tiden…

HDbild

Sofia Nilsson Sandra Jakob Sören Karlsson och Peter Ferm innan vi satte oss i bilen i Chicago

/Peter Ferm någonstans i Indiana

 

Journalistiken utmanas av ”öppna data”

Två franska forskare beskriver i ett färskt nummer av tidskriften News Media and Society, hur journalistikens traditionella uppfattningar utmanas inom datajournalistiken. De två forskarna, Sylvain Parasie och Eric Dagiral, har studerat datajournalistik vid Chicagio Tribune både med intervjuer och innehållsanalyser av vad som publicerats under 7-8 år. Resultatet är en intressant och läsvärd text som beskriver hur journalister vid Chicago Tribune arbetar med datajournalistik. Den beskriver också hur ett nytt synsätt från nya journalister med en bakgrund som ”dataaktivister”  växer fram där data inte bara är ett underlag för nyheter, utan att data också ska läggas ut för publiken som ska kunna söka själva och ta fram de analyser som man är intresserade av. Detta nya synsätt på ”öppna data” som en resurs för medborgarna utmanar  den traditionella synen bland journalister som mest utgår från data som del av av journalistisk research.

Läs själva i det bifogade dokumentet:New Media Society-2012-Parasie-1461444812463345

Datajournalistik-konferensen CAR 2012 i backspegeln

Imorgon börjar konferensen CAR 2013 i Louisville, Kentucky, USA. Konferensen pågår fram till söndag den 3 mars och är årets höjdpunkt för alla datajournalister världen över (även om fokus fortfarande ligger mycket på USA). CAR står för Computer Assisted Reporting och är termen i USA för det som vi kallar datajournalistik (eller databasjournalistik). För konferensen används även begreppet NICAR som står för National Institute for Computer Assisted Reporting) vilket kan vara lite förvillande.

CAR 2013

Som en del av forskningsprojektet i Datajournalistik kommer alla deltagande parter att besöka årets konferens och de flesta av oss har redan kommit fram till Louisville och börjat ladda inför de kommande fullspäckade dagarna. På denna blogg kommer ni under den närmsta veckan få rapporter dagligen kring konferensen och det som tas upp där. Vill ni följa konferensen på twitter är taggen #nicar13.

Inför konferensen kollade jag lite på de reflektioner som jag hade efter förra årets konferens som var i St Louis, Missouri. Här är de tre saker som jag tyckte var mest intressanta då.

Text som data
Förra året var ett fokusområde ostrukturerad data, dvs texter och dokument som inte från början finns uppdelade i fina och rena datakolumner som i ex Excel eller en SQL-databas. Majoriteten av all data som finns idag finns just som ostrukturerad data och möjligheten att kunna hitta trender, nyheter och scoop i dessa stora mängder data är väldigt intressant.

DocumentCloud

Det kanske allra bästa verktyget som tagits fram för detta ändamål är DocumentCloud som uppstått efter ett samarbete mellan de ledande medieorganisationer som sysslar med datajournalistik i USA och som nu drivs av IRE (Investigative Reporters and Editors, USA:s motsvarighet till Grävande journalister). DocumentCloud är ett gemensamt verktyg för uppladdning, analys och publicering av dokument på webben där man kan strukturera stora textmängder och hitta mönster och samband mellan dem. Ännu finns dock ingen svensk version av DocumentCloud men det är något vi hoppas på i framtiden.

Open Source-alternativ för kartvisualiseringar
Google har under många år varit förstavalet för alla som velat göra kartvisualiseringar och webbtjänster som bygger på geografisk data. Ex har deras verktyg Fusion Table varit ett verktyg som varit mest använt av datajournalister (ex Guardians Data Store m fl).

Open Street Map

Open Street Map är förmodligen är den allra mest intressanta utmanaren. De kan jämföras med ett Wikipedia för geografisk data där man använder fritt tillgänglig kartadata som kombineras med en ”crowdsource” av besökare som på olika sätt kan lägga in geodata i tjänsten. Kombinerat med Javascript-biblioteket Leaflet där man kan skräddarsy utseendet och funktionalitet av kartorna samt hosting-tjänsten Mapbox skapar de ett mycket intressant och kraftfullt open source-alternativ till Google Maps. Bland annat har vi på SVT Pejl använt av oss av detta i våra tjänster Skolpejl och Miljöpejl.

Webbtjänster med med längre livslängd
En tredje trend som diskuterades på förra årets konferens var att många mediesajter satsade mer på journalistiska webbtjänster (i USA kallade ”News applications”) som hade längre livslängd. Ett problem med mycket av de bästa sakerna som gjorts inom datajournalistiken är att de snabbt försvinner från nyhetslöpet på de stora mediesajterna som mycket styr inflödet till innehållet. Så även om man gjort ett stort och bra jobb med att analysera och ta fram unikt datajournalistiskt material och visualiseringar så får de lite exponering eftersom våra nyhetssajter måste vara först med det senaste. Detta gör att det kan vara svårt att få tillbaka pengarna som satsats på den mer avancerade datajournalistiken.

Banktracker

Nu har vissa mediesajter därför börjat tänka om och börjat producera mer långsiktiga webbtjänster som uppdateras löpande eller med ett visst intervall. Exempel som nämdes från USA är Pro Publicas Dollar for Docs och SOPA Opera samt Banktracker från Investigative Reporting Workshop. I Sverige ser vi ju även exempel på detta med exempelvis SvD:s Räntekartan och vår egen Valpejl som gjordes av inför riksdagsvalet 2010

Nu återstår att vilka de nya trender och diskussioner som kommer att prägla NICAR 2013. Är det något speciellt ni vill att vi tittar närmare på kan ni kontakta svara i kommentarsfältet nedan. Konferensschema hittar ni här. Och glöm inte att följa denna blogg om ni är intresserade av vad som som är intressant ur svenskt perspektiv inom datajournalistik.

Datajournalistik i Journalisten

Tidningen Journalisten presenterar projektet Datajournalistik i fler artiklar på sin sajt. Där finns intervjuer med forskare och med journalister som är med i projektet – såväl den datajournalistiske veteranen på SVT Helena Bengtsson och med journalister på Mittmedia som är en av de koncerner som ingår i projektet.

Här är länken: http://www.journalisten.se/nyheter/forskningsprojekt-ska-bredda-datajournalistiken

Journalistik tillsammans med läsarna

De senaste åren har vi sett en intressant förskjutning i vad och vilken information vi är benägna att dela med oss av på nätet. Vi behöver inte tillbringa många minuter på Facebook innan vi exempelvis ser våra vänners senaste träningspass, lyssnade låtar eller uppladdade bilder. Allt fler av till synes vardagliga aktiviteter omvandlas till koordinater och data, ibland inlåst men lika ofta öppet och sökbart.

I takt med att allt fler av våra prylar kan kopplas till internet och allt mer av vår kommunikation sker genom en telefon som alltid vet var vi befinner oss lär trenden inte avta. Fenomenet i sin extrem kallas ”lifelogging” och de riktigt inbitna har redan total koll på allt från vikt och sömn till sin hur många steg det är till jobbet. Till detta kan vi lägga all information som indirekt lämnas ut i sökningar och statusuppdateringar på Google och sociala nätverk som Twitter och Facebook. En sökning på ”vattenskada” i Google trender och på Kurrently kan exempelvis både ge intressant bakgrundsdata och case till artikeln eller inslaget.

Vad innebär det här då för oss journalister med ett uppdrag att bevaka och granska vår var vardag och samtid? I det korta perspektivet innebär det helt enkelt att det finns mer data att bygga journalistik på, för den som vet var man letar och har rätt verktyg för uppgiften. Men det innebär också, och det här är kanske än mer intressant, att vi möter en publik med helt andra vanor och inställning till att dela med sig av information om sig själva.

På Svenska Dagbladet har vi det senaste året framgångsrikt och tillsammans med våra läsare skapat datajournalistik om både räntor, hyror och förseningar i kollektivtrafiken. Gemensamt för dessa projekt är att de agerar på en typ av marknad som av olika anledningar inte fungerar och att det finns ett tydligt incitament för läsaren att dela med sig av data. Att förhandla om sin bolåneränta blir helt enkelt mycket lättare om vi har någonting att jämföra med. Har den vi jämför oss med dessutom samma bank, storlek på lån och bor i samma kvarter blir förhandlingen säkerligen än mer effektiv. Med Räntekartan har SvD tillsammans med tusentals läsare skapat ett effektivt sökarljus att använda på en till stora delar mörklagd förhandlingsmarknad.

Att skapa framtidssäker och framgångsrik journalistik handlar till viss del att förändras med sina läsare. Att vi nu exempelvis ser satsningar på mobilsajter och datajournalistik är ingen slump utan orsakat av ändrande vanor och intressen hos våra läsare. När vi ser att allt fler av våra läsare använder sig av tjänster där de loggar och delar med sig av information måste vi som journalister helt enkelt också anpassa oss.

Vilka tjänster kan vi bygga utifrån läsarnas data, vilken data kan de enkelt lämna hos oss och vilken data behöver vi för att skapa tjänster som passar dem? Hur bygger vi tjänster som både är journalistiskt intressanta och samtidigt användbara för den läsare som delar med sig av information? Den redaktion som kan svara på dessa frågor har med största sannolikhet också skapat en god grund för framgångsrik journalistik.

Johan Silfversten Bergman är utvecklingsredaktör på Svenska Dagbladet.

Vilka etiska gränser finns det i datajournalistik?

Borde data ha ett samvete? Det frågar sig David Carr i New York Times i en krönika några dagar efter den senaste skolskjutningen i USA. Han berättar om lokaltidningen The Journal News i Westchester County som dagen efter skolskjutningen i januari publicerade en karta med namn och adresser på alla personer i två förortsområden som ansökt om tillstånd för att köpa ett handeldvapen. Det var öppna data fullt tillgängliga, och det fanns ett stort publikt intresse för vapenfrågor – att låta journalistiken förena dessa två sidor borde väl vara perfekt?

David Carr är skeptisk, och använder det här fallet för att diskutera vilka gränser det finns för datajournalistik. Han visar det stora tryck som just nu finns i amerikanska medier, t ex har Knigth Foundation under hösten 2012 kommit med ett nytt initiativ för att göra data mer tillgängliga, bättre kartor och med data runt t ex allmänna val. Han ger också flera exempel bl a från Texas på hur journalister granskar både offentligt anställda och ledamöter i delstatsparlamentet för att undersöka missbruk av offentliga medel och påtryckningar på lagstiftare.

Men han påminner också om att man måste tänka efter före publicering. Stämmer det man påstår utifrån data? Verkligheten förändras, och när det gäller dem som ansökte om vapentillstånd så är det inte säkert att de alls köpte något vapen. Och är det journalistik att bara publicera offentliga data för att tillfredsställa människors nyfikenhet? Det finns många viktiga frågor runt datajournalistik.

Läs själv på länken:  http://www.nytimes.com/2013/01/14/business/media/guns-maps-and-disturbing-data.html?ref=davidcarr&_r=0

Enkät om datajournalistik till sju redaktioner

I veckan går det ut en enkät till närmare 400 journalister på de sju medieföretag som är med i projektet Datajournalistik. Syftet med enkäten är att kartlägga erfarenheter och attityder bland journalister när det gäller datajournalistik. Enkäten görs i form av en webbenkät som tar 4-5 minuter att besvara, och som forskare hoppas vi på många svar oavsett vad man tycker om begreppet datajournalistik.

Frågorna i enkäten är öppet formulerade för att kunna fånga in olika åsikter och värderingar. Dessutom finns det gott om utrymme för kommentarer för dem som vill förklara närmare hur man ser på ett ganska nytt begrepp som ”datajournalistik”. Alla kommentarer och åsikter är viktiga för projektet!
Resultatet av enkäten kommer att presenteras senare i år tillsammans med resultat från en serie längre intervjuer som görs med kontaktpersoner på alla sju redaktionerna.

Intervjustudien har påbörjats

Forskarna i projektet påbörjade i veckan en intervjustudie om datajournalistik. Syftet är att reda ut begrepp, erfarenheter, angreppssätt med projektets olika aktörer. Intervjustudien leds av professor Gunnar Nygren och är en första, riktad satsning att systematiskt undersöka den datajournalistiska ”verkligheten” i Sverige. Efter två intervjuer avklarade kan man konstatera att t.ex. crowdsourcing har intressanta förutsättningar och konsekvenser.

Snart dags för studieresa till CAR 2013

Om två och en halv vecka åker nästan hela projektgruppen över till Louisville, Kentucky i USA för att vara med på konferensen CAR 2013. Konferensen som fokuserar på Computer Assisted Reporting, anordnas av den amerikanska organisationen IRE (Investigative Reporters and Editors). Flera av projektets deltagare har åkt i flera år på denna konferens, men de flesta i projektgruppen kommer åka dit för första gången.

car2012

Några av oss forskare var där förra året när CAR ägde rum i Saint Louis, MI. Det som slog oss främst var hur öppna alla var med att dela med sig av sina kunskaper och metoder. Man kunde också konstatera att etiska ställningstaganden görs på ett annat sätt i USA än vad man är van vid här hemma. Det blir ganska tydligt när individer plottas ut i olika sammanhang på kartor, på en extremt lokal nivå.

Förra året gick några av oss som åkte över en kurs i Tableau. Jag tog en liten SPSS-kurs i regressionanalys, men även Mini-Boot Camp där grundläggande Excel och Access lärs ut, mest för att se hur de lägger upp det pedagogiskt. Det är ingen hemlighet att våra studenter på SH skriker rakt ut när det är dags att använda excel för första gången, men ganska snart börjar de gilla det.

car2012a

Allt var otroligt pedagogiskt upplagt, även för de som är ovana går det inte att missa poängen, i och med att saker upprepas om och om igen, och stegras så att det blir gradvis svårare. Det är dock lite ovant att man förväntas tjoa med kursledaren och aktivt svara på allehanda skumma utrop som görs där framme, eller att de ibland tar en extra tur ut bland studenterna, frågar något skämtsamt och liksom kollar läget.. Kanske skulle kunna funka med våra journaliststudenter – kanske inte.

Förra året besökte vi dessutom organisationen IRE på Missouri School of Journalism, träffade ansvariga för Document Cloud och besökte NY Times och ProPublica i New York. I och med att vi är så många i år kan vi inte göra samma typ av studiebesök, men Helena Bengtsson SVT, har istället ordnat två lunchseminarier med inbjudna amerikanska journalister under konferensen. Seminarierna är till bara för projektets deltagare. Här finns chans att ställa frågor på ett helt annat sätt än de stora konferenssessionerna.

I år är vi alltså en rekordstor grupp svenska journalister, utvecklare och forskare som åker över för att lära oss mer om verktyg och metoder inom datajournalistik.

Mer om konferensen kommer finnas löpande här på bloggen. Alla medföljande företag kommer nämligen att blogga varje dag om sina intryck.

”Big data” är ett växande forskningsområde

Våren 2014 ska forskningstidskriften Digital Journalism (som ges ut i UK) komma med ett temanummer om datajournalistik. redaktör är jouirnalistikforskaren Seth C Lewis på University of Minnesota i USA, och på listan över tänkbara bidragsgivare finns de forskare på Södertörn som är med i projektet Datajournalistik. Ett tecken på att vi Södertörnsforskare finns med i det som brukar kallas ”forskningens frontlinje”.
Temanumret ska ha ett sociologiskt perspektiv, dvs hur datajournalistik utvecklas på redaktioner, normer och rutiner i datajournalistik, yrkesroller och etik samrt hur datajournalistiken förändrar journalistik i relation till annat medieinnehåll. De erfarenheter som vi gör i forskningsprojektet tillsammans med sju olika medieföretag kommer att passa väl in i detta tema , och placerar Södertörn bland de forskare som ligger längst fram på området. Seth Lewis – Journalism in an Era of Big Data

1 2