Blogg / Datajournalistik

Ett forsknings- och utvecklingsprojekt i samverkan

Terminator – fast bättre

Först efter att ha sovit några timmar började jag begripa vad en av CAR 2013-föreläsningarna som jag var på i går egentligen handlade om. Polletten trillade ner (åtminstone delvis).

Föreläsningen hette ”Maskininlärning i praktiken: tips, trix och riktiga exempel i maskininlärning på redaktionen”. Jeff Larson från ProPublica och Chase Davis (nu frilans via egna bolaget Hot Type Consulting, men snart på New York Times) berättade om något som verkade hämtat från Terminator – där datorerna blir intelligenta och tar över världen.

terminator

Davis och Larson använder ett datorspråk som rycker ut intressanta fakta ur gigantiska mängder dokument med hjälp av algoritmer och programmering. Ett slags artificiell intelligens nästan, där man får datorn att se samband och olikheter i texter. Nästan som att den börjar hantera texter på samma sätt som den mänskliga hjärnan.

Det jag begrep först efter att sovit några timmar var ungefär följande: om vi tar de hemliga amerikanska ambassadrapporterna som Wikileaks släppte som exempel, så var det ju reportrar som satt och läste igenom dessa tusentals dokument och hittade intressanta vinklar. Vilket givetvis tog väldigt lång tid.

Med maskininlärning går det i stället till så här: du kastar in alla dokumenten i algoritm-programmet och ut kommer dokumenten sorterade i högar. Programmet sorterar nämligen upp dokumenten i buntar som liknar varandra, genom att analysera texten i dokumenten. Själva maskininlärningen handlar om att du efter hand kan justera programmet så att det blir smartare, och sorterar upp dokumenten i bättre högar.

Sen kan man lätt gå in i de avvikande dokument-buntarna och hitta guldkornen utan att behöva leta.

Programmeringsspråket som de båda reportrarna och data-genierna Larson och Davis använder är bland annat Python. Dessutom sade Larson att man inte ens behöver bygga egen kod. Det finns nämligen färdiga koder som man kan använda för fånga in de avvikande dokumenten på följande adress:

http://www.cs.waikato.ac.nz/ml/index.html

Blev detta klarare? Hmm. Men någonstans kände jag att det var väldigt intressant – det pekar i alla fall mot en mycket bättre framtid (för oss journalister) än i Terminator.

Joachim Kerpner, Aftonbladet

Bli först att kommentera på “Terminator – fast bättre

Kommentera

E-postadressen publiceras inte. Obligatoriska fält är märkta *