0517 Data Journalism

0517
Miðlunartækni
Gagnaöflun
The Data Journalism Handbook

The Data Journalism Handbook fæddist á vinnufundi hjá European Journalism Foundation og Open Knowledge Foundation árið 2011 í London. Hundruð manna tóku þátt í verkefninu og bókin kom út árið 2012.

Safari Books Online hefur til sölu stafrænar bækur á þessu sviði. Þar á meðal The Data Journalism Handbook eftir Jonathan Gray, Lucy Chambers og Liliana Bounegru á $13. Ég styðst hér við þá bók: http://shop.oreilly.com/product/0636920025603.do

Í vaxandi fréttastraumi, þar sem upplýsingar koma úr öllum áttum, er nauðsynlegt að hafa gagnablaðamennsku. Hún felst í að nota forritun til að gera sjálfvirka söfnun og sameiningu upplýsinga og til að finna samhengi milli hundruð þúsunda skjala.

Blaðamenn eiga að líta á gögn sem tækifæri. Gagnavinnsla veitir innsýn í framtíðina. Þröskuldur er í veginum, fólk þarf að þjálfa sig í að vinna við öll skref gagna. Ofangreind handbók hjálpar vonandi fleiri blaðamönnum til að nýta sér þetta nýja svið.

Nú, þegar gnægð er upplýsinga, er vinnsla þeirra mikilvægari.
1. Við könnum upplýsingarnar til að fá vit og stoðkerfi í þær.
2. Við komum á myndrænan hátt inn í hausinn á fólki, hvað sé mikilvægt og mikils virði.

Mikill vilji er fyrir hendi að fara úr þægindum hefðbundinnar blaðamennsku og verja tíma til að ná tökum á nýrri tækni.
Forustu hafa tekið Guardian, New York Times, Texas Tribune og Die Zeit.

Gagnablaðamennska er pakki af hæfileikum til að leita, skilja og sjá fyrir sér stafrænar heimildir á tíma, þegar hefðbundin blaðamennska nægir ekki. Þetta kemur ekki stað hefðbundinnar blaðamennsku, heldur er þetta viðbót við hana.

Jonathan Stray og Julian Burgess hjá AP tóku Iraq War Logs: http://jonathanstray.com/a-full-text-visualization-of-the-iraq-war-logs Bjuggu til aðferð til að sýna á myndrænan hátt hóp lykilorða í þúsundum bandarískra skýrsla um Irak, sem lekið var til WikiLeaks.

Tom Hargrove á Scripps Howard byggði upp nákvæman gagnabanka um 185.000 óleystar morð–gátur og fann síðan reiknirit, algórythma, til að leita að einkennum, sem gætu bent til raðmorðingja. http://projects.scrippsnews.com/magazine/murder-mysteries/

Gífurlegt magn gagna, sem eru aðgengilegar á vefnum, svo og fínpússuð tæki fyrir notendur, fámiðlun og hópmiðlun, gera fleira fólki kleift að vinna við gögn á auðveldari hátt en nokkru sinni fyrr. Eins konar vísindaleg blaðamennska.

Þeir sem starfa í hinu unga “data journalism” eru að miklu leyti aðrir en þeir, sem eru í hinni þroskuðu CAR (computer-assisted reporting) blaðamennsku. Gagnablaðamenn get lært af hinum nákvæmu og gagnrýnu vinnubrögðum CAR blaðamanna.

Fjölmiðlar reyna að búa til teymi, þar sem blaðamaður flytur með sér færni í texta, vefleitarnörd flytur með sér færni í leit og vefhönnuður flytur með sér færni í grafískri framsetningu upplýsinga. Fjölmiðlar þurfa líka að vinna með hökkurum og kóðurum.

Teymi BBC í gagnablaðamennsku telur 20 blaðamenn, hönnuði og þróunarfólk. Dæmi um árangur:
Skuldir evrusvæðislanda, BBC:
http://www.bbc.co.uk/news/business-15748696
Hvaða land skuldar hvaða landi?

Mismunandi gengi nemenda frá mismunandi skólum, þegar þeir koma í háskóla. BBC:
http://www.bbc.co.uk/news/education-11950098
Dauðsföll á þjóðvegum. BBC:
http://www.bbc.co.uk/news/uk-15975720

Finndu út, hvar þú ert í aldursröð mannkyns. BBC:
http://www.bbc.co.uk/news/world-15391515
Brezku fjárlögin skoðuð myndrænt, BBC:
http://www.bbc.co.uk/news/business-17442946

Vendipunktur hjá Guardian var vorið 2010, þegar blaðið fékk WikiLeaks töfluna með 92.201 skráningar um stríðið í Afganistan. Síðan kom Írak með 391.000 skráningar. Forsíða gagnablaðamennsku á Guardian: http://www.guardian.co.uk/data

Hvernig á að ráða hakkara? Ýmis vefföng má reyna: http://www.python.org/community/jobs/
http://hackshackers.com/blog/2012/02/25/subscribe-to-hackshackers-jobs-newsletter/
http://www.ire.org/resource-center/listservs/subscribe-nicar-l/

Ýmislegt samstarf blaðamanna í rannsóknum:
https://reportingproject.net/occrp/
http://www.fairreporters.org
http://gijn.org
Hugbúnaður í rannsóknum: http://www.investigativedashboard.org/2011/02/software-resources/

Viðskiptamódel fyrir gagnablaðamennsku krefst nýrrar nálgunar. Margir blaðamenn gera sér ekki grein fyrir tekjum, sem nú þegar verða til af völdum gagnasöfnunar, gagnarannsókna og myndrænnar framsetningar (visualization).

Finna þarf þá sem hafa gögnin og hvernig þau eru geymd. Eru oft í PDF formi, ekki í CSV eða XML.
PDF skjölum þarf að breyta með UnPDF og ABBYY Fine Reader yfir í CSV eða Excel.
Búa til gagnagrunn í SQL

Þú getur leitað aðeins að töflum: .XLS, .CSV
eða geodata: .shp
eða úrdrætti: .MDB, .SQL, .DB
jafnvel leitað að: .PDF
Þú getur líka leitað eftir URL
gúglaðu þá “inurl:downloads filetype:xls”

Oft er bezt að leita ekki beint heldur leita að stöðum þar sem magn gagna á að vera, t.d.:
“site:agency.gov Directory Listing”
“site:agency.gov Directory Download”

Alþjóðlegir listar yfir gögn:
http://datacatalogs.org
http://www.guardian.co.uk/world-government-data
http://datahub.io
https://scraperwiki.com

Spyrjið líka Forum: Get The Data:
http://getthedata.org
Quora: https://www.quora.com
Eða spyrja póstlista:
http://lists.okfn.org/mailman/listinfo/data-driven-journalism
Hafið samstarf við hakkara:
http://hackshackers.com

Sjá nánar:
Jonathan Gray, Lucy Chambers og Liliana Bounegru
The Data Journalism Handbook
2012, http://shop.oreilly.com