0632
Rannsóknir
Gagnagrunnar
Gagnagrunnur er þungaflutningatæki, sem getur skoðað milljónir af skráningum á sekúndum eða mínútum, raðað þeim í skylda flokka og borið saman skráningar milli gagnabanka. Gagnabankar eru m.a. notaðir við leit að upplýsingum.
Stjórnmálamenn og félagsvísindi hafa lengi notað gagnabanka í sínu starfi, en blaðamenn höfðu til skamms tíma dregist aftur úr á þessu sviði. Bandarísk stjórnvöld nota mikið af fjölvíðum gagnagrunnum, sem hafa fleiri en tvær víddir. Minna notað hér.
Meðal bandarískra gagnabanka af þessu tagi eru þeir, sem hægt er að ná í á slóðunum: www.open secrets.org og www.campaign finance.org. Í síðari gagnabankanum er hægt að finna, hvað mikið hver hagsmunaaðili hefur gefið hverjum frambjóðanda.
Þegar blaðamenn eru komnir með þessar tölur, fylgjast þeir með hegðun hvers frambjóðanda í atkvæðagreiðslum til að sjá, hvort þær fara eftir stuðningi hvers hagsmunaaðila við þann frambjóðanda.
Gagnagrunnar eru formlegri í umgengni en töflureiknar, meðal annars af því að þeir fyrrnefndu höndla margfalt fleiri skráningar. Í gagnagrunnum birtast gögnin óflokkuð og þú þarft sjálfur að velja, hvernig þau eru flokkuð og birt.
Í gagnagrunnum er skyldum þáttum oft raðað saman í pakka, til dæmis öllum greiðslum til eins frambjóðanda eða öllum greiðslum eins hagsmunaaðila til margra frambjóðenda eða greiðslum allra hagsmunaaðila til allra frambjóðenda.
Í gagnagrunnum eru formúlur ekki búnar til á reitum í töflu, heldur þarf að búa til formúlur í sérstöku umhverfi, “query”, þar sem þú skráir niður, hvernig leit skuli fara fram. Síðan þarftu að reikna, “run”, spurninguna sérstaklega.
Spurningarnar verða til með því að fylla út form í þessu formúluumhverfi. Við getum bætt við sviðum, “fields”, sem eru með reikningi og leikið okkur með þessa reikninga í spurningum. Svið samsvara dálkum eða línum í töflureikni.
Gagnagrunnar, sem koma frá öðrum aðilum, hafa oft marga tugi dálka eða sviða. Oft þarf blaðamaðurinn ekki að leita í nema örfáum þeirra og velur leitarskilyrði úr þeim. Við leit að nafni er valið fornafn, föðurnafn og millinöfn.
Til að framkvæma leit eða aðrar aðgerðir, sem hafa verið skipulagðar í “fields” og “queries” í Microsoft Access er ýtt á upphrópunarmerkið í aðgerðaborðanum, sem er efst, undir matseðlunum. Munið að haka í boxin “Show” í leiðinni.
Þegar leit er framkvæmd, missum við ekki allar hinar skráningarnar, sem ekki voru valdar. Þær eru bara skyggðar burt til að trufla ekki dæmið. Þær halda áfram að vera inni, tilbúnar til að taka þátt í nýjum skilyrðingum nýrra spurninga.
Leitarskilyrði geta verið mismunandi. Þú vilt leita að gefendum, sem gáfu meira en 500 dollara. Eða að viðtakendum, sem eru konur. Þú getur leitað að gefendum, sem eru á vissu aldursbili og viðtakendum, sem eru í ákveðinni fjölskyldustöðu.
“Boolean Logic” er mikið notuð í gagnagrunnum: “OG”, “EÐA”, “EKKI”. Þú þarft að átta þig á muninum á OG og EÐA. Í fyrra tilvikinu þurfa bæði skilyrði að vera uppfyllt en í hinu síðara bara annað.
Flokkun eftir eða “Group by” er mikilvægt hugtak. Þannig er gagnabankanum raðað eftir ákveðinni forskrift og síðan er honum raðað innan undirflokka hans.
Gagnabankar, dæmigerð notkun:
1) Þú nærð í upplýsingar.
2) Þú flokkar niður þessar upplýsingar.
3) Þú telur eða leggur saman hverja grúppu.
4) Þú raðar hverjum flokki eftir upphæð.
Að þessu búnu ertu búinn undir að hefja hefðbundna vinnu, viðtöl og heimsóknir, allt á hærra þekkingarstigi en áður. Þú ert búinn að sjá meginlínurnar og ert farinn að skoða málið á þeim grundvelli. Bankinn hefur lekið í þig hugmyndum.
Á þessu stigi ertu kominn með tölur í hendurnar og getur farið í viðkvæm viðtöl á grundvelli þeirra. Við slíkar aðstæður er mun líklegra, að viðmælandi þinn meti stöðuna svo, að þú vitir mikið og rétt sé að gefa þér upplýsingar. Þú virkar ekki eins og fáviti.
Tékklisti:
1) Gagnagrunnar höndla gífurlegan fjölda skráninga og leyfa hvers konar röðun þeirra.
2) Gagnagrunnar leita mjög hratt að þeim skilyrðum, sem þú setur upp.
3) Gagnagrunnar leyfa þér að filtra upplýsingar á auðveldan hátt.
4) Gagnagrunnar flokka gagnabanka niður í grúppur, tegundir upplýsinga, og telja innihald þeirra eða reikna það út.
Mikilvægasta notkun gagnagrunna er að bera saman tvo eða fleiri gagnabanka og finna það, sem þeim er sameiginlegt. Finna til dæmis einn og sama manninn eða eitt og sama heimilisfangið, eins og það finnst í tveimur eða fleiri grunnum.
Þetta heitir fjölvíð “relational” notkun gagnagrunna. Tveir eða fleiri gagnabankar eru hengdir saman á einni upplýsingu, til dæmis mannsnafni. Þannig eru fundnar nýjar upplýsingar, sem ekki voru í upprunalegu gagnabönkunum hverjum fyrir sig.
Gagnagrunnurinn gefur þér kost á að fylla út form, þar sem þú hengir saman lykiltölu í einum grunni við sömu lykiltölu í öðrum grunni. Þú getur síðan skoðað þá reiti, sem áhugaverðir eru, og raðað þeim og sýnt þá í sérstakri töflu.
Blaðamenn hafa borið saman nöfn eftir götunúmerum í dauðsfallaskrá og sömu nöfn eftir götunúmerum í kjörskrá og þannig fundið, hvaða látnir menn hafi kosið. Þetta væri útilokað að gera hér á landi, af því að kerfið og fólkið sættir sig ekki við það.
Brant Houston
Computer-Assisted Reporting
A Practical Guide
3rd Edition
2004