Fullkomin leit

Nýmiðlun
Fullkomin leit

Leit er aðeins komin 5% áleiðis. Þar er mikið verk óunnið. Í framtíðinni verða leitarvélar ólíkar þeim, sem nú eru. Greind þeirra verður meiri.

Ekki verður bara leitað á hörðum diskum í tölvum, heldur einnig í farsímum, lófatölvum, bíltölvum, sjónvarpstækjum, öllum þeim mörgu tólum, sem hafa örflögur.

Djúpir þekkingarbankar eins og LexixNexis eru núna lokaðir fyrir leit af viðskiptalegum ástæðum. Þessi ósýnilegi vefur verður opnaður.
Bækurnar, 100 milljón bækur, verða líka settar á vefinn, svo að hægt verður að leita í þeim.

Ferðir fólks um vefinn, “clickstreams”, eru líka skráðar og eru hluti af þessu stóra safni til að leita í. Google er komið með gömul fréttasöfn á netið. Allar leitarvélar ná nú þegar til sögu hverrar leitar, “clickstream” hennar.

Gular síður eru komnar í leitina. Það er staðbundin, persónuleg leit, leitarorð + póstnúmer. Með því að kynnast þér getur leitarvélin gert leitina markvissari. Yahoo Local er dæmi um þetta.
Yahoo kom með Y!Q, samhengisvædda leitartækni. Breytt viðmót.

Google kom með Google Deskbar, fljótandi leitarbox á skjáborðinu. Google kom líka með hugbúnaðarviðmót, sem gerir kleift að setja hugbúnað inn í Googleumhverfið. A9 hjá Amazon er líka með áhugaverð atriði, sem fóru fram úr öðrum.

Leitarvélar munu fljótlega geta svarað öllum spurningum þínum á grundvelli þess, hver þú ert, hvar þú býrð, hvað þú ert að lesa og hver er saga fyrri leita þinna.

Leit er notendaviðmót, leið til að sigla um stafrænu tilveruna. Með því að byggja upp sögu fyrri tilrauna þinna til að leit, munu leitarvélar senn geta tekið tillit til þess. Recovery er leit á fyrri nótum, Discovery á nýjum nótum. A9 hjá Amazon tekur á þessu.

A9 tekur ekki bara tillit til fyrri clickstreams ferða þinna, heldur einnig ferða annarra, sem hafa verið að fiska á sömu miðum.

Upplýsingahaugurinn verður aðgengilegri, ef hann er með merkimiðum, “tags”. Þeir upplýsa, um hvers konar upplýsingar er að ræða. Úr þessu verður eins konar metadata, sem meðal annars ná yfir “clickstreams”. Þetta er merkingarvæddi veraldarvefurinn.

Tim Berners-Lee, faðir veraldarvefsins, er helsti talsmaður merkimiða. Með merkimiðum fær vefurinn innri gerð eins og LexixNexis og Sabre. Merkimiðar auðvelda fólki að gera hluti á grundvelli leitar. Þetta er “resource description framework”, RDF.

Staðlar eru þröskuldur í vegi merkingarleitar. Hvaða merkimiði hentar í hverju tilviki? Það er oft ekki ljóst. Í stað merkingar að ofan er farið að nota þær að neðan. T.d. í Flicks og Technorati. Þar geta notendur sett inn merkimiða og komið þeim til annarra.

Bloggið og perlufestar, RSS, “really simple syndication”. RSS er færanleg útgáfa af bloggi og fréttum, sem menn nota fréttalesara til að lesa. Með RSS geta menn búið til perlufesti af bloggi þeirra, sem þeir vilja lesa, og lesið það síðan í einu lagi.

Í fyrsta lagi:
Blogg er persónuleg yfirlýsing einstaklings, sem segir, hver hann sé og hver hann vilji vera í leitarheiminum. Blogg má merkja með miðum. Í blogginu felst félagsleg staða bloggarins, afstæður hans, áhugi og saga.

Í öðru lagi:
Blogg hefur náð nægu magni til, að augu leitarvélar geti séð út úr því mynstur, sem gera leitina fínlegri og láta hana skila betri árangri. Úr þessu kerfi má ná fram flokkunarfræði.

IBM er að koma með WebFountain, sem tekur á ýmsum af þessum nýju verkefnum. Það forrit á að gera þér kleift að spyrja um “that regulation that lets me fly on other airlines” og fá svarið: “FAA Rule 240”. Þetta er blanda af fulltextaleit og merkingarleit.

Hægt er að spyrja WebFountain svona: “Láttu mig hafa öll skjöl á vefnum með amk. einni síðu á arabísku, sem eru í Bandaríkjunum og eru skyld tveimur öðrum skjölum, en tengjast ekki vef Al Jazeera og nefna einhvern á tilgreindum lista af terroristum.”

Önnur leit: “Finndu alla staði á vefnum, þar sem The Passion of the Christ” er rædd, sem einnig nefna eina af söluháum bíómyndum, fyrir utan Lord of the Rings og að frátöldum öllum slóðum á spönsku eða eru staðsettar á suðurhveli jarðar. Þýðist á ensku.”

Viðskiptavinir WebFountain geta svo bætt við eigin miðamerkingum, sem forritið keyrir á allan veraldarvefinn í flýti. Fyrr en síðar verður slík leit aðgengileg almenningi. En hún er núna ofviða Google. WebFountain skannar veraldarvefinn á tæpum degi.

GlobalSpec er verkfræðilegur gagnagrunnur yfir varahluti og staðsetningu þeirra, hentar verkfræðingum og engum öðrum. Á sínu sérsviði eru slíkir sérhæfðir grunnar betri en alhæfðu grunnarnir.

Ímyndið ykkur, að Google nái til slíkra sérhæfðra grunna og geti þannig búið til metaleitarvél, sem keyrir ofan á ótal slíkum grunnum. Metaleit er þegar mikið notuð, af því að svo margir aðilar hafa skráð vefinn.

Ósýnilegi vefurinn, lokaður leitarvélum, er víðtækur. Einnig er fortíðin utan við leitina. Vefurinn hefur ekkert minni. En senn kemur tímaásinn inn í þetta dæmi. Menn geta þá í leit tilgreint, á hvaða tímabili vefsins á að leita.

Þar með er tímaás mannkynssögunnar orðinn stafrænn og aðgengilegur. Það markar þáttaskil í leit. Kostnaður við geymslu stafrænna gagna og við tölvuvinnslu hefur hrunið og mun gera þetta kleift. Fyrirhugað er að afrita veraldarvefinn daglega.

Þá mun fólk geta arfleitt vefinn að öllum gögnum sínum. “Ég vil að mín slóð verði til eilífðarnóns.” Sjálfsmiðjun fólks hjálpar við að gera vefinn fullkomnari en ella og leitina víðtækari en ella.

Við sjáum skráningu merkinga. Persónulegri og staðbundnari leit. Tilkomu merkimiða. Leit á afmörkuðum sviðum. Leit á tímaási vefsins. Hvernig raðast allt þetta saman? Leit er ekki lengur sérstakur hugbúnaður, heldur gluggi að umheiminum.

Höfundurinn leitaði að Gilgamesh og fann endursagnir á ensku. Þar fann hann fyrsta rithöfund veraldarsögunnar, Shineqiunninni. Vefurinn og leitin eru Alexandríu-safn nútímans. Við höfum höggvið nafn okkar og ævi okkar í stein.

Google er konungur leitarinnar. Breytingarnar eru hraðari en áður. Google er komið á kaf í Kína og beygir sig undir reglur þar. Eins og allir hinir. Stjórnvöld hafa sett kíkinn á Yahoo, Cisco, Google og Microsoft. Er Google orðið “evil” undirsáti kínverskra stjórnvalda?

Fyrirtæki geta ekki stjórnað stefnunni gagnvart Kína. Það er bara bandaríska stjórnin, sem getur það. Hún verður sjálf að setja leikreglur, en ekki setja fyrirtæki á sakamannabekk.

Árið 2005 krafðist bandaríska dómsmálaráðuneytið gagna frá þrjátíu netfyrirtækjum, þar á meðal öllum hinum stóru. Allir gáfu eftir, nema Google. Það mál er ekki útkljáð enn.

Markaðshlutdeild Google hefur aukist. Það hefur aukið samkeppni við Yahoo á auglýsingamarkaði og í markaðssetningu. Það hefur aukið samstarfið við AOL. Árið 2006 byrjaði Google á Google Pack og Google Video.

Google lætur samstarfsaðila fá 70% af tekjum, meira en allir aðrir, og hugsar sér að geta farið upp í 80%. Flestir hafa hlutföllin þveröfug. Árið 2006 samdi Google við Dell um að setja tækjaræmu fyrirtækisins í allar tölvur þess. Árás á Microsoft.

Með aðstoð ókeypis forrita eins og Office Pack getur Google gert árás á Windows og Microsoft Office. Google hefur keypt ritvinnsluna Writely. Google ógnar Microsoft á mörgum sviðum. Með stýrikerfi, heimasíðum, office pack og leit. Gates svitnar.

Áður voru gerð bandalög gegn Microsoft. Nú er farið að gera bandalög gegn Google. EBay hefur keypt Skype og farið í samstarf við Yahoo. Yahoo er að ganga frá “Yahoo Publisher Network”. Amazon hefur rekið Google út.

Stóra deilumálið núna er skönnun Google á bókum og yfirlýsing þess um að skanna allar bækur á vefinn. Google hefur gert samninga við þekkt bókasöfn. Hagsmunasamtök rétthafa hafa kært Google. Þau óttast, að bækur fari sömu leið og tónlist.

Spurningin er, hvort Google sé eins konar bókasafn eða eins konar bókaútgefandi. Og Google getur líka skannað vídeó. Mikil málaferli eru fyrirsjáanleg.

Önnur spurning: Hver á internetið? Menn borga fyrir bandvíddina. Nóg pláss er á vefnum og nóg pláss er fyrir þráðlaust samband. Eftirlitsaðilar hafa þó hneigst til skömmtunar. Bretland og fleiri hafa sett lög um frelsi, en Bandaríkin hafa ekki gert það.

Google er að búa til sínar eigin pípur, nýtt internet, samhliða hinu fyrra. Þetta er þráðlaust kerfi, sem notar útvarpsbylgjur. Fyrsta verkefnið var San Francisco. Þar fá allir ókeypis aðgang að þráðlausu neti. Þetta hefur styrkt sjónarmið frelsis.

Öflug fyrirtæki með viðskipti við almenning, svo sem New York Times eru að efla leitarvélar sínar. YouTube safnar vídeói og mátaði Google á því sviði. Google keypti þá YouTube.

Höfundurinn er með vefsvæði:
http://battellemedia.com/

Sjá nánar:
John Battelle, The Search, How Google and Its Rivals Rewrote the Rules of Business and Transformed Our Culture, 2005

Fair Use © Jónas Kristjánsson, 2008

Endir