Magma topp logo Til forsiden Econa

Jon Bing (f. 1944), dr.juris. 1982, professor i rettsinformatikk 1988, dr.jur.hon. (Stockholm og København), Visiting Professor, Kings College, London. Skjønnlitterær debut 1967 med en novellesamling som også hadde noveller av Tor Åge Bringsværd, senere noveller, romaner, dramatikk for scene, radio og fjernsyn. Flere offentlige verv, bl.a. leder av Norsk kulturråd 1992­2000.

Velkommen til Institutt for rettsinformatikk

«Informasjon» er et ord som brukes og misbrukes. Det er en del av dagligspråket, men også en fagterm i flere disipliner. Innenfor informatikken defineres gjerne informasjon sammen med triaden «tegn», «data» og «informasjon». I denne betydningen er et tegn betegnelsen på et symbol, en gest, et signal eller noe annet som alene eller sammen med andre tegn kan brukes til å danne data. Data er en samling eller struktur av tegn som når den formidles frem til en person som har den nødvendige bakgrunn for å tolke den, forvandles til informasjon.

Et eksempel på et tegn er bokstavenC, som uten kontekst knapt betyr noe som helst. Men hvis tegnet føyes sammen med andre tegn ­ for eksempel i formen WC eller © ­ blir det data. Hvis disse dataene formidles til en person og personen er kjent med den aktuelle formalismen, blir de til informasjon. Den første gruppen har ofte vært kjærkommen for mange av oss i en trengt situasjon, den andre gruppen vil nok tolkes forskjellig alt etter om man tror det bare er et symbol for copyright, eller man har innsikt i den internasjonale traktaten som definerer symbolet og tillegger det rettslig virkning i de land som er tilsluttet traktaten. Dette siste illustrerer at informasjon i denne betydningen har et subjektivt aspekt.

Dette er ikke begynnelsen på noe forsøk på å diskutere begrepetinformasjon, bare en påpeking av at uttrykketinformasjonsteknologi egentlig blir en selvmotsigelse når man legger til grunn den definisjon som informatikken ­ det faget som utvikler og former denne teknologien ­ vanligvis bruker. For teknologi behandler data, ikke informasjon, og i så måte var den mer gammelmodige betegnelsen edb (elektronisk databehandling) mer nøktern. Det gjør det også lettere å se sammenhengen i den historiske utviklingen. For siden første gang et menneske presset et kileformet trestykke mot våt leire eller satte en meisel mot stein for å forme den første hieroglyfen, har vi arbeidet med og videreutviklet vår informasjonsteknologi.

FRA GUTENBERG TIL HOLBERG

Det er mange viktige sprang i denne utviklingen, og dette lille innlegget skal ikke forsøke å gi noen skisse av den. Men ett spennende skritt ble tatt da Gutenberg midt på 1400-tallet tok i bruk trykketeknikken. På det tidspunkt fantes det i Europa 30 000 bøker. Da hans nye kunst hadde vært brukt i 50 år, fantes det 300 boktrykkerier ­ ikke i Europa, men i Venezia! Og antallet bøker hadde økt til 15 millioner.

Naturligvis vakte også denne utviklingen av informasjonsteknologien tanker og kommentarer. Mot slutten av 1700-tallet skriver Ludvig Holberg et knippe epistler, blant annet» Om gode og dårlige virkninger av boktrykkerkunsten». 1

Derimod kand indvendes, at den Lethed og Magelighed, som Trykken fører med sig, foraarsager adskillige Uleiligheder. Derved bebyrdes Verden med en uhyrlig Mængde af unyttige Skrifter, og studerende Folk opfylder deres Hierner med vidløftig Erudition, givende sig hverken Tiid eller Middel til at reflectere paa hvad de læse. Herunder seer man i vor Tiid ikke saadanne rare Genier, som i gamle Dage, da studerende Mænd heller skierpede deres Hoveder ved idelig Meditiation, end opfyldte dem med vitløftig Læsning og med andres Tanker og Meeninger; Thi, ligesom en kand opfylde sit Huus med saa mange Giester, at han selv ikke faaer Rum at vende sig, saa kand og en opfylde Hiernen med saa mange fremmede Meeninger, at han intet Rum haver til egne Tanker.

Hvis vi hadde kunnet føre Holberg frem til vår tid og plassert ham midt i en moderne bokhandel, tror jeg han ville brutt sammen i krampegråt. Han ville se at hans verste anelser var gått i oppfyllelse. Hylle på hylle med unyttige skrifter, interesserte kjøpere ivrig opptatt med å anskaffe bøker for å fylle hodene med andres tanker. Og ingen som syntes at det var problematisk, tvert imot gledet foreldre seg over at barna leste ­ det var til og med opprettet organisasjoner med det formål å få folk til å lese mer!

METAINFORMASJON

En av de store forskjellene på Holbergs og vår tid er utviklingen avmetainformasjon, dvs. informasjon om informasjon. Når vi ikke fortviler ved inngangen til bokhandelen, kommer det av vår tro ­ kanskje av og til litt naive tro ­ på at vi kan beherske dette tilbudet, at vi kan «finne frem». Og vi finner selvsagt ikke frem ved å begynne nærmest døren og så lese titler bokhandelen rundt. Vi går målbevisst bort til hyller merket for eksempel «science fiction», vi utnytter bakgrunnskunnskap om forfatter og forlag, vi finner ­ kort sagt ­ frem!

Tradisjonelt finnes det flere former for metainformasjon. Man kan godt sondre mellom strategier som brukes for å finne frem i en «enhet» med samme forfatter eller annet opphav (typisk en bok), eller å finne frem i en «samling av enheter» med forskjellige forfattere og avvikende utforming enhetene imellom (typisk et bibliotek, en bokhandel eller lignende). I prinsippet er det knapt noen skarp grense mellom enheter og samlinger av enheter (tenk bare på et arkiv), men i praksis kan vi tillate oss å operere med den.

BOKEN

Det er enklest å bruke en bok som eksempel. Bøker er i og for seg en «oppfinnelse» basert på utviklingen av pergament i byen Pergamon. Byens bibliotek truet Alexandrias i renommé og størrelse, derfor heter det seg at Egypt forbød utføring av papyrus til Pergamon, og resultatet ble et alternativ. Pergament tillater blant annet at man skriver på begge sider av arket, og representerte derfor en mer kompakt lagringsform enn papyrusrullene. En langsom konverteringsprosess frem til omkring 400 e.Kr. førte til at ruller ble erstattet med bøker. Rullene var forsynt med merkelapper som hang ut fra de hyllene de ble lagret i. For bøker ble det etter hvert vanlig å trykke stikkordinformasjon på ryggen ­ i dag standardisert til forfatter, tittel og forlag. Dette gjør det mulig å gå langs en rekke bøker og lese titlene, en enkel form for metainformasjon.

En bok er i prinsippet en eneste lang linje med tekst som er brukket opp av hensyn til sidens bredde og lengde. Den har en ubønnhørlig sekvensiell form. Det innholdet som skal presenteres, har sjelden bare én mulig struktur, og sjelden er denne sekvensiell ­ det har de fleste forfattere erfaring fra mens de slåss med «disposisjonen», som jo er betegnelsen på det problemet det er å ordne emner inn i en sekvensiell struktur.

Denne strukturen erklæres gjerne gjennom eninnholdsfortegnelse, som blir en metarepresentasjon av den sekvensielle strukturen. De fleste bøker har en innholdsfortegnelse, men det finnes unntak, særlig for skjønnlitteratur (men også for annen litteratur; lovsamlingen har for eksempel ingen innholdsfortegnelse). De fleste av oss er flinke til å bruke innholdsfortegnelser. For det er jo slik ­ man kan like det eller ikke ­ at få fagbøker leses fra perm til perm. I praksis brukes ikke den sekvensielle strukturen av leseren på samme måte som den er brukt av forfatteren. Leseren «slår opp», gjerne på grunnlag av innholdsfortegnelsen. Det betyr nok en utfordring fordi forfatterens omhyggelige pedagogiske fremstilling blir brutt av leseren, som slik lett kan gå glipp av forklaringer og forbehold som leseren burde hatt in mente ved lesning av det avsnittet han eller hun finner frem til.

Innholdsfortegnelsen bygger vanligvis på metaelementer i selve den løpende teksten, nemlig overskrifter. En sekvensiell tekst brytes gjerne opp i ulike hierarkiske nivåer ­ kapittel, hovedavsnitt, avsnitt osv. ­ og det finnes flere konvensjoner for slik inndeling. Hvert nivå markeres. Det er gjerne en dobbelt markering: for det første en enkel kode som angir elementets sekvensielle og hierarkiske plassering i strukturen (kap. 1, pkt. 1.1), og dernest en overskrift eller tittel som tar sikte på å karakterisere innholdet i det aktuelle elementet. Disse overskriftene vil tradisjonelt være tilordnet av forfatter og altså være en del av den teksten forfatteren har skrevet, men det finnes mange nok eksempler på at en redaktør bistår med oppdeling mv. Det er disse overskriftene som sorteres frem til innholdsfortegnelsen, som derfor bygger på autentiske (forfatterskapte) elementer.

Av og til føyes det enda et metaelement til teksten, etsammendrag, en telegrafisk stikkordkarakteristikk eller lignende. I Charles DarwinsRejse om Jorden 2 finner man for eksempel denne karakteristikken av tredje kapittel:

Monte Video. ­ Maldonado. ­ Udflugt til R. Polanco. ­ Lazo og Bolas. ­ Agerhøns. Mangel paa Træer. ­ Hjorte. ­ Capybara eller Flodsvinet. ­ Tucutuco. ­ Molothrus, gjøgelignende Færd. ­ Tyran-Fluesnapper. ­ Spotfugl. ­ Aadselsfalke. ­ Rør dannede af Lynild. ­ Et Hus ramt af Lynild.

I dette tilfellet er denne karakteristikken autentisk og sikkert formet av forfatteren for å skjerpe leserens appetitt på det nedenstående kapitlet. Men ofte er slike sammendrag tilføyd av en tredjeperson, typisk en redaktør ­ dette er ikke uvanlig i vitenskapelige tidsskrift, domssamlinger mv. Hovedfunksjonen for sammendrag og lignende metaelementer er ikke egentlig å «slå opp» i boken, men å vurdere hvorvidt det beskrevne elementet er relevant eller har interesse for leseren. Forsøk viser da også at sammendrag er særlig velegnede til å kunne avgjøre at det beskrevneikke er relevant, og de har derfor ofte en betydelig nytteverdi i arbeidet med å orientere seg i en bok.

ALTERNATIVER TIL SEKVENSIELLE STRUKTURER

Det finnes strategier for å bygge inn strukturer som er alternative til den sekvensielle. Slike strategier realiseres gjerne ved registre, ofte kalt «bak i boken»-registre etter deres konvensjonelle plassering. Det finnes mange typer registre, men to viktige hovedtyper er stikkordregistre og systematiske registre.

Stikkordregistret bygger i sin enkleste form på en sidebeskrivelse. Noen ­ ofte forfatteren, men like ofte en tredjeperson ­ leser boken og skriver ned ord som synes å være karakteristiske for det boken behandler, side for side. Ofte baserer man seg på innfallsmetoden; det velges ord som fremstår som særlig betegnende. Det hender at dette fører til valg av ord fra overskrifter eller sammendrag, i så fall blir ikke stikkordregistret noe særlig viktig supplement til innholdsfortegnelsen. Eller man kan basere seg på å velge ord fra en forhåndsdefinert liste (tesaurus) i ønsket om å oppnå høyere grad av konsistens. Det kan også være veiledninger om ord man alltid skal plukke med seg ­ personnavn, stedsnavn, omtalte organisasjoner osv. Dette siste ­ regler som bygger på faste kriterier ­ vil også gi relativt høy grad av konsistens. Ofte vil man plukke ut enkelte slike stikkord og plassere dem i et eget register. I en juridisk monografi vil man for eksempel finne doms- og lovregister hvor referanse til lover eller dommer er stikkordene.

De systematiske registrene bygger på en systematisering av det domene boken omhandler. Denne systematikken vil gjerne være utarbeidet på forhånd og uavhengig av boken og også være felles for flere arbeider innenfor samme domene. Jo mer utbredt og jo mer stabil en systematikk er for domenet, desto bedre vil leserne kjenne systematikken, og desto lettere vil de kunne orientere seg ved hjelp av dem.

Slike registre representerer ikke bare metastrukturer, men også hyperstrukturer, dvs. alternative måter å organisere det materialet som i boken er tvunget inn på den rette linjes geledd. Et stikkord gir henvisning til flere sider hvor innholdet karakteriseres av dette stikkordet, og disse samles så til et knippe omkring det angitte emnet.

En tredje måte å danne hyperstrukturer på er de tradisjonelle fotnotene, som inneholder henvisning til andre steder i boken som er beslektet med den teksten noten er knyttet til. Dette er ikke metainformasjon. Fotnotene gir ingen oversikt over helheten, men knytter altså forbindelser i form av pekere fra én side til en annen.

Strukturen oppsummeres enkelt i figur 1 nedenfor.

figur

Figur 1 Meta- og hyperstrukturer i en bok

Når registrene etableres ved at en person ­ en indekserer ­ bruker egen forstand, kanskje hjulpet av regler, kalles detteintellektuell indeksering. Før datamaskinene hadde man egentlig ikke noe alternativ til dette, selv om det hendte ­ for særlig viktige forfattere eller verk ­ at man laget registre som omfatteralle ordene i teksten, en tesaurus som ga henvisning til alle de steder hvor for eksempel Ibsen hadde brukt et bestemt ord i sitt forfatterskap. Åpenbart krevde dette en stor og rutinepreget innsats, og investeringen kunne bare forsvares hvis hjelpemidlet i neste omgang ville lette arbeidet med analyse eller tolkning av teksten.

Kanskje bør man til slutt kort reflektere over den rollensidenummer representerer. Sidenumrenes hovedfunksjon er ikke å opplyse om hvor lang boken er, men å gjøre det mulig å foretaentydige henvisninger innenfor boken. Det er på en måte en nokså grov referanse; finner man en henvisning fra personregistret til en bestemt side, må leseren selv lete gjennom siden for å finne hvor på siden navnet forekommer. Men selvsagt er sidenumrenes funksjon helt avgjørende nettopp for ved hjelp av metainformasjon som registre å vise til hvor i boken noe forekommer. Det hender at man har alternativer til sideinformasjon qua nøkkel. I lovsamlingen henvises det for eksempel ved hjelp av dato ­ ettersom lovene gjengis kronologisk, er dette like hensiktsmessig. Faktisk er det mer hensiktsmessig, for mens sidetallet vil kunne forandres fra utgave til utgave, vil datoen være stabil. Sidetallet er altsåmedierelativt. Ved overgangen til digitale media mister man sidetallet som referanse. Derfor utvikles alternativer, for eksempel en fortløpende nummerering av avsnitt, som vil være den samme i papirutgaver og elektroniske utgaver.

BIBLIOTEK

Et annet tradisjonelt eksempel er biblioteket, dvs. en samling med mange enheter (i praksis bøker), gjerne skrevet av helt forskjellige forfattere. Hver av disse bøkene inneholder typisk den form for meta- eller hyperinformasjon som er nevnt ovenfor. Men åpenbart vil dette gi liten hjelp til den brukeren som vandrer inn mellom hyllene. Denne brukeren kan lese på ryggene av bøkene og slik få en slags oversikt over hylleoppstillingen. Men det ville bli ørkesløse vandringer om man ikke hadde mer å hjelpe seg med.

Derfor har biblioteker egne registre i form avkataloger. Disse er igjen etablert etter ulike prinsipper, men tre vanlig forekommende typer svarer til de registrene som kort er omtalt i forbindelse med en bok. Utgangspunktet er gjerne et systematisk register basert på en på forhånd oppstilt systematikk. En klassisk systematikk kalles Dewey Decimal Classification System 3 etter Melvin Dewey, som utarbeidet den første versjonen av systemet i 1873 og publiserte det første gang i 1876. I dag inneholder det 110 000 ulike klassifikasjonsnøkler i et system som brukes av nasjonalbibliotekene i 60 land. Et enkelt eksempel på systemets hierarkiske oppbygning, som reflekteres i notasjonen, gjengis i figur 2 nedenfor.

figur

Figur 2 Eksempel på Deweys klassifikasjon

I tillegg til systematisk katalog vil man gjerne ha en forfatterkatalog. Denne er til liten hjelp for den som kommer til biblioteket med et problem uten forhåndskunnskap, men den vil ofte være til hjelp for den som kjenner sentrale forfattere mv. Det kan også være andre typer kataloger, for eksempel enemnekatalog som supplerer den systematiske katalogen. Det hender man griper til den når en kategori får svært mange innførsler. I eksemplet kan man tenke seg at antallet bøker om katter i kategori 636.8 blir svært høyt. Da kan man enten utvide klassifikasjonen (6368.1 ­ «abyssinere») eller supplere med en emneordkatalog innenfor den aktuelle kategorien.

Kanskje bør man understreke det arbeidet som er nødvendig for å vedlikeholde kataloger. Dette gjelder ikke bare innføring av nye enheter som skaffes til samlingen, men også en stadig bearbeidelse av klassifikasjonssystemet, slik at det utvides for å kunne reflektere ny viten og endret forståelse. Dette gjør slike systemer arbeidsintensive og kostbare.

BIBLIOTEKARER ER METAINFORMATIKERE

Katalogene i biblioteket representerer metainformasjon og var kanskje de mest avanserte eksemplene før man fikk datamaskinbaserte systemer. Bibliotekets systematiske katalog var et kart over informasjonen som kunne tilbys fra hyllene. Likevel var det ikke enkelt å finne frem på egen hånd ­ derfor er biblioteker også bemannet med eksperter i utnyttelse av metainformasjon, nemlig bibliotekarer. En bruker kan henvende seg til en bibliotekar, og selv om man mangler kjennskap til Deweys klassifisering eller andre hjelpemidler, vil bibliotekaren forstå henvendelsen han eller hun mottar i naturlig språk, og på grunnlag av denne forståelsen selv utnytte tilgjengelige hjelpemidler for å finne forslag til hva brukeren trenger. Bibliotekarer er på en måte metainformatikere, en profesjon man skulle tro ville ha en enda høyere profil i dagens virkelighet, hvor behovet for å finne frem i informasjonsressursene er aksentuert.

Det er gjort forsøk på å forbedre brukerens utnyttelse av bibliotekarer. Et par slike forsøk har hatt som hypotese at brukerens forespørsel er for knapp, og at man ved å forsterke interaksjon mellom bibliotekar og bruker skal kunne oppnå økt effektivitet. Paradoksalt nok fant man at den økte kontakten i stedet førte til redusert effektivitet (slik dette ble målt i disse eksemplene). Forklaringenkan være at bibliotekarer er flinkere til å formidle metainformasjon til brukere enn brukere er til å formidle spørsmål til bibliotekarene, og at interaksjonen på en måte forandrer brukerens forståelse av spørsmålet, slik at det passer best mulig til katalogenes systematikk og begrensninger. Hvis dette er tilfelle, har vi altså en illustrasjon av forholdet mellom metainformasjon og informasjon som viser hvordan det ene på ingen måte er upåvirket eller uavhengig av det andre.

Et bibliotek er ikke en isolert institusjon. Antakelig kommer flertallet av brukere til biblioteket med forespørsel om en bestemt bok ­ de vet på forhånd hva de ønsker. Denne kunnskapen må komme et sted fra, og den kommer ofte fra andre bøker i form av henvisninger eller omtaler. Fagbøker innenfor et område etablerer gjennom henvisninger mv. en nokså sterk hyperstruktur. En anbefalt måte å skaffe seg oversikt over et område på vil være å lese et standard innføringsverk og så følge henvisningene fra dette til den litteraturen det refereres til. Det finnes egne systemer som nettopp tar sikte på å eksplisere slike hyperstrukturer (navnene varierer mellom områder, men de omtales gjerne som «citation indexes»).

Ofte brukes nettopp forfatterregistret når man får en forespørsel generert på grunnlag av en henvisning fra eksterne kilder. Det er nok ingen helt generell måte å henvise til en bok på, men forfatter og tittel inngår alltid i henvisningen. Og kommer en bruker til biblioteket med ønske om en bestemt bok, vil man ved hjelp av slike opplysninger kunne bestemme om boken finnes eller mangler på hyllene. Eller kanskje er den lånt ut, noe man forhåpentligvis finner svar på i utlånsregistret. Forfatterregister (med tilhørende elementer som tittel) har altså en funksjon som svarer til den sidenumrene har internt i en bok.

Skissemessig kan man derfor også oppsummere et bibliotek i figur 3 nedenfor.

figur

Figur 3 Informasjonssystemer rundt et bibliotek

INTELLEKTUELL OG AUTOMATISK INDEKSERING

Ovenfor er det gitt flere eksempler på «intellektuell indeksering», dvs. at en bok, artikkel eller annet dokument karakteriseres av en person på grunnlag av en klassifisering, tesaurus eller eget skjønn. Det er også nevnt at man unntaksvis også tidligere laget oversikter som inneholdt alle ordene i for eksempel en roman eller et viktig verk. Da man kunne bearbeide tekster ved hjelp av datamaskiner, ble det nokså trivielt å lage slike «inverterte filer», altså registre som inneholder alle de ulike ordene i ett eller flere dokumenter, med henvisning til hvor i dokumentet ordet forekom. I vanlige «bak i boken»-registre var disse adressene begrenset til en sidehenvisning; i de datamaskingenererte registrene kunne adressen være svært nøyaktig med dokument-, avsnitts-, setnings- og ordnummer. Ved hjelp av et slikt register var det trivielt å be om å finne for eksempel en artikkel der ordetLille forekom umiddelbart før ordetEyolf, og slik med stor sikkerhet finne artikler som omtalte Henrik Ibsens skuespillLille Eyolf (1894) i motsetning til «Lille Herbern» eller «Eyolf Haug».

I begynnelsen sto det strid om effektiviteten av automatisk indeksering. Det ble med rette påpekt at datamaskinbaserte systemer ikke kunne utøve noe skjønn slik som en erfaren indekserer. Ordetmark ble oppfattet forskjellig fra ordeteng, men beslektet med ordetmarg; datamaskinen la i utgangspunktet en rent syntaktisk behandling til grunn. Dette kan selvsagt forbedres med bøyningsregler og unntak fra disse. En slik inkrementell forbedring kan skje nærmest uten begrensning, men dette ville jo bety at man på en måte slo vrak på det som var den dramatiske fordelen med de datamaskinbaserte systemene, nemlig at man ved marginale kostnader kunne etablere indekser over store volum av tekst. Tilhengerne av automatisk indeksering pekte på sin side på at man sjelden oppnådde konsistens ved intellektuell indeksering. Ulike indekserere tilordnet de samme dokumentene ulike stikkord, og faktisk ville den samme indeksereren tilordne det samme dokumentet ulike stikkord hvis det ble presentert for vedkommende på ny sammen med andre dokumenter.

I dag er egenskapene ved intellektuell og automatisk indeksering velkjente. Begge metodene har fordeler og ulemper. Men den altoverskyggende fordelen ved automatisk indeksering er at det gjør det mulig å lage søkesystemer uten prohibitive kostnader i form av menneskelig innsats.

Det er faktisk litt kuriøst at det ble jurister ­ en profesjon som ikke nettopp er kjent som trendsettere i ny teknologi ­ som først tok disse mulighetene i bruk i stor skala. Det første tekstsøkesystemet for lover i autentisk form (full tekst) ble demonstrert i 1960, Norge fikk sitt første direktekoblede (online) rettslige informasjonssystem i 1981, og institusjonen Lovdata tilbyr i dag over 100 databaser med juridiske primærkilder.

INTERNETT OG METAINFORMASJON

Internett bygger på et initiativ som ble tatt av det amerikanske forskningsdepartementet i 1969, men er for lengst blitt et sivilt nettverk. Det er verdensomspennende og kan i omfang bare sammenlignes med det større nettet for taletelefoni. Det har vært i bruk i Norge siden 1972 ­ faktisk var noden ved Kjeller utenfor Oslo den første utenfor USA.

Men Internett forble et redskap for universiteter og forskningsinstitusjoner frem til begynnelsen av 1990-årene. Da ble det mulig for også andre å knytte seg til nettet. Og enda viktigere: I disse årene ble den tjenesten innenfor Internett som heter World Wide Web, utviklet. Den første nettleseren ble tilgjengelig i mars 1993 ­ det var Marc Andreessens Mosaic, som ble tilbudt gratis til begjærlige brukere. Men ved utgangen av 1993 var det i hele verden bare omtrent femti datamaskiner knyttet til WWW. I løpet av de årene som er gått siden 1993, er ­ bokstavelig talt ­ Internett blitt allemannseie, og nettet er blitt en uunnværlig og dagligdags ressurs, ikke bare for forskere, men for alle som kommuniserer eller på annen måte arbeider med eller trenger informasjon.

Mengden av informasjon er overveldende. Vi får sikkert lyst til å gjøre som Ludvig Holberg på terskelen til en moderne bokhandel, nemlig sette oss ned og gispe litt av maktesløshet og frustrasjon: Hvordan skal vi orientere oss i denne mengden av informasjon, hvor jo det aller, aller meste nettopp representerer «en uhyrlig Mængde af unyttige Skrifter»?

SØKEMOTORER

Ovenfor er det brukt forholdsvis mye plass på å forklare metainformatiske elementer i bøker og biblioteker. Grunnen er at dette fremdeles er de viktigste verktøyene vi har å hjelpe oss med i Internetts enda mer overveldende virkelighet.

En viktig form for metainformasjon tilbys avsøkemotorer. Disse fungerer i bunn og grunn på to måter: som intellektuell eller automatisk indeksering. Enkelte tjenester, som Yahoo!, har en omfattende klassifisering av nettsider. Det forutsetter intellektuell indeksering, selv om denne selvsagt er datamaskinassistert. Indeksererne benytter programmer som automatisk oppsøker nettadresser og leter etter ord eller fraser som kan indikere hva slags emne den aktuelle siden handler om, og så presentere dem til indeksereren for nærmere vurdering. Andre tjenester, som AltaVista, bygger først og fremst på automatisk indeksering: Systemet kopierer sider fra nettet som indekseres automatisk slik vi antydet ovenfor. Begge strategiene hjelpes av den underliggende strukturen for nettsidene. Sidene skrives ved hjelp av etsidebeskrivelsesspråk, som godt kan oppfattes som en autentisk indeksering av siden. Hvis man for eksempel går til hjemmesiden for min egen institusjon (Institutt for rettsinformatikk, http://www.jus.uio.no/iri/), er dette en konvensjonell presentasjon av et institutt ved Universitetet i Oslo. Bak denne finner man en beskrivelse, og de første linjene i denne er:

Velkommen til Institutt for rettsinformatikk

Institutt for rettsinformatikk presenterer seg selv, og tilbyr artikler, kommentert samling av lenker m.m."

Velkommen til Institutt for rettsinformatikkInstitutt for rettsinformatikk presenterer seg selv, og tilbyr artikler, kommentert samling av lenker m.m."

Ser man litt nedover, finner man et par linjer som definerer seg selv som «meta content» og «meta name». Hvis vi hadde ansvaret for en søkemotor, kunne det være nærliggende for oss å programmere den til å lete frem linjer med denne definisjonen, kopiere innholdet og legge dem til grunn for en automatisk indeksering. 4 Dette bygger på den hypotesen at her finner man nettopp ord som er karakteristiske for det innholdet som tilbys på dette nettstedet. Går man tilbake til den grafiske siden, vil man se at den har en tittel som svarer til den linjen som i utdraget ovenfor er definert som «title». Men de to linjene med «meta content» og «meta name» vises ikke ­ disse er lagt inn nettopp for å samvirke med slike mekanismer som søkemotorer og assistere i den automatiske indekseringen.

Karakteristisk for nettet er også en sterkt utbygd hyperstruktur i form av lenker eller pekere. I prinsippet fungerer disse akkurat som henvisninger i fotnoter eller på annen måte innenfor en bok eller mellom bøker, som nevnt ovenfor. Men denne prinsipielle likheten med det tradisjonelle må selvsagt ikke få overskygge det nye, det som gjør hyperstrukturen kvalitativt forskjellig: nemlig at man kan klikke på henvisningen og dermed instruere programmet til automatisk å følge den henvisningen som er angitt i den underliggende representasjonen av siden, og slik hoppe til den siden det er henvist til.

Men det er for så vidt påfallende at vi ikke har fått helt nye former for metainformasjon. Den frustrasjonen vi kan føle konfrontert med nettets uoversiktlige tilbud, kommer nettopp av at deter uoversiktlig, og av at vi ennå ikke har gode nok hjelpemidler for metainformasjon som skaper muligheter for effektiv gjenfinning og lett begripelig oversikt. Man vil finne nettsteder som har kart over det materialet som tilbys, av og til presentert som grafiske strukturer hvor man ser oppbygningen og lett kan hoppe innenfor nettstedet ­ et slags motstykke til innholdsfortegnelser for materiale somikke er ordnet sekvensielt. Men de fleste nettsteder er nok utformet som om de skulle være elektroniske bøker, til tross for at teknologien nettopp tillater flukt fra den lange, rette linjes tyranni.

Man må imidlertid ikke bli sittende igjen med det inntrykk at man innenfor den nye teknologien bare har parallellforskjøvet den typen registre mv. som har hjulpet oss i en papirbasert verden, selv om dette i prinsippet ikke er så uriktig. Det finnes mange smarte muligheter som utnyttes. Til og med det enkle eksemplet som ble nevnt i forbifarten ­ «finn dokumenter hvor ordetLille forekommer umiddelbart foran ordetEyolf» ­ ville være vanskelig å realisere i den papirbundne verden. Selv om man hadde hatt et nøyaktig register med alle ordenes adresser, måtte man puslet sammen henvisningene for Lille og Eyolf på egen hånd for å finne i hvilke setninger de fulgte etter hverandre. Og det finnes mange strukturer i dokumenter som kan tolkes og utnyttes ved datamaskinbaserte metoder. Det finnes også mange spennende forsøk på å «forstå» naturlig språk ved hjelp av kunnskapsbaserte metoder (ofte omtalt litt misvisende som «artificial intelligence»), og spesielt innenfor begrensede domener er man kommet nokså langt ­ for eksempel ved produksjon av automatiske sammendrag.

LANG OG SPENNENDE VEI

Men vi har langt igjen. Trøsten får bli at det er en spennende vei å gå. Som et siste eksempel på hvor lang denne veien er, tilbyr jeg et forsøk gjort med et program som i markedsføringen reklamerer med at det kan oversette frem og tilbake mellom mer enn tretti språk. I mitt lille useriøse forsøk valgte jeg den første strofen av fedrelandssangen: «Ja, vi elsker dette landet, som det stiger frem». Jeg valgte å oversette til engelsk (det var riktig nok et amerikansk flagg som indikerte valget, men pytt sann). Og svaret kom: «Ja, we lover this country, as the ladder forward.» Her gjenkjennes typiske eksempler på problemene ved maskinoversettelse, for eksempel at verb ble forvekslet med substantiver. Spesielt var jeg fascinert av frasen «Ladder forward»! Det har jo noe norsk over seg, ikke sant ­ kanskje en redningsdåd på åpent hav: Frem med stigen!

Og det er kanskje også et passende motto for den oppgaven vi står overfor i konstruksjonen av en bedre metainformatisk oversikt over Internett.

  • 1: Ludvig Holberg:Epistler. Utvalg ved Kjell Heggelund. J.W. Cappelens forlag. Oslo, 1981.
  • 2: Til dansk ved Emil Chr. Hansen og Alfred Jørgensen. Brødrene Salmonsen. København, 1876:42.
  • 3: Jf.http://www.oclc.org/dewey/index.htm (15.4.2001).
  • 4: Derfor er også både formen juss og jus anvendt, slik at brukere vil finne siden uansett hvordan de velger å stave ordet.

Econa er foreningen for høyt utdannede innen økonomi og administrasjon. Er du ikke medlem?
Sjekk medlemstilbudene og meld deg inn i dag.

© Econas Informasjonsservice AS, Rosenkrantz' gate 22 Postboks 1869 Vika N-0124 OSLO
E-post: post@econa.no.  Telefon: 22 82 80 00.  Org. nr 937 747 187. ISSN 1500-0788.

RSS