1 Innledning
1.1 Regjeringens mål og ambisjoner
Formålet med denne meldingen er å legge fram regjeringens politikk for verdiskaping med data som ressurs. Regjeringen vil at Norge skal utnytte mulighetene som ligger i data til økt verdiskaping, flere nye arbeidsplasser i hele landet, og en effektiv offentlig sektor. Bedre utnyttelse av data er viktig om Norge skal lykkes i overgangen til et mer bærekraftig samfunn og en grønnere økonomi.
Framveksten av dataøkonomien forventes å bli en viktig driver for økonomisk vekst. Dataøkonomi er verdiskaping som skjer når data er en viktig innsatsfaktor i produksjon av varer og tjenester, eller når data er en driver for innovative løsninger.
Regjeringens ambisjon er å få til økt deling av data innad i næringslivet og mellom offentlig og privat sektor. I dag utgjør data en stadig større andel av verdiskapingen i de fleste norske næringer og sektorer, men næringslivet må bli enda bedre til å utnytte egne data og til å dele data med hverandre. Økt tilgang til og bedre utnyttelse av data innad i næringslivet kan bidra til at oppstartsselskaper, vekstbedrifter og det etablerte næringslivet utvikler nye forretningsmodeller, produkter og tjenester. Det vil igjen kunne bidra til å styrke norsk næringslivs konkurransekraft nasjonalt og internasjonalt.
Det offentlige må bli bedre til å gjøre data tilgjengelige for næringslivet. Viderebruk av offentlige data handler om å gi næringslivet, forskere og det sivile samfunn tilgang til data fra offentlig sektor på en måte som gjør at de kan brukes i nye sammenhenger. Offentlige data som bearbeides eller kobles sammen med andre data, fra private eller offentlige kilder, kan bidra til bedre tjenester, ny innsikt eller andre verdiskapende aktiviteter og produkter.
Flere offentlige datasett kan deles, og kvaliteten på dataene kan bli bedre, slik at det blir enklere å ta dataene i bruk i nye sammenhenger. Norge faller på internasjonale rangeringer som måler tilgjengeliggjøring og deling av åpne offentlige data. I EUs årlige undersøkelse Open Data Maturity for 2020 er Norge rangert på 29. plass. I 2017 lå Norge på 9. plass i den samme undersøkelsen. Regjeringen vil sørge for en mer effektiv og sikker digital infrastruktur for deling og bruk av offentlige data. Det må etableres gode rammevilkår og sterke nok insentiver for å dele data, samtidig som det etableres modeller for gevinstfordeling som sikrer at data kommer samfunnet, og ikke bare enkeltaktører, til gode.
Utdannings- og forskningssystemet må innrettes slik at arbeidslivet får tilgang til nødvendig kunnskap og kompetanse om og for dataøkonomien. Riktig og tilstrekkelig kompetanse er helt nødvendig for å kunne skape verdier med data som ressurs. For å møte behovet for kompetanse i arbeidslivet framover trengs det både å utdanne flere kandidater med spesialisert IKT-utdanning, og å gi de som allerede er yrkesaktive en mulighet til å utvikle sin kompetanse gjennom kurs og videreutdanning.
Regjeringen vil legge til rette for ansvarlig dataøkonomi i Norge, og arbeide for at bruken av data skjer på en rettferdig, etisk og ansvarlig måte. Sikkerheten og personvernet må ivaretas. Forbrukernes rettigheter må sikres, og det må legges til rette for rettferdige konkurranseregler for norske og internasjonale aktører. Kunstig intelligens og stordataanalyse kan bidra til at tjenester blir bedre tilpasset den enkelte. Samtidig er det viktig å forhindre diskriminering, manipulasjon av informasjon og misbruk av informasjon. Åpenhet, likebehandling og rettssikkerhet er viktige demokratiske verdier som også må gjelde i dataøkonomien.
Mange av problemstillingene som dataøkonomien bringer med seg, må løses gjennom internasjonalt samarbeid. Det handler blant annet om hvordan det er mulig å sikre rettferdige konkurransevilkår og regulere virksomheten til multinasjonale selskaper i dataøkonomien. En av regjeringens hovedprioriteringer i den nasjonale IT-politikken er at Norge skal være en integrert del av og en aktiv deltaker i det digitale indre markedet i Europa.
Bedre utnyttelse av data vil også bidra til at Norge lykkes i overgangen til et mer bærekraftig samfunn og en grønnere økonomi. Europakommisjonens strategier for digitalisering og data fra februar 2020 tydeliggjør at en samlet digitaliseringspolitikk er et viktig felles anliggende for EU. Digitaliseringsstrategien har som overordnede mål at Europas digitale utvikling skal virke til fordel for mennesker og miljø, være i tråd med europeiske samfunnsverdier og fremme målene i Europas grønne giv om en bærekraftig, klimanøytral og ressurseffektiv økonomi. Norge deler de store samfunnsutfordringene som Europa står overfor. Det er derfor ingen grunn til at Norge skal ha lavere ambisjoner enn resten av Europa på dette området.
Norge har gode forutsetninger for å kunne ta en aktiv rolle i dataøkonomien
Norge har gode forutsetninger for å kunne ta en mer aktiv rolle i den globale dataøkonomien. De siste ti årene har Norge rettet betydelig innsats mot det å utnytte offentlige data som ressurs. Det er etablert flere nasjonale tiltak og virkemidler som skal fremme deling og bruk av offentlige data til effektivisering av offentlig sektor, innovasjon, forskning og næringsutvikling.
Norge ligger langt fremme når det gjelder digitalisering både i offentlig sektor og i næringslivet. Landet har en sterk økonomi, kompetente industrielle og teknologiske fagmiljøer og en befolkning som er rask til å ta i bruk nye digitale løsninger. I Europa er det bare Danmark og Luxembourg som er bedre enn Norge når det gjelder digital kompetanse i befolkningen.1 Norge har i likhet med Danmark, den beste mobil- og bredbåndstilgangen i Europa.2
I Norge er en stor del av de offentlige tjenestene allerede digitaliserte, og mange offentlige data og registre er av god kvalitet. Dette er verdifulle data som må forvaltes på en riktig og ansvarlig måte om verdiene skal komme hele samfunnet til gode.
At Norge har mange gode offentlige registre, henger også sammen med befolkningens vedvarende høye tillit til offentlige myndigheters forvaltning av informasjonen som hentes inn. Høy tillit i samfunnet og det gode samarbeidet mellom myndigheter, partene i arbeidslivet, akademia og forskningsmiljøene er viktige fortrinn Norge må utnytte og bevare i utviklingen av dataøkonomien.
1.2 Nasjonale prinsipper for deling og bruk av data
Regjeringen legger følgende prinsipper til grunn for datapolitikken, se figur 1.1:
Data skal åpnes når de kan, og skjermes når de må.
Data bør være tilgjengelige, gjenfinnbare, mulige å bruke, og kunne sammenstilles med andre data.
Data skal deles og brukes på en måte som gir verdi for næringslivet, offentlig sektor og samfunnet.
Data skal deles og brukes slik at grunnleggende rettigheter og friheter respekteres, og norske samfunnsverdier bevares.
Regjeringens prinsipper for datapolitikken skal underbygge effektiv deling og bruk av data innenfor trygge og ansvarlige rammer, og skal sikre at det skapes verdi med data som kommer næringslivet, offentlig sektor og samfunnet til gode. Prinsippene skal også legge grunnlaget for at de som deler og bruker hverandres data har tillit til hverandre, og at allmennheten har tillit til at deling og bruk av data skjer på en samfunnstjenlig måte.
Prinsippene er fundert på gjeldende rettslige krav og politiske føringer innenfor EU, OECD og i Norge, og skal praktiseres i samsvar med Norges internasjonale handelsavtaler. Prinsippene skal ikke være til hinder for at offentlige virksomheter skal kunne ta betalt for data, og sektorenes valg av finansieringsmodeller for deling og bruk av data til viderebruk skal respekteres.
1.3 Dataøkonomi og data som ressurs
Verdien av dataøkonomien
Det er et stort potensial for vekst i dataøkonomien i årene framover. Europakommisjonen antar i sin datastrategi (2020) at verdien av dataøkonomien i EU27 vil øke fra 301 milliarder euro i 2018 til 829 milliarder euro innen 2025. Menon har i sin rapport Er verdiskaping med data noe Norge kan leve av? sett på dataøkonomiens bidrag til verdiskaping i Norge. Det anslås at norsk dataøkonomi utgjør en årlig verdiskaping tilsvarende 150 milliarder kroner og en sysselsetting på hundre tusen arbeidsplasser i 2020. Dersom forholdene legges til rette, kan disse tallene dobles fram til 2030.3
Teknologi som kunstig intelligens og stordataanalyser legger grunnlaget for verdiøkende aktiviteter som får mer ut av dataene enn det som tidligere har vært mulig. Se boks 1.1 for en oversikt over viktige teknologiske drivere i dataøkonomien.
Den teknologiske utviklingen har drevet fram fundamentale endringer i produksjon, tjenesteyting og digital samhandling, og i dag genereres det store mengder data fra en rekke ulike kilder. Europakommisjonen anslår at industrielle og kommersielle data å har størst verdiskapingspotensial, både for næringslivet og samfunnet.4 Det skyldes hovedsakelig at de allerede store datavolumene fra industrielle og kommersielle anvendelser vil øke ytterligere framover. Økt deling og bedre utnyttelse av dataene vil bidra til økt verdiskaping. Industrielle data er data fra sensorer og kontrollsystemer i produksjonen, vedlikeholds- og arbeidsplanleggingssystemer og utstyrsinformasjon. Kommersielle data kan være kundedata, transaksjoner og lignende. I takt med utviklingen av flere digitale tjenester og plattformer som er rettet mot forbrukere, er det også flere kommersielle tjenestetilbydere som samler inn, bruker og deler forbrukerdata. Slike data kjøpes og selges i stort omfang, og brukes blant annet til målrettet markedsføring og forbedring av produkter og tjenester. Når det gjelder deling og bruk av data, går det et viktig å skille mellom data som inneholder personopplysninger, og data som ikke kan knyttes til enkeltpersoner. Personvernforordningen setter rammene for hvordan aktører skal behandle personopplysninger, se kapittel 7.
Boks 1.1 Teknologiske drivere i dataøkonomien
Skytjenester
Skytjenester er datalagring- og behandling utenfor egen virksomhet – vanligvis i store datasentre. Et kjennetegn ved skytjenester er at man betaler for den kapasiteten man bruker. Tjenestene leveres ofte av store internasjonale selskaper som også tilbyr tilleggstjenester som sikkerhet, statistikk og analyse, maskinlæring med mer. For mange virksomheter er bruk av skytjenester en forutsetning for å kunne utnytte potensialet i datavitenskap og kunstig intelligens, fordi de gjennom slike tjenester får tilgang til regnekraft og rammeverk for maskinlæring som de ikke har mulighet for å etablere lokalt.
Sensorteknologi og tingenes internett (IoT)
Tingenes internett (Internet of Things, IoT) er objekter («ting») som har sensorer, programvare og kommunikasjonsteknologi slik at de kan kommunisere med andre objekter som er koblet til internett. Etter hvert som utviklingen innenfor sensorteknologi har gitt bedre, mindre og billigere sensorer, og teknologier for trådløs kommunikasjon er blitt bedre, har dette nettverket av ting bare vokst. Ulike kilder anslår at det ved utgangen av 2020 var 20–30 milliarder objekter koblet til internett. Datavolumet fra slike objekter har derfor vokst enormt de senere årene.
Når disse objektene brukes i tjenester som er avhengige av å gjøre beregninger i sanntid, for eksempel autonome kjøretøy eller avanserte produksjonsprosesser, må databehandlingen ofte gjøres lokalt på objektet («edge computing») – altså på selve kjøretøyet eller i et sensornettverk i industrien. Slike nettverk vil ofte bruke 5G for rask og sikker kommunikasjon. Ettersom «edge computing» får større utbredelse, og datavolumene vokser, vil en vesentlig mindre andel av den totale datamengden bli behandlet i skytjenester og sentraliserte systemer, se figur 1.2.
Stordataanalyse
Stordataanalyse er analyse av store datavolumer satt sammen av mange ulike datakilder med både strukturerte, ustrukturerte og sanntids data. Hensikten er å finne nye sammenhenger og innsikter, for eksempel innenfor medisinsk diagnostisering, forbrukeradferd eller kriminalitetsbekjempelse, som ikke kan hentes ut gjennom tradisjonell dataanalyse.
Kunstig intelligens
Kunstig intelligens er en samlebetegnelse på informasjonsteknologi der maskinlæring, maskinresonnering og robotikk står sentralt. Kunstig intelligente systemer utfører handlinger, fysisk eller digitalt, basert på tolkning og behandling av strukturerte og ustrukturerte data. Systemer basert på kunstig intelligens kan også «lære» og tilpasse seg gjennom å analysere og ta hensyn til hvordan tidligere handlinger har påvirket omgivelsene. Eksempler på praktiske anvendelser av kunstig intelligens er mønstergjenkjenning, språkteknologi og autonome fremkomstmidler. For å utnytte det potensialet som ligger i kunstig intelligens, er det avgjørende med tilgang til data av god kvalitet.
Regnekraft (High Performance Computing, HPC)
På mange av områdene der det jobbes med svært store datamengder, er det behov for mer regnekraft til å behandle dataene enn det en enkelt virksomhet har mulighet til å etablere selv eller skaffe gjennom tradisjonelle skytjenester. For både industrien og offentlig sektor blir tungregning stadig viktigere, for eksempel til analyse av de store datamengdene som genereres fra gensekvensering, satellittobservasjoner eller klimamodeller. Norske aktører har tilgang til europeiske tungregneanlegg gjennom det europeiske samarbeidet EuroHPC.
Egenskaper ved data som ressurs
Boks 1.2 Sentrale begreper
Data er i utgangspunktet enhver fysisk representasjon av opplysninger, viten, meninger og lignende, og kan være både ustrukturerte og strukturerte. Data danner grunnlag for informasjon. Det er ikke alltid et tydelig skille mellom data og informasjon.
Strukturerte data er typisk det man finner organisert i en database, liste eller tabell. Ustrukturerte data er alt mulig annet, som bilder, lydfiler, filmer, e-post, dokumenter og annen informasjon som ikke er organisert. Det antas at 70–90 prosent av alle data er ustrukturerte.
Datasett er en samling av data i form av for eksempel en tabell, liste eller en database som kan gjøres tilgjengelige som en nedlastbar fil og/eller nås via et API (et programmeringsgrensesnitt).
Datakatalog er en strukturert samling av beskrivelser av datasett. En datakatalog gjør det mulig å finne opplysninger om datasett, hvem som forvalter dataene, og hvordan de eventuelt er gjort tilgjengelige for andre. Data.norge.no er et eksempel på en slik datakatalog.
Deling av data er tilfeller hvor en virksomhet gjør data tilgjengelige for bruk for en eller flere andre virksomheter, offentlige og/eller private, med eller uten vilkår for bruk (lisenser).
En dataprodusent genererer data gjennom sin virksomhet. En datatilbyder deler egne eller andres data med én eller flere andre. I mange tilfeller kan den samme virksomheten opptre både som dataprodusent og datatilbyder. En datakonsument (databruker) anvender egne og/eller andres data i prosesser, produkter, tjenester, analyser, eller til andre formål.
Åpne data er informasjon som er gjort tilgjengelig slik at den kan leses og tolkes av både maskiner og mennesker, og som alle kan få tilgang til, bruke og dele. Lukkede data er informasjon som kun autoriserte og autentiserte brukere har tilgang til. Dataene kan for eksempel være skjermet på grunn av forretningshensyn eller personvernhensyn.
Data er et såkalt ikke-rivaliserende gode. Det betyr at data kan brukes og gjenbrukes mange ganger, for eksempel i ulike algoritmer og programmer. Data blir slik ofte mer verdt dersom de deles.
Sammenkoblinger mellom datasett i ulike kombinasjoner kan gi større innsikt og grunnlag for større verdiskaping enn ett enkelt datasett alene. Derfor blir verdien av data som sammenstilles ofte større for samfunnet enn for den som kontrollerer enkelte datasett. Økt deling og bruk av data kan føre til ny kunnskap og alternative løsninger som kan gi større samfunnsnytte enn om dataene holdes lukket hos den enkelte dataeieren.
Bruk av data har skalafordeler. Sammenslåing av to komplementære datasett kan gi mer innsikt enn datasettene hver for seg, og bearbeiding av store datamengder kan være mer effektivt enn å behandle datasett enkeltvis. Likevel er ikke store datamengder eller deling av data i seg selv nok til å skape verdier. Det er først når data settes inn i en sammenheng, analyseres og bearbeides, at det kan skapes verdier.
Det er heller ikke slik at datasett enten er åpne og tilgjengelige for alle, eller lukkede. OECD opererer med ulike grader av åpenhet og tilgang, fra data som er begrenset til den enkelte virksomhet, via data som er tilgjengelige for enkelte interessenter eller brukergrupper, til data som er allment tilgjengelige. Data kan være tilgjengelige for ulike grupper, på ulike vilkår og til ulike tidspunkter.
For mange aktører handler verdiskaping med data om å ha oversikt over og å ta i bruk egne data til forbedring, fornying eller nyskaping i egen virksomhet. Menon estimerer at cirka 90 prosent av verdiskapingen med data i Norge i dag er knyttet til økt produktivitet i det eksisterende næringslivet og offentlig sektor, mens fem prosent er knyttet til nyskaping.5
I figur 1.3 gis det et forenklet bilde av hvordan ulike typer data kan samles inn fra forskjellige kilder som er koblet til internett. Dataene lagres, prosesseres og analyseres i digitale dataplattformer «i skyen». Slike plattformer kan tilbys fra det offentlige, fra private aktører, eller i et samarbeid.
Det kan trekkes ut ny innsikt fra analysene. Denne innsikten kan virksomhetene bruke til forbedring, fornying eller nyskaping. Bedre utnyttelse av data som ressurs kan for eksempel bidra til å håndtere noen av de store samfunnsutfordringene verden står overfor, og til å generere nye forretningsmuligheter og økonomisk vekst for den enkelte bedrift.
Fotnoter
OECD (2017): Digital Government Review of Norway. Boosting the Digital Transformation of the Public Sector og SSB (2020): Bruk av IKT i husholdningene www.ssb.no/ikthus
Europakommisjonen (2020): The Digital Economy and Society Index (DESI)
Menon Economics (2019) Er verdiskaping med data noe Norge kan leve av? Menon-publikasjon nr. 88/2019
Communication from the Commission to the European Parliament, the Council, the European Economic and Social Committee and the Committee of the Regions A European strategy for data COM/2020/66 final
Menon Economics (2019): Er verdiskaping med data noe Norge kan leve av? Menon-publikasjon nr. 88/2019