• No results found

Kartläggning av datahantering hos tio forskare vid LiU : ”Man lutar sig på pragmatik och tradition.”

N/A
N/A
Protected

Academic year: 2021

Share "Kartläggning av datahantering hos tio forskare vid LiU : ”Man lutar sig på pragmatik och tradition.”"

Copied!
26
0
0

Loading.... (view fulltext now)

Full text

(1)

LINKÖPINGS UNIVERSITET

DOKUMENT- OCH ARKIVENHETEN, JURISTENHETEN OCH UNIVERSITETSBIBLIOTEKET

Kartläggning av

datahantering hos tio

forskare vid LiU

”M

AN LUTAR SIG PÅ PRAGMATIK OCH TRADITION

.”

Kristina Nordström, Dokument- och arkivenheten

Johanna Nählinder, Universitetsbiblioteket

Linköpings universitet

Linköping

2020

(2)

Inledning

Under 2019 startade ett samarbete mellan Dokument- och arkivenheten,

Juristenheten och Universitetsbiblioteket kring hanteringen av forskningsdata.

Frågan har aktualiserats bland annat genom att kraven på efterlevnad av

offentlighets- och sekretesslagen och arkivlagen vad gäller forskningsdata har ökat.

Mängden frågor som rör forskningsdata ur olika aspekter har också ökat. Även

införandet av dataskyddsförordningen GDPR och diskussionen kring öppna data

har ökat kraven på hanteringen av forskningsdata och forskningshandlingar i stort.

Samtidig fick forskningsdirektören ett uppdrag i LiU:s verksamhetsplan

1

(2018)

från universitetsledningen att inventera universitetets forskningsdata.

Tidigt i processen stod det klart att även om frågorna om efterlevnad av

offentlighets- och arkivlagstiftningen å ena sidan och frågan om öppen

tillgänglighet av forskningsdata å andra sidan ofta betraktas som två olika

organisatoriska stuprör har de stor beröring. Inte minst för forskare som förväntas

ta hänsyn till båda i sitt arbete med forskningsdata.

Det övergripande syftet med kartläggningen är att ge en bild av vilken

forskningsdata som finns vid LiU och hur den hanteras i dagsläget. Det är viktigt att

påpeka att syftet med intervjustudien inte har varit att få en heltäckande bild av

vilken forskningsdata som finns och hur den i dagsläget hanteras av forskare.

Tillämpningen av offentlighets- och arkivlagstiftningen (inklusive frågan om hur

allmänna handlingar ska hanteras) har vi här diskuterat under benämningen

”bevara”. Frågor kopplade till tillgängliggörande av öppna data har vi här diskuterat

under benämningen ”tillgängliggöra”. För mer bakgrund, information och

diskussion av begreppen hänvisar vi till en uppföljande rapport som analyserar

intervjuerna.

1

Uppdraget var att ” Kartlägga institutionernas behov av, och förmåga att, kunna skapa

öppna forskningsdata.” Källa: ”Verksamhetsplan och budget för 2019 samt plan för

2020-2021”

https://insidan.liu.se/siffror/ar/1.745217/LiUVP18-2019-2021-20180628-webb.pdf

sidan 12.

(3)

Metod

För att skapa en bild av vilken forskningsdata som finns vid LiU och hur den

hanteras i dagsläget har tio intervjuer med forskare från olika discipliner utförts, se

Tabell 1. Intervjuerna har genomförts med disputerade forskare. Flertalet av dessa

är professorer och har alltså såväl lång erfarenhet av forskning som hantering av

forskningsdata. Som professorer är de också som regel ansvariga för en

forskningsmiljö och har stor erfarenhet av att leda forskningsprojekt. På detta sätt

ger de en god bild av hur forskningsdata de facto hanteras i forskningsmiljöer vid

LiU.

Eftersom karaktären på forskningsdata och forskningens villkor är starkt

beroende av forskningsområde har vi i urvalet sökt att finna forskare från olika

fakulteter och forskningsområden. På detta sätt hoppas vi även att undvika att

behandla forskning som om all forskning baseras på samma ontologiska och

metodologiska grundvalar. Det finns stora skillnader mellan hur forskning bedrivs

inom exempelvis medicin och humaniora. Därför är det viktigt att fånga upp röster

från flera olika vetenskapsområden.

Kontakter med forskare har tagits på olika sätt. Några forskare har tagit kontakt

med oss och bett om att bli intervjuade. Andra forskare har rekommenderats oss

och åter andra har vi kontaktat för att få en balans mellan forskningsområden. Vi

fortsatte intervjuerna fram till dess att vi började se en mättnad, det vill säga när vi

inte längre fick så mycket ny information av varje enskild intervju.

Intervjuerna har varit semistrukturerade för att ge utrymme för forskare att

uttrycka även sådant vi på förhand inte specifikt frågat efter. På detta sätt blev vi

exempelvis medvetna om betydelsen av förlagens initiativ för att driva på

utvecklingen av öppet tillgängliga data.

Intervjuerna har genomförts med dubbla intervjuare utifrån en intervjuguide (se

bilaga 1) och var semistrukturerade, dvs vi hade en lista med vägledande frågor.

Förutom Kristina Nordström och Johanna Nählinder har även Jenny Wäsström och

Maria Skoglund deltagit i intervjuer. Anteckningar har tagits och renskrivet av båda

närvarande intervjuare. Efter renskrivningen av anteckningarna har dessa bland

annat analyserats och kategoriserats med hjälp av programmet NVivo.

Eftersom minnesanteckningarna tydligt återger hur forskarna hanterar och

förhåller sig till forskningsdata har vi valt att citera ur de renskrivna

intervjuanteckningarna. Några citat återkommer två gånger eftersom vi använt dem

som exempel på flera företeelser. Vi har vidare valt att inte använda

(4)

Nr.

Befattning

Institution

1

Professor

IMH

2

Professor

IKE

3

Professor

TEMA

4

Lektor

IBL

5

Professor

ISY

6

Professor

IFM

7

Lektor

IEI

8

Professor

IEI

9

Professor

IFM

10

Lektor

MAI

Tabell 1. Personer som har intervjuats.

Intervjusvaren har strukturerats efter datahanteringskedjans faser, se Figur 1.

Figur 1. Faser i datahanteringen. Bygger på:

https://www.reading.ac.uk/internal/res/ResearchDataManagement/AboutRDM

/reas-RDMindetail.aspx

(5)

Kartläggning av LiU-forskares hantering av

forskningsdata

Planering av datahantering

Ingen av de forskare vi talat med har skrivit en datahanteringsplan. Några av dem

har hört begreppet.

Han har aldrig behövt skriva någon datahanteringsplan.

NN har hört talas om datahanteringsplaner. Hon har sökt VR-pengar men inte funderat närmare över om hon behöver skriva en datahanteringsplan.

Hon är inte alls bekant med begreppet datahanteringsplan.

Hon har hört talas om begreppet datahanteringsplan men känner inte så bra till vad det handlar om.

Datahantering under pågående forskningsprojekt

Under den här rubriken återges datahantering under pågående forskningsprojekt,

det vill säga aktiviteter förknippade med att samla in, processa, analysera och gallra

forskningsdata.

I intervjuerna behövde begreppet forskningsdata förklaras och exemplifieras för

att få betydelse.

Inledningsvis beskriver han sitt forskningsmaterial som papers som andra har skrivit, i vissa fall tjocka böcker. Sedan nämner han data, vilket vi tar fasta på.

Varje typ av forskningsdata förekommer i flera olika versioner. Detta kan liknas vid

kedjor av alltmer bearbetade former av forskningsdata. Det gör det otydligt vilken

typ av forskningsdata som avses.

NN har uppenbart funderat mycket på dessa frågor innan vårt besök. En fråga är hur man ser på data. Han tar exemplet att utvärdering sker i flera steg. Man kan tex utgå från en stor rådatafil (4GB). Rensa fram det väsentliga (som alltså krymper filen). Och sedan merga den med en annan rådatafil. Man genererar då ihop dem. På detta sätt bildas träd av utvärderade data. Vad ska då sparas?

NN arbetar med olika typer av forskningsdata beroende på projekt. Hon exemplifierar från två pågående projekt: I det första arbetar hon med intervjuer (som dokumenteras genom ljudinspelningar och minnesanteckningar) och brev. Breven kommer från arkivinstitutioner eller privatarkiv. Hon fotograferar breven och tar bort personnamn. I det andra jobbar hon med ett stort antal beslutshandlingar (fotografier av 1225 beslut som är ordnat i ett Excelark).

Bilder tar plats. Det är mycket individuellt hur mycket man väljer att spara. Det blir otympligt stora filer. Har man anledning till det kan man reducera filerna sedan (handy-prog). Så det kan bli en annan fil.

(6)

Flera av forskarna hade loggböcker eller labb-böcker, ofta som fysiska

anteckningsböcker som fylldes i samband med laborationer och experiment. Andra

typer av dokumentation som förekom var readme-filer.

I samband med laborationer görs anteckningar i labböcker som är antingen på papper eller digitala. Man får göra som man vill. Det finns många redundanta nivåer. Det finns inga särskilda regler för hur labbar ska dokumenteras. Man är ej underställd good laboratory practise, men man är inspirerad av sådant tänk. Man lutar sig på pragmatik och tradition.

Dokumentation är inte alltid, och kan inte alltid, vara tillräcklig för att göra

forskningsdata personoberoende.

Han tror att det är svårt att förstå datan utan hjälp från forskaren som tagit fram den. Det svåraste är att komma ihåg sambandet mellan provet och datan. Vilket prov var vilket, vad hade jag gjort med det?

Forskarna lagrar ofta forskningsdata i datorn och med det avses oftast OneDrive

eller Fillagret. Ibland används externa hårddiskar som backup eller för att det är

stora datamängder som inte får plats på fillagret. Man litar oftast på att

back-up-systemet fungerar.

NN lägger på sin hårddisk, det finns backup. På frågan hur det backas är hon först tyst. ”Totalt okunnig”. ”Förr var det fillagret…. OneDrive!” ”Jag backar allt, det kanske jag inte borde göra….”Hon är ganska säker på att det backas. Hon har fått intryck av att det funkar. Han använder sig av molnet (och öppnar från flera olika datorer – det ser han som ett tecken på att backupen fungerar)

Han tror att filerna ligger på ett fillager men är osäker på om det finns backup. ”Jag uppfattar att fillager speglas”. Alla videor läggs inte in där eftersom de tar för mycket plats: ”hur gör jag med en massa videofilmer där utrustningen inte fungerat”. Ibland använder han externa hårddiskar för lagring.

Datan lagras också som backup på lösa hårddiskar som låses in i låsbara hyllskåp, antingen på forskarens tjänsterum eller gemensamt i avdelningens labb. Det kan vara hårddiskar från datorer som ska skrotas som plockas ut.

Han är också misstänksam mot Microsoft och Onedrive. Att ha hårddiskar på rummet garanterar också en snabb tillgång till datan. Forskarna har inte råd att t.ex. vänta en månad på att IT-avdelningen ska plocka fram datan.

Många har också forskningsmaterial i pappersform eller media på sina rum eller i

säkerhetsskåp på institutionen.

Hanteringen av forskningsdata sker dels fysiskt (pärmar som ofta är inlästa i säk-skåp) dels virtuellt (på hårddisk, extern hårddisk, OneDrive, samarbetsyta Lisam).

Under pågående studie förvarar forskaren material i pappersform på sitt rum för att ha omedelbar tillgång till det.

(7)

Data systematiseras i mappstrukturer som forskarna skapar utifrån vad de upplever

fungerar bäst.

NN har själv mappar för varje publicerat projekt på sin dator där han sparar forskningsdata: ”just nu är det inte superstrukturerat”.

Vad gäller strukturen på data, nämner han att övermapp är forskningsprojekt, sedan undermappar för varje paper. Man ”borde ha” följande i mappen:

* programmet (”lilla snurran”)

* massa förklaringar på hur man gjort och hur man tänkt. Det kan vara svårt att förstå hur man har tänkt även om det bara gått något år.

* Rådata. Som man testar och extraherat. * Resultatfiler (som regel txt)

* Visualiseringar: Bilder (vektor) /kartor (matlab), gantth-scheman * Den färdiga artikeln.

Vi frågar om varför han strukturerar som han gör. Han har inte funderat så mycket, ”man lägger sig till med saker”. Till en början jobbar man med äldre kollegor som kanske inte hänger med på det senaste. Det tar tid att ställa om. Han nämner Git. Det märks att han vill lära sig, är sugen, men hinner inte riktigt.

Hon har en genomtänkt och konsekvent använd struktur för forskningsdata och hon kan återvända till forskningsdata som samlats in tidigare i karriären. (Exempel mappstrukturen projekt>material>tidningsklipp). […] Hon berättar att hon under sin doktorandperiod inte sparat i mappar men på en kollegas uppmaning börjat göra det.

När vi pratar struktur på förvaring i datorer/molnet säger han att det är mycket upp till studenten (sic!). Man har det i dropbox, i undermappar. Det är i studentens intresse, så det är viktigt att det är något som fungerar för dem. Han nämner att man ser till att datera och att man helst ska göra en sammanfattning (sammanställning på processdata). Det borde alltid finnas. Han själv har undermappar med experiment, mätningar, manuskript och sammanfattningar av resultat.

Vanligtvis finns inga fastställda rutiner vid institutionerna. Var och en sköter

lagring och strukturering själva. Ibland kommer handledare eller kolleger med råd.

NN har utvecklat en namngivningslogik, som han också är angelägen om att tradera till sina doktorander. ”Det har man lärt sig med tiden.” ”Det första jag lär doktorander” de flesta utvecklar sitt eget system. Hans tips till doktorander är att skriva allt i filnamnet. Hur vet man hur man ska hantera forskningsdata? Han känner inte till någon nedskriven kodex. Det har inte känts aktuellt. Han tycker hans fält är enkelt på det sättet. Han tänker att det kanske skulle vara bra om doktorander lär sig detta – tas det månne upp på forskningsetikkursen?

Det måste till nya metoder och hjälp för hur man ska förvara och var. ”Alla inser att det är bra att systematiskt spara data, men verktygen måste finnas där. Morötter är inte viktiga, men verktyg är det.”

Det skulle behövas… visst kan vi spara i OneDrive. Men vi behöver en struktur för det, som binder ihop. Det finns ju databaser som används för att spara. Det är alltid en tröskel innan man lägger över i databas. Det får inte vara för mycket data, eller för lite, utan det måste vara lagom. Som det är nu är en vettig mappstruktur och excelfiler mer funkis.

(8)

Det är också svårt att veta hur man ska gruppera forskningsdatat. Kring doktoranden, projektet, publikationen?

Hur vet man hur man hanterar forskningsdatan? Det är skitsvårt. Det finns ingen skola. Learning by doing. Hon har lärt sig av att jobba med andra.

Forskarna har ofta behov av att dela forskningsdata med andra som är

involverade i samma projekt. Det kan även handla om samarbeten med andra

lärosäten i Sverige eller utomlands och företag. Då används olika molntjänster.

Han använder sig av 3 olika molntjänster för detta, och är medveten om vilka som inte bör användas. Vid samarbeten måste man vara pragmatisk så att det går att samarbeta och lösa det på olika sätt.. De är 3-10 personer som jobbar tillsammans, ofta på 1-5 olika organisationer.

Men OneDrive var ett stort steg framåt. Och där kan man även dela filer. När man ska dela filer externt (han nämner ett projekt med Chalmers och några företag som exempel) använder man ett rum på Lisam.

Forskningsdata sovras fortlöpande. All forskningsdata sparas inte.

Man går på magkänslan för att avgöra vad som ska bevaras.

Det är alltså inte komplett data som sparas. Han ser det inte som ett problem. Det är forskningsledaren som sovrar. Det är gruppledaren som har ansvar. Det är viktigt att kunna motbevisa om någon anklagar för fusk. Man går på magkänsla. Man bevarar sådant som behövs för att bevisa att det ej är oredligt.

En del forskningsdata räknas inte riktigt. Det kan röra sig om forskningsdata som

används för att skapa och kalibrera ett försök eller en modell. Det kan vara

forskningsdata som är oanvändbar för att det uppstått mätfel. Det kan vara

forskningsdata som inte går att publicera på eftersom hypotesen förkastades eller

det inte fanns signifikanta värden.

”hur gör jag med en massa videofilmer där utrustningen inte fungerat”

Det vore konstigt att publicera all data. Man får lita på forskaren. NN får 10 förfrågningar i veckan om att granska forskningsstudier som ska publiceras, så det finns inte tid att granska rådatan. Det som granskas är ”supporting information” i form av figurer och grafer.

Forskningen bedrivs bara på data som kan publiceras. I vissa fall kan hemliga mätdata lämnas till LiU tillfälligt för att LiU ska kunna extrahera den data som kan användas i forskningen. T.ex. kan LiU-forskarna få en extern hårddisk från en annan part och sedan återlämna den. Det kan handla om företagshemligheter eller bilder av militära

skyddsområden.

Han har ett intressant resonemang om två typer av ”fel” som blöder in i varandra: Viss forskningsdata har mätfel. Det kastar man. Han tar exemplet depression: om man undersöker hur dygnsrytmen påverkar depressionen. Om man då får ett nollresultat, vad gör man då? Misslyckas man med modellen, eller misslyckas man med hypotesen?

(9)

Även misslyckade beräkningar sparas tills publikationen är färdig. Det handlar då oftast om tekniska fel som inte är intressanta i sig utan behövs för att spåra felkällor

Vid simuleringar med superdator genereras mycket stora datamängder. Då sparas

inte all data. Istället sparas en textfil med information om hur data kan återskapas

vid behov.

När forskarna gör beräkningar och simuleringar på superdator skapas outputfiler som kan vara mycket stora. Ibland kan många beräkningar göras under flera års tid och 200 000 material kan testas samtidigt. Om filerna tas för mycket plats tas de bort. Forskarna skapar en fil som anger taggar med parametrar, programversion m.m. och som ger information som göra att outputfilerna kan återskapas vid behov.

När är ett forskningsprojekt avslutat?

Forskarna betraktar sina projekt som oavslutade så länge det kan göras fler

publiceringar av resultat. I något fall anser man att materialet ska arkiveras när

insamlingen av data har slutförts. Många har projekt som är vilande men inte helt

avslutade.

Hon har inga forskningsmedel just nu, men vissa delar jobbar hon med. tex skriver hon [4] två artiklar baserat på sin avhandling tillsammans med XX. Alltså baserat på intervjuer genomförda 2002-2007.

Forskningsprojekt har ingen bestämd avgränsning i tid. Det finns inte heller någon förutbestämd insamlingsperiod med förutbestämda försök.

Hon ser projektet som oavslutat så länge det fortfarande finns artiklar att skriva utifrån materialet. Inget är således arkiverat.

Datainsamlingen är en tydligt definierad period med en klar början och slut. Ekonomisk slutfinansiering eller publicering har däremot inte några hårda tidsgränser. Finansieringen kan förlängas och nya publiceringar kan göras på samma material. Dessa fungerar alltså inte för att avgränsa projektet.

Datahantering efter avslutat forskningsprojekt ur ett

bevarande-perspektiv

Under den här rubriken återges datahantering efter avslutat forskningsprojekt, det

vill säga aktiviteter förknippade med att arkivera, bevara och gallra forskningsdata.

Forskningsdata lämnas inte till arkivet

Forskarna känner inte till att institutionerna har arkivsamordnare som bland annat

har till uppgift att samla in handlingar för arkivering. Ingen lämnar forskningsdata

till dem. Var och en tar hand om sitt eget material. Sällan finns behov av att lämna

forskningsdata till arkivet.

(10)

NN känner inte till att det finns en arkivsamordnare vid institutionen. Han skulle gärna se att det fanns ett ställe där forskningsgruppen kunde lagra sin data gemensamt: nu fastnar det på den enskilda individen.

Vi diskuterar lite vem hon skulle ha kunnat lämna det till. Kollegor? Arkivsamordnare? Möjligtvis hade hon pratat med XX (avdelningschef). Hon skulle aldrig ha kommit på tanken att ta upp frågan om forskningsdata när hon bytte institution. ”Borde jag ha tagit kontakt med registrator/arkivarie?”

Han har inte funderat alls på arkivering eller bevarandeaspekten. Men kommenterar att vad gäller de fysiska artefakterna kommer man att få betala hyra för att kunna bevara det. Hon säger att hennes uppfattning är att det nog inte är så mycket forskningsmaterial som arkiveras. Hon tar med doktorandkursdeltagare ner i arkivet under institutionen och det är ju inte mycket forskningsdata som finns där. När hon skrivit etikprövningar har hon skaffat sig kunskap om vad som behöver arkiveras.

Ett undantag är de forskare som har stora mängder pappersmaterial på sina rum

och därför är i behov av att lämna det för arkivering.

Ett skäl till att lämna forskningsmaterial på papper till arkivering kan vara att det blir för mycket att förvara på rummet eller avdelningen. Då lämnas materialet till arkivsamordnaren. NN upplever att arkiveringen av pappershandlingar fungerar bra. För elektroniska handlingar finns det däremot inga anvisningar att följa. När elektroniskt forskningsmaterial ska arkiveras sparas det på USB-stickor och läggs tillsammans med pappersmaterial i arkivskåp i källaren. Filerna från ett visst projekt läggs i en mappstruktur. Filerna sparas också på forskarens eller handledarens egen yta på fillagret.

I vissa fall lagras forskningsdata gemensamt vid avdelningen, inom

forskargruppen eller att handledaren tar hand om doktorandernas data. Flera av

forskarna efterlyser möjligheten att kunna lagra data gemensamt vid avdelningen

eller motsvarande.

Han skulle gärna se att det fanns ett ställe där forskningsgruppen kunde lagra sin data gemensamt: nu fastnar det på den enskilda individen.

Inget forskningsmaterial lämnas till arkivet utan all förvaring sköts av forskaren och forskargruppen.

Många upplever problem med att lämna ifrån sig forskningsdata till arkivet. De är

rädda för att svika sina informanter genom att låta någon annan ta hand om

materialet eller att konkurrenter ska stjäla deras idéer.

Jag frågar om varför hon tänker att hon äger forskningsdata. Hon hänvisar direkt till lärarundantaget, ”jag har ju gjort jobbet”. Hon har lovat respondenterna att hon ensam har tillgång.” Detta kommer du inte att lätt hitta på nätet.” Hon känner ”ett starkt personligt ansvar” och att hon ”gått i god”.

(11)

Vi för en diskussion om allmänna handlingar. Är han medveten om att hans forskningsdata kan komma att krävas ut? Det är inget han har ställt inför. Han har inte officiellt arkiverat data, tex. Han vet inte hur man gör. Han säger att detta är saker han inte fick veta om när han disputerade. Han tänker spontant att det måste finnas situationer när man inte vill arkivera. Han säger spontant att forskningsdata måste vara arbetsmaterial som man vill komma tillbaka till och göra bättre. Han känner till LiUDok och att t.ex.

ansökningshandlingar ska lämnas till registrator, men inte datahanteringsplan. Han tänker sig att det räknas som någon form av arbetsmaterial.

Det är otroligt märkligt att se forskningsdata som allmän handling. För det skulle innebära att man inom samhällsvetenskaperna aldrig skulle kunna försöka lova sekretess.

Etikprövningsmyndigheten är också otroligt konstiga här. Om vi inte kan säga att vi gör så gott vi kan för att informanterna ej ska kunna identifieras, kan vi ej lova det, ge det

förtroendet, skulle de inte prata med oss. Detta är arbetsmaterial! Möjligtvis kan alla få veta att den existerar, möjligen.

Den officiella hållningen är inte forskarvänlig. Man har inte förstått konsekvensen av vad man lagstiftat. [...] Det finns inte en tillstymmelse till chans att de som skrivit förstår vad det innebär. Man ser medicinsk prövning, och det är svårt att tillämpa på samhällsvetenskap. Exempelvis blir det svårt att läsa rättsfall, vi får del av saker (tex organisationsnummer och personliga uppgifter. Vi får reda på så mycket som vi inte frågar efter. Detta innebär att vi innan vi ens läser rättsfallet måste vi skicka in etikprövning! Det är inte så genomtänkt. Jag spekulerar, jag skulle kunna tro, att det är samma brist på konsekvensanalys. Hur fungerar etikprövning när materialet är en allmän handling? Vet man vad forskning är, och att det kan vara på tusen olika sätt, förstår man att våra etikregler befinner sig på andra plan. Orsaken till att hon inte vill att det ska vara allmän handling är flera. Det är oetiskt om andra forskare publicerar på det, men också för att man inte vill att allmänheten ska kunna få ut materialet.

Kanske ska forskningsdata sparas 10 år?

De flesta forskare tänker att forskningsdata ska sparas i 10 år för att kunna visa att

man inte har fuskat. 10 år är en gräns som återkommer i flera sammanhang när det

gäller lagring av forskningsdata.

Forskarna har en pragmatisk inställning till hanteringen av forskningsdata. Det är traditionen som styr hur man gör. NN har inte kollat upp reglerna men han har en känsla av att man kan behöva data i ca 10 år för att kunna visa att man inte har fuskat.

Hans uppfattning är att man måste spara forskningsmaterial i 10 år. Vi undrar varför. Han kommer fram till att ”när vi skriver avtal är tio år en magisk gräns”, vilket hänger samman med sekretess-lagstiftningen.

Publicering och lagringen på GITHUB eller GITLAB är ett sätt att förvara datan under de 10 år som krävs för att uppfylla den internationella datalagringspolicy som man utgår ifrån. Risken för att data som publiceras på GITHUB ska försvinna är enligt NN liten, eftersom det är många som använder tjänsten och är beroende av att den fungerar. Han jämför med Wikipedia som har en väldigt stor spridning världen över. För säkerhets skull lagras datan även lokalt på flera ställen. När data används lagra dem på tre olika ställen och när den inte längre används lagras den på två ställen.

Både digitalt material och pappersmaterial förvaras av forskaren i 10 år. Det finns en systematik för förvaringen som rekommenderas vid avdelningen men som inte efterlevs.

(12)

Institutionen tillhandahåller blanketter om arkivering och gallring som ska fyllas i och lämnas till kansliet.

Forskarna säger att forskningsansökningar och slutrapporter ska diarieföras. Detta

sker genom att t.ex. en administratör samlar in ansökningar som ska skrivas under

av prefekten och sedan ser till att de blir diarieförda eller att handlingarna lämnas

till en administratör. Forskaren ser sig inte som handläggare eller ärendeansvarig.

Forskaren vet inte heller vad som finns i de egna diarieärendena. Mycket diarieförs

inte.

Projektansökningar blir diarieförda eftersom det krävs att prefekten ska skriva under ansökan innan den skickas in. Prefektsekreteraren ser till att det blir gjort.

På XXX fanns det noll koll på registrering, men på YYY där hon arbetar nu, upplever hon att det finns mer rutiner och strukturer. Sedan dess vet hon att hon ska skicka

forskningsansökningar till registrator. Så det sista året har hon varit duktig.

Han redogör för vad som diarieförs, och nämner här bla slutrapporter. Man diarieför det som skickas till forskningsfinansiären.

Forskare har ytlig kunskap om lagstiftning

Forskarna arbetar utifrån tradition och praxis inom sitt område i högre

utsträckning än utifrån lagstiftning och andra regelverk. Kunskapen om

offentlighets- och sekretesslagstiftningen i forskningsmiljöerna är begränsad. Några

har kommit i kontakt med GDPR och etikprövning och lärt sig mer på det sättet.

Kunskapen om GDPR tycks vara mer utbredd än kunskapen om

offentlighetslagstiftningen. Vissa känner ett behov av att motivera varför de sparar

handlingar.

Hon har inte koll på vilken grund hennes data skulle vara sekretessbelagt.

NN uppfattar att kraven på etikprövning har ökat under åren. När hon var doktorand var det något man endast pratade om i relation till medicin. ”Så tänkte jag fram till GDPR.” NN har inte funderat så mycket på om forskningsdata kan behöva lämnas ut till andra. NN har någon gång behövt lämna ut en forskningsansökan till en annan forskare och maskerade då de delar som hon inte ville visa. Det hon inte vill visa är de preliminära resultat som hon menar är nödvändigt att ange för att få medel beviljade. Hon känner inte till på vilka grunder uppgifterna kan sekretessbeläggas utan utgår från sin egen

uppfattning om vad som ska vara hemligt. Hon är ibland tveksam till att lämna forskningsansökningar till diariet för att hon vill hålla dem hemliga.

Sammanfattningsvis har forskarna utvecklat egna rutiner för hur de hanterar

forskningsdata efter avslutat forskningsprojekt. Man känner inte till

arkivlagstiftningen och inte heller de arkivsamordnare som finns vid varje

institution för att samordna i arkivfrågor. Man upplever inte att LiU visar intresse

för deras forskningsdata och tar ett eget ansvar för sin forskningsdata, bland annat

för att kunna motbevisa forskningsfusk. Kunskapen om offentlighets- och

(13)

sekretesslagstiftningen är även den begränsad och man uppfattar inte

forskningsdata som allmänna handlingar. Man ser risker med utlämnande av

forskningsdata.

Datahantering efter avslutat forskningsprojekt ur ett

tillgängliggörande-perspektiv

Ibland kan forskaren själv återanvända sina forskningsdata

Återanvändningen av egna forskningsdata är i hög utsträckning beroende av den

enskilda forskaren och hur denne lagrat forskningsdata.

NN har inte kvar datan från sin doktorandtid (han började 1998) men tror att han kan få tag på den från sin handledare som också jobbar på LiU.

Skulle han kunna återanvända tio år gammalt forskningsdata? Han har avhandlingens forskningsdata på CD-skivor, och lagt över på hårddisk/OneDrive.

På frågan om hon kan återfinna 10 år gammalt forskningsmaterial svarar hon ”om inte liu ställer till det…”

Många av de forskare vi talat med har sparat forskningsdata. Bristfällig

dokumentation gör sparad data svår att återanvända. Ibland är använda loggböcker

bristfälliga. Det är svårt att koppla ihop de olika typerna och versionerna av

forskningsdata. Detta gör det svårt att återanvända forskningsdata.

Loggboken är central, men mycket knapphändig. För det mesta ger den bara tillräckligt med information för att veta vem man ska fråga.

Forskningsdata sparas i format som inte är framtidssäkrade. Ibland genereras

forskningsdata med hjälp av script eller annan egengenererad programmering.

Från platsen där vi sitter i hans arbetsrum kan han se sin loggbok, men konstaterar att det kanske inte hjälper. Vissa program är skrivna i programspråk som inte används idag. Det gäller specifikt rådatafiler som är genererade i omoderna styrsystem. Om man inte gjort om det till en txt-fil blir det meckigt.

Detta sparas ned i format som kanske inte är läsbart över tid. Detta är iofs inget stort problem, för det är viktigast de första åren för att kunna verifiera forskningen.

Vissa program är skrivna i programspråk som inte används idag. Det gäller specifikt rådatafiler som är genererade i omoderna styrsystem. Om man inte gjort om det till en txt-fil blir det meckigt. Från platsen där vi sitter i hans arbetsrum kan han se sin loggbok, men konstaterar att det kanske inte hjälper. Vissa program är skrivna i programspråk som inte används idag. Det gäller specifikt rådatafiler som är genererade i omoderna styrsystem. Om man inte gjort om det till en txt-fil blir det meckigt.

Detta sparas ned i format som kanske inte är läsbart över tid. Detta är iofs inget stort problem, för det är viktigast de första åren för att kunna verifiera forskningen.

Dokumentation är sådant som behövs för att kunna förstå och tolka forskningsdata

(14)

En professor förestår en forskargrupp som är vana vid att återanvända

forskningsdata. De beskriver en process där:

Med dataseten som publiceras finns en readme-fil med information om datan. Där finns information om vem som har skapat datasetet och hur den som använder det ska referera för att den som har skapat datasetet ska krediteras på rätt sätt. Det ska finnas en referens till orginaldatasetet om det återanvänds vid nya publikationer. Det anse också vilka program som krävs för att använda datan.

I vissa fall uppger forskaren att forskningsdata är ointressant efter publicering

därför att den då är uttömd.

I hans forskning kan man skilja mellan de huvudsakliga data och de repeterade mätningar som utförs. Dessa integreras sedan. Man skriver på i stort sett allt. … Det är helt ok för NN att andra får del av hans forskningsdata efter publiceringsdatum. Detta gäller vare sig om det publiceras som patent eller som artikel.

I andra fall upplever forskaren att forskningsdata inte är uttömda. Forskningsdata

blir då värdefull för forskaren för framtida publicering. En viktig resurs för att

kunna förverkliga potentialen hos denna forskningsdata är tid för att skriva.

Men det kan hända att hon om några år kan vilja publicera något på data som skapats i ett gammalt projekt.

Det stöd han skulle behöva för att återanalysera data från doktorandtiden är TID. Han har fortfarande den information han behöver. Han skulle behöva sitta ner och skriva. Göra om tester för att se att det stämmer, kanske vidareutveckla lite…

En forskare påpekar att det kommer att kräva resurser att anonymisera

forskningsdata för att kunna tillgängliggöra den:

En aspekt jag tycker försvinner är skillnaden mellan data som insamlats i anonym form, och data som har anonymiserats av forskaren. Ska data delas med andra måste kanske forskaren bearbeta den innan den kan tillgängliggöras - kan det krävas?

Sammanfattningsvis ger forskarna exempel på en rad förutsättningar som

behöver vara uppfyllda för att det ska vara möjligt att återanvända forskningsdata.

Att återfinna forskningsdata är en fundamental förutsättning, likaså att

forskningsdata är dokumenterad på ett sådant sätt att man känner sig trygg med att

återanvända det. Här kan vi konstatera att så oftast inte är fallet. Ett relaterat

problem är att forskningsdata ofta inte sparas i framtidssäkrade format. Det saknas

också en levande diskussion om vilka format som är framtidssäkra och värdet av

framtidssäkrade filformat.

Förstrött intresse av återanvändning av andras tillgängliga forskningsdata

Inom vissa forskningsfält finns det tradition av att använda sig av andras data för

den egna forskningen, antingen på grund av rollfördelning (tex åtskillnad

(15)

och önskvärt att använda andra forskargruppers data. Ibland är sådan data öppet

tillgänglig för alla.

Doktorander kan ibland vilja få tag på data från gamla studier. Det kan vara svårt att hitta om forskaren har slutat på LiU.

Det finns klassiska jämförelsedata som alla använder. De används för att kunna jämföra metoder.

Forskarna vid LiU deltar i stället i projekt där andra aktörer spelar in datan och garanterar att dataskyddsförordningen efterlevs eller återanvänder dataset som andra projekt delar med sig av.

Den forskning som NN och hans forskargrupp bedriver bygger på att all data som tas fram och publiceras öppet och kan återanvändas av andra. NN menar att det inte har någon betydelse hur datan har framställts. Av tradition brukar man beskriva bl.a. vilken utrustning som har använts. Men det är inte som med annan typ av forskning där man anser att kontexten har en avgörande betydelse.

Men det är ofta känsligt att återanvända historiskt material. Det kan finnas tillgängligt, ibland i dumpar, det är tidskrävande att städa data.

Vi undrar om det finns poänger med att komma åt gamla data. Nu hittar vi en annan dimension i förutsättningarna för ämnet: man skiljer mellan experimentella och teoretiska studier. Hos NN är det vanligast med experimentella studier. När man jobbar teoretiskt, med att ta fram modeller och prediktera, så arbetar man ibland med andras data. De som har tagit fram data ”på beställning” vet då detta från början. (”man generar data till en annan forskargrupp”). Det kan också leda till motsättningar mellan forskare (vems doktorand ska stå som huvudförfattare, vems doktorand ska få publicera först). Man vill ju gärna publicera först.

Andra forskare uttrycker tvekan till att återanvända andras data, främst utifrån

tankar om kvalité. Vissa forskare ser kopplingen till publikation som en

kvalitetsindikator, medan andra forskare nämner att man som kollegial granskare

inte granskar bakomliggande forskningsdata vilket gör publikationen svår som

kvalitetsindikator.

Det mesta skulle man vilja spara på lång tid. De bra artiklarna från sextio och sjuttiotalen – vad byggde de artiklarna på för data?

NN anser att det vore bra att spara det mesta under en längre tid. Det är bra att kunna kolla upp mätdata från gamla artiklar. Det vore intressant att gå tillbaka och se hur de gick tillväga i äldre studier. Men det måste vara data som det har publicerats resultat från. NN får 10 förfrågningar i veckan om att granska forskningsstudier som ska publiceras, så det finns inte tid att granska rådatan. Det som granskas är ”supporting information” i form av figurer och grafer.

Kopplingen till en publikation är alltså ett sätt att bedöma forskningsdatas

kvalité. Andra sätt är dokumentation av forskningsdata så att återanvändning är

möjlig. Vissa forskare uttrycker skepsis till om det överhuvudtaget är möjligt att

(16)

beskriva (dokumentera) de omständigheter under vilka forskningsdata tagits fram

tillräckligt väl för att de ska vara värdefulla för återanvändning.

Han tror att det är svårt att förstå datan utan hjälp från forskaren som tagit fram den. Vi frågar om han skulle vara intresserad av att använda någon annans forskningsdata. Han vet inte om det skulle vara relevant. Om man skulle kunna få ut något mer av mätdata. Generellt säger han sig vara skeptisk mot andras mätdata och att det är risk för att forskarna som har skapat det inte har varit tillräckligt noggranna. Han nämner en forskare i Kina. Data övertolkas (mätartefakter). Mätfel. Det finns så mycket dålig forskning! Han kallar det forskningsfantasier.

Vad hade behövts för att hon skulle återanvända någon annans intervjuer? Kontextuell förståelse, syfte, mål. Förstå organisationen. ”Men första frågan hade varit: vem har gett mig tillgång, varför har de gett mig tillgång, vilken förankring i organisationen. Är det tex en person i ansvarsställning.” Jag skulle pratat med dem som genomfört intervjuer. Tycker de att det är ok att nyttja intervjuerna? Det kräver att man förstår organisationen. Jag hade behövt göra intervjuer med den som intervjuade för att greppa kontexten. Samtidigt har vi ju XX. Men det är ju offentligt material (sic!) därför är det ok att använda.

Vad skulle krävas för att NN skulle kunna tänka sig att återanvända någon annans data? Han tänker länge. Han är skeptisk mot att återanvända andras data. Han hänvisar till att tester kan göras enligt vissa standards, som då blir ett kvalitetsmärke (ett viktigare kvalitetsmärke än vad publikationen är publicerad). Detta rör tex kalibrering av mätsignaler. Och att det framgår hur provet är gjort.

Sammanfattningsvis anser de forskare vi talat med att andras forskningsdata är

värdefulla under vissa omständigheter. Kvalité och dokumentation är två faktorer

de lyfter upp som viktiga. Andras forskningsdata ses oftast inte som åtråvärda.

En del forskare än intresserade av att tillgängliggöra forskningsdata

Det är inget problem att visa datan för andra men det efterfrågas inte.

Många forskare har inte tänkt på att tillgängliggöra de egna forskningsdata. Det

finns ett underförstått antagande att forskningsdata tas fram för att ligga som grund

för publicering och därför är forskningsdata som sådant ointressant för

utomstående.

NN har inte funderat så mycket på om forskningsdata kan behöva lämnas ut till andra. Han tänker sig att det räknas som någon form av arbetsmaterial. Hans ser det inte som något problem.

Han säger spontant att forskningsdata måste vara arbetsmaterial som man vill komma tillbaka till och göra bättre.

Man vill inte att forskningsdata ska vara tillgängligt för alla förrän tidigast efter

publicering av de vetenskapliga artiklarna man tänkt skriva baserat på

(17)

Det är helt ok för NN att andra får del av hans forskningsdata efter publiceringsdatum. Detta gäller vare sig om det publiceras som patent eller som artikel.

Han studsar vid tanken på att någon annan ska begära ut hans forskningsdata: (”man kan ju inte begära ut konkurrerande!”)

Det viktiga är att publicera på data innan man släpper det.

NN vill ofta hålla forskningshypoteser och forskningshandlingar hemliga innan resultaten är publicerade. Det händer att vissa personer stjäl idéer.

Hon anser att det är okej att andra använder hennes data så fort resultaten är publicerade.

En forskare upplever att tanken på att tillgängliggöra data även har ekonomiska

dimensioner. Forskningsfinansiärer har bekostat framtagningen av forskningsdata.

Det är också en ekonomisk fråga. Att telefonintervjua 1000 företag kostar 250.000 kronor. Om du har externfinansiering borde väl finansiären ha åsikter om det. Har inte Wallenberg åsikter om forskningsdata inhämtats och någon annan nyttjar det. Jättemärkligt!

En annan orsak till att man inte vill lämna ifrån sig forskningsdata kan vara att man

inte vill äventyra möjligheter att få forskningsanslag:

Det hon inte vill visa är de preliminära resultat som hon menar är nödvändigt att ange för att få medel beviljade.

Forskningsdata är inom många områden tydligt kopplad till forskaren snarare än

till universitetet.

Hur hade hon agerat med sitt forskningsmaterial om hon istället, säg, hade flyttat till VTI? ”Jag äger väl det själv fortfarande. Det är så jag känner och tänker. Det är ju människor som har valt att prata med mig. Jag ser det som mitt material. Vem skulle annars haft det?”

Hur skulle han göra om han flyttade till Chalmers? Han skulle vilja ta med sig

wordfiler/motsvarande, dataprogram och hårddata. ”Det jag har jobbat på, det tror jag inte någon vill ta ifrån mig.”

Han anser oreflekterat att forskningsdata tillhör forskaren. Ingen skulle ha något emot att en forskare tog med sig forskningsdata till ett annat lärosäte när man bytte tjänst. Hon har under sin karriär bytt arbetsgivare några gånger och då flyttat med sig sitt forskningsmaterial.

Jag frågar om varför hon tänker att hon äger forskningsdata. Hon hänvisar direkt till lärarundantaget, ”jag har ju gjort jobbet”. […] Hon drar spontant parallell till de böcker hon har på arbetsplatsen (som hon tagit med från tidigare arbetsplats).

Forskningsledare kontrollerar också doktorandens forskningsdata inom vissa

forskningsområden.

(18)

Han nämner mot slutet av intervjun att han tagit upp frågan på en ATP, och sökt göra medarbetarna (doktoranderna) medvetna om att datan inte kan ses som helt egna data. (ägarskap)

När en doktorand slutar ser NN till att få tillgång till datan. Man måste lämna ifrån sig det projektspecifika datan.

Forskaren skyddar sina respondenter och tillvaratar det förtroende man har fått

genom insamlandet av forskningsdata, vare sig det är från enskilda personer,

organisationer eller företag.

Hon har lovat respondenterna att hon ensam har tillgång.” Detta kommer du inte att lätt hitta på nätet.” Hon känner ”ett starkt personligt ansvar” och att hon ”gått i god”. Företag har rätt att godkänna publicering (i praktiken fördröja publicering) och rätt att köpa IPRs. En gång har de varit med om att ett företag sagt att den här datan får ni inte lov att publicera.

Han har lärt sig att föra diskussionen med företagen. ”Det material jag får nu, är det känsligt eller inte”. Vi resonerar lite kring vad som skulle hända om han nu publicerade på XX-datat som de inte ville att han skulle publicera på. Han resonerar lite om det fortfarande skulle gå att anse som känsligt, och han förstår inte heller vad som är så känsligt med det. Samtidigt, om de vill ha hjälp med ett praktiskt problem så behövs riktiga data. ”Om jag missbrukar förtroende får jag inte data.” För att få tillgång till data behövs bra kontakter. På precis rätt nivå.

Prover är känsliga. Eftersom man oftast har industripart är det inte snyggt om det försvinner för att senare dyka upp på ett annat universitet. NN upplever inte att det blir problem med att publicera, det känsliga är att ge uppgifter om den exakta kemiska sammansättningen på namngivna kommersiella material. Det är också därför man inte vill släppa materialet.

NN upplever inte att det blir problem med att publicera, det känsliga är att ge uppgifter om den exakta kemiska sammansättningen på namngivna kommersiella material. Det är också därför man inte vill släppa materialet.

Detta bottnar bland annat i att man vill vara rädd om de som ger en tillgång till

forskningsdata:

”Om jag missbrukar förtroende får jag inte data.” För att få tillgång till data behövs bra kontakter. På precis rätt nivå.

”min skyldighet är att lämna ut för granskning, men det är inte så att jag skulle gå och erbjuda andra att ta del”

Forskare är bekymrade för att utvecklingen kommer att omöjliggöra vissa typer av

forskning.

Hon är bekymrad över utvecklingen mot öppna data, och ser arkiv som ett betydligt bättre sätt att bevara/tillgängliggöra än datarepositorier. ”Jag hoppas verkligen inte på öppna data.” Hon har kollegor i Storbritannien (där man kommit längre i de här frågorna) som vittnat om att det finns forskning som inte kommer att kunna göras. Hennes farhågor berör främst att personuppgifter/uppgifter som är dåliga för de intervjuade ska läcka ut. Hon

(19)

utgår från att sådant som är arkiverat på LiU hanteras så att inte vad som helst kommer ut.

Hon vill hellre se materialet i arkivet, också för att arkivet blir ett filter i och med att handlingarna måste sekretessprövas innan de lämnas ut.

Inte ens på ledande frågor om hur hon skulle känna sig om någon krävde ut hennes intervjuer beskriver hon det som en förlust.

Om vi inte kan säga att vi gör så gott vi kan för att informanterna ej ska kunna identifieras, kan vi ej lova det, ge det förtroendet, skulle de inte prata med oss.

Sammanfattningsvis har vi i intervjuerna sett att forskarna i varierande grad

beskriver en äganderätt till sina forskningsdata (”mina data, jag bestämmer”) och

att de ofta inte är beredda att tillgängliggöra forskningsdata. Känslan av äganderätt

över forskningsdata bottnar i flera aspekter:

• hänsyn till intervjupersoner och industriparter

• praxis

• en upplevelse av att forskningsdata saknar värde för andra

• en upplevelse av att forskningsdata inte är förbrukad.

Vidare ses ofta en potential i fortsatt publicering av insamlad forskningsdata, men

detta är beroende av forskningsområde.

Forskarna bestämmer över forskningsdata: vare sig det handlar om att publicera

dem (tillsammans med artikel) publicera på dem (vilket ju är utgångspunkten) men

också att de har ett ansvar att hantera dem korrekt.

Forskningsdata görs öppna redan idag

Flera av de intervjuade forskarna har kommit i kontakt med öppna data via

förfrågan från tidskrift. Forskarna har valt att förhålla sig till erbjudandet på olika

sätt.

Det har hänt att forskarna på avdelningen har publicerat dataset på något repositorium, t.ex. inom CERN.

NN har någon gång fått frågan om han vill publicera rådata i form av tabeller. Han tror att han då skickade med det till publikationen. […] Det är ok att dela med sig av något

bearbetad data. Det känns som det har varit schyssta initiativ.

Tidskrifter vill eller ibland kräver att data ska publiceras. Det brukar dock inte handla om all rådata. När en beräkning har gjorts skapas först en excelfil med rådata. Sedan görs en kurva av det som minskas med färre mätpunkter. Det är den kurvan som publiceras.

Vissa forskare har förhållit sig avvaktande och istället valt att ge kontaktuppgifter

för att forskningen ska kunna verifieras utan att göra forskningsdata tillgängliga.

I dagsläget har man valt att inte dela med sig öppet av forskningsdata till tidskriften. Tidskriften efterfråga supplementary data. Istället uppmanas man att kontakta corresponding author.

(20)

I vissa forskningsmiljöer har tidskrifternas fråga skapat diskussion om

forskningsdata och tillgängliggörande av forskningsdata.

Tidskriftens fråga ledde till funderingar om vi kan låta andra forskargrupper ta del av datan.

Tillgängliggörande av forskningsdata ses ibland som en möjlighet att öka chanserna

att få artikeln accepterad för publicering samt som ett sätt att göra sin forskning

känd och citerad.

Det finns klassiska jämförelsedata som alla använder. De används för att kunna jämföra metoder. Han har nyligen tagit med ett supplementary data-material till en artikel som han hoppas att folk ska börjar testköra mot. Då får man citeringar. De valde att lägga upp data på Elsevier som ett sätt att lättare få artikeln accepterad. De vet inte om det var det som gjorde att de fick accept. Artikeln är inte så teoretiskt tung. De skrev från början att de planerade att göra data offentliga.

Sammanfattningsvis kommer tillgängliggörande in som ett krav – eller möjlighet

- från tidskriftsvärlden.

Forskare vill ha stöd

I samband med intervjuerna, ofta som en av de sista frågorna, har vi frågat

forskarna om vilken typ av stöd de efterfrågar från LiU.

Forskare vill ha stöd i lagringen av forskningsdata under pågående projekt.

hjälp med datalagring

Hur fungerar vårt backup-system?

lokalt lager för gemensam lagring av forskningsdata

Ett system ska gärna ha både ett enkelt och ett mer avancerat gränssnitt. hanterar extremt stora filer. Det skulle behövas ett bättre sätt att paketera datan.

Man efterlyser också bättre information om lagstiftningen och vad den säger. Detta

skulle till exempel kunna genomföras inom ramen för kurser i forskarhandledning

och ledarskap.

GDPR,

Var står vi rent juridiskt i frågan? Jag som intervjuare upplever att intervjupersonen är ängslig för att göra fel.

Hur går sekretessprövning/menprövning av forskningsmaterial till vid LiU?

Forskarhandledningskurser och ledarskapskurser ska innehålla utbildning om hantering av forskningsdata. Hon tycker också att det ska finnas en webbplats om hantering av

forskningsdata med lättillgänglig information och gallring, arkivering, datasäkerhet och vad det innebär att vara ansvarig för ett forskningsprojekt i detta avseende.

(21)

En forskare efterlyste konkret hjälp att tillgängliggöra forskningsdata

modifierar man ofta bilder inför publicering för att kunna lyfta upp det betydelsebärande i en bild. För att kunna renskriva sig från misstankar om forskningsfusk vore det värdefullt att kunna hänvisa till originalbilden som ligger någon annanstans, tex på ett repositorium.

Avslutningsvis pekade en forskare på en resurs som är viktig för att man ska kunna

nyttja insamlade data: tid för forskning.

Han är irriterad över att han inte får någon grundtjänst i botten för att kunna forska. För att börja med en ny sorts data är det en inlärningsperiod. Det tar mycket tid att förstå det, innan man kan börja med matematiken. Han tror att LiU måste tänka om på den här punkten.

(22)

Några reflektioner från intervjuerna

I intervjuerna har vi kunnat konstatera att:

Forskarna ger olika svar. Det är stora individuella och disciplinberoende

skillnader.

Kunskapen om datahanteringsplaner är begränsad.

Forskarna har kunskap om de etiska aspekter som berörs, men mindre

kunskap om offentlighets- och sekretesslagstiftningen och

arkivlagstiftningen.

Forskarna tar ansvar för att avgöra på vilket sätt forskningsdata ska

hanteras, vem som ska få tillgång till den och när.

Organisering och strukturering av forskningsdata sker enligt

egenutvecklade personberoende principer.

Forskningsdata bevaras ofta av forskaren, men kan inte alltid återanvändas.

Det är oklart om projekt avslutas och vad som kan anses vara ett naturligt

projektavslut.

(23)

Slutsats

De flesta av forskarna är tveksamma till att dela med sig av forskningsdata, även om

det finns undantag Det ingår ofta inte i praxis i de forskningsmiljöer som forskarna

vi intervjuat är del i.

Forskare hanterar forskningsdata på olika sätt. Det finns ett behov av att skapa

strukturella förutsättningar för LiU-forskare att kunna ”göra rätt” i betydelsen följa

gällande lagstiftning. Inte minst gäller detta struktur för lagring, arkivering och

datahanteringsplaner. Se vidare bilaga 2.

(24)

Bilaga 1: Intervjuguide som används vid intervjuerna

Vad är forskningsmaterial/data för dig? (Ur detta vill vi få fram, med hjälp av

följdfrågor, vilka typer av forskningsdata som finns, hur är det med sekretess, när

upprättas handlingar)

Hur hanterar du forskningsdata idag?

Hur strukturerar du forskningsdata? Mappar? Filversioner? (Ur detta vill vi också få

fram hur man strukturerar information och data så att man kommer ihåg och så att

det går att dokumentera. Känner man till begreppet datahanteringsplan?)

Hur sparar du forskningsdata under pågående projekt?

Vilket stöd upplever du att du behöver idag?

Vilka uppgifter behövs för att förstå forskningsdata? (Ur detta vill vi förstå hur

dokumentationen sker idag och vilken dokumentation som behövs för att begripliggöra

forskningsdata för återanvändning.)

Var tar forskningsdata vägen efter publikation/projektavslut? (När och om öppnar du

upp din data för kollegor – före eller efter publikation?)

Hur vet man hur man ska hantera forskningsdata?

Vad tycker du behöver bevaras? Varför?

(25)

Bilaga 2. Förutsättningar för bevarande och

tillgängliggörande av forskningsdata

Bevarande och tillgängliggörande är två olika processer som har olika syften. Men

under pågående forskningsprocess behöver ungefär samma faktorer finnas på plats

för att forskningsdata senare ska kunna bevaras och eventuellt tillgängliggöras. Idag

saknas egentliga processer för bevarande och tillgängliggörande. Istället finns en

personberoende process för behållande. I tabellen nedan beskrivs de tre

processerna överskådligt.

Tabell. Tre processer för hantering av forskningsdata efter avslutat projekt

7A: Behållande

7B: Bevarande

7C: Tillgängliggörande

För eget bruk

För arkivering

För tillgängliggörande

Syfte

För att kunna

göra fler

publikationer

För att uppfylla

lagkrav om bl a

offentlighet och

bevarande av

kulturarv

För att andra ska kunna

återanvända

Begränsningar GDPR

samtycken

etikansökningar

2

(GDPR)

GDPR

sekretessgrunder

Mm?

Hantering

efter

projektslut

idag

På samma sätt

som

korttidslagringen

Svårt idag

3

DiVA

Zenedo

Tidskrifter

2

Kan tex ange att data måste förstöras efter projektslut.

3

Det finns möjlighet att lagra forskningsdata som fysiska handlingar i arkivet idag.

Elektroniska handlingar kan bevaras genom att lagras elektroniskt på olika sätt

(fillagret, filvalvet, LiUDok mm): Det saknas gemensamma riktlinjer för hur detta ska

göras.

(26)

Kommentar

Personberoende

Framtidssäkrade

filformat.

Metadata och

dokumentation

för att förstå

forskningsdata.

Behövs för att

kunna verifiera

publicerad

forskning och för

framtida

forskning och

allmänintresse.

Forskningsdata med

metadata och

dokumentation som är

intressant för andra

forskare att bygga vidare

på.

Bevarande och tillgängliggörande av forskningsdata förutsätter ett omfattande

arbete i hela kedjan kring forskningsdata – från rutinmässig lagring av

forskningsdata under pågående forskningsprocess, kännedom om relevant

lagstiftning, hjälp och stöd kring tolkning av lagstiftning till infrastruktur för

långsiktig arkivering av forskningsdata och inte minst attityder och rutiner kring

forskningsdata. Se figuren.

Figur. Beskrivning av vissa centrala förutsättningar för att möjliggöra

behållande, bevarande och tillgängliggörande

References

Related documents

Syftet med den här undersökningen har varit att undersöka hur sexåringar uttrycker tankar och föreställningar om skolstart och skola samt var de säger att de har lärt sig detta. Min

Vi ämnar även analysera och utvärdera tänkbara förändringar i pris och utbud till följd av att subventionen till den lokala och regionala kollektivtrafiken tas

Lilla pinnen Lilla snigel Masken kryper i vårt land Masken Pellejöns.. Sida av

c) Antibiotikaprofylax för att minska risk för infektion + trombosprofylax. Lång op + ev långsam postoperativ mobilisering.
.. d) Stomiterapeut som informerar om och märker

Låt oss därför för stunden bortse från bostadspriser och andra ekonomiska variabler som inkomster, räntor och andra kostnader för att bo och en- bart se till

Uppsiktsansvaret innebär att Boverket ska skaffa sig överblick över hur kommunerna och länsstyrelserna arbetar med och tar sitt ansvar för planering, tillståndsgivning och tillsyn

När nya lösningar krävs inför ett nytt DLL-projekt så utvecklas de inom ramen för detta projekt, men tas sedan över av konceptägaren så att lösningarna lever vidare för

Migrationsverket har beretts möjlighet att yttra sig gällande utredningen Kompletterande åtgärder till EU:s förordning om inrättande av Europeiska arbetsmyndigheten