Metoder
På den här sidan hittar du information om olika metoder för att hantera och skydda forskningsdata som innehåller personuppgifter.
Ingångar
Vanliga frågor
Hur bedömer jag om mina forskningsdata innehåller personuppgifter?
Att bedöma om forskningsdata innehåller personuppgifter innebär att bedöma om innehållet i data på något sätt går att koppla till en nu levande person. Denna koppling kan göras genom att data innehåller information som direkt pekar ut en person (direkta identifierare) eller genom att data innehåller uppgifter som i kombination med varandra eller i kombination med kompletterande information från andra datakällor pekar ut en person (indirekta identifierare).
Läs mer om personuppgifter och direkta och indirekta identifierare i juridikdelens avsnitt med frågor.
Hur bedömer jag om mina forskningsdata innehåller känsliga personuppgifter?
Forskningsdata innehåller känsliga personuppgifter om de innehåller uppgifter om etniskt ursprung, politiska åsikter, religiös eller filosofisk övertygelse, medlemskap i fackförening, uppgifter om en persons hälsa, sexualliv eller sexuella läggning, genetiska eller biometriska uppgifter som går att koppla till en nu levande, identifierad eller identifierbar fysisk person. Vissa personuppgifter, till exempel information om lagöverträdelser och domar, räknas som integritetskänsliga och behöver också särskilt skydd.
Läs mer om känsliga personuppgifter i forskningsdata.
Hur kan man koppla ihop olika datamängder med information på annan plats?
Det skulle kunna vara möjligt att koppla ihop forskningsdata (till exempel en oidentifierad persons uppgifter om ålder, bostadsort, utbildning, yrke eller inkomst) med information från andra källor (exempelvis befolkningsregister) och på så sätt peka ut en viss person. Notera att det inte spelar någon roll hur tillgängliga eller skyddade dessa källor är eller var de finns, utan så länge de teoretiskt gör det möjligt att identifiera en person kan forskningsdata inte betraktas som anonyma och utgör alltså personuppgifter.
Finns det olika grader av pseudonymisering och anonymisering?
Ja, graden av pseudonymisering eller anonymisering av en datamängd beror på vad forskningsdata ska användas till, vem som ska ha tillgång till data, hur data lagras och hur känslig information data innehåller. En viktig utgångspunkt är att graden av pseudonymisering eller anonymisering kan ändras över tid beroende på yttre omständigheter. Forskningsdata existerar inte i ett vakuum och faktorer som teknisk utveckling, förändringar av hur data lagras eller tillgång till kompletterande datakällor förändras ständigt. Det påverkar hur skyddade individer i forskningsdata anses vara. Med andra ord behöver du kontinuerligt utvärdera graden av skyddsåtgärder som behöver tillämpas för en datamängd.
Organisationen Future of Privacy Forum (FPF) har tagit fram en figur som illustrerar olika grader av integritetsskydd: A Visual Guide to Practical Data De-Identification (pdf).
Hur mycket bör jag pseudonymisera mina data?
Så mycket som det går utan att göra det omöjligt att utföra din forskning på ett vettigt sätt. Om till exempel forskningspersonens modersmål är en viktig variabel i ditt forskningsprojekt ska du behålla den, även om variabeln gör forskningspersoner identifierbara. I forskning där uttal eller ansiktsuttryck är viktiga kan det vara omöjligt att avidentifiera forskningspersoner genom röstförvrängning eller maskning av ansiktet, till exempel forskning i fonetik. I andra fall är det möjligt att pseudonymisera forskningsdata och ändå bedriva meningsfull forskning.
Räcker det anonymisera eller pseudonymisera mina data en enda gång?
Forskningsdata existerar inte i ett vakuum. Externa faktorer som tillgång till kompletterande datakällor, förändringar av hur data lagras eller teknisk utveckling förändras ständigt. Det påverkar huruvida forskningsdata är att betrakta som anonyma eller pseudonymiserade. Att anonymisera eller pseudonymisera forskningsdata ska därför ses som en iterativ process som påverkas av andra kontextuella faktorer. Med andra ord behöver du kontinuerligt utvärdera hur väl anonymiserade eller pseudonymiserade dina forskningsdata är.
Hur kan jag pseudonymisera/hantera fritextsvar i en enkät?
Du kan se till att den information som varje respondent anger i fritextsvaren inte innehåller personuppgifter eller annan information som i kombination med andra uppgifter i datasetet kan identifiera respondenten själv eller andra individer. En metod för att säkerställa detta är att helt ta bort fritextsvar eller att koda fritextsvaren i bredare kategorier i just den version av forskningsdata som du arbetar i eller ska dela med andra.
Vad finns det för metoder för att pseudonymisera kvantitativa data?
Det finns flera olika metoder för att pseudonymisera kvantitativa data. Du kan exempelvis koda om värden på variabler (exempelvis ålder, inkomst, yrke eller geografiska variabler som kan betraktas som indirekta identifierare) för att skapa bredare kategorier, redigera fritextsvar som innehåller direkta eller indirekta identifierare, lägga till ”statistiskt brus” eller slumpmässigt arrangera om värdena för en av variablerna för att minska risken för bakvägsidentifiering (så kallad permutering).
Läs mer om metoder för att pseudonymisera kvantitativa data.
Vad finns det för metoder för att pseudonymisera kvalitativa data?
Beroende på vilken typ av kvalitativa data det handlar om kan man använda sig av flera metoder för pseudonymisering. Man identifierar först direkta och indirekta identifierare i materialet; det kan till exempel handla om namn eller andra uppgifter som avslöjar levande individers identitet i transkriberade intervjuer, röster i ljudinspelningar, bilder på personer eller videoinspelningar. Man kan sedan ta bort eller benämna om forskningspersonerna (till exempel Intervjudeltagare 1, 2 osv.), redigera bilder/videor och förvränga röster. Detta görs antingen direkt i datafilerna eller i mer avancerade verktyg för hantering av texter, transkribering eller redigering av bilder och ljud- och videoinspelningar.
Läs mer om metoder för att pseudonymisera kvalitativa data.