Gå til sidens indhold

Registre og referencetyper

Danmarks Statistik har samlet en lang række historiske registerdata i vores grunddatabank, som brugere kan tilgå via platformen Danmarks Datavindue. Forskningsservice varetager grunddatabanken og står for adgang til platformen, support, mm. De fleste registre i databanken opdateres mindst én gang om året i forbindelse med udgivelse af de statistikker, der bygger på registrene (se Udgivelseskalenderen). 

Datasafarien og Register- og variabeloversigten (herunder) viser begge registrene i Danmarks Datavindue, og her kan du se variable for de enkelte registre. Dokumentationen af variable findes i Danmarks Statistiks dokumentationssystem.

Gå til Datasafari

Gå til Register- og variabeloversigten

 

 

Referencetyper

Registre i grunddataoversigten opgøres ved hjælp af forskellige referencetyper. Ud for hvert register i grunddataoversigten kan du se, hvilken referencetype et register har: ’Status’, ’Statusperiode’, ’Forløb’ eller ’Hændelse’.

Status

Denne referencetype viser status for en given dato. Fx LONN (lønstruktur), som viser hvad en borger tjener pr. registerdato (fx 31.12.2021). Eller BEF, som viser befolkningen pr. kvartalsdato (herunder status for bopæl, alder, familie m.fl.).

Datadefinition: Ren status pr. en given dato. Populationsafgrænsningen og alt dataindhold retter sig mod datoen.

Statusperiode

Denne referencetype viser periodestatus, hvor populationen er afgrænset pr. given dato, men variablerne indeholder summerede data for en bestemt periode. Fx IND, som indeholder lønindkomst for et år (perioden fremgår af ’Opdateringsfrekvens’ i grunddataoversigten). Andre eksempler på statusperiode-registre: PERSBEST (bestyrelsesmedlemmer og direktører), MFR (medicinsk fødselsregister), HANDICB (støtte til handicapbiler), DMRB (motorkøretøjer). Det er ikke altid let at se, hvad der summeres.

Datadefinition: Populationsafgrænsningen er lavet pr. given dato, men indholdet i variablene er akkumuleret over en given periode. Periode kan ikke udledes af datoer i mikrodata, men af den angivne periode (ses under ’Opdateringsfrekvens’) - dvs. at indhold i eksempelvis beløb, antal, mængder mv. er aggregeret over den angivne periode (fx kvartal, år).

Forløb

Her beskriver data et forløb. Der vil altid kun være én udgave af registeret tilgængelig. Fx UDDF, som indeholder Højeste fuldførte uddannelse. Eller BEFADR, som er et adressenøgleregister (hvor fx 1,4 mio. adresser ændrede nøgle d. 1.1.2007 ved kommunesammenlægningen). Når et forløbsregister opdateres, opdateres det enkelte datasæt. Derfor er der altid kun ét datasæt til et forløbsregister.

Datadefinition: Definitionen på forløbsdata er, at data indeholder start- og slutdato.

Hændelse

Her beskriver data en hændelse. Eksempelvis UDFK, som indeholder grundskolekarakterer (indeholder ikke en dato, men et skoleår), eller OPHGIN (opholdsgrundlag for indvandrede). Når et hændelsesregister opdateres, opdateres det enkelte datasæt med nye hændelser. Derfor er der altid kun ét datasæt.

Datadefinition: Definitionen på hændelser er først og fremmest, at data indeholder en dato - kun én dato - for hændelsens indtræden, og vil som regel også have tilknyttet én hændelsestype.

 

Dokumentation til brugen af registre

Danmarks Statistik har udarbejdet et notat, der beskriver sammenhængen mellem flere af de mest anvendte registre i Danmarks Statistiks Mikrodataordning og deres forbindelse til den offentliggjorte statistik.

Personstatistikregistrene i Danmarks Statistik består af omfattende datasamlinger, som er op- og udbygget siden begyndelsen af 1980’erne. Data er af høj kvalitet og omfatter hele befolkningen. Dette giver unikke analysemuligheder for brugerne af data, som både kan analysere status på et givent tidspunkt og udviklingen over tid.

Notatet henvender sig primært til forskere, analytikere og andre brugere af mikrodata, som ønsker at opnå et bedre indblik i kvaliteten af sammenhængen mellem de forskellige registre.

Dokumentation til brugen af registre (pdf)

 

Specielt om Det Erhvervsstatistiske Datavarehus

I januar 2024 lancerede Danmarks Statistik det nye Erhvervsstatistiske Datavarehus – en væsentlig udvidelse og forbedring af de eksisterende erhvervsregistre.

Det nye varehus sikrer en større og bedre adgang til anonymiserede data om virksomheder og giver mulighed for at trække unikke data ved at sammenkoble data på tværs af flere statistiske registre. Datavarehuset gør det også muligt at sammenkoble erhvervs- og socialstatistik på mikro-niveau, det såkaldte ’Linked Employer-Employee Data’ (LEED).

Læs mere i denne brochure (pdf) eller se oplægget ved præsentationen af Erhvervsstatistiske Datavarehus d. 30. november 2023 (pdf).