Gå til sidens indhold

Statistisk behandling

Kontaktinfo

Offentlige Finanser, Økonomisk Statistik
Ulla Ryder Jørgensen

urj@dst.dk

Hent som PDF

Indkomst- og forbrugsfordeling i husholdningssektoren (eksperimentel statistik)

Stort set al økonomisk statistik, der er til rådighed anvendes til nationalregnskabet. Når nye kilder er klar, indarbejdes de løbende i nationalregnskabet efter en fast rytme. Tre år efter en given periode, anses nationalregnskabet for at være endeligt Forbrugsundersøgelsen er en stikprøveundersøgelse, hvor antallet af husstande udgør 2.200 ud af Danmarks i alt ca. 2,8 millioner private husstande. Fra 2024 spørges 3.200. I undersøgelsen indgår oplysninger fra tre datakilder: Regnskab, CAPI-interviews og registre.

Kilder

Kildegrundlaget til nationalregnskabet består af mange forskellige statistikker om økonomisk aktivitet. Som de vigtigste kilder kan nævnes: -Forbrugsundersøgelsen -Regnskabsstatistik for private byerhverv -Arbejdstidsregnskabet -Huslejeundersøgelser -Indkomststatistikken -Regnskaber for offentlig forvaltning og service -Værdipapirstatistik -Regnskabsstatistik for finansielle selskaber

Forbrugsundersøgelsen er baseret på data indsamlet via en stikprøveundersøgelse, som er opdelt i en interviewdel og en regnskabsdel, kombineret med data fra administrative registre. Stikprøven udtrækkes simpelt tilfældigt fra ca. 2.000 adresser hvert kvartal, der tilsammen udgør ca. 82.000 årligt. Adresserne fordeles ligeligt på uger. I interviewdelen indhentes oplysninger om husstanden husholdningen 12 måneder tilbage i tid. Det er primært oplysninger om større faste udgifter fx husleje, forsikringer, hårde hvidevarer, tjenesteydelser samt sundhedsbesøg mv., som indhentes i interviewdelen. I regnskabsdelen indhentes oplysninger om husholdningensstandens daglige indkøb igennem 14 dage. De daglige indkøb omfatter fx dagligvarer, benzin, tøj samt restaurantbesøg mv. Data fra administrative registre omfatter oplysninger om indkomst, boligforhold, husholdningensstandens sammensætning, uddannelse og sygehusbenyttelse. IDer indgår oplysninger fra flg. registre i Forbrugsundersøgelsen for 2022 kommer oplysningerne fra følgende registre: -Indkomststatistikregistret -Bygnings- og Boligregistret, BBR -Befolkningsstatistikregistret -Uddannelses- og arbejdsklassifikationsregistret -Sygehusbenyttelsesstatistikken -Bilregister DMR

Indsamlingshyppighed

Forbrugsundersøgelsen gennemføres årligt. Husholdninger deltager løbende i undersøgelsen hen over året. Årlige nationalregnskabstal for husholdningssektoren offentliggøres to gange årligt

Indsamlingsmetode

Data til nationalregnskabet leveres via interne leverancer. En eksternt tjenesteyder varetager dataindsamlingen til Forbrugsundersøgelsen. Husholdninger som er tilfældig udvalgt, får tilsendt et brev om deltagelse i undersøgelsen via E-boks og kontaktes efterfølgende telefonisk med henblik på at få husholdningen til at deltage. Takker husholdningen ja til deltagelse, skal husholdningen føre et 14 dages regnskab over deres forbrug og efterfølgende få besøg af en interviewer der stiller spørgsmål vedr. husholdningens faste udgifter samt større udgiftsposter et år tilbage i tid. 14 dages regnskabet er digitalt og kan dog også blive udfyldt på papir. Interviewet fortages i CAPI (et computerbaseret personligt interview) af en interviewer. Data fra administrative registre hentes pr. 31. december i referenceåret, eller det nyeste tilgængelige år. Hvis data hentes fra et tidligere år end referenceåret, pris- og mængdeomregnes data til prisniveauet for referenceåret.

Datavalidering

Ud over den datavalidering der foretages i primærstatistikkerne, foretages der yderligere en række datavalideringsprocedurer efter modtagelse til nationalregnskabet. Der foretages bl.a. valideringsprocedurer der sikrer, at der kan foretages en korrekt økonomisk fortolkning af resultaterne. Interviewdata valideres både under og umiddelbart efter besøgsinterviewet. Valideringen under interviewet består dels af logiske og dels af sandsynlige kontroller, mens valideringen efter interviewet foretages manuelt. En logisk kontrol kan fx være , at husholdningen har bil, men ikke rapporterer udgifter til vægtafgift, bilforsikring mv. En sandsynlig kontrol kan fx være at meget høje eller lave beløb undersøges direkte i det program, som anvendes til interviewet og at husholdningen konfronteres med dette og skal forholde sig til, om det er korrekt. Når data kommer ind til Danmarks Statistik gennemgår de en validering, som fx går ud på at vurdere husholdningens forbrug i forhold til dens størrelse. Hvis der fx kun er én person og et meget højt vandforbrug, eller der fx er to voksne med børn, hvor der ikke er rapporteret, hvor mange måneder der er benyttet til daginstitution og skole vil husholdningen blive kontaktet for at afklare rigtigheden af oplysningerne. Nogle rettelser laves uden at kontakte husholdningen, hvor beskrivelsen af indkøbet og beløbet virker modstridende. Det kan fx være en liter mælk er registreret med et beløb på 1.000 kr. Dette vil blive rettet til 10,00 kr. 14-dages-regnskaberne valideres løbende, når de kommer ind, og samlet når indsamlingen af regnskaber for et år er afsluttet. I den samlede validering vil der fx tjekkes, om alle indkøb er kodet korrekt ift. klassifikationen, ECOICOP.

Databehandling

I denne statistik anvendes data fra sektorkonti og for husholdningernes forbrug opgjort i det samlede nationalregnskab.
Forbrugsundersøgelsen er baseret på en 2-årig stikprøve, dvs. Forbrugsundersøgelsen for fx 2022 er sat sammen af stikprøver trukket i 2021 og 2022. Når data for 2021 indgår som en del af Forbrugsundersøgelsen 2022, bliver de justeret for udviklingen i det generelle prisniveau. Til denne justering anvendes den samme justeringsfaktor, som anvendes til at beregne det private forbrug i faste priser i nationalregnskabet. Når alle regnskaber, interviews og adressekort for et år er indkommet samles alle disse oplysninger for hver enkel husstand. I forbrugsundersøgelsen 2022 indgår registre oplysninger for 2021 og 2022, da det er en toårig stikprøve som anvendes. Registeroplysningerne skal knyttes til de enkelte individer i husholdningen. For nogle personer vil der mangle oplysninger i registrene. I tilfælde af manglende oplysninger hentes de fra et tidligere år eller ved imputering. Når imputeringen af forbrugsundersøgelsen laves for alle husholdninger i Danmark, anvendes de samme registeroplysninger, som anvendes i forbrugsundersøgelsen, men for alle husholdninger. Herefter udfyldes de tomme huller via en imputering, hvor man anvender metoden ”The Missing Forest imputation”, udviklet af Stekhoven and Buehlmann (2012). Som baggrundsinformation til imputeringen anvendes følgende variable: - Demografi: -Antal personer i husstanden og subtotaler for antallet af voksne, børn, mænd og kvinder i husholdningen -Alder på "hovedpersonen i husholdningen" -Køn på "hovedpersonen i husholdningen" -Etnicitet (dansk, indvandrer eller efterkommer) af "hovedpersonen i husholdningen" -Geografisk region i Danmark (NUTS2) -Dato for indflytning i deres nuværende bolig -Socioøkonomisk: -Socio-økonomisk klassifikation -Uddannelsesniveau for "hovedpersonen i husholdningen" -Boligtype, dvs. enfamiliehus, lejlighed mv. -Boligens størrelse i kvadratmeter -Bilejerskab (hvis relevant) -Strømkilde : Benzin, diesel, elektrisk eller andet -Alder: Dato for første indregistrering af bilen -Kendte variable (fra inkomstregistret): -D11: Modtaget løn -D5: Betalt løbende indkomst- og formueskatter mv. -D62: Modtaget sociale ydelser, undtaget sociale overførsler I naturalier

Disse variable bliver brugt til at imputere de manglende værdier for de resterende indkomst og forbrugsvariable. Enkelte størrelser i nationalregnskabet har ikke nogen tilsvarende mikrodata, hvorfor der er fordelt med de bedst mulige mikrodata eller de mindst forstyrrende for det samlede resultat. Det gælder FISIM, hvor der er fordelt med renter og fx investeringsindkomst fra forsikringsformue, hvor der er fordelt med den disponible indkomst.

I dokumentet her er der et overblik over forskellen mellem mikro- og makrodata: (https://www.dst.dk/ext/national/HusIF--pdf)

For at gruppere husholdningerne, har vi brugt den ækvivalerede disponible indkomst, som gør det muligt at sammenligne familiers indkomst uafhængigt af familiernes størrelse og alderssammensætning. Læs mere om Ækvivaleret disponibel indkomst. Link til (https://www.dst.dk/Site/Dst/SingleFiles/GetArchiveFile.aspx?fi=8722154520&fo=0&ext=velfaerd)

Korrektion

Der laves ikke korrektioner af data udover hvad der allerede er beskrevet under datavalidering og databehandling.