Gå til sidens indhold

Præcision og pålidelighed

Kontaktinfo

Offentlige Finanser, Økonomisk Statistik
Ulla Ryder Jørgensen

urj@dst.dk

Hent som PDF

Indkomst- og forbrugsfordeling i husholdningssektoren (eksperimentel statistik)

Nationalregnskabets evne til præcist at beskrive den økonomiske virkelighed afhænger dels af usikkerheden forbundet med kilderne og dels af de modelantagelser, der ligger til grund for udarbejdelsen. Nogle dele kan opgøres mere præcist end andre, da der er bedre tilgang til kildedata. De første bud på en periodes nationalregnskab vil være mere usikre end den endelige version, som kommer efter tre år, da der løbende revideres når nye kilder er tilgængelig. Deltagerprocenten for Forbrugsundersøgelsen i årene 2018-2022 har varieret med hhv. . Dette skaber usikkerhed, ikke mindst for detaljerede forbrugsgrupper. For det samlede forbrug betyder dette, at der er en usikkerhedsmargin på +/- 1,2 pct. mens den for fx brød er 2 pct. For Fødevarer og ikke alkoholiske drikkevarer er den 1,2 pct. , mens den for Alkoholiske drikkevarer og tobak er 4,8. Der er underrapportering på en række områder som fx alkohol, tobak, prostitution og sort arbejde. Usikkerheden er større, når data bygger på regnskabsføringen i stedet for interview, og den vil være større, hvis man ser på mindre undergrupper af husholdninger. I denne statistik har vi valgt et mere overordnet niveau for at sikre større sammenhæng mellem nationalregnskabet og forbrugsundersøgelsen, samt for at minimere usikkerheden.

Samlet præcision

Data til nationalregnskabet stammer fra så mange forskellige kilder, at det i praksis er vanskeligt at opgøre et tal for usikkerheden. Forskellen mellem fordringserhvervelsen, netto opgjort fra den finansielle side af nationalregnskabet og fordringserhvervelsen, netto opgjort fra den ikke-finansielle del af nationalregnskabet, kan dog ses som et udtryk for den samlede usikkerhed i såvel den finansielle som den ikke-finansielle del af nationalregnskabet. 2.301 husholdninger ud af 17.730 adspurgte husholdninger valgte at deltage i Forbrugsundersøgelsen i 2022. For det samlede forbrug for hele befolkningen er der en usikkerhedsmargin på +/- 1,2 pct., så det samlede forbrug, som er estimeret til 359.661 kr. med 95 procents sikkerhed forventes at ligge mellem 348.434 kr. og 370.888 kr. For enkeltgrupperinger i befolkningen og varegrupper, der handles sjældent er usikkerheden større. Forbruget er således mere præcist beregnet for fx husholdninger med højere indkomster eller hvor hovedindkomstmodtageren er af dansk herkomst, er i arbejde, er over 60 år eller har uddannelse ud over grundskolen, da der er relativt flere i disse grupperinger, der har deltaget i undersøgelsen.

Stikprøveusikkerhed

Dette er ikke relevant for nationalregnskabet. Den samlede stikprøve for Forbrugsundersøgelsen 2022 bestod af i alt 17.730 husholdninger udtrukket i hhv. 2021 (9551) og 2022 (8.179). I 2021 deltog 1.123 husholdninger, mens 1.178 husholdninger deltog i 2022, tilsammen 2.301 for FU2022. Deltagerprocenten for FU2022 blev således 13 pct. Stikprøveusikkerhed er beregnet for de enkelte forbrugsvaregrupper baseret på de husholdninger, som har valgt at deltage i undersøgelsen. I FU2022 er stikprøveusikkerhed baseret på svarene fra de 2.301 deltagende husholdninger. Stikprøveusikkerheden kvantificeres ved varianskoefficienten (den relative standardfejl). Varianskoefficienten for det samlede forbrug pr. husholdning i FU2022 blev 1,2 pct. Dette betyder, at 95 pct. konfidensintervallet for det samlede forbrug pr. husholdning er 359.661 kr. +/- 5728 kr. Der er stor variation på stikprøveusikkerheden mellem det samlede forbrug og de specifikke forbrugsvarer. Forbrugsvarer som købes ofte, har en lavere stikprøveusikkerhed, end forbrugsvarer som købes sjældent. Brød er fx en varegruppe som de fleste husholdninger ofte køber i løbet af den to ugers regnskabsføring, de har haft i forbindelse med deltagelse i undersøgelsen. Varianskoefficienten på brød for en gennemsnitshusholdning er 2 pct., mens den for fx konserveret mælk, er på 28 pct. Tilsvarende er varianskoefficienten 3,9 pct. i region hovedstaden, mens den er 7,4 pct. i region Sjælland for brød.

Anden usikkerhed

Med ca. 2.200 komplette årlige husholdninger og mere ca. 2,8 mio. husholdninger i alt, hvor to tredjedele af variablerne er imputerede, må der forventes en høj grad af usikkerhed. Resultatet af en imputering er derfor ikke egnet til at forudsige den enkelte husholdnings indkomst og forbrugsniveau, men kan anvendes til at give et rimeligt skøn over den samlede indkomst og det samlede forbrug i store grupper af husholdninger. Selve imputationen udføres ved hjælp af imputeringsmetoden ”The Missing Forest Imputation”, udviklet af Stekhoven and Buehlmann (2012). Det er en ikke-parametrisk implementering af den mere velkendte Random Forest-algoritme implementeret i R. Da det er ikke-parametrisk, er der ikke behov for manuel træning af modellen, i modsætning til de fleste andre overvågede maskinlæringsmetoder. MissForest-algoritmen er iterativ og forsøger at optimere præcisionen af forudsigelserne af variablerne med manglende værdier.

Kvalitetsstyring

Danmarks Statistik følger anbefalinger vedrørende organisering og styring af kvalitet, der er givet i Adfærdskodeks for europæiske statistikker (Code of Practice, CoP) og den tilhørende implementeringsmodel Quality Assurance Framework (QAF). Læs mere om disse på Adfærdskodeks for europæiske statistikker. Der er etableret en arbejdsgruppe for kvalitet og en central kvalitetssikringsfunktion, der løbende gennemfører tjek af produkter og processer.

Kvalitetssikring

Danmarks Statistik følger principperne i Adfærdskodeks for europæiske statistikker (Code of Practice, CoP) og bruger den tilhørende implementeringsmodel Quality Assurance Framework (QAF) ved implementeringen af disse principper. Dette indebærer løbende decentrale og centrale tjek af produkter og processer på baggrund af dokumentation, der følger internationale standarder. Den centrale kvalitetssikringsfunktion rapporterer til arbejdsgruppen for Kvalitet. Rapporteringen indeholder blandt andet forslag til forbedringer, som vurderes, besluttes og implementeres.

Kvalitetsvurdering

ESA 2010 forordningen tilsiger, at Eurostat skal bedømme kvaliteten af data indberettet ifølge ESA transmissionsprogrammet. Det gøres med udgangspunkt i landenes kvalitetsrapporter, der ikke offentliggøres selvstændigt af Eurostat. Rapporten udarbejdes årligt. Forbrugsundersøgelsen er en stikprøveundersøgelse, der er kombineret med en lang række registervariable. Undersøgelsen baserer sig på en simpelt tilfældigt trukket stikprøve. Undersøgelsens årlige stikprøve er ikke stor nok til alene at give et sikkert estimat af forbruget. Derfor indgår stikprøve data fra det foregående år i den samlede beregning for året. Undersøgelsen får dermed karakter af en slags "glidende gennemsnit".

Revisionspolitik

Danmarks Statistik foretager revisioner i offentliggjorte tal i overensstemmelse med Danmarks Statistiks revisionspolitik. De fælles procedurer og principper i revisionspolitikken er for nogle statistikker suppleret med en specifik revisionspraksis.

Praksis for revisioner

Der udarbejdes foreløbige årlige ikke-finansielle sektorkonti, som offentliggøres 2 gange årligt: ultimo marts og ultimo juni. Endelige årlige nationalregnskaber udgives en gang årligt ultimo juni 3 år efter referenceåret. Fra og med publiceringen af forbrugsundersøgelsen 2017 er der kun én årlig publicering, og der foretages derfor ikke revisioner fremover. Denne statistik vil følge revisioner i nationalregnskabet, men kun udgives en gang om året efter publiceringen af forbrugsundersøgelsen.