Datenverifizierung

Hier laufen automatische Prüfungen gegen Eurostat-Beschäftigung, die Verdienststrukturerhebung (VSE) der Statistik Austria sowie die neue occupation-first Logik rund um ISCO-Familien, Gehälter, KI-Exposition und ÖNACE-Kontext. So sehen Sie schnell, ob die Kernaussagen des Datensatzes stabil bleiben.

Die Prüfungen sind nach Datenintegrität, occupation-first Struktur, Gehaltslogik, KI-Scoring und Sektor-Kontext gegliedert. Nach jeder Regeneration des Datensatzes erneut ausführen.

Zuletzt ausgeführt:

31/34 bestanden
Datenintegrität
7/7
bestanden

Abdeckung, Quellen, Slugs und erforderliche Basisfelder.

Occupation-first Struktur
4/4
bestanden

Prüfungen für ISCO-Codes, Hauptfamilien und Familienlabels, die Navigation und Struktur tragen.

Gehaltsverteilung
6/7
bestanden

Plausibilitätschecks für Median, Streuung, Lohnsumme und Bildungsleiter.

KI-Scoring
8/8
bestanden

Grenzen, Spannweite, Begründungen und Richtungslogik für Exposition und Ausblick.

Sektor-Kontext
6/8
bestanden

ÖNACE-Checks bleiben als wirtschaftlicher Kontext für das occupation-first Modell erhalten.

Datenintegrität

Abdeckung, Quellen, Slugs und erforderliche Basisfelder.

7/7 bestanden
Gesamtbeschäftigung entspricht LFS-Summe (modellierte ISCO-Codes)
Wir summieren die Beschäftigten über alle Berufszeilen und vergleichen mit der Summe der Eurostat-LFS-Beschäftigung je genutzter ISCO-08-Gruppe (3,991,100). Nach Rundung soll das Verhältnis bei 98–102 % liegen.
Erwartet: 98–102% of 3,991,100Aktuell: 3,991,099 (100.0%)
Jeder Beruf hat positive Beschäftigung
Fehlende oder null Beschäftigte würden auf eine defekte LFS×NACE-Aufteilung auf Berufszeilen hindeuten.
Erwartet: All occupations > 0 jobsAktuell: All > 0
Jeder Beruf hat ein VSE-basiertes Gehalt
Median-Bruttojahresgehalt soll aus der Statistik-Austria-VSE stammen (ISCO oder ÖNACE), mit dem hier verwendeten Faktor für 13./14. Monatsgehalt skaliert.
Erwartet: All occupations have pay dataAktuell: All > 0
Bildungslabels entsprechen der kanonischen Liste
Jede Zeile muss ein Bildungslabel aus EDU_LEVELS_EN verwenden, damit Filter und Vergleiche in EN/DE stabil bleiben.
Erwartet: All in EDU_LEVELS_ENAktuell: All valid
Berufs-Slugs sind eindeutig
Doppelte Slugs würden Routing und Zusammenführung in der Oberfläche stören.
Erwartet: No duplicatesAktuell: All unique
Jede Zeile hat eine nachvollziehbare Quellenangabe
Die kombinierte Herkunftszeile für Beschäftigung und Entgelt soll lang genug sein, um Eurostat-/VSE-Bezüge zu erkennen.
Erwartet: All occupations have source fieldAktuell: All have sources
Genügend Berufsgruppen für eine aussagekräftige Treemap
Es gibt eine Mindestzahl aggregierter Berufsgruppen, damit die Visualisierung nicht von wenigen Zellen dominiert wird.
Erwartet: ≥ 50Aktuell: 62

Occupation-first Struktur

Prüfungen für ISCO-Codes, Hauptfamilien und Familienlabels, die Navigation und Struktur tragen.

4/4 bestanden
Jede Zeile trägt ISCO-Code und Familienlabels
Die occupation-first Oberfläche hängt davon ab, dass ISCO-08, die Major-Familie und zweisprachige Familienlabels in jeder Zeile vorhanden sind.
Erwartet: All rows have ISCO code + family labelsAktuell: All rows complete
ISCO-Majorgruppe passt zum 2-stelligen Code
Jede Berufszeile soll einen gültigen 2-stelligen ISCO-Code tragen; die gespeicherte Majorgruppe muss dem ersten Digit entsprechen.
Erwartet: 2-digit ISCO; major = first digitAktuell: All rows aligned
ISCO-Familienlabels bleiben konsistent zu den Majorgruppen
Die englischen und deutschen Familienlabels sollen zur kanonischen ISCO-Majorgruppen-Zuordnung der Website passen.
Erwartet: Labels match canonical ISCO familiesAktuell: All labels canonical
Alle ISCO-Hauptfamilien 1–9 sind vertreten
Eine österreichweite Berufs-Karte sollte mindestens eine Zeile aus jeder ISCO-Hauptfamilie enthalten, die in Navigation und Zusammenfassungen genutzt wird.
Erwartet: All families 1–9 representedAktuell: 9 families represented

Gehaltsverteilung

Plausibilitätschecks für Median, Streuung, Lohnsumme und Bildungsleiter.

6/7 bestanden
Jahresgehälter bleiben in einer realistischen Spanne
Über aggregierte Berufe soll Min./Max.-Bruttojahresgehalt im Bereich 15k–150k € liegen, damit offensichtliche Eingabefehler auffallen.
Erwartet: €15,000 – €150,000Aktuell: €24,798 – €111,629
Gehaltsungleichheit (Gini) über Berufe ist plausibel
Ungewichteter Gini der medianen Jahresgehälter über Berufszeilen soll 0,10–0,35 liegen — passend zur komprimierten Lohnstruktur in Österreich.
Erwartet: 0.10–0.35Aktuell: 0.147
Variationskoeffizient der Gehälter ist plausibel
VK (Std/Ø) der Gehälter über Berufe soll zwischen 0,15 und 0,50 liegen — genug Streuung ohne extreme Ausreißer.
Erwartet: 0.15–0.50Aktuell: 0.291
Höhere formale Bildung → höheres Medianentgelt
Gewichteter Median für Master/PhD-Berufe soll über dem gewichteten Median für reine Pflichtschule liegen.
Erwartet: High median > Low medianAktuell: Low: €29,203 | High: €60,986
Beschäftigungsgewichteter Median liegt nahe der nationalen Bandbreite
Beschäftigungsgewichteter Median-Bruttojahreslohn soll bei 35k–45k € liegen, konsistent mit nationalen Medianen der Statistik Austria (inkl. 13./14.).
Erwartet: €35,000–€45,000Aktuell: €45,338
Gesamtlohnsumme (Gehalt × Jobs) ist ökonomisch plausibel
Summe Gehalt×Jobs soll bei 150–260 Mrd. € liegen, nahe der Arbeitnehmerentgelte laut Eurostat.
Erwartet: €150B–€260BAktuell: €182.5B
Extreme Bildungsniveaus sind eine Minderheit der Zeilen
Anteil der Berufe mit nur Pflichtschule oder PhD soll unter 30 % bleiben.
Erwartet: < 30%Aktuell: 7 of 62 (11.3%)

KI-Scoring

Grenzen, Spannweite, Begründungen und Richtungslogik für Exposition und Ausblick.

8/8 bestanden
KI-Exposition bleibt im Bereich 0–10
Exposition ist ein ganzzahliger Rubrik-Score (kuratiert, optional mit LLM-Overrides gemischt). Werte außerhalb 0–10 deuten auf fehlerhafte Daten hin.
Erwartet: All values 0–10Aktuell: All 0–10
Ausblick-Scores bleiben im Bereich −10…+10
Der Ausblick ist ein qualitatives Nachfragesignal pro Berufsgruppe, kein Prognosemodell. Er muss in der dokumentierten Skala bleiben.
Erwartet: All values −10 to +10Aktuell: All −10 to 10
KI-Exposition nutzt den Großteil der Skala 0–10
Spanne (Max − Min) der Exposition soll mindestens 7 Punkte betragen, damit physische vs. kognitive Jobs sichtbar getrennt sind.
Erwartet: span ≥ 7Aktuell: Range 1–9 (span 8)
KI-Exposition korreliert positiv mit dem Gehalt
Über Berufe hinweg tendieren kognitivere Rollen zu höherem Entgelt; Pearson r zwischen Exposition und Gehalt soll > 0 sein.
Erwartet: r > 0Aktuell: r = 0.606
Physische Sektoren (A, F) haben niedrige KI-Exposition
Beschäftigungsgewichteter Mittelwert der Exposition für Landwirtschaft + Bau soll unter 4 bleiben — überwiegend manuell/vor-Ort.
Erwartet: < 4.0Aktuell: Avg 2.14 (n=7)
Wissensintensive Sektoren (J, K, M) haben hohe Exposition
Beschäftigungsgewichteter Mittelwert für IT, Finanzen und freiberufliche Dienstleistungen soll >5 sein.
Erwartet: > 5.0Aktuell: Avg 7.31 (n=10)
Jede Expositionsbewertung hat eine Begründung
Begründungstexte zur Exposition sollten mindestens ~20 Zeichen haben, damit die Rubrik in der UI erklärbar ist.
Erwartet: All rationales ≥ 20 charsAktuell: All ≥ 20 chars
Ausblick ist nicht systematisch verzerrt
Beschäftigungsgewichteter Mittelwert des Ausblicks soll nahe 0 liegen (±3). Starke Drift würde auf einseitige Bewertung hindeuten.
Erwartet: −3.0 to +3.0Aktuell: 0.92

Sektor-Kontext

ÖNACE-Checks bleiben als wirtschaftlicher Kontext für das occupation-first Modell erhalten.

6/8 bestanden
Verarbeitendes Gewerbe (NACE C) in Eurostat-Größenordnung
Summierte Jobs in allen NACE-C-Zeilen sollten >600k sein, passend zur Eurostat-Größenordnung für Österreich (~690k).
Erwartet: > 600,000 (Eurostat ≈ 690k)Aktuell: 505,638
Information & Kommunikation (NACE J) in Eurostat-Größenordnung
Summierte Jobs in NACE J sollten >140k sein, konsistent mit Eurostat für Österreich (~155k).
Erwartet: > 140,000 (Eurostat ≈ 155k)Aktuell: 312,100
Dienstleistungen (G–S) beschäftigen mehr als Güter (A–F)
Tertialisierungs-Check: Beschäftigung in G–S soll A–F übersteigen, passend zur dienstleistungslastigen Wirtschaft.
Erwartet: Services > 50%Aktuell: 73.7% in G–S (2,941,618 jobs)
Gesundheits- & Sozialwesen (NACE Q) ist ein Großarbeitgeber
Summierte Jobs in NACE Q sollten >400k sein, in der Größenordnung von Eurostat für Österreich (~440k).
Erwartet: > 400,000Aktuell: 354,764
Bau (NACE F) liegt in der Eurostat-Bandbreite
Bau-Beschäftigung soll zwischen 250k und 350k liegen, um Eurostat (~300k) für Österreich.
Erwartet: 250k–350kAktuell: 261,510
Alle ÖNACE-Abschnitte A–S kommen vor
Jeder Abschnittsbuchstabe A bis S soll ≥1 Beschäftigtenzeile haben, damit die Sektorabdeckung vollständig ist.
Erwartet: All sections A–S representedAktuell: 19 sections A–S
Beschäftigung ist nicht von einem Abschnitt dominiert (HHI)
Herfindahl-Index über Abschnittsbuchstaben (A–S), gewichtet mit Jobs, soll <0,15 bleiben.
Erwartet: < 0.15Aktuell: HHI = 0.0829
Handel (NACE G) ist der größte private Handelsblock
Summierte Jobs in allen G-Zeilen (G45–G47) sollten 500k–700k sein (WKO/Eurostat-Größenordnung).
Erwartet: 500k–700kAktuell: 565,591