Über dieses Projekt

Hintergrund, Methodik und warum unsere österreichische occupation-first Adaption anders aufgebaut ist.

Hintergrund zum österreichischen Rebuild: was aus dem US-Original übernommen wurde, was wir lokal ersetzt haben und wie Datensatz, Routing und Methodik im occupation-first Modell zusammenspielen.

Was wir für Österreich geändert haben

Andrej Karpathy hat den US Job Market Visualizer konzipiert und gebaut — Treemap, Pipeline und Bewertungsrahmen sind seine Leistung. Diese Seite zeigt, was wir für Österreich neu aufgebaut haben: lokale Daten, occupation-first Navigation, zweisprachige Copy und die ISCO-basierte Struktur auf diesem Upstream-Fundament.

Wir haben alle Datenquellen durch offizielle österreichische und EU-Statistiken ersetzt:

  • Beschäftigungsdaten → Eurostat nama_10_a64_e (2024) statt US BLS
  • Gehaltsdaten → Statistik Austria Verdienststrukturerhebung 2022 (VSE) statt BLS Medianlohn
  • Branchenklassifikation → ÖNACE 2025 (österreichische NACE) statt SOC
  • Berufszuordnung → ISCO-08 Berufsgruppen statt BLS-Detailberufe
  • Informationsarchitektur → occupation-first über ISCO-Familien; ÖNACE bleibt Sektor-Kontext
  • Routenmodell → eigene Seiten für Beruf, Familie und Sektor statt eines sektor-first Browsing-Flows
  • Gehälter → EUR Bruttojahresgehalt (inkl. 13./14. Gehalt) statt USD
  • Bildungsniveaus → Österreichischer Qualifikationsrahmen (Lehre, HTL, FH, Uni, etc.)
  • KI-Exposition & Ausblick Für österreichische Berufsgruppen kuratiert mit einem Karpathy-kompatiblen Bewertungsrahmen (0–10 Exposition, –10…+10 Ausblick), aber auf lokale Berufsgruppen und lokalen Sektor-Kontext angepasst; Details unten.

ÖNACE: ÖNACE 2025 ist unsere Ebene für wirtschaftlichen Sektor-Kontext, nicht die primäre analytische Einheit. Die Verdienststrukturerhebung 2022 wurde weiterhin unter ÖNACE-2008-Codes (NACE Rev.2) geführt — in den Open-Data-Dateien der Statistik Austria z. B. Spalte C-ONVE10-0. Deshalb zeigen wir heutige Abschnittsbezeichnungen A–S zur Orientierung, während die occupation-first Analyse selbst auf ISCO-Gruppen und Familien läuft.

Wie KI-Exposition & Ausblick entstehen (exakte Pipeline)

  1. Quelle: scripts/generate-occupations.ts → Array OCCUPATION_DEFS. Jede Zeile setzt exposure (0–10), exposureRationale (Begründung EN), outlook (–10…+10) und outlookDesc (kurze Stufe, z. B. „Slow growth“).
  2. Rahmen (Karpathy-kompatibel): Exposition beschreibt den Anteil kognitiver/digitaler bzw. LLM-relevanter Aufgaben— keine empirische Messung wie Felten et al. Hohe Exposition bedeutet nicht automatisch Jobverlust (vgl. Karpathys Hinweis zu Softwareentwicklung). Ausblick ist ein qualitatives Nachfragesignal pro aggregierter Gruppe (sektorinformiert),kein statistisches Prognosemodell.
  3. Regenerieren: npm run generate:occupations berechnet Beschäftigung und Gehälter neu aus Eurostat + in src/lib/real-data.ts eingebetteten Statistik-Austria-Daten und schreibt src/lib/data.ts. Basis-Exposition/-Ausblick stammen aus OCCUPATION_DEFS. npm run build ruft keine LLM-API auf.
  4. Optionales LLM-Scoring (wie Karpathy): npm run score:exposure-llm (mit OPENROUTER_API_KEY) ruft OpenRouter mit festem Rubrik-Text + Temperatur 0,2 auf und schreibt scripts/llm-exposure-overrides.json. Der Generator überschreibt damit nur exposure und exposureRationale—danach erneut npm run generate:occupations.

Umsetzung dieser österreichischen Instanz: Next.js, TypeScript, shadcn/ui und das webconsulting Design System. Das aktuelle Produkt ergänzt Berufsdetailseiten, ISCO-Familienansichten, Sektor-Kontextseiten, einen AT-vs-US-Vergleich und eine zweisprachige Oberfläche.

Was Karpathy entwickelt hat

Im März 2026 veröffentlichte Andrej Karpathy — ehemaliger Director of AI bei Tesla, Gründungsmitglied von OpenAI und einer der meistzitierten Forscher im Bereich Deep Learning — ein Open-Source-Tool, das alle 342 Berufe des U.S. Bureau of Labor Statistics Occupational Outlook Handbook scrapt, parst und visualisiert. Die Visualisierung ist eine Treemap, in der die Fläche jedes Rechtecks proportional zur Gesamtbeschäftigung ist und die Farbeeine gewählte Metrik kodiert: BLS- Wachstumsprognose, Medianlohn, Bildungsanforderungen oder — am kontroversesten — einen LLM-generierten "Digital AI Exposure"-Score auf einer Skala von 0–10.

Das Tool umfasst 143 Millionen Arbeitsplätze und 8,9 Billionen Dollaran Jahreslöhnen. Es ist bewusst keine wissenschaftliche Arbeit, keine Politikempfehlung und keine Prognose — es ist, in Karpathys eigenen Worten, "ein Entwicklungstool zur visuellen Exploration von BLS-Daten."

Warum es intensiven öffentlichen Diskurs auslöste

Die virale Rezeption des Projekts in Technologie-, Wirtschafts- und Politik-Communities lässt sich auf fünf sich überschneidende Faktoren zurückführen, die jeweils in etablierten Kommunikations- und Verhaltenswissenschaften verankert sind:

1. Quellglaubwürdigkeit und epistemische Autorität

Hovland, Janis & Kelleys Source-Credibility-Modell (1953) zeigt, dass die Überzeugungskraft einer Botschaft stark von der wahrgenommenen Expertise und Vertrauenswürdigkeit der Quelle abhängt. Karpathy nimmt eine seltene Position ein: Er ist sowohl führender technischer Praktiker (Produktions-KI-Systeme bei Tesla und OpenAI) als auch weitreichender Kommunikator (3M+ YouTube-Abonnenten). Wenn ein Insider dieses Kalibers eine KI-Expositionskarte des Arbeitsmarktes veröffentlicht, trägt das Signal qualitativ anderes Gewicht als eine äquivalente Analyse einer Beratungsfirma.

2. Konkretisierung abstrakten Risikos

Forschung zur Risikokommunikation (Slovic, 2000; Kahneman & Tverskys Prospect Theory, 1979) zeigt konsistent, dass Menschen statistische Wahrscheinlichkeiten untergewichten, aber lebhafte, persönlich relevante Informationen übergewichten. Frühere KI-Arbeitsmarktstudien — Frey & Osborne (2017), Eloundou et al. (2023) — quantifizierten Exposition auf aggregierter Ebene. Karpathys Treemap macht jeden Beruf individuell sichtbar, nach Beschäftigung dimensioniert und nach Exposition eingefärbt. Dieser Konkretisierungseffekt — die Transformation aggregierter Statistiken in persönlich identifizierbare visuelle Repräsentationen — erklärt die emotionalen Reaktionen.

3. Das Nuancen-Paradoxon: Exposition ≠ Verdrängung

Karpathy betonte explizit, dass ein hoher Expositionswert "nicht vorhersagt, dass ein Job verschwindet." Dies entspricht dem ökonomischen Konzept der Nachfrageelastizität und dem von Autor (2015) identifizierten Produktivitätseffekt. Die Dual-Process-Theorie (Kahneman, 2011) sagt jedoch voraus, dass die System-1-Verarbeitung (schnell, intuitiv) eines rot eingefärbten Berufsfeldes die System-2-Verarbeitung (langsam, deliberativ) der schriftlichen Einschränkungen überlagert. Dies schuf eine produktive Spannung, die die Reichweite des Projekts verstärkte.

4. Open-Source-Erweiterbarkeit als Forschungsplattform

Die gesamte Pipeline ist offen: Web-Scraping, Parsing, LLM-Scoring und Site-Generierung. Die Scoring-Komponente ist durch einen Prompt parametrisiert — jeder Forscher kann eine andere Frage substituieren und die gesamte Visualisierung regenerieren. Dies transformiert das Projekt in eine generative Plattform (Zittrain, 2008). Die österreichische Adaptation in diesem Repository ist eine solche Erweiterung.

5. Temporaler Kontext: Das KI-Beschleunigungsfenster

Die Veröffentlichung fiel mit einer beispiellosen KI-Fähigkeitsbeschleunigung (GPT-4o, Claude 3.5, Gemini 1.5), gleichzeitigen Tech-Entlassungen und aktiver Gesetzgebungsdebatte (EU AI Act, US-Executive-Orders) zusammen. Kingdons Multiple-Streams-Framework(1984) erklärt solche Momente: Wenn Problem-, Politik- und Aufmerksamkeitsstrom konvergieren, öffnet sich ein "Policy Window." Karpathys Visualisierung diente als Focusing Event — ein konkretes Artefakt, das diffuse Ängste in ein teilbares, diskutierbares Objekt kristallisierte.

Bedeutung für das öffentliche Verständnis

Trotz methodischer Einschränkungen (LLM-Scoring ist keine empirische Messung, keine nachfrageseitige Modellierung, statische Momentaufnahme) ist der Beitrag zum öffentlichen Diskurs erheblich. Das Projekt zeigte, dass ein einzelner Entwickler mit öffentlichen Daten und LLM-APIs Arbeitsmarktanalysen produzieren kann, die Millionen erreichen. Es verschob die Konversation von "Wird KI Jobs wegnehmen?" (binäre Rahmung) zu "Wie wird KI spezifischeJobs umgestalten?" (graduierte, berufsbezogene Rahmung). Und es stellte eine wiederverwendbare Plattform bereit, die kontextualisierte Adaptionen ermöglicht — wie diese österreichische Version.

Referenzen

  • Acemoglu, D. & Restrepo, P. (2019). Automation and New Tasks. Journal of Economic Perspectives, 33(2), 3–30.
  • Autor, D. (2015). Why Are There Still So Many Jobs? Journal of Economic Perspectives, 29(3), 3–30.
  • Eloundou, T. et al. (2023). GPTs are GPTs. arXiv:2303.10130.
  • Frey, C.B. & Osborne, M.A. (2017). The Future of Employment. Technological Forecasting and Social Change, 114, 254–280.
  • Hovland, C.I. et al. (1953). Communication and Persuasion. Yale University Press.
  • Kahneman, D. (2011). Thinking, Fast and Slow. FSG.
  • Kingdon, J.W. (1984). Agendas, Alternatives, and Public Policies. Little, Brown.
  • Slovic, P. (2000). The Perception of Risk. Earthscan.
  • Zittrain, J. (2008). The Future of the Internet. Yale University Press.