
Anthropic veröffentlichte im März einen Artikel mit dem Titel „Labor Market Impacts of AI: A New Measure and Early Evidence“. Der Großteil der Berichterstattung konzentrierte sich auf die Schlagzeilen – welche Arbeitsplätze am stärksten gefährdet sind, welche am wenigsten prognostizierten Auswirkungen auf die Beschäftigung haben. Für sich allein schon lesenswert.
Der Teil, der nicht genügend Aufmerksamkeit erhielt, ist der strukturelle Befund, der diesen Zahlen zugrunde liegt.
Für jeden Hauptberuf unterscheidet das Papier zwischen zwei Kennzahlen:
- Theoretische KI-Fähigkeit: was KI basierend auf der Aufgabenanalyse leisten könnte
- Beobachtete KI-Abdeckung: Wofür KI derzeit tatsächlich verwendet wird, gemessen anhand echter Claude-Nutzungsdaten
Die Kluft zwischen diesen beiden ist enorm und in allen Sektoren gleichbleibend:
| Sektor | Theoretische Fähigkeiten | Beobachtete Berichterstattung |
|---|---|---|
| Computer und Mathematik | 94 % | 33 % |
| Büro & Verwaltung | 90 % | 25 % |
| Wirtschaft und Finanzen | 85 % | 20 % |
| Legal | 80 % | 15 % |
| Vertrieb und Marketing | 62 % | 27 % |
| Unterstützung im Gesundheitswesen | 40 % | 5 % |
Die Schlagzeile lautet "Die KI-Fähigkeit ist der Einführung weit voraus." Das stimmt, aber es ist die oberflächliche Lesart. Die interessantere Frage ist, was genau in dieser Lücke lebt und ob die Dinge in der Lücke vorübergehend oder dauerhaft sind.
Die Zusammensetzung der Lücke, basierend auf der Analyse des Papiers:
- Rechtliche und Compliance-Einschränkungen. Aufgaben, die KI erledigen könnte, für die sie aber nicht eingesetzt wird, weil die Vorschriften einen Menschen auf dem Laufenden halten müssen oder weil die Haftungsrahmen nicht aufgeholt haben. Dies ist ein großer Teil der Rechts-, Gesundheits- und Finanzarbeit.
- Reibungsverluste bei der Softwareintegration. Aufgaben, die KI erledigen könnte, aber derzeit nicht kann, weil die Daten in Altsystemen gesperrt sind, die keine APIs bereitstellen, oder weil Arbeitsabläufe menschliche Übergaben zwischen Tools erfordern, die nicht verbunden sind. Ein großer Teil der Verwaltungs- und Backoffice-Arbeit.
- Überprüfungsaufwand. Aufgaben, die KI mit Maschinengeschwindigkeit erledigen könnte, benötigen in der Praxis jedoch menschliche Zeit für die Überprüfung, wodurch der Geschwindigkeitsvorteil größtenteils zunichte gemacht wird. Häufig in der Codierung, Forschung und Datenanalyse.
- Trägheit des Arbeitsablaufs. Aufgaben, die KI erledigen könnte, bei denen der bestehende Prozess jedoch sozial eingebettet ist – Besprechungen, Entscheidungen, etablierte Kommunikationsmuster – und eine Änderung des Prozesses schwieriger ist als das Technologieproblem. Häufig in Vertrieb, Management und Beratung.
- Qualitätsschwelleneffekte. Aufgaben, bei denen die KI-Ausgabe technisch möglich ist, aber durchweg 10–15 % unter der Qualitätsgrenze liegt, die in der Praxis wichtig ist. Häufig bei kreativer Arbeit, komplexem Schreiben und allen Aufgaben, bei denen Grenzfälle dominieren.
Aus dem Papier geht klar hervor, dass die Forscher alle fünf dieser Hindernisse als vorübergehend betrachten – Barrieren, die eher schwinden als bestehen. Die Kategorien 2 und 3 (Integrationsprobleme und Verifizierungsaufwand) nehmen am schnellsten ab, da sie durch Infrastrukturinvestitionen und Werkzeugverbesserungen angegangen werden. Die Kategorien 1, 4 und 5 erodieren langsamer, weil sie sich nicht nur auf die Technik, sondern auf Gesetze, soziale Dynamiken und Qualitätsschwellen beziehen.
Warum das wichtiger ist als die Schlagzeilen:
Wenn Sie vorhersagen möchten, wie sich die KI-Präsenz auf eine bestimmte Rolle auswirken wird, ist die Schlagzeilenzahl (aktuell beobachtete Berichterstattung) irreführend. Was Sie eigentlich wissen möchten, ist, auf welcher dieser fünf Lückenkategorien der Schutz Ihrer Rolle basiert.
Eine Rolle, die derzeit bei 20 % der beobachteten Abdeckung liegt, ist in einer anderen Position, je nachdem, ob die verbleibenden 80 %:
- Gefangen hinter Compliance-Einschränkungen (langsame Erosion)
- Versteckt hinter Integrationsproblemen (schnelle Erosion – wahrscheinlich innerhalb von 2-3 Jahren verschwunden)
- Hinter Qualitätsschwellen gesperrt (mittlere Erosion – Verbesserung mit jeder Modellgeneration)
- Eingesperrt hinter der Trägheit des Arbeitsablaufs (langsame Erosion – aber sobald es vorbei ist, am Rande der Klippe)
Zwei Rollen mit dem gleichen beobachteten Expositionsniveau können sehr unterschiedliche zukünftige Entwicklungen haben, je nachdem, in welcher Kategorie ihr Schutz angesiedelt ist. Die Schlagzeile sagt Ihnen das nicht. Die Komposition schon.
Der grobe Rahmen, den ich verwende, um meine eigene Rolle anhand dieses zu lesen:
Fragen Sie sich für jede Aufgabe in Ihrer Arbeit: Wenn KI diese Aufgabe heute nicht erledigen könnte, warum nicht? Kategorisieren Sie die Antwort dann in eine der fünf oben genannten Kategorien. Die Mischung sagt Ihnen genauer als jede einzelne Belichtungszahl, wie dauerhaft Ihre aktuelle Position ist.
Durch Compliance oder Arbeitsablaufträgheit geschützte Aufgaben sind selbst bei hoher theoretischer Belastung einige Jahre lang haltbar. Aufgaben, die durch Integrationsreibung oder Verifizierungsaufwand geschützt sind, werden bald exponiert, selbst bei geringer aktueller beobachteter Exposition. Aufgaben, die durch Qualitätsschwellenwerte geschützt sind, liegen im mittleren Bereich – sich verbessernde Modellgenerationen schließen diese schrittweise und nicht plötzlich.
Ein Hinweis zur Datenquelle:
Anthropisch gemessene beobachtete Abdeckung anhand der tatsächlichen Claude-Nutzung. Das bedeutet, dass der Datensatz widerspiegelt, was Early Adopters und KI-native Arbeitnehmer tun, und nicht den durchschnittlichen Arbeitnehmer. Die tatsächliche Lücke ist wahrscheinlich größer, als die Tabelle vermuten lässt, da die Benutzerbasis von Anthropic eher auf Menschen ausgerichtet ist, die KI bereits intensiv nutzen. Die beobachtete Abdeckung von 33 % für Computer- und Mathematikberufe ist was Claude-Benutzer in diesem Bereich tun. Im gesamten Feld ist die Zahl niedriger. Dadurch wird die Lückenschlussfolgerung stärker und nicht schwächer.
Ich habe eine kostenlose Ressource erstellt, die Ihre spezifische Rolle durch dieses Framework steuert – Ihre Aufgaben übernimmt, jede einzelne anhand der fünf oben genannten Kategorien bewertet und Ihnen neben der rohen Expositionsbewertung eine Haltbarkeitsbewertung gibthier, wenn es hilft.
Wenn Sie nach dem Lesen nichts anderes tun, führen Sie den Fünf-Kategorien-Test für Ihre eigene Rolle durch. Die Zusammensetzung Ihres Schutzes ist wichtiger als dessen Höhe.
Anthropic's job exposure data shows an enormous gap between what AI can do and what AI is actually doing. The composition of that gap is the most interesting part of the dataset.
byu/Professional-Rest138 inFuturology
13 Kommentare
I would not believe too much of anything like this from a company that be or not to be is the adoption of said technology.
Their job is to sell hype. Any independent analysis would be more appreciated.
I suspect the opposite. AI has been adopted nearly across the board but is not actually capable of performing the tasks for which it is adopted. See, e.g., numerous instances of attorneys being sanctioned for citing AI hallucinated cases, AI slop customer service chat bots, this AI slop post summarizing anthropic’s underlying AI slop study, etc. Each of these feign competence but actually are inaccurate, lack substance, make society dumber, and drain earth’s resources.
There is a huge difference between the manufacturer of a tool says it can do it and the market confirming it. If the adoption is not there, maybe the manufacturers claim is wrong/hyped?
Especially in medicine and legal topics determinism and consistency is a LOT more valuable than speed.
You could say the same about human.
You have human who can be medical doctor and what they are actually doing is driving a cab or being a real-estate agent.
What AI company are discovering is that the supply of AI capabilities is worthless if there is no demand for it. They hide it behind „there’s compliance or integration problems“ but the truth is that either there is no real demand for that, or there is no real demand for an AI doing it very well with 98% of confidence, but it can hallucinate and get it very wrong 2% of times.
Is that the same anthropic that charges people extra when they use their AI with certain tools? Or is that one of those AI companies that charges you full price for the „good“ model, and then they silently offload your tasks to the „cheaper“ model to save money….
usage doesn’t mean effectiveness, number of prompts doesn’t equal amount of work done
also, the only pattern in the data is „no-one is using it as much as we think they should“, there’s no tasks or industries that get used especially more or less than the fraction of their „capacity“ compared to use in other areas, the reasons given are conjecture that the data doesn’t address
it’s a nothing burger, as typical of AI summaries
This is such a head scratcher of data. Especially Healthcare support being inly at 40%
I know for a fact some hospitals are testing out AI therapists and social workers to provide services and mental health needs. It wouldnt be totally out there if they focused on case management too. Some social workers even use chat GPT to convert there notes into charting.
That number should be higher than 40%
As for everything else i believe it. The security is the biggest issue and a lot of trade secrets are kept in house exposing it to Claude and the possibility of being hacked is something I do not want to do.
One could argue once the limiters disengage that number will shoot up. Eventually we’ll get to the point of compromising security for ease of access but thats the current barrier.
Ai realizing in it’s youth how much potential it has…then getting to the working world and finding out it’s stuck doing menial tasks and unable to get it’s foot in the door and swapping careers to make ends meet and getting stuck in that temp job for a lifetime? You don’t say?
We’re going to need you to move your desk down to the basement.
I think it’s more about the gap between what so-called „AI“ *can* do and what real AI actually *could* do hypothetically one day in future if it wasn’t just the LLM scam industry
Why not link to the actual Anthropic paper? Why is the only link to your data gathering „resource“?
Anthropic blaming everyone else for not buying the product they’re trying to sell…
This breakdown actually makes the gap feel more real most of what’s protecting roles doesn’t seem permanent, especially integration and verification, feels like those will become fully runable soon.
AI better do what we all think it can do because USA is all in. So many data centers being built to support AI infrastructure and so much money has gone into AI development that if robots aren’t replacing coal miners or grocery store stockers in 30 years then it’ll be a total fail.