[OC]Ich habe 35.000 GitHub-READMEs von 2019 bis 2025 analysiert

Ich habe die 5.000 GitHub-Repositories mit den meisten Sternen von 2019 bis 2025 analysiert, um herauszufinden, ob KI-Tools tatsächlich die Art und Weise verändert haben, wie wir Codedokumentation schreiben. Die Antwort ist Ja. Hier sind die wichtigsten Erkenntnisse aus 35.000 erstklassigen Repos:

Der "Funkelt" Epoche

Die beliebtesten Emojis vor KI (2019–2021) waren nützlich: 💻, ⭐, ⚠️. Im Jahr 2024 sind die Rakete (🚀) und die Glitzer (✨) vollständig zum Markenzeichen des KI-Hypes geworden.

Emojis sind überall

Die Emoji-Dichte stieg um 130 %. KI-Modelle formatieren Listen standardmäßig mit Emojis, wodurch der Durchschnitt von 4,8 Emojis pro Repo auf über 11 sinkt.

Der "Em Dash" Explosion

Generative KI liebt das "em Dash" (—). Im Jahr 2019 verwendete das durchschnittliche Repo 0,41 Striche. Bis 2025 stieg dieser Wert sprunghaft auf 1,01 (ein Anstieg um 146 %).

Aufblähen

Die Erstellung einer kompletten Einrichtungsanleitung dauert jetzt 5 Sekunden. Aus diesem Grund wuchs die durchschnittliche README-Größe um etwa 1.000 Byte (8 %).

Methodik

Die Daten stammen aus Google BigQuery (identifiziert jedes Jahr die 5.000 Repos mit den meisten Sternen) und wurden mithilfe eines Python-Skripts analysiert, das genau 35.000 HTTP-Anfragen an gesendet hat raw.githubusercontent.com.

Vollständiger Bericht: https://medium.com/@srkorwho/i-analyzed-35-000-github-readmes-to-see-if-ai-changed-how-we-write-code-documentation-6e8715a4f43c

Von Mean-Sink6996

View 6 Comments

6 Kommentare

der_reifen on 19.03.2026 6:10 p.m.

Nice overview, just one criticism: your first graph really suffers from the Y-axis truncation. It’s fine for the other graphs, as the ordinate displays a reasonable value range, but for the first one it makes it seem like a very small (<10%) difference is substantial.
Vexnew on 19.03.2026 6:15 p.m.

How did you come to that emoji conclusion? Pre-LLM emoji usage trendline seems to agree with the increase in usage.
Deto on 19.03.2026 6:32 p.m.

Cool data, it’s really interesting that a lot of these trends were in place, pre-LLM explosion, and LLMs just accelerated them.

However I don’t agree with this interpretation:

> It now takes 5 seconds to generate an entire setup guide. Because of this, the average README size grew by ~1,000 bytes (8%).

LLMs weren’t really being used for README generation widely until 2023 and onward. If anything, we see that there was already a trend of increasing README lengths prior to the introduction of LLMs and LLMs actually halted this.
Pale_Squash_4263 on 19.03.2026 6:49 p.m.

Curious what data looks like before 2019. Is it relatively stable and thus not really worth showing?
rikzyjesuli on 19.03.2026 7:21 p.m.

Y axis range is 14800 to 158000. Just a 1000 byte difference. I think the difference is explained by heavy use of emoji?

GPTs are statistical models so it’s unlikely go over or below pre AI era average README lengths unless specifically prompted to do so by a human.
gardenenigma on 19.03.2026 7:45 p.m.

LLM produced READMEs are way to verbose and unreadable in my opinion. Better than empty READMEs I guess.

Du musst angemeldet sein, um einen Kommentar abzugeben.

Südkoreas ausländische Direktinvestitionen steigen im Jahr 2025 um mehr als 8 %

Mutterschaft beeinträchtigt die akademische Karriere von Frauen – diese Daten zeigen, wie und warum. Der Grund dafür ist, dass Frauen fast fünfmal so viele Kinderbetreuungspflichten tragen wie Männer.

Ein Major der israelischen Luftwaffe wird beschuldigt, vertrauliche Informationen verwendet zu haben, um Wetten auf Polymarket zu platzieren

Implantierbare Inselzellen könnten Diabetes ohne Insulininjektionen kontrollieren: „Die Zellen können mindestens drei Monate im Körper überleben und dabei genug Insulin produzieren, um den Blutzuckerspiegel zu kontrollieren, wie Untersuchungen zeigen.“ »

Trump und Modi hatten ein Gespräch über den Iran-Krieg. Elon Musk schloss sich ihnen an.

Tiger Woods in Florida in Unfall mit Überschlag verwickelt

Drei Schiffe kehrten in Hormus um – die Blockade überdauerte den Kommandanten, der sie errichtete

[OC]Ich habe 35.000 GitHub-READMEs von 2019 bis 2025 analysiert

6 Kommentare

Südkoreas ausländische Direktinvestitionen steigen im Jahr 2025 um mehr als 8 %

Mutterschaft beeinträchtigt die akademische Karriere von Frauen – diese Daten zeigen, wie und warum. Der Grund dafür ist, dass Frauen fast fünfmal so viele Kinderbetreuungspflichten tragen wie Männer.

Ein Major der israelischen Luftwaffe wird beschuldigt, vertrauliche Informationen verwendet zu haben, um Wetten auf Polymarket zu platzieren

Implantierbare Inselzellen könnten Diabetes ohne Insulininjektionen kontrollieren: „Die Zellen können mindestens drei Monate im Körper überleben und dabei genug Insulin produzieren, um den Blutzuckerspiegel zu kontrollieren, wie Untersuchungen zeigen.“ »

Trump und Modi hatten ein Gespräch über den Iran-Krieg. Elon Musk schloss sich ihnen an.

Tiger Woods in Florida in Unfall mit Überschlag verwickelt

Drei Schiffe kehrten in Hormus um – die Blockade überdauerte den Kommandanten, der sie errichtete

Schlagwörter

[OC]Ich habe 35.000 GitHub-READMEs von 2019 bis 2025 analysiert

6 Kommentare