

Vollständig interaktive Version hier über GitHub verfügbar
Als Replikationsstudie wollte ich versuchen, eine meiner Lieblingsvisualisierungen aller Zeiten nachzubilden: die NYTimes‘ "Rotverschiebung" Datenvisualisierungskarte (Bitte werfen Sie einen Blick auf das Original!!) Darin wird dargestellt, wie sich die Stimmenanteile der Landkreise von den Präsidentschaftswahlen 2020 bis 2024 verändert haben. Es ist visuell so klar, äußerst intuitiv und äußerst wirkungsvoll, während es auf einer durchdachten zugrunde liegenden Datenanalyse basiert. Alles, was wir meiner Meinung nach von guten Daten erwarten, nämlich!
Quelle: Dank der konnte ich die relevanten Daten problemlos abrufen MIT Election Data and Science Lab (über das Harvard Dataverse)
Verwendete Werkzeuge:
- Python, Handlung, Polaren
Ich habe dies hauptsächlich als Robustheitstest für ein von mir erstelltes Open-Source-Datenanalyse-Framework durchgeführt, um zu sehen, ob es möglich ist, mit Claude Code eine Datenanalyse auf eine Weise durchzuführen, die immer noch streng, reproduzierbar und transparent ist und bei der ein menschlicher Experte immer noch die volle Kontrolle hat und das Sagen hat (KI-Schlappe ist ein echtes Problem!! Ich werde unten nur mit den Informationen und dem Video-Tutorial kommentieren, um Spam zu vermeiden). Diese Replikationsstudie ermöglichte es mir, Punkt für Punkt direkt zu überprüfen, ob die Datenanalyse im Vergleich zu den bekanntermaßen guten Werten aus dem NYT-Artikel wie erwartet funktionierte, und es war auch ein großartiger Test, um zu sehen, wie einfach ich die interaktive Dashboard-Version mit der KI-Unterstützung erstellen konnte (es stellte sich heraus, dass es erschreckend einfach war – nicht zu unterschätzen).
Beachten Sie, dass einige Stimmenanteilszahlen und -werte vom NYTimes-Artikel abweichen können, hauptsächlich weil die Quelldaten erheblich unterschiedlich sind, was meiner Meinung nach zu erwarten ist – mehr können Sie im zugrundeliegenden Dokument sehen Datendokumentation verfügbar über Harvard Dataverse und die verlinkten Artikel zur Naturdatenmethodik.
Von brhkim
1 Kommentar
Source: I was able to easily pull the relevant data thanks to the [MIT Election Data and Science Lab (via the Harvard Dataverse)](https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi:10.7910/DVN/VOQCHQ)
Tools used: Python, plotly, polars
Only for those interested from the main post: My Claude Code framework [DAAF, the Data Analyst Augmentation Framework](https://github.com/DAAF-Contribution-Community/daaf), can be found in this open-source forever-free repo here. I also made a [youtube tutorial demonstrating the exact process](https://youtu.be/G5uKSlI6jls) for replicating the NYTimes‘ viz using DAAF here. For this dataisbeautiful post specifically, I also went back and did another 5 minutes of iterating on the aesthetics with Claude after the version shown in the video.