
Die beiden Teams, die ein WM-Finale erreichen, greifen ungefähr gleich an: Der Meister erzielt durchschnittlich 2,40 Tore pro Spiel, der Zweitplatzierte 2,16, ein Abstand, der klein genug ist, um ein statistisches Rauschen darzustellen (p=0,39). Wo sie sich trennen, ist hinten. Meister kassieren 0,79 Gegentore pro Spiel; Zweitplatzierte 1,09 (p=0,03). Wenn zwei großartige Mannschaften im Finale aufeinandertreffen, gewinnt tendenziell die bessere Verteidigung den Pokal.
Jeder Marker ist der Lauf einer Mannschaft bei einer einzelnen Männer-Weltmeisterschaft 1930–2022. Die horizontale Achse zeigt die pro Spiel kassierten Tore (Verteidigung, mit den geizigsten Mannschaften auf der linken Seite); Die vertikale Achse zeigt die pro Spiel erzielten Tore (Angriff, weiter oben). Die Farbe zeigt, wie sie abgeschnitten haben: Gold = Champion, Silber = Zweiter, Bronze = Dritter, Grau = alle anderen. Die Kurven am oberen und linken Rand sind die Verteilungen für jeden Podiumsplatz, und die rote gestrichelte Linie verbindet die durchschnittliche Mannschaft bei jedem Ziel: flach im Angriff, stetig fallend in der Verteidigung.
Betrachtet man alle 489 Mannschaften, korrelieren Punkte und Gegentore im Wesentlichen nicht miteinander (r = −0,05): Wie viele Punkte eine Mannschaft erzielt, sagt wenig darüber aus, wie viel sie zulässt. Und während man den Pokal mit einem bescheidenen Angriff gewinnen kann (Spanien 2010 erzielte nur 1,14 Tore pro Spiel), gewinnt fast niemand, während Tore durchsickern. Die geizigsten Meister (Frankreich 1998, Italien 2006, Spanien 2010) kassierten jeweils etwa 0,29 pro Spiel, also etwa zwei Gegentore im gesamten Turnier. Die einzige Ausnahme, Westdeutschland 1954, übertraf einfach alle anderen.
Interaktive Version, in der Sie mit der Maus über ein beliebiges Team fahren, zu einer Zeitleiste wechseln können, um den Spielwechsel zu verfolgen, und die Bilanz jedes Teams lesen können: https://viz.luarai.com/worldcup-defense
Von ArchiTechOfTheFuture
9 Kommentare
Source: Fjelstul World Cup Database (men’s tournaments, 1930–2022): [https://github.com/jfjelstul/worldcup](https://github.com/jfjelstul/worldcup)
Tools: Python (pandas) for data prep, d3.js for the chart.
So you’re saying defense wins championships?
Cool data – would be better with a darker silver color for runners up because those points blend in with the randos
hmm, how do I know which team is which unless I click on the link? I feel a graph should be clear enough on its own
Why is a difference of .24 so much more significant than a difference of .30 that the later is 10 times less likely to be statistical noise?
One could argue this is how both USA Hockey teams swept the Olympics.
Maybe I’m just yelling at clouds, but I’d swap the positions of the normal distributions on the left y axis with the label on right y axis. It just felt a little weird when I looked at it and tried to figure out what the numbers meant but saw a normal distribution. I like the use of it, just its placement bothered me. Again, maybe I’m yelling at clouds.
I’d also be curious if this correlates with possession, and also how this relates to the Keepers. Obviously going further into the past makes the stats less reliable (or even there, especially for players), but is there a way to rank importance of positions? Like a team with stronger backs will go further than a team with amazing strikers? This would imply having a really strong keeper is probably the most important (and I doubt you’ll find a coach or a keeper who disagrees) but I would want to prove.
Would be interesting to filter for knockout rounds only – some unbalanced games in the group stages would affect the overall results.
The deeper data on your site is interesting too. The filtering isnt quite working right – some data from outside the filter range still shows up (eg Germany 2014 is highlighted in the 1986-2002 data). Since the mouseover still pops up for filtered data it’s hard to see which one is actually in the dataset for really grouped ones – there’s a third place symbol somewhere underneath Italy 82 (winners) and Netherlands 2010 (runners up) that pops up in 1986-2002 but you cant see which team it is.
This data does show that defense is typically the deciding factor in who wins. But it doesn’t show that defense is the most important thing for a team to invest in – in fact, it could show the opposite.
If everyone is investing in offense then most teams are more likely to cluster near the top percentile in offense. At that point, the only margin for variation between teams becomes defense.
This is like the luck versus skill trade off discussed in [this](https://youtu.be/3LopI4YeC4I?is=qb6IaRe1zTWlPFcx) veritasium video. Even if you weigh luck at just 5% and skill at 95% in some metric, if the population of skilled people is big enough luck will be the determining factor as all the top candidates quickly end up clustered at the top for skill.