paint-brush
Die Umfragen sehen für Harris gut aus. Mit dem Umfragefehler 2016/20 steckt sie nun in Schwierigkeitenvon@maxspeicher
475 Lesungen
475 Lesungen

Die Umfragen sehen für Harris gut aus. Mit dem Umfragefehler 2016/20 steckt sie nun in Schwierigkeiten

von Maximilian Speicher3m2024/09/26
Read on Terminal Reader

Zu lang; Lesen

Ich habe angefangen, mit öffentlich verfügbaren Umfragedaten für die US-Präsidentschaftswahlen 2024 herumzuspielen. Ich berücksichtige nur qualitativ hochwertige Meinungsforscher, ohne ihre Umfragen jedoch unterschiedlich zu gewichten. Ich konzentriere mich auf die 7 Swing States, die die Wahl entscheiden werden. 2024 wird den Wahlen 2020 und 2016 viel ähnlicher sein als allen Wahlen davor.
featured image - Die Umfragen sehen für Harris gut aus. Mit dem Umfragefehler 2016/20 steckt sie nun in Schwierigkeiten
Maximilian Speicher HackerNoon profile picture
0-item

Also habe ich angefangen, herumzuspielen mit Öffentlich zugängliche Umfragedaten von FiveThirtyEight . Warum? Weil ich mich einfach für die Umfragen zur US-Präsidentschaftswahl 2024 und die statistische Seite der Dinge interessiere und mich gefragt habe, wie ich meine eigene kleine Vorhersage von Grund auf erstellen könnte. Also, hier ist, was ich für einen ersten Versuch gemacht habe.


(Haftungsausschluss: Ich bin kein professioneller Datenwissenschaftler. Mein Hauptaugenmerk liegt darauf, mit den Daten herumzuspielen und einige Dinge zu erkunden.)


Zunächst einmal möchte ich es zunächst einfach halten. Wie Kahneman in seinem Buch „Noise“ erklärt: Einfache Modelle erledigen die Aufgabe oft recht gut.


Daher berücksichtige ich nur qualitativ hochwertige Meinungsforscher, ohne deren Umfragen jedoch unterschiedlich zu gewichten. Ich berücksichtige nur Datenpunkte mit einem numeric_grade ≥2,5 (am besten: 3) im Datensatz von 538.


Was ich gewichte, ist die Nähe zum Wahltag. Je näher der 5. November, desto relevanter ist die Umfrage. Ich berücksichtige Umfragen von bis zu 90 Tagen (~3 Monaten) davor, linear gewichtet. Eine Umfrage, die am 7. August endet, hat eine Gewichtung von 1/90, und eine Umfrage, die am 4. November endet, hat eine Gewichtung von 90/90.


Abschließend möchte ich sagen, dass ich nicht auf nationale Umfragen achte. Ich konzentriere mich auf die sieben Swing States, die die Wahl entscheiden werden.


Mit all dem kommen wir zum folgenden Bild vom 24. September. Harris vorne in MI, NV, NC, PA, WI; Trump in AZ und GA.



Basierend auf diesen Wahrscheinlichkeiten können wir auch die erwarteten Wahlmännerstimmen (EVs) für jeden Swing State und das Rennen insgesamt berechnen:



Dabei werden jedoch die Umfragefehler nicht berücksichtigt, die sowohl 2016 als auch 2020 erheblich waren. Daher habe ich für diese beiden auch ①–③ durchgeführt. Die Wahlen davor berücksichtige ich nicht, da sich die Wahldynamik seit Trumps Auftritt erheblich verändert hat. Alte Regeln gelten nicht mehr. 2024 wird 2020 und 2016 viel ähnlicher sein als allen Wahlen davor. Der Umfragefehler für meine Methodik sieht folgendermaßen aus:



Gemäß der Regel „keep it simple“ gehen wir davon aus, dass der Umfragefehler im Jahr 2024 dem Durchschnitt der Jahre 2016/20 entspricht, wenden ihn auf die oben genannten Margen an und addieren zur Unsicherheit aus den Umfragen die Unsicherheit durch den Umfragefehler:



Und dies sind wiederum die erwarteten EVs basierend auf den Wahrscheinlichkeiten:



Nun könnte man argumentieren, dass die Meinungsforscher ihre Lektion gelernt haben und die Umfragen in diesem Jahr wieder genauer werden. Dies war jedoch bereits 2020 ein Argument. Außerdem scheint zumindest ein Teil des Problems darin zu liegen, dass bestimmte Trump-Anhänger aufgrund von Vertrauensproblemen einfach nicht mehr an Umfragen teilnehmen möchten (siehe z. B. https://www.cnbc.com/2024/05/04/why-election-polls-were-wrong-in-2016-and-2020-and-whats-changing.html ).


Natürlich versuchen Meinungsforscher zu lernen und sich anzupassen, aber ob sie in diesem Jahr weniger danebenliegen als bei den beiden Wahlen davor, werden wir erst am 5. November sehen. Ich berücksichtige vorerst auch keine Umfragefehler aus den Wahlen 2022. Dazu muss ich mich erst noch genauer einlesen und gehe davon aus, dass eine Präsidentschaftswahl anderen Präsidentschaftswahlen am ähnlichsten ist.


Für diesen ersten Versuch enthält meine eigene kleine Prognose eine Vorhersage, die ausschließlich auf gewichteten Umfragen von hochkarätigen Meinungsforschern basiert, und eine Vorhersage, die davon ausgeht, dass der Umfragefehler für 2024 dem Durchschnitt der Umfragefehler von 2016 und 2020 entsprechen wird.


Besuchen Sie gerne mein Github – wo ich alles sammle und archiviere – und sehen Sie sich die vollständigen Daten und Berechnungen in der neuesten Excel-Datei an: https://github.com/maxspeicher/2024-us-presidential-election/