Brunsten » Brownstone Journal » Regeringen » Val 2024: Analys och förutsägelser
Val 2024: Analys och förutsägelser

Val 2024: Analys och förutsägelser

DELA | SKRIV UT | E-POST

Beskrivning

Målet med detta modellprojekt var att förutsäga resultatet av valet 2024 med hjälp av folkhälsodata, demografiska och historiska data. Det unika tillvägagångssättet bygger på prediktorer som är en proxy för allmänhetens stöd för det demokratiska partiet inom en befolkning. I USA står vi inför ett binärt val, demokrat eller republikanskt, och vårt val avgörs av elektorsröster från varje stat. Därför var det förutspådda svarsmåttet helt enkelt segermarginalen inom en stat.

På grund av Electoral College, förutsäga valet är i huvudsak en fråga om att förutsäga en handfull stater. De flesta stater har en pålitlig historia av en stor segermarginal för den ena eller den andra, medan ett fåtal inte har det. Data och modell kommer att vara korrekta i den utsträckning de exakt förutsäger dessa tillstånd. På grund av den mindre urvalsstorleken för de senaste nationella valen och vikten av nya datapunkter i modellen, kommer den inte att kunna producera mycket exakta förutsägelser för stater med små segermarginaler. Därför kommer framgången för denna modell att bero på dess förmåga att upptäcka vilka svängande stater som kan ha mer stöd för demokrater (eller republikaner) än vad som för närvarande upptäcks i opinionsundersökningarna.

Bakgrund och antaganden

Under de två senaste presidentvalscyklerna har vi sett offentliga opinionsundersökningar misslyckas på stora sätt. Under 2016 misslyckades nästan alla större opinionsundersökningar och media att upptäcka graden av allmänhetens stöd bland demokrater och oberoende som ledde till Trumps seger i viktiga svängande stater och Rustbältet. År 2020 underskattade vallokalerna återigen Trumps stöd i nyckelstater. Sedan dess har förtroendet för medias förmåga att undersöka och komma fram till sanningen urholkats ytterligare.

Denna analys försöker hitta prediktorer som återspeglar ett mer exakt tillstånd av allmänhetens politiska preferenser som inte är föremål för svagheterna i opinionsundersökningsbranschens fördomar. På grund av Covid-19-pandemins hyperpolariserade karaktär och de tydligt tydliga linjerna där stödet för Covid-19-skottet föll, är det offentliga upptaget för varje års "nya" version av ett Covid-19-skott starkt korrelerat med stöd för det demokratiska partiet. Eftersom det finns ett nytt Covid-19-skott varje år, antas fortsatt upptag indikera demokratisk rösttrohet. Andra indikatorer, såsom inhemsk migration och begäranden om röstsedlar, är starkt korrelerade med demokratiskt stöd under de senaste fyra åren.

Dessutom har befolkningsdata från folkhälsokällor använts som kontrollerande eller prediktiva variabler, inklusive dödlighet, födelsetal och mental hälsa. Vissa demografiska och befolkningsmässiga dynamik är förknippade med mer republikanskt lutande stater och andra med demokratiskt lutande stater, och dessa relationer har hållit över tiden under senare tid. Andra åtgärder, som nettomigreringshastighet, har starka associationer, men de är nyare och påverkades av Covid-19-pandemin, under vilken många låsta blå stater såg en nettoförlust och röda öppna stater såg en nettovinst. Populariteten för det nu årliga Covid-19-skottet avtar år för år, och uppgifterna har justerats för att mäta relativ popularitet, med delstater med högre övergripande upptag än genomsnittet som återspeglar högre demokratiskt partistöd.

Sammantaget försöker denna analys kombinera både långsiktiga trender och nyare trender för att uppskatta den nuvarande nivån på stödet för det demokratiska partiet. Eftersom modellen måste tränas på data som endast gjorts tillgänglig under månaderna (Covid-Vax) och veckorna (förfrågningar om frånvarande omröstning) fram till valet, kommer den inte att kunna upptäcka några 11:e timmesskift.

Som George Box sa: "Alla modeller är fel, men vissa är användbara." Min förhoppning med denna analys är att det kan vara användbart att upptäcka signaler som kanske inte finns i traditionella valundersökningar. Förutom förutsägelser (vilket mest är för skojs skull) har jag inkluderat några swing state-analyser som jag tror kan kasta lite ljus över viktiga förändringar som har hänt under de senaste fyra åren.

Metoder

Eftersom förklarabarhet och tolkning är avgörande i valsammanhang har jag hållit mig till enkla modeller. Generaliserad linjär modellering, logistisk regression och Random Forest-modeller tränades alla på data från 2020-2022. Resultatet, eller svaret, var marginalen för det demokratiska partiets seger. För den logistiska modellen var det förutspådda svaret en binär vinst eller förlust för det tillståndet. Eftersom varje modell har sina egna styrkor och svagheter, tillsammans med sina egna felfrekvenser, kommer den slutliga klassificeringen av en vinst eller förlust att avgöras av majoriteten. Jag har laddat upp min kod och data till github, och alla är välkomna att kritisera, korrigera eller ge feedback.

Begränsningar

På grund av mitt beslut att använda Covid-19-skottupptagningen bland stater som en prediktor, begränsar detta tidslinjen och data som kan samlas in. På grund av detta förväntar jag mig att modellen kommer att ha en partiskhet mot demokraterna. Av 50 delstater föll fem inom intervallet för fel. Alla fem av dessa stater anses vara swing states. I kategoriseringssyfte kommer endast stater som tydligt faller utanför felen i mina modeller att kategoriseras som en vinst för den parten. De inom felintervallen kommer att kategoriseras som toss-ups.

Diskussion

Eftersom val i USA är ett binärt val, tittar analysen endast på demokrat kontra republikan och kan inte upptäcka förändringar i stödet för en kandidat bland väljare från det motsatta partiet. Detta avslöjar ett kärnantagande i modellen, att detta val fortfarande i första hand handlar om partitrohet gentemot den enskilda kandidaten.

För den demokratiska kandidaten Kamala Harris tror jag att detta antagande stämmer, eftersom hon inte valdes via folkomröstning under primärvalet, och mycket av kampanjen har handlat om att skapa en strategiskt utformad persona av en kvinna som tills nyligen till stor del hade ignorerats. , avfärdade och till och med hånade. Vi kan se att under de senaste månaderna har debatterna, mordförsöken och andra stora ögonblick helt enkelt inte haft någon större effekt på opinionsundersökningtrenderna.

För Donald Trump tror jag inte att detta antagande håller. Trumps välkända persona är dominerande och allestädes närvarande. Från hans presidentskap 2017-2021 och hans fortsatta strider med stämningar, mordförsök och mediabesatthet, säger Trumps vinst mycket mer om honom än det republikanska partiet. Det demokratiska partiet är en maskin, och det republikanska partiet stärkte bara motvilligt stödet för Trump efter år av stridigheter och splittring bland dess ledare.

Eftersom modellen använder data från både presidentvalet 2020 och senatsvalet 2022, är den utbildad för att modellera partistöd, och därmed dess inneboende svaghet. Den senaste opinionsundersökningen har skiftat till Trumps fördel, men har stora svängstater i döda lopp. För att hålla fast vid mina metoder och syftet med denna övning, ingår ingen av dessa uppgifter.

Swing State Analysis

Resultatet av valet kommer att bestämmas av en handfull stater. För närvarande räcker de täta tävlingarna i Arizona, Nevada, Wisconsin, Michigan, North Carolina, Georgia och Pennsylvania för att vända valet till någons fördel. Av dessa stater kategoriserade modellen Michigan och Pennsylvania som säkert svängande demokratiska. De återstående tillstånden var alla inom modellens felintervall och kategoriserades därför som toss-ups.

För att ge ett visuellt sammanhang för hur denna analys fungerar, här är några uppdelningar av några av prediktorerna för de tillstånd som allmänt anses vara svängtillstånd. 

Inhemska migrationshastigheter: 2019–2023*

Sammantaget finns det ett negativt samband mellan nettomigrationshastighet och demokratisk segermarginal. Under de senaste fyra åren har många blå stater tappat människor, medan röda stater har vunnit. För dessa svängstater är vissa "röda" med avseende på guvernörer och delstatsregering, och andra är "blå". Sammantaget är Pennsylvania och Michigan de enda två som har haft negativa migrationshastigheter under de senaste fyra åren.

In-omröstningsförfrågningar

Vissa stater, som Kalifornien, Colorado och Nevada, är "All Mail"-stater. Detta innebär att varje registrerad väljare får en pappersröst som standard. Med undantag för Utah (och möjligen Nevada) är nästan alla dessa stater blå stater och är helt blå. Nevada är den enda swing-staten som är en all-mail-stat, som du kan se att dess förfrågningar förblir oförändrade. Den allmänna trenden med de flesta andra utom Arizona är en minskning av post-i-omröstningsförfrågningar.

Årlig Covid-19-skottupptagning**

Eftersom modellen använder årlig Covid-shot-upptagning som en stark prediktor av det demokratiska partiets stöd, men den totala populariteten minskar, använder modellen relativa poäng för att jämföra varje stat med varandra under året. Bortsett från Wisconsin hade de återstående delstaterna något under genomsnittet Covid-19-skottupptagning under 2021**, 2022 och 2024. 

*Inhemska migrationshastigheter matchas från föregående år.
**Eftersom Covid-19-skotten inte var tillgängliga förrän 2021, parades 2021-data med valresultat för 2020. För 2022 och 2024 återspeglar data upptaget för det årets nya version.

För att få en känsla av hur viktiga prediktorerna är för modellen, rangordnar diagrammet nedan varje mått för hur mycket det påverkar en av modellens förutsägelser. Som du kan se rankas Covid-19-skottupptaget precis under "föregående demokratisk seger."

Resultat

Modellen har gjort att Harris säkert vinner 260 elektorsröster från de stater som den förutspår kommer att vara säkert demokratiska. Om Pennsylvania och Michigan faktiskt är i strid, då är bara 226 av dem säkert demokratiska.

Modellen har fått Trump att säkert vinna 219 elektorsröster från de stater som den förutspår kommer att vara säkert republikanska.

Swing-staterna Wisconsin, Georgia, North Carolina, Nevada och Arizona är alla aktuella och representerar 59 elektorsröster. Om Pennsylvania och Michigan är i mixen, är det 93 elektorsröster att vinna.

Harris's Path to Win

Harris väg till seger ser lättast ut. Med en högre startande valröst "i bagaget" kan hon samla en handfull svingstater. Pennsylvania och Michigan visas som vinster för henne i modellen, och om hon vinner dem behöver hon helt enkelt någon av Arizona, North Carolina, Wisconsin eller Georgia för att låsa den. Om hon vinner den ena eller den andra av Pennsylvania eller Michigan, måste hon ersätta förlusten med 1-2 ytterligare swingstater.

Trumps väg till seger

Det är viktigt att titta på Trumps väg med ett "allt kan hända"-tänkesätt. Han har överträffat förväntningarna i båda föregående valen. De flesta informationsportvakter, vanliga förståsigpåare och valundersökningsledare har tidigare missuppfattat det.

Med 219 i bagaget måste Trump ta varenda delstat Arizona, Georgia, North Carolina, Wisconsin och Nevada som kastas upp. Om Trump vinner Pennsylvania och/eller Michigan, blir hans väg lättare, vilket betyder att han fortfarande skulle behöva 2-3 av de återstående toss-ups.

Ta en titt på instrumentpanelen nedan. Interagera för att se hur någon av kandidaternas väg till seger genom att vinna utkasttillstånden, och se spridningsdiagram för förutsägelser mätt efter stat.

Mina personliga förutsägelser baserade på modellen

Jag har mer av en intuition om North Carolina och Georgia sedan jag tillbringar tid där, och jag kallar dem för Trump. Jag har inte den intuitionen för Arizona, Nevada eller Wisconsin. Så ta detta med en nypa salt. Men eftersom metoden är trogen, kallar min modell Pennsylvania och Michigan för Harris, och jag tror att hon kommer att ta minst 2-3 ytterligare swingstater. Jag hoppas att jag har fel.


Referenser: 

MIT vallab https://electionlab.mit.edu/data#data

USA Fakta https://usafacts.org/economy/

UF Vallab https://election.lab.ufl.edu/voter-turnout/

CDC https://data.cdc.gov/Vaccinations/Cumulative-Percentage-of-Adults-18-Years-and-Older/hm35-qkiu/about_data

Röstning och registrering i valet i november 2022 https://www.census.gov/data/tables/time-series/demo/voting-and-registration/p20-586.html

CDC https://data.cdc.gov/NCHS/Indicators-of-Anxiety-or-Depression-Based-on-Repor/8pt5-q6wp/about_data

CDC https://data.cdc.gov/Vaccinations/COVID-19-Vaccinations-in-the-United-States-Jurisdi/unsk-b7fc/about_data

CMS https://data.cms.gov/provider-data/dataset/avax-cv19

CDC https://www.cdc.gov/covidvaxview/weekly-dashboard/vaccine-administration-coverage-jurisdiction.html

Fem trettio åtta https://github.com/fivethirtyeight/election-results/blob/main/election_results_senate.csv

KFF Vaccinmonitor https://www.kff.org/coronavirus-covid-19/dashboard/kff-covid-19-vaccine-monitor-dashboard/

UF Vallab https://election.lab.ufl.edu/2024-presidential-nomination-contests-turnout-rates/

National Center for Health Statistics https://www.cdc.gov/nchs/data_access/VitalStatsOnline.htm CDC https://www.cdc.gov/nchs/data/vsrr/vsrr035.pdf Census.Gov https://www.census.gov/data/tables/time-series/demo/popest/2020s-state-total.htmlCDC https://www.cdc.gov/covidvaxview/interactive/adults.html

National Center for Health Statistics https://www.cdc.gov/nchs/fastats/state-and-territorial-data.htm

Folkräkning- Fattigdom https://www.census.gov/data/tables/time-series/demo/income-poverty/historical-poverty-people.html

Folkräkning- Befolkningsförändring efter stat https://www.census.gov/newsroom/press-kits/2023/national-state-population-estimates.html

USA:s valprojekt https://electproject.github.io/

Återpublicerad från författarens understapel



Publicerad under a Creative Commons Erkännande 4.0 Internationell licens
För omtryck, vänligen ställ tillbaka den kanoniska länken till originalet Brownstone Institute Artikel och författare.

Författare

  • Josh bor i Nashville Tennessee och är en datavisualiseringsexpert som fokuserar på att skapa lättförståeliga diagram och instrumentpaneler med data. Under hela pandemin har han tillhandahållit analyser för att stödja lokala förespråkargrupper för personligt lärande och andra rationella, datadrivna covid-policyer. Hans bakgrund är inom datasystemteknik & konsultation, och hans kandidatexamen är i ljudteknik. Hans arbete kan hittas på hans understack "Relevanta data."

    Visa alla inlägg

Donera idag

Ditt ekonomiska stöd från Brownstone Institute går till att stödja författare, advokater, vetenskapsmän, ekonomer och andra modiga människor som har blivit professionellt utrensade och fördrivna under vår tids omvälvning. Du kan hjälpa till att få fram sanningen genom deras pågående arbete.

Prenumerera på Brownstone för fler nyheter

Håll dig informerad med Brownstone Institute