Brunsten » Brownstone Journal » Sannolikhet men inte vetenskap har dominerat offentliga diskussioner om covid-pandemin
rimlighet inte vetenskap

Sannolikhet men inte vetenskap har dominerat offentliga diskussioner om covid-pandemin

DELA | SKRIV UT | E-POST

"Attacker på mig, ärligt talat, är attacker på vetenskap.” ~ Anthony Fauci, 9 juni 2021 (MSNBC).

Orimlig.

För det första har Dr. Fauci inte rapporterat korrekt om vetenskapliga frågor under hela Covid-19-pandemin. För en annan är vetenskapens väsentliga dialektik att argumentera, ifrågasätta, debattera. Utan debatt är vetenskap inget annat än propaganda. 

Ändå kan man fråga sig, hur har det varit möjligt att presentera tekniskt material för den amerikanska allmänheten, om inte för den internationella allmänheten, i nästan tre år och uppnå en allmän förståelse för att frågorna var "vetenskapliga", när de i själva verket inte var det. ? Jag hävdar att det som har matats till dessa allmänheter genom de traditionella medierna under pandemins gång till stor del har varit rimlighet, men inte vetenskap, och att både den amerikanska och internationella allmänheten, såväl som de flesta läkare och vetenskapsmän själva, inte kan säga skillnaden. Men skillnaden är grundläggande och djupgående.

Vetenskapen börjar med teorier, hypoteser, som har undersökbara empiriska förgreningar. Ändå är dessa teorier inte vetenskap; de motivera vetenskap. Vetenskap uppstår när individer gör experiment eller gör observationer som har betydelse för teoriernas implikationer eller konsekvenser. Dessa fynd tenderar att stödja eller motbevisa teorierna, som sedan modifieras eller uppdateras för att anpassa sig till de nya observationerna eller förkastas om övertygande bevis visar att de misslyckas med att beskriva naturen. Cykeln upprepas sedan. Vetenskap är utförandet av empiriskt eller observationsarbete för att få bevis som bekräftar eller vederlägger teorier.

I allmänhet tenderar teorier att vara rimliga påståenden som beskriver något specifikt om hur naturen fungerar. Sannolikhet ligger i betraktarens öga, eftersom det som är rimligt för en tekniskt kunnig expert kanske inte är rimligt för en lekman. Till exempel – kanske alltför förenklat – var heliocentrism inte rimligt innan Nicolaus Copernicus publicerade sin teori 1543, och det var inte särskilt troligt efteråt under ganska lång tid, tills Johannes Kepler förstod att astronomiska mätningar gjorda av Tycho Brahe föreslog att förfina de kopernikanska cirkulära banorna till ellipser , liksom att matematiska regler verkade styra planetrörelserna längs dessa ellipser – men skälen till dessa matematiska regler, även om de var bra beskrivningar av rörelserna, var inte rimliga förrän Isaac Newton 1687 ansåg existensen av en universell gravitation kraft mellan massor, tillsammans med en massproportionell, omvänd kvadratisk avståndslag som styr storleken på gravitationsattraktionen, och observerade ett flertal kvantitativa fenomen som överensstämmer med och stöder denna teori.

För oss idag tänker vi knappast på rimligheten av elliptiska heliocentriska solsystembanor, eftersom observationsdata som sträcker sig över 335 år har varit mycket överensstämmande med den teorin. Men vi kan undvika att tro att det är rimligt att ljus färdas samtidigt som både partiklar och vågor, och att göra mätningar på ljuset, vad vi gör som observatörer, avgör om vi ser partikelbeteende eller vågbeteende, och vi kan välja att observera antingen partiklar eller vågor, men inte båda samtidigt. Naturen är inte nödvändigtvis rimlig.

Men ändå, rimliga teorier är lätta att tro, och det är det som är problemet. Det är vad vi har fått mat under nästan tre år av Covid-19-pandemin. Faktum är att vi har matats med rimlighet istället för vetenskap mycket längre.

Cargo-Cult Science

Charlataner som utgav sig för att böja skedar med sina sinnen, eller påstå sig studera obekräftad, irreplicerad "extrasensorisk uppfattning" var mycket populära på 1960- och 1970-talen. Konstiga övertygelser om vad "vetenskap" kunde fastställa nådde en sådan nivå att nobelpristagaren i fysik Richard Feynman höll Caltechs starttal 1974 (Feynman, 1974) och beklagade sådana irrationella övertygelser. Hans kommentarer var inte riktade till allmänheten, utan till examen Caltech-studenter, av vilka många var avsedda att bli akademiska vetenskapsmän.

I sitt tal beskrev Feynman hur söderhavsöborna efter andra världskriget efterliknade amerikanska soldater som var stationerade där under kriget och som hade väglett flygplanslandningar av förnödenheter. Öborna, med hjälp av lokalt material, återgav formen och beteendet av vad de hade sett av de amerikanska GI:erna, men inga förnödenheter kom.

I vårt sammanhang skulle Feynmans poäng vara att tills en teori har objektiva empiriska bevis för sig, så förblir den bara en teori hur trolig den än kan verka för alla som underhåller den. Öborna saknade det avgörande faktum att de inte förstod hur försörjningssystemet fungerade, trots hur troligt deras reproduktion av det var för dem. Att Feynman kände sig tvungen att varna utexaminerade Caltech-studenter för skillnaden mellan plausibilitet och vetenskap, vilket antydde att denna skillnad inte var tillräckligt lärd i deras institututbildningar. Det lärdes inte uttryckligen ut när den här författaren var en student där under dessa år, men på något sätt förväntades vi ha lärt oss det "genom osmos".

Evidensbaserad medicin

Det finns kanske ingen större sannolikhetsbiff idag än "evidensbaserad medicin” (EBM). Denna term myntades av Gordon Guyatt 1990, efter att hans första försök, "Scientific Medicine", misslyckades med att få acceptans föregående år. Som universitetsepidemiolog 1991 blev jag förolämpad av hybris och okunskap i användningen av denna term, EBM, som om medicinska bevis på något sätt var "ovetenskapliga" tills det utropades en ny disciplin med nya regler för bevis. Jag var inte ensam om att kritisera EBM (Sackett et al., 1996), även om mycket av det negativa svaret verkar ha varit baserat på förlust av narrativ kontroll snarare än på objektiv granskning av vad medicinsk forskning faktiskt hade åstadkommit utan "EBM."

Västerländsk medicinsk kunskap har vuxit fram i tusentals år. I den hebreiska bibeln (21 Mosebok 19:XNUMX), "När två parter bråkar och den ena slår den andra ... skall offret bli helt botat" [min översättning] vilket antyder att det fanns individer som hade typer av medicinsk kunskap och att någon grad av inneboende effektivitet. Hippokrates, på femte-fjärde århundradet f.Kr., föreslog att sjukdomsutveckling kanske inte var slumpmässig utan relaterad till exponeringar från miljön eller till vissa beteenden. På den tiden fanns det gott om vad vi idag skulle betrakta som motexempel till god medicinsk praxis. Ändå var det en början, att tänka på rationella bevis för medicinsk kunskap.

James Lind (1716-1794) förespråkade skydd av skörbjugg genom att äta citrus. Denna behandling var känd för de gamla, och hade i synnerhet tidigare rekommenderats av den engelske militärkirurgen John Woodall (1570-1643) - men Woodall ignorerades. Lind får äran för att han 1747 genomförde en liten men framgångsrik ickerandomiserad, kontrollerad prövning av apelsiner och citroner mot andra substanser bland 12 skörbjuggspatienter.

Under 1800-talet utvecklades Edward Jenners användning av kokoppor som smittkoppsvaccin genom att odlas i andra djur och användes allmänt vid utbrott, så att vid tiden för 1905 års högsta domstolsfall av Jacobson mot Massachusetts, kan chefsdomaren hävda att smittkoppsvaccination var överens om av medicinska myndigheter att vara ett allmänt accepterat förfarande. Medicinska tidskrifter startade regelbundna publikationer även på 1800-talet. Till exempel Lansetten började publiceras 1824. Tilltagande medicinsk kunskap började delas och diskuteras mer allmänt och brett.

Snabbspolning framåt till 1900-talet. 1914-15 genomförde Joseph Goldberger (1915) en icke-randomiserad kostinterventionsförsök som drog slutsatsen att pellagra orsakades av brist på niacin i kosten. På 1920-talet utvecklades vacciner mot difteri, pertussis, tuberkulos och stelkramp. Insulin extraherades. Vitaminer, inklusive D-vitamin för att förebygga rakitis, utvecklades. På 1930-talet började antibiotika skapas och användas effektivt. På 1940-talet utvecklades acetaminophen, liksom kemoterapier, och konjugerat östrogen började användas för att behandla klimakteriets värmevallningar. Effektiva nya mediciner, vacciner och medicintekniska produkter växte exponentiellt i antal under 1950- och 1960-talen. Allt utan EBM.

År 1996, som svar på kritik av EBM, David Sackett et al. (1996) försökte förklara dess övergripande principer. Sackett hävdade att EBM följde av "Bra läkare använder både individuell klinisk expertis och bästa tillgängliga externa bevis." Detta är en anodyn plausibilitetsimplikation, men båda komponenterna är i grunden felaktiga eller åtminstone missvisande. Genom att formulera denna definition i termer av vad enskilda läkare borde göra, menade Sackett att enskilda läkare skulle använda sina egna kliniska observationer och erfarenheter. Den allmänna bevismässiga representativiteten för en individs kliniska erfarenhet torde dock vara svag. Precis som andra former av evidens behöver klinisk evidens systematiskt samlas in, granskas och analyseras, för att bilda en syntes av kliniska resonemang, som sedan skulle tillhandahålla den kliniska komponenten av vetenskapliga medicinska bevis.

Ett större misslyckande i bevisresonemang är Sacketts uttalande att man bör använda "bästa tillgängliga externa bevis" snarare än alla giltiga externa bevis. Bedömningar om vad som utgör "bästa" bevis är mycket subjektiva och ger inte nödvändigtvis övergripande resultat som är kvantitativt mest exakta och exakta (Hartling et al., 2013; Bae, 2016). När Sir Austin Bradford Hill (1965) formulerade sina nu kanoniska "aspekter" av bevismässiga orsaksresonemang, inkluderade inte Sir Austin Bradford Hill (XNUMX) en aspekt av vad som skulle utgöra "bästa" bevis, och han föreslog inte heller att studier skulle mätas eller kategoriseras för "studiekvalitet". ” och inte ens att vissa typer av studiedesign kan vara i sig bättre än andra. I den Referenshandbok om vetenskapliga bevisMargaret Berger (2011) säger uttryckligen, "... många av de mest välrespekterade och prestigefyllda vetenskapliga organen (såsom International Agency for Research on Cancer (IARC), Institute of Medicine, National Research Council och National Institute för miljöhälsovetenskaper) överväga alla relevanta tillgängliga vetenskapliga bevis, som helhet, för att avgöra vilken slutsats eller hypotes angående ett orsakspåstående som bäst stöds av bevismaterialet." Detta är exakt Hills tillvägagångssätt; hans aspekter av kausala resonemang har använts mycket flitigt i mer än 50 år för att resonera från observation till orsakssamband, både inom vetenskap och juridik. Att EBM bygger på subjektivt "bästa" bevis är en rimlig metod men inte en vetenskaplig.

Med tiden verkar EBM:s tillvägagångssätt för att selektivt överväga "bästa" bevis ha "fördummats", först genom att placera randomiserade kontrollerade studier (RCT) överst i en pyramid av alla studiedesigner som den förmodade "guldstandard"-designen, och senare, som den påstådda enda typen av studie som man kan lita på för att få opartiska uppskattningar av effekter. Alla andra former av empiriska bevis är "potentiellt partiska" och därför opålitliga. Detta är en sannolikhet som jag kommer att visa nedan.

Men det är så troligt att det rutinmässigt lärs ut i modern medicinsk utbildning, så att de flesta läkare bara överväger RCT-bevis och avfärdar alla andra former av empiri. Det är så troligt att den här författaren hade en verbal strid i luften om det med en medicinskt outbildad tv-kommentator som inte gav några andra bevis än rimlighet (Whelan, 2020): Är det inte "bara uppenbart" att om man slumpmässigt slumpar ämnen, skillnader måste orsakas av behandlingen, och inga andra typer av studier går att lita på? Självklart, ja; sant, nej.

Vem drar nytta av ett enda, tvångsmässigt fokus på RCT-bevis? RCT är mycket dyra att genomföra om de ska vara epidemiologiskt giltiga och statistiskt adekvata. De kan kosta miljoner eller tiotals miljoner dollar, vilket begränsar deras dragningskraft till stor del till företag som marknadsför medicinska produkter som sannolikt kommer att inbringa vinster som är betydligt större än dessa kostnader. Historiskt sett gav läkemedelskontroll och manipulation av RCT-bevis i regleringsprocessen ett enormt uppsving i förmågan att driva ut produkter genom regulatoriskt godkännande på marknaden, och motivationen att göra detta fortsätter än idag.

Detta problem erkändes av kongressen, som antog Food and Drug Administration Modernization Act från 1997 (FDAMA) som år 2000 fastställde ClinicalTrials.gov webbplats för registrering av alla kliniska prövningar som utförs under nya läkemedelsansökningar för att undersöka effektiviteten av experimentella läkemedel för patienter med allvarliga eller livshotande tillstånd (National Library of Medicine, 2021). Av relaterade skäl som involverar intressekonflikter i kliniska prövningar, webbplatsen ProPublica "Dollars for Docs" (Tigas et al., 2019) som täcker läkemedelsföretags betalningar till läkare under åren 2009-2018 och webbplatsen OpenPayments (Centers for Medicare & Medicaid Services , 2022) som omfattar betalningar från 2013 till 2021 upprättades och gjordes offentligt sökbara. Dessa informationssystem skapades eftersom "sannolikheten" att randomisering automatiskt gör studieresultaten korrekta och opartiska ansågs vara otillräcklig för att klara av forskningschanery och olämpliga motiv för utredares intressekonflikt.

Även om dessa försök att reformera eller begränsa medicinsk forskningskorruption har hjälpt, kvarstår felaktig framställning av bevis under sken av EBM. Ett av de värsta exemplen var en tidning som publicerades i New England Journal of Medicine 13 februari 2020, i början av Covid-19-pandemin, med titeln "The Magic of Randomization versus the Myth of Real-World Evidence", av fyra välkända brittiska medicinska statistiker som har betydande band till läkemedelsföretag (Collins et al. ., 2020). Den skrevs troligen i januari 2020, innan de flesta visste att pandemin var på väg. Denna artikel hävdar att randomisering automatiskt skapar starka studier, och att alla icke-randomiserade studier är bevisskräp. När jag läste den kände jag att den var en avjämning mot hela min disciplin, epidemiologi. Jag blev direkt kränkt av det, men jag förstod senare författarnas allvarliga intressekonflikter. Att representera att endast mycket oöverkomliga RCT-bevis är lämpliga för regulatoriska godkännanden ger ett verktyg för läkemedelsföretag att skydda sina dyra, mycket lönsamma patentprodukter mot konkurrens med effektiva och billiga off-label godkända generiska läkemedel vars tillverkare inte skulle ha råd med storskaliga RCT:er.

randomisering

Så, vad är felet med randomisering som jag har hänvisat till, som kräver en djupare undersökning för att förstå den relativa giltigheten av RCT-studier kontra andra studiedesigner? Problemet ligger i förståelsen av confounding. Confounding är en epidemiologisk omständighet där ett samband mellan en exponering och ett utfall inte beror på exponeringen, utan på en tredje faktor (confounderen), åtminstone delvis. Konfoundern är på något sätt associerad med exponeringen men är inte ett resultat av exponeringen.

I sådana fall beror det skenbara exponerings-utfall-förhållandet verkligen på konfounder-utfall-förhållandet. Till exempel kan en studie av alkoholkonsumtion och cancerrisk potentiellt förväxlas av rökhistoria som korrelerar med alkoholanvändning (och inte orsakas av alkoholanvändning) men som verkligen driver den ökade cancerrisken. En enkel analys av risken för alkohol och cancer, ignorera rökning, skulle visa ett förhållande. Men när effekten av rökning kontrollerades eller justerades, skulle alkoholsambandet med cancerrisk minska eller försvinna.

Syftet med randomisering, att balansera allt mellan behandlings- och kontrollgruppen, är att ta bort potentiell förvirring. Finns det något annat sätt att ta bort potentiell förvirring? Ja: mät faktorerna i fråga och justera eller kontrollera för dem i statistiska analyser. Det är således uppenbart att randomisering har exakt en möjlig fördel som inte är tillgänglig för icke-randomiserade studier: kontrollen av unuppmätta confounders. Om biologiska, medicinska eller epidemiologiska samband är ofullständigt förstått om ett resultat av intresse, kan inte alla relevanta faktorer mätas, och vissa av dessa omättade faktorer kan fortfarande förvirra en intresseassociation.

Alltså randomisering, i teorin, tar bort potentiell förvirring av omätade faktorer som en förklaring till en observerad association. Det är rimlighetsargumentet. Frågan gäller dock hur väl randomisering fungerar i verkligheten, och vem som exakt behöver balanseras av randomiseringen. Kliniska prövningar tillämpar randomisering på alla deltagande försökspersoner för att fastställa behandlingsgruppsuppgifter. Om individer i studiens utfallshändelse utgör en delmängd av den totala studien, måste dessa utfallspersoner också balanseras i sina potentiella confounders. Till exempel, om alla dödsfall i behandlingsgruppen är män och alla i placebogruppen är kvinnor, så förväxlar sannolikt kön effekten av behandlingen. 

Problemet är att RCT-studier i princip aldrig explicit visar adekvat randomisering av deras resultatämnen, och vad de utger sig för att visa av randomisering för deras totala behandlingsgrupper är nästan alltid vetenskapligt irrelevant. Detta problem uppstår sannolikt eftersom de individer som utför RCT-studier, och de granskare och tidskriftsredaktörer som överväger deras papper, inte tillräckligt förstår epidemiologiska principer.

I de flesta RCT-publikationer tillhandahåller utredarna en lättillgänglig initial beskrivande tabell över behandlings- och placebogrupperna (som kolumner), kontra olika uppmätta faktorer (som rader). Det vill säga de procentuella fördelningarna av behandlings- och placebopatienter efter kön, åldersgrupp, ras/etnicitet etc. Den tredje kolumnen i dessa tabeller är vanligtvis p-värdesstatistiken för frekvensskillnaden mellan behandlings- och placebopatienterna på varje uppmätt faktor. Löst sett uppskattar denna statistik en sannolikhet för att en så stor frekvensskillnad mellan behandling och placebopatienter kunde ha uppstått av en slump. Med tanke på att försökspersonerna tilldelades sina behandlingsgrupper helt av en slump är statistisk undersökning av randomiseringsprocessen tautologisk och irrelevant. Att i vissa RCT:er kan vissa faktorer tyckas vara mer extrema än slumpen skulle tillåta under randomisering beror bara på att flera faktorer längst ner i raderna har undersökts för fördelningsskillnader och under sådana omständigheter måste statistisk kontroll av flera jämförelser åberopas.

Vad som behövs i den tredje kolumnen i den beskrivande RCT-tabellen är inte p-värde, utan ett mått på storleken på förväxling av den specifika radfaktorn. Förvirring mäts inte av hur det uppstod, utan av hur illa det är. Enligt min erfarenhet som karriärepidemiolog är det bästa enstaka måttet på confounding den procentuella förändringen i storleken av behandlings-resultatförhållandet med vs utan justering för confounderen. Så om till exempel med justering för kön, behandling minskar dödligheten med 25 % (relativ risk = 0.75), men utan justering minskar den med 50 %, då skulle storleken av förväxling efter kön vara (0.75 – 0.50)/0.75 = 33 %. Epidemiologer överväger i allmänhet mer än en 10-procentig förändring med sådan justering för att antyda att förvirring är närvarande och måste kontrolleras.

Som jag har observerat ger de flesta RCT-publikationer inte omfattningen av förvirrande uppskattningar för deras övergripande behandlingsgrupper, och aldrig för deras resultatämnen. Så det är inte möjligt att säga att utfallsämnena har randomiserats tillräckligt för alla faktorer som anges i uppsatsens beskrivande tabell. Men det potentiella fatala felet med RCT-studier, det som inte kan göra dem bättre än icke-randomiserade studier och i vissa fall värre, är att randomisering bara fungerar när ett stort antal försökspersoner har randomiserats (Deaton och Cartwright, 2018), och detta gäller specifikt för utfallsämnena, inte bara till den totala studien. 

Överväg att vända ett mynt tio gånger. Det kan komma upp minst sju huvuden och tre svansar, eller vice versa, lätt av en slump (34%). Men storleken på denna skillnad, 7/3 = 2.33, är potentiellt ganska stor när det gäller möjlig förvirring. Å andra sidan skulle förekomst av samma magnitud på 2.33 från 70 eller fler huvuden av 100 vändningar vara sällsynt, p=.000078. För att randomisering ska fungera måste det finnas ett betydande antal utfallshändelser i både behandlings- och placebogruppen, säg 50 eller fler i varje grupp. Detta är den outtalade potentiella stora bristen i RCT-studier som gör deras rimlighetsargument värdelösa, eftersom RCT-studier i allmänhet är utformade för att ha tillräckligt med statistisk kraft för att hitta statistisk signifikans av deras primära resultat om behandlingen fungerar som förutspått, men inte utformade för att ha tillräckligt med resultat ämnen för att minska potentiell förvirring till mindre än 10 % säger.

Ett viktigt exempel på detta problem kan ses i det första publicerade effektivitets-RCT-resultatet för Pfizer BNT162b2 mRNA Covid-19-vaccinet (Polack et al., 2020). Denna studie ansågs tillräckligt stor (43,548 19 randomiserade deltagare) och tillräckligt viktig (Covid-XNUMX) för att den på grund av sin antagna RCT-plausibilitet säkrade publicering i den "prestigefyllda" New England Journal of Medicine. Det primära resultatet av studien var förekomsten av Covid-19 med debut minst sju dagar efter den andra dosen av vaccinet eller placeboinjektionen. Men medan den observerade 162 fall bland placebo-personerna, tillräckligt för bra randomisering, fann den bara åtta fall bland vaccin-personerna, långt ifrån tillräckligt för att randomisering skulle ha gjort något för att kontrollera confounding. 

Från allmän epidemiologisk erfarenhet skulle en uppskattad relativ risk som är så här stor (ungefär 162/8 = 20) sannolikt inte helt bero på förvirring, men riktigheten av den relativa risken eller dess implicita effektivitet ((20 – 1)/20 = 95 %) är tveksam. Att detta vaccin i användning inte observerades vara så effektivt för att minska infektionsrisken är inte förvånande med tanke på studieresultatets svaghet på grund av otillräcklig urvalsstorlek för att säkerställa att randomisering fungerade för utfallspersonerna i både behandlings- och placebogruppen.

Denna "dyka in i epidemiologins ogräs" belyser varför en RCT-studie med färre än, låt oss säga, 50 utfallspersoner i varje behandlingsarm av studien har små eller inga anspråk på att undvika eventuell förvirring av omättade faktorer. Men det visar också varför en sådan rättegång kan vara sämre än en icke-randomiserad kontrollerad studie med samma exponering och resultat. I icke-randomiserade studier vet utredarna att många faktorer, som möjliga störande faktorer, kan påverka uppkomsten av resultatet, så de mäter allt de tycker är relevant, för att sedan justera och kontrollera för dessa faktorer i de statistiska analyserna. 

Men i RCT:er tror forskare rutinmässigt att randomiseringen har varit framgångsrik och utför därför ojusterade statistiska analyser, vilket ger potentiellt förvirrade resultat. När du ser RCT:er paraderade som "stora" studier på grund av deras tiotusentals deltagare, se förbi det, till antalet primära resultathändelser i försökets behandlingsarm. Försök med ett litet antal primära utfallshändelser är värdelösa och bör inte publiceras, än mindre förlita sig på folkhälso- eller policyöverväganden.

Empiriska bevis

Efter att ha läst allt det föregående kanske du tror att dessa argument om randomiserade vs icke-randomiserade studier är mycket rimliga, men hur är det med empiriska bevis som stöder dem? För det har en mycket grundlig analys utförts av Cochrane Library Database of Systematic Reviews (Anglemyer et al., 2014). Denna studie sökte omfattande sju elektroniska publikationsdatabaser för perioden från januari 1990 till december 2013 för att identifiera alla systematiska översiktsdokument som jämförde "kvantitativa effektstorleksuppskattningar som mäter effektivitet eller effektivitet av interventioner som testats i [randomiserade] studier med de som testats i observationsstudier. ” I själva verket en metaanalys av metaanalyser, analysen inkluderade många tusentals individuella studiejämförelser sammanfattade i 14 översiktsartiklar. 

Summan av kardemumman: en genomsnittlig skillnad på endast 8 % (95 % konfidensgränser, −4 % till 22 %, inte statistiskt signifikant) mellan RCT:erna och deras motsvarande icke-randomiserade prövningsresultat. Sammanfattningsvis visar denna kunskapsmassa – den empiriska såväl som den som baseras på epidemiologiska principer – att, i motsats till så kallad ”plausibilitet”, randomiserade prövningar inte har någon automatisk rangordning som en guldstandard för medicinska bevis eller som den enda acceptabla formen av medicinska bevis, och att varje studie måste granskas kritiskt och objektivt för sina egna styrkor och svagheter, och för hur mycket dessa styrkor och svagheter spelar roll för de slutsatser som dras.

Andra rimligheter

Under Covid-19-pandemin har många andra påståenden om vetenskapliga bevis använts för att motivera folkhälsopolitiken, inklusive själva tillkännagivandet av själva pandeminkrisen. Bakom många av dessa har legat den rimliga men felaktiga principen att målet med pandemihanteringen för folkhälsan är att minimera antalet personer som smittas av SARS-CoV-2-viruset. 

Den policyn kan tyckas självklar, men den är fel som en generell policy. Det som måste minimeras är de skadliga konsekvenserna av pandemin. Om infektion leder till obehagliga eller irriterande symtom för de flesta människor men inga allvarliga eller långvariga problem – som i allmänhet är fallet med SARS-CoV-2, särskilt i Omicron-eran – så skulle det inte finnas någon påtaglig fördel med allmän folkhälsa ingripanden och begränsningar som kränker sådana individers naturliga eller ekonomiska rättigheter och orsakar skada i sig själva. 

Västerländska samhällen, inklusive USA, tar årliga luftvägsinfektionsvågor med ro utan deklarerade pandemiska nödsituationer, trots att de producerar miljontals infekterade individer varje år, eftersom konsekvenserna av infektion anses generellt sett vara medicinskt mindre, till och med medger några tiotusentals dödsfall årligen. 

Det konstaterades under de första månaderna av Covid-19-pandemin att risken för infektionsdödlighet varierade med mer än 1,000 XNUMX gånger över åldersspannet och att personer utan kroniska hälsotillstånd som diabetes, fetma, hjärtsjukdomar, njursjukdomar, cancerhistoria etc. löpte försumbar risk för dödlighet och mycket låg risk för sjukhusvistelse. Vid den tidpunkten var det enkelt att definiera kategorier av högriskindivider som i genomsnitt skulle dra nytta av folkhälsointerventioner, jämfört med lågriskindivider som framgångsrikt skulle klara infektionen utan märkbara eller långsiktiga problem. Således var ett tvångsmässigt, enstaka pandemihanteringssystem som inte särskiljde riskkategorier orimligt och förtryckande från början.

Följaktligen har åtgärder som främjats av rimligheten för att minska smittspridningen, även om de varit effektiva för detta ändamål, inte tjänat bra pandemihantering. Dessa åtgärder motiverades dock aldrig av vetenskapliga bevis i första hand. Sexfotsregeln om social distansering var ett godtyckligt hopkok av CDC (Dangor, 2021). Påståenden om fördelar för bärande av ansiktsmasker har sällan särskiljt potentiell nytta för bäraren – för vilken sådan bärande skulle vara ett personligt val om man vill acceptera mer teoretisk risk eller inte – jämfört med fördelar för åskådare, så kallad "källkontroll", där offentliga hälsoöverväganden kan vara tillämpliga. Studier av maskbaserad källkontroll för luftvägsvirus, där studierna är utan dödliga brister, har inte visat någon nämnvärd nytta för att minska infektionsöverföringen (Alexander, 2021; Alexander, 2022; Burns, 2022).

Allmänna befolkningsnedstängningar har aldrig använts i västländer och har inga bevis på effekt för att göra något annat än att skjuta upp det oundvikliga (Meunier, 2020), vilket Australiens befolkningsdata klargör (Worldometer, 2022). I den definitiva diskussionen om folkhälsoåtgärder för kontroll av pandemisk influensa (Inglesby et al., 2006), säger författarna, "Det finns inga historiska observationer eller vetenskapliga studier som stöder instängning i karantän av grupper av möjligen infekterade människor under längre perioder för att bromsa spridningen av influensa. En skribentgrupp från Världshälsoorganisationen (WHO) drog, efter att ha granskat litteraturen och beaktat samtida internationella erfarenheter, slutsatsen att "påtvingad isolering och karantän är ineffektiva och opraktiska." … De negativa konsekvenserna av storskalig karantän är så extrema (påtvingad instängning av sjuka människor i brunnen; fullständig begränsning av rörelser för stora befolkningsgrupper; svårigheter att få fram viktiga förnödenheter, mediciner och mat till människor i karantänszonen) att denna begränsning åtgärd bör elimineras från seriöst övervägande."

Om reserestriktioner har Inglesby et al. (2006) noterar, "Resestriktioner, såsom att stänga flygplatser och kontrollera resenärer vid gränser, har historiskt sett varit ineffektiva. World Health Organization Writing Group drog slutsatsen att "screening och karantän för inresa till resenärer vid internationella gränser inte avsevärt försenade virusintroduktionen i tidigare pandemier ... och kommer sannolikt att vara ännu mindre effektiva i den moderna eran." Om skolnedläggningar (Inglesby et al. 2006): "I tidigare influensaepidemier har inverkan av skolstängningar på sjuktalen varit blandad. En studie från Israel rapporterade en minskning av luftvägsinfektioner efter en 2-veckors lärarstrejk, men minskningen var bara uppenbar för en enda dag. Å andra sidan, när skolorna stängde för en vinterlov under pandemin 1918 i Chicago, "uppstod fler influensafall bland elever ... än när skolorna var i session."

Den här diskussionen klargör att dessa åtgärder som påstås ha stört virusöverföringen på grundval av rimlighetsargument för deras effektivitet både har varit missriktade för att hantera pandemin och ogrundade av vetenskapliga bevis på effektivitet för att minska spridningen. Deras storskaliga marknadsföring har visat misslyckandet med folkhälsopolitiken under Covid-19-eran.

Plausibilitet vs dålig vetenskap

Ett argument skulle kunna föras om att olika folkhälsopolitiker såväl som information som gjorts tillgänglig för allmänheten inte har stöds av rimlighet utan istället av dålig eller dödligt felaktig vetenskap, som utger sig för att vara verklig vetenskap. Till exempel, i sin interna, icke-referentgranskade tidskrift, Veckorapporter för sjuklighet och dödlighet, har CDC publicerat ett antal analyser av vaccinets effektivitet. Dessa rapporter beskrev tvärsnittsstudier men analyserade dem som om de vore fall-kontrollstudier, systematiskt med hjälp av skattade oddskvotparametrar istället för relativa risker för att beräkna vaccinets effektivitet. När studieresultaten är sällsynta, säg färre än 10 % av försökspersonerna, kan oddskvoter approximera relativa risker, men annars tenderar oddskvoterna att vara överskattade. I tvärsnittsstudier kan emellertid relativa risker beräknas direkt och kan justeras för potentiella störande faktorer genom relativ riskregression (Wacholder, 1986), liknande användningen av logistisk regression i fall-kontrollstudier.

Ett representativt exempel är en studie av effektiviteten av tredjedos Covid-19-vacciner (Tenforde et al., 2022). I denna studie, "... IVY-nätverket registrerade 4,094 18 vuxna i åldern ≥2,952 år," och efter relevanta uteslutningar av försökspersoner, "inkluderades 1,385 1,567 sjukhusvårdade patienter (19 82 fallpatienter och 1 0.82 icke-COVID-0.18-kontroller)." Tvärsnittsstudier – genom design – identifierar det totala antalet försökspersoner, medan antalet fall och kontroller, och exponerade och oexponerade, sker utanför utredarens ingripande, det vill säga av de naturliga processer som ligger bakom de medicinska, biologiska och epidemiologiska mekanismerna som undersöks. Genom att välja ett totalt antal ämnen kan Tenforde et al. studien är per definition en tvärsnittsdesign. Denna studie rapporterade en vaccineffektivitet på 31 % bland patienter utan immunkomprometterande tillstånd. Denna uppskattning återspeglar en justerad oddskvot på 70 – 3 = 0.45. Emellertid var andelen fallpatienter bland de vaccinerade 0.43 % och bland de ovaccinerade var 1 %, vilket inte är tillräckligt sällan för att tillåta användning av approximationen av oddskvoten för att beräkna vaccinets effektivitet. Med siffrorna i studierapporten Tabell 0.43 beräknar jag en ojusterad relativ risk på 57 och en ungefärlig justerad relativ risk på 82, vilket ger den verkliga vaccineffektiviteten på XNUMX – XNUMX = XNUMX %, vilket är väsentligt annorlunda och mycket sämre än de XNUMX %. presenteras i tidningen.

I ett annat sammanhang, efter att jag publicerat en sammanfattande översiktsartikel om användningen av hydroxiklorokin (HCQ) för tidig poliklinisk covid-19-behandling (Risch, 2020), publicerades ett antal artiklar om kliniska prövningar i ett försök att visa att HCQ är ineffektivt . Den första av dessa så kallade ”vederläggningar” utfördes hos inlagda patienter, vars sjukdom är nästan helt annorlunda i patofysiologi och behandling än tidig poliklinisk sjukdom (Park et al., 2020). De viktiga resultat som jag hade tagit upp i min granskning, risker för sjukhusvistelse och dödlighet, distraherades i dessa arbeten av fokus på subjektiva och mindre utfall såsom varaktighet av viral testpositivitet eller längd på sjukhusvistelse.

Därefter började RCTs av öppen HCQ-användning att publiceras. En typisk sådan är den av Caleb Skipper et al. (2020). Det primära effektmåttet för denna prövning var en förändring av den totala självrapporterade symtomens svårighetsgrad under 14 dagar. Detta subjektiva effektmått var av ringa pandemivikt, särskilt med tanke på att försökspersonerna i studier av denna forskargrupp var måttligt förmögna att avgöra om de var i studiens HCQ- eller placeboarm (Rajasingham et al., 2021) och därmed själv- rapporterade utfall var inte så blinda för medicinarmarna. Från sina statistiska analyser drog författarna på lämpligt sätt slutsatsen att "Hydroxyklorokin inte avsevärt minskade symtomens svårighetsgrad hos polikliniska patienter med tidig, mild COVID-19." Men de allmänna medierna rapporterade denna studie som visar att "hydroxiklorokin inte fungerar." Till exempel Jen Christensen (2020) i CNN Health uttalade om denna studie, "Det malariamedicinska läkemedlet hydroxiklorokin gynnade inte icke-inlagda patienter med milda Covid-19-symtom som behandlades tidigt i sin infektion, enligt en studie som publicerades på torsdagen i den medicinska tidskriften Annals of Internal Medicine. " 

Men i själva verket rapporterade Skipper-studien om de två viktiga resultaten, risker för sjukhusvistelse och dödlighet: med placebo, 10 sjukhusinläggningar och 1 dödsfall; med HCQ, 4 sjukhusinläggningar och 1 dödsfall. Dessa siffror visar en 60 % minskad risk för sjukhusvistelse, vilket, även om det inte är statistiskt signifikant (p=0.11), helt överensstämmer med alla andra studier av sjukhusinläggningsrisk för HCQ-användning i öppenvård (Risch, 2021). Ändå är dessa små antal utfallshändelser inte tillnärmelsevis tillräckligt för att randomisering ska ha balanserat några faktorer, och studien är väsentligen värdelös på denna grund. Men det tolkades fortfarande fel i lekmannalitteraturen som att det visar att HCQ inte ger någon fördel vid öppenvård.

Slutsatser

Många andra fall av trovärdiga vetenskapliga fall eller dålig vetenskap har inträffat under Covid-19-pandemin. Som framgick av de tillbakadragna Surgisphere-tidningarna publicerar medicinska tidskrifter rutinmässigt och okritiskt detta nonsens så länge slutsatserna överensstämmer med regeringens politik. Denna samling av falska kunskaper har förkunnats på högsta nivå, av NSC, FDA, CDC, NIH, WHO, Wellcome Trust, AMA, medicinska specialitetsstyrelser, statliga och lokala folkhälsomyndigheter, multinationella läkemedelsföretag och andra organisationer runt om i världen som har brutit mot sitt ansvar gentemot allmänheten eller avsiktligt valt att inte förstå den falska vetenskapen. 

Den amerikanska senaten röstade nyligen, för tredje gången, för att avsluta undantagstillståndet för Covid-19, men president Biden uppgav att han skulle lägga in sitt veto mot åtgärden på grund av "rädsla" för att återkomma ärendenummer. Mina kollegor och jag hävdade för nästan ett år sedan att den pandemiska nödsituationen var över (Risch et al., 2022), men den falska tilliten till fallräkningar för att rättfärdiga undertryckandet av mänskliga rättigheter under täckmantel av "nödsituation" fortsätter oförminskat.

Massiv censur av traditionella medier och stora delar av sociala medier har blockerat de flesta offentliga diskussioner om denna dåliga och falska vetenskap. Censur är verktyget för det oförsvarbara, eftersom giltig vetenskap försvarar sig själv. Tills allmänheten börjar förstå skillnaden mellan rimlighet och vetenskap och hur stora ansträngningarna har varit för att massproducera vetenskaps "produkt" som ser ut som vetenskap men inte är det, kommer processen att fortsätta och ledare som söker auktoritär makt kommer att fortsätta att förlita sig på den för falsk motivering.

Referensprojekt

Alexander, PE (2021, 20 december). Mer än 150 jämförande studier och artiklar om maskineffektivitet och skador. Brownstone Institute. https://brownstone.org/articles/more-than-150-comparative-studies-and-articles-on-mask-ineffectiveness-and-harms/

Alexander, PE (2022, 3 juni). CDC vägrar att publicera korrigeringen av sin maskstudie. Brownstone Institute. https://brownstone.org/articles/cdc-refuses-to-post-the-fix-to-its-mask-study/

Anglemyer, A., Horvath, HT, Bero, L. (2014). Sjukvårdsresultat bedömda med observationsstudiedesign jämfört med de som bedömts i randomiserade studier (Review). Cochrane Database of Systematic Reviews, 4, artikel MR000034. https://doi.org/10.1002/14651858.MR000034.pub2

Bae, J.-M. (2016). Ett förslag till kvalitetsbedömning i systematiska översikter av observationsstudier i nutritionsepidemiologi. Epidemiologi och hälsa, 38, Artikel e2016014. https://doi.org/10.4178/epih.e2016014

Berger, MA (2011). Tillåtligheten av sakkunnig vittnesmål. I National Research Council, Committee on the Development of the Third Edition av Reference Manual on Scientific Evidence, Referenshandbok om vetenskapliga bevis, tredje upplagan (s. 11-36). National Academies Press. https://nap.nationalacademies.org/catalog/13163/reference-manual-on-scientific-evidence-third-edition

Burns, E. (2022, 10 november). Another Day, Another Terrible Mask Study. Låt oss titta under huven på det senaste stycket av lågkvalitativ vetenskap om masker. Substack. https://emilyburns.substack.com/p/another-day-another-terrible-mask

Centers for Medicare & Medicaid Services. (2022, juni). Sök Öppna betalningar. US Department of Health and Human Services, Centers for Medicare & Medicaid Services. https://openpaymentsdata.cms.gov/

Christensen, J. (2020, 16 juli). Hydroxyklorokin hjälper inte heller Covid-19-patienter som inte är inlagda på sjukhus, finner ny studie. CNN Health. https://www.cnn.com/2020/07/16/health/hydroxychloroquine-doesnt-work-hospitalized-patients/

Collins, R., Bowman, L., Landray, M., & Peto, R. (2020). The Magic of Randomization kontra Myth of Real-World Evidence. New England Journal of Medicine, 382 (7), 674-678. https://www.nejm.org/doi/10.1056/NEJMsb1901642

Dangor, G. (2021, 19 september). CDC:s sexfots regel för social distansering var "godtycklig", säger tidigare FDA-kommissionär. Forbes. https://www.forbes.com/sites/graisondangor/2021/09/19/cdcs-six-foot-social-distancing-rule-was-arbitrary-says-former-fda-commissioner/

Deaton, A., & Cartwright, N. (2018). Förstå och missförstå randomiserade kontrollerade studier. Samhällsvetenskap & medicin, 210, 2-21. https://doi.org/10.1016/j.socscimed.2017.12.005

Feynman, RP (1974). Cargo Cult Science. Teknik och vetenskap, 37 (7), 10-13. https://resolver.caltech.edu/CaltechES:37.7.CargoCult

Goldberger, J., Waring, CH, & Willets, DG (1915). Förebyggandet av pellagra: Ett test av kost bland institutionella interner. Folkhälsorapporter, 30 (43), 3117-3131. https://www.jstor.org/stable/4572932

Hartling, L., Milne, A., Hamm, MP, Vandermeer, B., Ansari, M., Tsertsvadze, A., Dryden, DM (2013). Att testa Newcastle Ottawa-skalan visade låg tillförlitlighet mellan enskilda granskare. Journal of Clinical Epidemiology, 66, 982-993. https://doi.org/10.1016/j.jclinepi.2013.03.003

Hill, AB (1965). Miljön och sjukdomen: samband eller orsakssamband. Proceedings of the Royal Society of Medicine, 58 (5), 295-300. https://doi.org/10.1177/003591576505800503

Inglesby, TV, Nuzzo, JB, O'Toole, T., Henderson, DA (2006). Sjukdomsreducerande åtgärder vid kontroll av pandemisk influensa. Biosäkerhet och bioterrorism: Bioförsvarsstrategi, praxis och vetenskap, 4 (4): 366-375. https://doi.org/10.1089/bsp.2006.4.366

Meunier, T. (2020, 1 maj). Fullständig låsningspolitik i länder i Västeuropa har inga uppenbara effekter på COVID-19-epidemin. medRxiv. https://doi.org/10.1101/2020.04.24.20078717

MSNBC. (2021, 9 juni). Fauci svarar på attacker från republikaner [Video]. Youtube. https://www.youtube.com/watch?v=z-tfZr8Iv0s

National Library of Medicine (2021, maj). ClinicalTrials.gov. Historia, policyer och lagar. US Department of Health and Human Services, National Institutes of Health, National Library of Medicine. https://clinicaltrials.gov/ct2/about-site/history

Park, JJH, Decloedt, EH, Rayner, CR, Cotton, M., Mills, EJ (2020). Kliniska prövningar av sjukdomsstadier i COVID 19: komplicerade och ofta feltolkade. Lancet Global Health, 8(10), e1249-e1250. https://doi.org/10.1016/S2214-109X(20)30365-X

Polack, FP, Thomas, SJ, Kitchin, N., Absalon, J., Gurtman, A., Lockhart, S., Perez, JL, Pérez Marc, G., Moreira, ED, Zerbini, C., Bailey, R. ., Swanson, KA, Roychoudhury, S., Koury, K., Li, P., Kalina, WV, Cooper, D., Frenck, RW, Jr., Hammitt, LL, …, Gruber, WC (2020). Säkerhet och effekt av BNT162b2 mRNA Covid-19-vaccinet. New England Journal of Medicine, 383 (27), 2603-2615. https://www.nejm.org/doi/full/10.1056/nejmoa2034577

Rajasingham, R., Bangdiwala, AS, Nicol, MR, Skipper, CP, Pastick, KA, Axelrod, ML, Pullen, MF, Nascene, AA, Williams, DA, Engen, NW, Okafor, EC, Rini, BI, Mayer , IA, McDonald, EG, Lee, TC, Li P., MacKenzie, LJ, Balko, JM, Dunlop, SJ, …, Lofgren, SM (2021). Hydroxyklorokin som profylax före exponering för Coronavirus Disease 2019 (COVID-19) hos vårdpersonal: En randomiserad studie. Clinical Infectious Diseases, 72(11), e835-e843. https://doi.org/10.1093/cid/ciaa1571

Risch, HA (2020). Tidig poliklinisk behandling av symtomatiska, högriskcovid-19-patienter som borde trappas upp omedelbart som nyckeln till pandemikrisen. American Journal of Epidemiology, 189 (11), 1218-1226. https://doi.org/10.1093/aje/kwaa093

Risch, HA (2021, 17 juni). Hydroxyklorokin vid tidig behandling av högriskcovid-19 öppenvårdspatienter: effektivitet och säkerhetsbevis. EarlyCovidCare.org, https://earlycovidcare.org/wp-content/uploads/2021/09/Evidence-Brief-Risch-v6.pdf

Risch, H., Bhattacharya, J., Alexander, PE (2022, 23 januari). Nödsituationen måste avslutas, nu. Brownstone Institute. https://brownstone.org/articles/the-emergency-must-be-ended-now/

Sackett, DL, Rosenberg, WMC, Gray, JAM, Haynes, RB, & Richardson, WS (1996). Evidensbaserad medicin: vad det är och vad det inte är. BMJ, 312, artikel 71. https://doi.org/10.1136/bmj.312.7023.71

Skipper, CP, Pastick, KA, Engen, NW, Bangdiwala, AS, Abassi, M., Lofgren, SM, Williams, DA, Okafor, EC, Pullen, MF, Nicol, MR, Nascene, AA, Hullsiek, KH, Cheng , MP, Luke, D., Lother, SA, MacKenzie, LJ, Drobot, G., Kelly, LE, Schwartz, IS, …, Boulware, DR (2020). Hydroxyklorokin hos icke-hospitaliserade vuxna med tidig covid-19: En randomiserad studie. Annals of Internal Medicine, 173 (8), 623-631. https://doi.org/10.7326/M20-4207

Tenforde, MW, Patel, MM, Gaglani, M., Ginde, AA, Douin, DJ, Talbot, HK, Casey, JD, Mohr, NM, Zepeski, A., McNeal, T., Ghamande, S., Gibbs, KW, Files, DC, Hager, DN, Shehu, A., Prekker, ME, Erickson, HL, Gong, MN, Mohamed, A., …, Self, WH (2022). Morbidity and Mortality Weekly Report, 71(4), 118-124. https://www.cdc.gov/mmwr/volumes/71/wr/mm7104a2.htm

Tigas, M., Jones, RG, Ornstein, C., & Groeger, L. (2019, 17 oktober). Dollar för Docs. Hur industridollar nådde dina läkare. ProPublica. https://projects.propublica.org/docdollars/

Wacholder, S. (1986). Binomial regression i GLIM: uppskattning av riskkvoter och riskskillnader. American Journal of Epidemiology, 123 (1), 174-184. https://doi.org/10.1093/oxfordjournals.aje.a114212

Whelan, R. (2020, 3 augusti). 2020-08-03 – CNN COVID med intervju Harvey Risch, Yale Epidemiologist [Video]. Youtube. https://www.youtube.com/watch?v=gGO6Ke81bUQ

Världsmätare. (2022, 15 november). Totalt antal fall av coronavirus i Australien. Världsmätare. https://www.worldometers.info/coronavirus/country/australia/



Publicerad under a Creative Commons Erkännande 4.0 Internationell licens
För omtryck, vänligen ställ tillbaka den kanoniska länken till originalet Brownstone Institute Artikel och författare.

Författare

  • Harvey Risch

    Harvey Risch, Senior Scholar vid Brownstone Institute, är läkare och professor emeritus i epidemiologi vid Yale School of Public Health och Yale School of Medicine. Hans huvudsakliga forskningsintressen är cancer etiologi, prevention och tidig diagnos samt epidemiologiska metoder.

    Visa alla inlägg

Donera idag

Ditt ekonomiska stöd från Brownstone Institute går till att stödja författare, advokater, vetenskapsmän, ekonomer och andra modiga människor som har blivit professionellt utrensade och fördrivna under vår tids omvälvning. Du kan hjälpa till att få fram sanningen genom deras pågående arbete.

Prenumerera på Brownstone för fler nyheter


Handla Brownstone

Håll dig informerad med Brownstone Institute