Kort antwoord: Sophie Trudeau's positieve test kan betekent nog steeds een kans van 3: 1 dat niet Covid-19 heeft opgelopen, maar de kans zou ook veel groter kunnen zijn om Covid te hebben -19.
De negatieve test van Justin Trudeau betekent vrijwel zeker dat hij negatief was toen hij werd getest. Mocht Sophie positief zijn, dan kan dat natuurlijk inmiddels veranderd zijn.
Update: ik vond een webpagina van de FDA-lijsttests die dit hebben Goedkeuring voor gebruik in noodgevallen. Elk van hen heeft instructies van de fabrikant die hun testresultaten tegen het einde vermelden. Sommige van de ingediende testresultaten gebruiken ≈ 100 negatieve monsters bij de klinische evaluatie. Maar er is er ook een met slechts 13 positieve gevallen (die allemaal correct zijn gevonden) in hun test - maar die kreeg al begin februari de noodgoedkeuring.
De laatste 2 (door Thermo en Roche) gebruikten 60 / 60 en 50/100 gevallen voor hun klinische evaluatie (alle resultaten correct). Dat brengt de onderkant van de betrouwbaarheidsintervallen voor gevoeligheid en specificiteit op 94-97% (met de onderkant van de ci zouden we dus LR +> ≈ 20 of 17 hebben, de verwachte waarden zouden respectievelijk 61 of 51 zijn. Voor LR - <≈ 1/20 of 1/32 (verwacht 1/61 of 1/100).
Lange versie: Laten we wat jongleren met cijfers en kijken of we er iets nuttigs uit kunnen halen. berekeningen zijn gebaseerd op een ietwat worstcasescenario: de FDA-richtlijnen voor noodvalidatie specificeren uitkomsten waaraan een dergelijke nieuwe test in de huidige noodsituatie moet voldoen, en ik bereken vanuit het lage prestatieniveau dat kan worden verwacht om aan deze criteria te voldoen onder enigszins pech omstandigheden.
We kennen dus minimale prestatie-eisen, maar ik weet [nog] niet hoe goed (= hoeveel beter dan minimale prestatie) de tests zijn.
Gevoeligheid en specificiteit
Het startpunt is gevoeligheid en specificiteit van de respectieve test. Ik heb hierover geen gepubliceerde gegevens gevonden, maar de FDA heeft een Policy for Diagnostics Testing for Coronavirus Disease-2019 waarin staat hoe laboratoria die een test ontwikkelen een "noodvalidatie" moeten uitvoeren. Ze kunnen dan goedkeuring krijgen voor gebruik in noodgevallen.
- Gevoeligheid vertelt ons: van alle echt Covid-19-positieve specimen, welk percentage correct wordt herkend als positief door de test; Ik ga 87,5% gebruiken (zie hieronder).
- Specificiteit vertelt ons: van alle specimen die echt negatief zijn voor Covid-19, die percentage wordt correct herkend door de test.
Gevoeligheid en specificiteit kunnen worden gemeten door gestandaardiseerde protocollen, en ze karakteriseren de uitvoering van de test.
Vanuit het oogpunt van een patiënt of arts zijn het echter niet erg bruikbare getallen, aangezien ze (we) het antwoord nodig hebben op de omgekeerde vragen:
Voorspellende waarden
- positief voorspellende waarde PPV: gezien het feit dat de test positief opleverde, wat is dan de kans dat de patiënt echt het virus heeft?
- negatief voorspellende waarde NPV: gegeven het feit dat de test negatief opleverde, wat is de kans dat de patiënt het virus echt niet heeft?
Voorspellende waarden kunnen worden berekend op basis van gevoeligheid en specificiteit samen met de prevalentie (of, zoals we het hebben over nieuw geïnfecteerde patiënten, de incidentie) van virus onder de geteste populatie . Dit is hoe ze omgaan met de veronderstelde gevoeligheid en specificiteit:
rood voor positieve testresultaten, donkergroen voor negatieve testresultaten. posterieure waarschijnlijkheid = na de test zei iets, wat is de kans dat het testresultaat correct is = NPV voor negatief testresultaat, PPV voor positief testresultaat.
Goede schattingen van de prevalentie zijn vaak moeilijk te verkrijgen, omdat we de prevalentie onder degenen die worden getest nodig hebben en dat is (en zou moeten zijn) heel anders dan de prevalentie van de ziekte bij de algemene bevolking.
Voor sommige landen, zoals Italië, hebben we een aantal uitgevoerde tests ( wikipagina met cijfers voor meer landen): vanaf vandaag (14 maart ), hebben ze 109170 tests uitgevoerd en hebben ze in totaal 21157 gevallen. Niet alle tests zijn bedoeld voor de initiële diagnose (AFAIK, een patiënt wordt pas als genezen beschouwd nadat een aantal tests negatief zijn), maar aangezien de meeste gevallen nog "vers" zijn, kunnen we de verhouding positieve gevallen: tests uitvoeren als een surrogaat voor de prevalentie in de geteste populatie. Voor Italië zou dit ongeveer 20% zijn.
Uit het diagram kunnen we vervolgens lezen voor een nieuwe patiënt die de eerste keer wordt getest:
- als het testresultaat positief is, is de kans groot ≈ 75% (of meer als ik reken met de onderkant van het mogelijke bereik van de noodvalidatie) dat de patiënt echt Covid-19 heeft.
Dus tot 25% fout-positieven. - als het testresultaat negatief is, is de kans ≈ 95% (of meer ...) dat de patiënt echt geen Covid-19 heeft.
Dus, omhoog tot 5% valse negatieven.
Canada rapporteert momenteel 25 positieve van de in totaal 796 tests, dus ongeveer 3% prevalentie in de geteste populatie.
Voor de In de VS rapporteert de CDC casusnummers en testnummers, momenteel 1629 gevallen met (3995 + 15749) tests - maar het is mij niet helemaal duidelijk of de populaties volledig samenvallen. Hoe dan ook, ik gebruik 8% als schatting voor de prevalentie.
| prevalentie | PPV | NPV | Land / bevolking | + ------------ + ------ + -------- + -------------------- + | 3% | 26% | 99,6% | Canada || 8-9% (?) | 50% | 98,8% | VS, Duitsland || 20% | 75% | 95% | Italië |
Dat is de populatie van "iedereen die wordt getest". In ieder geval voor Duitsland (14 maart) maar waarschijnlijk ook voor Canada en de VS worden tests gedaan op mensen die symptomen vertonen en op mensen waarvan bekend is dat ze contact hebben gehad met gevallen van het Coronavirus: als ze positief blijken te zijn, zijn ze naar huis gestuurd om in quarantaine te gaan en te wachten of ze de ziekte acuut hebben opgelopen. Maar we kunnen nog steeds zeggen dat de populatie met 'geteste mensen' subpopulaties heeft met en zonder symptomen.
Dus als er nog meer vermoedens zijn, bijvoorbeeld dat de patiënt hoest, zouden we zeggen dat ze tot een hoog risico behoren. subpopulatie met een hogere prevalentie van Covid-19 in vergelijking met de algehele prevalentie onder geteste personen, dus de kans op een vals-positief zou voor hen kleiner zijn.
Dit zal veranderen aangezien tests alleen worden uitgevoerd op mensen die symptomen vertonen (inmiddels, 16 maart, wordt iedereen al verteld om thuis in Duitsland te blijven en zo goed mogelijk zichzelf te isoleren - het testresultaat zal dit op geen enkele manier veranderen).
Als we de prevalentie uitdrukken als odds (in plaats daarvan 1:99 van 1%), LR + en LR- maken eenvoudige berekeningen van de achterkant van de envelop mogelijk.
LR + = gevoeligheid / (1 - specificiteit) ≈ 11 of beter voor onze test en LR- = (1 - gevoeligheid) / specificiteit ≈ 0,05 = 1/20 of beter voor onze test.
dus ze zijn onafhankelijk van de prevalentie en ze vertellen ons hoe de odds veranderen als gevolg van de test: de posterieure waarschijnlijkheid (voorspellende waarden) zijn de pre-test odds vermenigvuldigd met de waarschijnlijkheidsratio. In die zin vertellen ze ons hoeveel informatie we verkrijgen door testen (voor positieve en negatieve uitkomsten).
Canada rapporteerde dus een odds van 25 positieve: 771 negatieve tests. Dus voor Sophie Trudeau gingen de kansen van 25: 771 (of 3%) naar 25: 771 * 11 = 273: 771 ≈ 1: 3 of 25%. Voor Justin Trudeau 25: 771/20 = 25: 15420 ≈ 1: 617 of 0,16% van Covid-19-positief (lichte afwijking ten opzichte van hierboven vanwege afronding).
Aan de andere kant, als we beginnen als we steeds meer mensen testen voor wie het risico om daadwerkelijk het virus te hebben opgelopen steeds kleiner is, kunnen we binnenkort geen zinvolle conclusies meer trekken uit de testresultaten: ik ben in Duitsland, momenteel de federale info-pagina geeft een overzicht van 3800 bevestigde gevallen. Zelfs als we aannemen dat er een enorme donkere figuur is en in werkelijkheid 20 x zoveel mensen zijn geïnfecteerd * dat zou een prevalentie zijn in de algemene bevolking van 0,1%, is de kans 1 geïnfecteerd: 1,5 miljoen niet-geïnfecteerd. Als iemand die niet tot een bepaalde risicogroep behoort, positief wordt getest, neemt de kans toe met een factor 11, dat wil zeggen ongeveer 1: 140000. Een negatief testresultaat zou de kans met een factor 1/20 verlagen tot 1:31 miljoen. Beide resultaten hebben echter geen praktisch nut, aangezien ze de situatie niet veranderen: pre-testsituatie is "zeer onwaarschijnlijk Covid-19-geval", post-testsituatie is nog steeds "zeer onwaarschijnlijk Covid-19-geval" .
Dit is de reden waarom, zelfs als er testcapaciteiten waren voor de hele populatie, tests geen zin hebben, tenzij we weten dat er enkele risicofactoren zijn, zoals een soort van ademhalingsziekte of contact met iemand van wie bekend is dat hij het virus heeft. En waarom het verstandig is om te zeggen dat men onder licht verdachte omstandigheden (= lage, maar niet extreem lage prevalentie), contact zelf in quarantaine moet plaatsen / vermijden, maar het heeft geen zin om te testen [nog].
Geeft details over hoe ik gevoeligheid en specificiteit schat
- Het laboratorium bepaalt eerst de detectielimiet (LoD) voor virus-RNA. De LoD is hier de laagste concentratie waarbij 19 van de 20 herhaalde tests positief zijn (dat zou 95% gevoeligheid zijn, maar voor monsters die in het laboratorium zijn verrijkt, maar met een relevante en zo moeilijk mogelijke matrix zoals sputum).
-
Vervolgens worden [overgebleven] klinische monsters gebruikt:
-
Aangezien er mogelijk geen positieve monsters beschikbaar zijn, kan het laboratorium negatieve monsters pieken met virus RNA; minimaal 20 monsters worden verrijkt binnen een bereik van 1 - 2 LoD plus 10 monsters om het resterende klinische bereik te dekken.
Hiervan mag maximaal 1 een negatief resultaat hebben (en dat moet er een zijn in de lagere concentratie bereik). Dus 29 positieve van de 30 echt positieve.
-
Ook worden 30 niet-reactieve exemplaren getest. Het beleid zegt niet dat een aantal valse positieven is toegestaan, dus ik ga ervan uit dat dit nul moet zijn.
-
Het lab kan dan beginnen met echte patiëntmonsters. De eerste 5 positieve en de eerste 5 negatieve gevallen moeten worden bevestigd door een goedgekeurde test (en moeten allemaal overeenkomen).
Door de 2 "ronden" van het testen van klinische monsters samen te voegen, hebben we:
- 34 (of 35) positieve tests uit 35 echt positief monster -> gevoeligheid ten minste 97% met 95% geloofwaardig interval 87,5 - 100%,
-
specificiteit 100% met 95% geloofwaardig interval 92 - 100%
-
Er zijn aanvullende controles vereist, maar ze helpen ons hier niet.
-
Steekproeffouten maken geen deel uit van deze validatie.
I'm niet een klinisch chemicus, maar ik ben analytisch chemicus en in het algemeen analytische chemie kan dat gemakkelijk de overheersende bron van fouten zijn. In dat geval zouden de bovenstaande cijfers nutteloos zijn.
-
Vooral de gevoeligheid kan na verloop van tijd afnemen naarmate het virus muteert.
-
Om hiermee om te gaan, worden in sommige gevallen meerdere tests gedaan (lees dat in een krantenartikel dat ik momenteel niet vind).
Bij het uitvoeren van meerdere tests worden indien mogelijk tests van verschillende providers gebruikt: aangezien ze zijn ontwikkeld op basis van verschillende virusstalen, geeft dit een betere dekking voor mutaties in het virus dan het uitvoeren van dezelfde test in replicatie.
* Zeer handzaam scenario dat ik heb afgeleid van de ontwikkeling van zaaknummers in China na hun quarantaine / sluiting op 26 januari, uitgaande van een incubatietijd van 2 weken en dat niemand kreeg besmet nadat quarantaine is gestart.
Update 3 juni 2020:
-
Resultaten van een round robin-test / ringonderzoek in april in Duitsland over detectie van SARS-CoV2-RNA (opgehaald uit https://www.instand-ev.de/en/eqas-online/service-for-eqa-tests.html#rvp//340/ 2003 /)
- 7 monsters: 4 positief voor SARS-CoV2 met een factor 1000 in concentratie van virus-RNA; 3 negatief voor SARS-CoV: 1 negatief voor elk coronavirus, 1 positief voor HCoV OC43 maar niet SARS-CoV2 en 1 positief voor HCoV 229E maar niet SARS-CoV2.
-
463 laboratoria namen deel en dienden in in totaal 983 resultaten per monster (1 laboratorium kan resultaten indienen voor verschillende methoden)
-
De eindevaluatie omvat slechts 4 van de 7 monsters: terwijl de ringproef nog liep , de grondwaarheid en een voorlopige evaluatie werd gepubliceerd voor 3 monsters, zodat laboratoria de resultaten konden gebruiken om hun procedure aan te passen.
-
Er was een probleem met 24 laboratoria (59 lab × -methoden) waarbij de resultaten voor twee monsters (de positieve 1: 100000-verdunning en de negatieve met HCoV 22E) werden uitgewisseld.
Ik zal deze twee voorbeelden voorlopig buiten beschouwing laten.
-
Specificiteit was 969/983 = 98,6% voor het negatieve en 961/983 = 97,8% voor het negatieve met HCoV OC43 (monster was gedeblindeerd).
Het rapport merkt op dat het niet duidelijk is of de fout-positieven een resultaat zijn van de specificiteit van de methode zelf of dat ze voortkomen uit besmetting van de testmonsters met SARS-CoV2 in de laboratoria.
Gevoeligheid was 980/983 = 99,7% voor de hoogste (monster werd gedeblindeerd) en 914/983 = 93,0% voor de laagste virus-RNA-concentratie.
Zo'n ringonderzoek meet de prestaties van de diagnostische methode en laboratoriumbehandeling van de monsters samen.
-
Wenling Wang et al. : Detection of SARS-CoV-2 in Different Types of Clinical Specimens, JAMA, 12 mei 2020; 323 (18): 1843-1844. rapporten over de gevoeligheid van RT-PCR-tests voor verschillende bemonsteringsprocedures / -locaties. 1070 monsters verzameld van 205 bevestigde Covid-19-patiënten. Ze rapporteren dat 5 van de 8 neusuitstrijkjes (95% c.i. 30 - 90%) positief waren en 126 van 398 faryngeale uitstrijkjes (95% c.i. 27 - 36%). Deze andere studie, hoewel niet primair over PCR-gevoeligheid, rapporteert ongeveer 60%
De paper heeft zeer weinig details, bijv. op het tijdstip waarop de monsters werden genomen.
Deze studie meet de gevoeligheid van methode, laboratoriumbehandeling en monsternameprocedure samen.
Experts in radion-interviews die ik de afgelopen maanden heb gehoord, hadden het over gevoeligheid in de orde van grootte van 70-80% vanwege moeilijke bemonstering (waarvoor getraind personeel nodig was, bij voorkeur met het nemen van 2 wattenstaafjes [maar wattenstaafjes waren schaars een punt], de juiste procedure voor nasofaryngeale bemonstering is pijnlijk, het juiste tijdstip met betrekking tot het beloop van de ziekte)
In ieder geval lijkt de algehele gevoeligheid te worden gedomineerd door bemonsteringsfouten in plaats van lab behandeling of de gevoeligheid van de RT-PCR.
Dus mijn aanvankelijke schattingen waren te optimistisch voor de algehele gevoeligheid, maar specificiteit ziet er beter uit dan het aanvankelijke worstcasescenario: we hebben een LR⁺ van ongeveer 50, maar LR⁻ is slechts ongeveer 1/4.
Belangrijke opmerking: dit alles gaat over de real-time PCR-tests voor virus-RNA . Antilichaamtests hebben hun eigen en eigenlijk heel verschillende kenmerken.