xmlns="http://www.w3.org/2000/svg" viewBox="0 0 54 54">
Gå til indhold

Læger og tolkning af statistiske oplysninger

Rationel farmakoterapi nr. 12, 2011

Månedsbladet opdateres ikke efter udgivelsen. Indholdet afspejler den aktuelle evidens på udgivelsestidspunktet.


Af Niels C Heebøll-Nielsen, IRF.

Mange patienter, journalister og politikere har problemer med at forstå og drage konklusioner af sundhedsstatistik, men også mange læger har problemer.

Her kommer en håndfuld eksempler:

Relativ vs. absolut risiko

Forestil dig, at du skal tage stilling til 3 nye lægemidler, som skal forebygge død af iskæmisk hjertesygdom. Hvilket af de 3 lægemidler vil du vælge?

  • X er et præparat, som ved behandling af personer, der har haft myokardieinfarkt, over 5 år nedsætter dødeligheden med 29 %.
  • Y er et præparat, som på 5 år nedsætter dødeligheden, hos personer, der har haft myokardieinfarkt, fra 11,5 % til 8,2 % altså med 3,3 %.
  • Z er et præparat, som ved behandling af 30 personer, som har haft myokardieinfarkt, i 5 år medfører 1 undgået dødsfald.

Der er foretaget flere undersøgelser af lignende opstillinger.
De fleste læger vil vælge X, men alle 3 udsagn er hentet fra samme undersøgelse, 4S, som drejede sig om forebyggelse med simvastatin hos personer, der havde haft myokardieinfarkt.
256 (11,5 %) i placebogruppen døde mod 182 (8,2 %) i gruppen, der fik simvastatin.
Den relative risiko (RR) for død var 8,2 %/11,5 % = 0,71. Den relative risikoreduktion (RRR) var 1 – 0,71 = 0,29 eller 29 %, mens den absolutte risikoreduktion (ARR) var 11,5 % - 8,2 % = 3,3 %. Grupperne var lige store. Der var 2.221 i behandlingsgruppen, og man undgik 74 dødsfald i behandlingsgruppen. Altså 2.221/74=30 behandlet i 5,4 år per undgået dødsfald = number needed to treat (NNT).
NNT kan også beregnes som den reciprokke værdi af ARR dvs. 1/ARR.
Det er velkendt, at RRR umiddelbart ser bedre ud end ARR.
Tidligere var det almindeligt, at reklamer for lægemidler med omtale af RRR, mens omtalen af bivirkninger blev angivet i absolutte tal.
Det er nu blevet kutyme, at reklamer, som omtaler RRR for effekt for at undgå forvirring også omtaler ARR, og tidsskrifter har indført det som et krav.
Tidligere undersøgelser af førende medicinske tidsskrifter har vist, at artikler i BMJ, JAMA og Lancet i perioden 2004 til 2006 manglede oplysninger om absolut risiko i omkring halvdelen af tilfældene, men det er der nu rettet op på.
1/3 af undersøgelser publiceret i BMJ og 2/3 af undersøgelser i nordamerikanske tidsskrifter var betalt af medicinindustrien.

Odds ratio

I kohorteundersøgelser beregner man den relative risiko (RR).
Man udregner forholdet mellem virkning og årsag i de to grupper

Årsag

fx rygning 

 Virkning fx hoste

 +

 -

 

 +

 a

 b

 a + b

 -

 c

 d

 c + d

 

a + c

b + d

 

RR  =  (a/(a+b)) / (c/(c+d))

I case-kontrolundersøgelser kan man ikke foretage denne beregning, da tabellen ved denne type undersøgelser kun kan læses lodret, idet man selv bestemmer antallet af cases og kontroler. I stedet anvendes odds ratio (OR), som beregnes således:
OR =  (a/c)  /  (b/d)

Det er praktisk at regne med, at OR er en god tilnærmelse til RR, hvis hyppigheden af virkningen er lille dvs. a<<a+b og c<<c+d.
I en undersøgelse fandt man at OR for kardiovaskulære tilfælde ved behandling med Champix var
1,72. Der fandtes 52 tilfælde blandt 4.908 behandlede mod 27 blandt 3.308 placebobehandlede. OR kan i denne situation sidestilles med RR.
Det er vigtigt at huske, at retrospektive case-kontrolundersøgelser ikke kan afgøre, om en sammenhæng er udtryk for kausalitet.

Screening

Når en screeningstest præsenteres, kan det ske med forskellige oplysninger:

  • RRR. Hvis du får denne test hvert 2. år, vil det reducere risikoen for at dø af denne cancer med omkring 1/3 i løbet af de næste 10 år.
  • ARR. Hvis du får denne test hvert 2. år, vil det reducere risikoen for at dø af denne cancer fra omkring 3 per 1.000 til 2 per 1.000 i løbet af de næste 10 år.
  • NNT. Hvis 1.000 personer får denne test hvert 2. år, vil 1 person kunne undgå at dø af denne cancer hvert 10 år.

Tilslutning til screeningsprogrammer afhænger i høj grad af oplysningerne om programmerne.
I nogle tilfælde oplyses fordelene ved et program i store tal (RRR) og ulemperne i små tal (ARR).
U.S. Preventive Services Task Force kom i 2002 med oplysning om, at screening med sigmoideoskopi reducerede risikoen for død med 59 % for cancer, som kunne nås med sigmoidoskop, og perforation rapporteret i forbindelse med sigmoideoskopi var 1 per 1.000-10.000.

P-piller

Problemer med omtale af relativ risiko spiller stadig en rolle i pressen.
August 1993 bragte det husstandsomdelte blad Hjertenyt på forsiden nyheden:
P-piller fordobler risikoen for blodprop.
Slog man op i bladet kunne man læse en artikel, som citerede Øjvind Lidegard, som ved en undersøgelse havde fundet, at 497 danske kvinder i alderen 15-44 år i perioden 1985-1989 havde fået blodprop i hjernen.
Risiko for 20-årige kvinder var      2/100.000 = 0,002 %.
Med p-piller blev risikoen øget til 4/100.000 = 0,004 %.
Den relative risikoøgning var 100 %. Den absolutte risikoøgning var 0,002 %.
Forsidens oplysning var korrekt, men værdien af oplysningen var ringe.

Faldgruber

Gerd Gigerenzer og medarbejdere har beskrevet andre eksempler på faldgruber, når man skal vurdere sundhedsoplysninger (1).

Politik

I 2007 udtalte tidligere New York borgmester Rudy Giuliani: ”Jeg havde prostatacancer for 5-6 år siden. Jeg blev Gud ske lov kureret. Hvad er chancerne for at overleve med prostatacancer i USA? 82 %. Hvad ville min chance være for at overleve i England? Kun 44 % under socialized medicine!”
Hvad er problemet med denne udtalelse?
Giuliani har tilsyneladende anvendt data fra år 2000, da 49 britiske mænd per 100.000 fik diagnosticeret prostatacancer, og 28 af 100.000 døde i løbet af 5 år.  I USA diagnosticeres de fleste tilfælde af prostatacancer ved screening for prostata specifik antistof (PSA) mens det i England diagnosticeres ved symptomer.
Man kan forestille sig, at en person ved screening får påvist prostatacancer i 60 års alderen og at han dør i 70 års alderen. Han ville måske først få påvist sygdommen pga. symptomer 67 år gammel,
men dødstidspunktet som 70-årig ligger fast. På den måde ser overlevelsen ud til at være forlænget
ved screening – lead-time bias. Det er også muligt, at man ved screening får påvist tilfælde, som aldrig vil udvikle sig – overdiagnosis bias.
Hvis man skal sammenligne landene, må man anvende mortalitets rater. I USA forekom 26 dødsfald pga. prostatacancer per 100.000 mænd versus 27 per 100.000 mænd i England. Det socialiserede system i England har færre diagnoser og altså mindre overdiagnosticering.

Lægers problemer
med at vurdere statistiske oplysninger illustreres af følgende eksempler:

Mammografi

En undersøgelse er foretaget blandt 160 gynækologer, som fik følgende oplysninger:

  • Prævalensen af brystkræft er 1 %.
  • Sensitiviteten af mammografi er 90 %.
  • Mammografi medfører 9 % falsk positive resultater.

Spørgsmålet til gynækologerne var: Hvad er sandsynligheden for, at et positivt mammogram er ægte positivt?
47 % af gynækologerne svarede 90 %. 13 % svarede 81 % og 21 % svarede 10 %.

En anden undersøgelse viste, at 1 af 3 kvinder med universitetsuddannelse mente, at resultatet af mammografi var helt sikkert.
Man kan stille det op på en denne måde: Af 1.000 undersøgte kvinder vil 10 have brystkræft. Af de 10 vil mammografi være positiv hos 9 og negativ hos 1.  Af 990 kvinder uden brystkræft vil 990 x 9 % = 89 have et falsk positivt resultat. Sandsynligheden for, at et positivt mammogram er ægte positivt er derfor
9/(9+89) ~ 9 %.

HIV

Et andet eksempel drejer sig om påvisning af positiv HIV test.
Ved en konference om AIDS i 1987 blev det berettet, at af 22 bloddonorer, som havde fået påvist positiv ELISA test for HIV, begik 7 selvmord.

  • Sensitiviteten af ELISA og Western Blot test er 99,9 %
  • Specificiteten er 99,99 %
  • Prævalensen af positiv HIV test blandt heteroseksuelle mænd er 1 ud af 10.000

Hvis man ikke er inficeret med HIV, er det så muligt at få et positivt test resultat?
Dette spørgsmål stillede man 20 AIDS konsulenter, de fleste læger. Deres svar ses i Tabel 1.

Tabel 1. 20 AIDS konsulenters svar på spørgsmålet: Hvis man ikke er inficeret med HIV, er det så muligt at få et positivt test resultat?

1 ‘‘No, certainly not’’          

11 ‘‘False positives never happen’’
2 ‘‘Absolutely impossible’’ 12 ‘‘With absolute certainty, no’’
3 ‘‘With absolute certainty, no’’ 13 ‘‘With absolute certainty, no’’
4 ‘‘No, absolutely not’’  14 ‘‘Definitely not’’. . . ‘‘extremely rare’’
5 ‘‘Never’’  15 ‘‘Absolutely not’’. .  ‘‘99.7 % specificity’’
6 ‘‘Absolutely impossible’’   16 ‘‘Absolutely not’’. . ‘‘99.9 % specificity’’
7 ‘‘Absolutely impossible’’  17 ‘‘More than 99 % specificity’’
8 ‘‘With absolute certainty, no’’                    18 ‘‘More than 99.9 % specificity’’
9 ‘‘The test is absolutely certain’’   19  ‘‘99.9 % specificity’’
10 ‘‘No, only in France, not here’’ 20 ‘‘Don‘t worry, trust me’’

Sensitivitet er evnen til at påvise de syge i en syg population og specificitet evnen til at påvise de raske i en rask population.
Ud af 10.000 mænd vil der være 1 sand positiv. Af de negative vil 9.999 x 99,99 % = 9.998 være ægte negative og derfor 1 falsk positiv. Sandsynligheden for at et positivt testresultat er ægte positivt er 1/(1+1) = 50 %.

Coloncancer

Et sidste eksempel stammer fra en undersøgelse af 48 læger bl.a. radiologer, intern medicinere, kirurger, urologer og gynækologer, som fik til opgave at svare på, hvad sandsynligheden for coloncancer er, hvis testen for okkult blod er positiv. Deres svar varierede fra 1 % til 99 %. 95 af 100 læger overestimerede den positive prædiktive værdi af en positiv prøve.

  • Prævalensen af coloncancer er 0,3 %.
  • Sensitiviteten af undersøgelsen er 50 %. 
  • Falsk positiv rate er 3 %.

Af 10.000 undersøgte personer vil 30 have coloncancer. Af dem vil testen finde 15. Af de 9.970 uden cancer vil testen være positiv for 9.970 x 3 % = 299. Sandsynligheden for at en positiv test vil være ægte positiv er 15/(15+299) ~5 %.
Hvordan beregner man?
Hvis man om et projekt får oplysninger, som ved første betragtning kan være vanskelige at håndtere fx om sensitivitet, specifitet, falsk positiv rate osv., står man sig ved at anvende en 2 x 2 tabel. Det gælder læger, politikere, journalister og andre interesserede.

 

Sygdom + 

Sygdom - 

 

Test + 

 a

b (falsk pos.)

a+b

Test -  

c (falsk neg.) 

d

c+d

  

a+c

b+d

a+b+c+d

Sensivitet er a/(a+c), antallet af ægte positive blandt alle de syge.
Specificitet er d/(b+d), antallet af ægte negative blandt alle de raske.
Prædiktiv værdi af positiv test (PPV) a/(a+b) dvs. hvor stor en del af de positive prøver er ægte positive?
Prædiktiv værdi af negativ test (NPV) d/(c+d) dvs. hvor mange af de negative er ægte negative?

Man anvender tabellen ved at udfylde felterne baglæns.
Man indsætter et vilkårligt antal personer (a+b+c+d) fx 1.000. Som regel ved man, hvor mange af dem, der vil være syge. Herefter kan de øvrige felter beregnes og de prædiktive værdier, som er de mest interessante, udregnes.

Referencer

1. Gigerenzer G et al. Helping Doctors and Patients Make Sense of Health Statistics. http://www.psychologicalscience.org/journals/pspi/pspi_8_2_article.pdf

Interessekonflikter:

Ingen

Institut for Rationel Farmakoterapi 05-12-2011


 



Opdateret 05 DEC 2011