× ATTENTION - Ce site est un prototype proposé uniquement comme démonstrateur du concept. Ce document est un brouillon inachevé présent uniquement pour tester la cohérence technique du prototype. Merci de votre compréhension.

Les indices d'efficacité pour les critères binaires

Les indices d’efficacité pour critères binaires quantifient l’efficacité d’un traitement à partir des modifications observées dans la fréquence de survenue d’un événement clinique utilisé comme critère de jugement. Si, par exemple, le critère est le décès, ces indices quantifient la réduction de la mortalité (c’est-à-dire la réduction de la fréquence des décès) provoquée par le traitement. Plusieurs indices sont utilisables avec ces critères de jugement binaires : risque relatif, odds ratio, différence des risques, NNT.

1. Données nécessaires aux calculs

Ces indices sont calculés à partir de la fréquence de survenue (risque) du critère de jugement dans les deux groupes expérimental et contrôle. Le terme risque est synonyme de fréquence, il est dérivé du domaine de l’épidémiologie. Dans la suite, ces deux termes seront utilisés indifféremment. Dans un essai, le risque correspond à l’incidence du critère de jugement. Ces risques sont calculés à partir des effectifs (« size, sample size, effective ») et du nombre d’événements observés dans chacun des deux groupes. Les données nécessaires sont celles du Tableau 1.

Tableau 1 – Données aux calculs des indices d’efficacités avec les critères de jugement binaires. Groupe Effectif Événements Risque traitement étudié n1 x1

traitement contrôle n0 x0

Le risque r0 qui correspond au risque du groupe contrôle est dénommé risque de base (car il correspond en quelque sorte au risque spontanée des patients). Il est aussi appelé risque sans traitement dans les essais contre placebo. Les indices mesurent en quelque sorte la « distance » qui sépare les risques observés entre le groupe expérimental et le groupe contrôle suivant différente métrique.

Dans la suite, les calculs des différents indices seront illustrés à l’aide de l’exemple suivant :

Tableau 2 – Exemple de résultat apporté par un essai avec un critère de jugement binaire Effectif Événements Risque traitement étudié 250 21 0.08 (8%)

traitement contrôle 246 36 0.15 (15%)

2. Risque ratio

2.1. Définition et généralités

Le risque relatif (« relative risk ») est le rapport du risque r1 obtenu sous traitement divisé par le risque de base r0 :

Dans notre exemple, le risque relatif vaut RR = 0,08 / 0,15 = 0,53 La réduction relative de risque (RRR) est assez fréquemment utilisée à la place du risque relatif :

Pour l’exemple, RRR = (1 - 0,53)×100% = 47%. Le traitement entraîne une réduction relative de la fréquence de l’événement (le risque) de 47%. Le risque relatif (ou la réduction relative des risques) mesure le bénéfice relatif et appartient à la classe des mesures d’effet multiplicatives.

Figure 1 – Exemple d’essai quantifiant les effets à l’aide de risque relatif

Figure 2 – Exemple de présentation sous forme de réduction relative du risque

2.2. Interprétation du risque relatif

Le risque relatif est une mesure relative. Il exprime l’effet relativement à la fréquence de base de l’événement. Le but d’une mesure relative est de réaliser un ajustement sur la valeur initiale et donc d’obtenir une mesure indépendante de cette-ci. L’objectif est d’obtenir une même valeur que le risque de base soit faible ou important. Selon les conventions habituelles, un RR<1 témoigne d’un effet bénéfique tandis que RR=1 marque un traitement sans efficacité. Un RR>1 signale un effet délétère (Quand le critère de jugement a valeur d’échec du traitement, ce qui est le cas le plus fréquemment).

La valeur 1 est importante pour l’interprétation du risque relatif. Dans le cas le plus courant où le critère de jugement a valeur d’échec du traitement, par exemple le décès ; un risque relatif inférieur à 1 est obtenu quand la fréquence de l’événement sous traitement est inférieure à celle sans traitement. Le traitement réduit donc la fréquence de l’événement. Un RR<1 signale donc un traitement bénéfique.

Un risque relatif de 1 traduit un traitement sans efficacité : la fréquence de l’événement est la même avec ou sans traitement. Un RR>1 témoigne d’un traitement délétère qui augmente la fréquence de l’événement. L’interprétation est inversée si le critère de jugement est un événement favorable comme la survenue d’une grossesse dans un traitement de l’hypofertilité. Un risque relatif >1 témoigne alors d’un effet bénéfique (augmentation de la fréquence de survenue d’une grossesse). Dans un essai contre traitement de référence, un risque relatif inférieur à 1 indique que le traitement testé est supérieur au traitement contrôle tandis qu’un RR>1 témoigne d’une plus grande efficacité du traitement contrôle. La valeur du risque relatif est le coefficient par lequel il faut multiplier le risque sans traitement pour obtenir celui sous traitement . Par exemple, un risque relatif de 0,7 signifie que le risque sous traitement est 0,7 fois celui sans traitement (éventuellement, il est possible de dire qu’avec le traitement, le risque est 70% du risque de base). Avec un risque relatif de 0,5, le risque est divisé par 2. Quand RR=4, le risque est multiplié par 4.

Dans le domaine des effets bénéfiques, plus le risque relatif est proche de zéro, plus le bénéfice apporté par le traitement est important. Un risque relatif de 0,3 témoigne d’un effet plus important qu’un RR de 0,7. En effet, les réductions relatives des risques sont respectivement de 70% et de 30%. Pour les effets délétères, plus le risque relatif est supérieur à un, plus l’effet délétère est important en taille.

2.3. Calcul de l’intervalle de confiance du risque relatif

Le calcul de l’intervalle de confiance du risque relatif passe par celui de l’intervalle de confiance du logarithme du risque relatif, car le logarithme (népérien) du risque relatif est distribué selon une loi normale et il est possible d’approcher sa variance.

La variance du logarithme du risque relatif est :

Les bornes inférieure (bi) et supérieure (bs) de l’intervalle de confiance à 95% du logarithme du risque relatif sont obtenues par :

Les bornes de l’IC à 95% du risque relatif s’obtiennent par : et

3. Odds ratio

3.1. Définition

3.1.1. Odds

L’odds ratio (dont une traduction littérale en français peut être « rapport des cotes ») est le rapport de l’odds de l’événement (sa cote, il s’agit de la cote des parieurs, comme par exemple la cote d’un cheval) dans le groupe traité divisé par l’odds de l’événement dans le groupe contrôle. L’odds est égale à c = r /(1 – r) où r est la fréquence de l’événement. Ainsi un odds est le rapport du nombre de patients présentant l’événement, r×n, divisé par le nombre de patients ne présentant pas l’événement, (1-r)×n. Par exemple, un odds de 0,25 correspond au rapport 2/8 et signifie que pour 2 patients présentant l’événement, 8 ne le présentent pas (0,25=2/8=r/(1-r) ). Dans la même situation, le risque est 0,20 (2/10). Un odds peut aussi être interprétée de la façon suivante : dans un groupe, pour 100 patients ne présentant pas l’événement étudié, 100*c le présentent.

3.1.2. L’odds ratio

L’odds ratio s’obtient par

où c1 et c0 sont respectivement les odds dans le groupe traité et dans le groupe contrôle. Avec l’exemple précédent :

L’odds ratio peut être aussi exprimé en réduction relative des odds (« relative change in odds ») obtenu par : . Ainsi avec l’exemple, RRO = (1-0,49)*100% = 51%. En épidémiologie, l’odds ratio est utilisé avec les études cas-témoin pour appréhender le risque relatif qui ne peut pas être calculé directement. En effet, dans ces études, les nombres de cas et de témoins sont fixés par l’investigateur « sans que l’on connaisse la population dont-ils sont issues ». On ne peut pas le risque, et par conséquent le risque relatif, car on ne connaît pas le dénominateur. Dans certaines publications, le terme risque relatif est d’ailleurs improprement utilisé pour présenter les résultats obtenus avec un odds ratio. L’odds ratio est assez peu utilisé dans l’essai thérapeutique. Par contre il est fréquent en méta-analyse (Figure 3).

Figure 3 – Exemple de résultats rapportés sous la forme d’odds ratio dans une méta-analyse.

3.2. Interprétation

L’odds ratio s’interprète de façon similaire au risque relatif (nous allons d’ailleurs voir que l’odds ratio est proche du risque relatif). Un odds ratio de 1 correspond à l’absence d’effet. En cas d’effet bénéfique, l’odds ratio est inférieur à 1 et il est supérieur à 1 en cas d’effet délétère. Plus l’odds ratio est éloigné de 1, plus l’effet est important.

Comparaison mathématique du risque relatif et de l’odds ratio L’odds ratio peut aussi se calculer directement à partir de la table de contingence. En considérant les notations suivantes :

l’odds ratio se calcule par :

tandis que le risque relatif est :

Ainsi quand la fréquence de l’événement est faible, c’est-à-dire quand A est petit comparé à B et C petit par rapport à D, C+D est assimilable à D et A+B à B. La formule du risque relatif devient alors similaire à celle de l’odds ratio.

3.3. Relation entre l’odds ratio et le risque relatif

L’odds ratio est une estimation du risque relatif lorsque la fréquence de l’événement est faible. Sur un même jeu de données, l’odds ratio est en général assez proche du risque relatif. Ainsi avec notre exemple, OR=0,49 et RR=0,53.

L’odds ratio est d’autant plus proche du risque relatif que le risque de base dans le groupe contrôle est faible. Le tableau 3 compare la valeur des risques relatifs et des odds ratio calculés à partir des mêmes données, dans différentes situations où le risque de base est plus ou moins grand. La figure 4 représente graphiquement cette évolution de l’odds ratio en fonction du risque de base.

Tableau 3. Relation entre l’odds ratio (OR) et le risque de base (R0) dans une situation ou le risque relatif (RR) est constant et égal à 0,8.

Figure 4 – Évolution de l’odds ratio en fonction du risque de base pour un risque relatif constant de 0,8. Quand le risque de base est faible, l’odds ratio est donc une bonne approximation du risque relatif. À l’inverse, l’odds ratio tend vers zéro quand le risque de base est très important (voisin de 1) quelle que soit la valeur du risque relatif.

En termes, d’efficacité d’un traitement, l’odds ratio aura tendance à surestimer l’effet du traitement quand le risque de base est élevé (au dessus de 25% environ). Dans ce cas, les résultats présentés avec un odds ratio seront plus favorables au traitement que ceux basés sur le risque relatif et un odds ratio ne peut plus être interprété comme un risque relatif. L’odds ratio ne peut plus être utilisé pour estimer la réduction relative des risques ; et il doit être interprété en termes de réduction des odds, qui est plus importante que la réduction des risques. Par exemple, avec les données de la dernière ligne du tableau 3, l’odds ratio de 0,71 ne doit pas être interprété comme une réduction du risque de 29% puisque celle-ci n’est que de 20% par construction, mais bien comme une réduction relative des odds de 29%. Dans ce cas, l’effet du traitement exprimé en réduction des odds semble plus important que lorsqu’il est exprimé en réduction de risque.

Bien que l’odds ratio soit quelque peu décrié à l’heure actuelle comme mesure de l’effet d’un traitement 1,2, il présente néanmoins différents intérêts (cf. § 9. L’odds ratio est aussi l’indice naturel de paramètrisation d’une table 2x2. De ce fait, il intervient dans de nombreuses méthodes de calculs statistiques (régression logistique).

3.3.1. Calcul de l’intervalle de confiance de l’odds ratio

Comme pour le risque relatif, le calcul de l’intervalle de confiance de l’odds ratio se fait par l’intermédiaire de l’intervalle de confiance de son logarithme, car le logarithme (logarithme népérien) de l’odds ratio est distribué selon une loi normale et il est possible d’approcher sa variance. La variance du logarithme de l’odds ratio est :

Les bornes inférieure (bi) et supérieure (bs) de l’intervalle de confiance à 95% du logarithme de l’odds ratio sont obtenues par :

Les bornes de l’intervalle de confiance à 95% de l’odds ratio s’obtiennent alors par : et

3.3.2. Surestimation de l’effet traitement par l’odds ratio.

Exemple des unités de soins intensifs pour AVC Une méta-analyse réalisée par le Cochrane Stroke Review Group 3 a évalué l'efficacité en terme de mortalité totale ou de dépendance à la fin de la période de suivi de la prise en charge en unités neuro-vasculaires spécialisées des patients ayant présenté un accident vasculaire cérébral constitué ou transitoire, quelle qu’en soit l'ancienneté.

Cette méta-analyse conclu à un bénéfice important apporté par les unités de soins intensifs sur le risque de mortalité totale ou de dépendance, caractérisé par un odds ratio de 0,75 IC95%=[0,65 ;0,87]. Cet odds ratio ne doit cependant pas être interprété comme une réduction relative du risque de 25% car le risque de base varie entre 39,1 % et 92,3 % en fonction des essais. Ce résultat se situe donc dans une zone de risque de base où l’odds ratio sous-estime fortement le risque relatif. En refaisant les calculs de la méta-analyse directement avec le risque relatif on obtient RR=0,90 IC95%=[0,85 ;0,95], résultat toujours en faveur d’un effet du traitement mais qui apparaît alors moins important (réduction relative du risque de 10%). Dans cet exemple, l’odds ratio traduit la réduction relative des odds apporté par le traitement mais ne permet pas d’estimer la réduction relative de risque. Interpréter l’odds ratio comme un risque relatif revient à surestimer fortement (de 15%) le bénéfice de l’intervention : réduction relative de risque de 25% à la place de 10%.

3.4. Avantages et inconvénients du risque relatif par rapport à l’odds ratio

Le risque relatif est la mesure préférentielle du bénéfice relatif apporté par un traitement. Il présente cependant certaines limites. Deux indices mesurent le bénéfice relatif. Sont-ils cependant identiques ? En pratique, le risque relatif est préféré à l’odds ratio car :

  • il est d’interprétation intuitive,
  • c’est un indice qui vient naturellement à l’esprit pour mesurer l’effet d’un traitement,
  • il donne une valeur similaire à celle de l’odds ratio car dans une grande majorité des situations le risque de base est peu important.

Cependant, le risque relatif présente certaines limites. Il ne peut pas prendre la même plage de valeur en fonction du risque de base. Imaginons, que dans une population où la fréquence de base de l’événement est de 0,2, un traitement délétère entraîne un risque relatif de 4 conduisant à une fréquence sous traitement de 0,8. La mesure de l’effet de ce même traitement dans une population où la fréquence de base est supérieure à 0,25 aurait forcément conduit à un risque relatif plus petit. En effet au-dessus de r0>0,25, le produit r0 rr qui est la fréquence sous traitement r1 est supérieur à 1 ce qui est une valeur impossible. Pour un risque de base r0=0,3, le risque relatif maximum qui correspond à un risque sous traitement de r1=1 est de 1/0,3 = 3,33 inférieur à 4. Ainsi, le risque relatif ne peut pas être considéré comme étant une caractéristique universelle d’un effet traitement étant donné que sa valeur est contrainte en partie par le risque de base de la population dans laquelle est étudié l’effet. L’odds ratio (cf. infra) ne présente pas cet inconvénient. Une même valeur d’odds ratio est compatible avec tous les risques de base.

L’autre limite de cet indice provient de son asymétrie. Le risque relatif n’est pas symétrique dans l’opposition présence / absence de l’événement. Si un traitement entraîne une réduction relative du risque de 20% sur la mortalité il n’entraîne, par exemple pour un risque de base de 10%., qu’une augmentation de 2% de la survie. La survie est pourtant symétrique à la mortalité : une réduction de mortalité entraîne une augmentation de la survie, mais les tailles d’effet ne sont pas conservées. Si la fréquence de présence de l’événement est r1 dans le groupe traité et r0 dans le groupe contrôle, la fréquence de l’absence de l’événement est respectivement dans ces deux groupes 1-r1 et 1-r0. Le risque relatif rattaché à l’absence d’événement n’est pas l’inverse de celui rattaché à la présence de l’événement. Avec l’exemple initial, la fréquence de l’absence de l’événement est de 1-8%=92% dans le groupe traité et de 1-15%=85% dans le groupe contrôle. Nous avons vu que le traitement entraîne une réduction relative de 47% de la fréquence de l’événement. Par contre le traitement n’augmente que de 8% la fréquence des patients exempts de l’événement ((1-0,92 / 0,85)*100%) et non pas de 47%. Le traitement pourrait paraître moins efficace avec le critère de jugement de prévention de l’événement par rapport au critère d’échec du traitement. Il s’agit pourtant des deux façons symétriques de voir le problème. L’odds ratio ne présente pas cet inconvénient.

3.5. Bibliographie

1. Sackett DL, Deeks JJ, Altman DG. Down with the odds ratio! Evidence Based Medicine 1996;1:164-6. 2. Bland JM, Altman DG. The odds ratio. BMJ 2000;320:1468. 3. Organised inpatient (stroke unit) care for stroke. Stroke Unit Trialists' Collaboration. Cochrane Database Syst Rev 2000(2):CD000197.

4. Hazard ratio

5. Différence des risques, (absolute risk reduction)

5.1. La différence des risques

5.1.1. Définition et calcul

La différence des risques (« risk difference »), appelée aussi différence absolue ou bénéfice absolu, est égale à la différence entre le risque sous traitement (r1) et le risque sans traitement (r0). Elle se calcule par :

Le calcul de la différence des risques à partir des données de l’exemple donne : DR = 0,08 - 0,15 = 0,07 soit –7%. La différence des risques donne la taille de l’effet non ajustée sur la valeur initiale. Il est possible de rapporter la différence des risque sous forme de réduction absolue des risques RAR («absolute reduction in risk») qui est égale à :

Figure 5 – Exemple d’essai quantifiant les effets à la fois avec un risque relatif et la réduction absolue des risques (1-DR)

5.1.2. Interprétation

En l’absence d’effet du traitement, la différence est nulle. Un effet bénéfique se traduit par une différence des risques négative et un effet délétère par une valeur positive. Plus la valeur absolue de la différence de risque est importante plus l’effet est grand. Une différence des risques de -7% signifie que le traitement évite la survenue de 7 événements pour 100 patients traités. Parfois, la différence des risques est calculée comme étant la différence entre le risque sans traitement et celui avec traitement : r0-r1 (avec les données de l’exemple cela donne 0,015-0,08 = 0,07). Dans ce cas, la signification de la différence des risques est inversée : valeur positive pour un effet bénéfique, valeur négative pour une effet délétère. La première définition présente l’avantage de localiser sur un graphique les valeurs correspondantes à un effet bénéfique à gauche de la valeur témoignant l’absence d’effet, de la même façon qu’avec le risque relatif ou l’odds ratio. Calcul de l’intervalle de confiance Les bornes de l’intervalle de confiance à 95% de la différence des risques s’obtiennent par :

où var(DR) désigne la variance de la différence des risques dont une approximation est :

5.2. Le NNT

Cet indice nommé par l’abréviation NNT pour Nombre de sujet Nécessaire de Traiter (ou en anglais « Number Needed to Treat ») correspond au nombre moyen de sujets qu’il est nécessaire de traiter pour éviter 1 événement. Il est égal à l’inverse de la différence des risques :

Dans notre exemple, le NNT est égal à NNT = 1/-0,07 = -14. Le signe moins témoigne d’un effet bénéfique et l’interprétation en fonction du signe est identique à celle de la différence des risques. Attention, pour le calcul du NNT, la différence des risques ne doit pas être exprimée en pourcentage. En effet, 1/7=0,14 n’est pas la bonne valeur du NNT (rappel 7%=0,07). Un NNT de 14 signifie qu’il faut traiter en moyenne 14 patients pour éviter un événement. En effet, sans traitement le nombre d’événements attendu chez 14 sujets est de 14×0,15=2,1 tandis que sous traitement ce nombre est de 14×0,08=1,1, ce qui correspond bien à un patient de moins. En moyenne, tous les NNT patients traités, un événement est évité.

5.2.1. Exemple

“Treatment with atorvastatin 10 mg daily for 4 years in 1000 such patients would prevent 37 first major cardiovascular events … * One major first cardiovascular event would be avoided for every 27 patients treated for 4 years. We have expressed these measures of absolute benefit at our median duration of follow-up of 4 years” D’après ref. 1.

5.2.2. Différence des risques, NNT et durée de suivi

Le NNT et la différence des risques, dépendent de la durée de suivi 2. Celle-ci doit donc toujours être précisée quand on rapporte ces indices. Le tableau 4 présente l’évolution au cours du temps des risques absolus avec et sans traitement, de la différence des risques et du NNT dans une situation où le risque annuel est de 5% et le risque relatif constant et égal à 0,80. Plus la durée de suivi est longue, plus le risque sans traitement est élevé. La différence des risques augmente aussi avec la durée de suivi alors que le NNT diminue. Cette relation entre NNT et différence de risque et durée de suivi doit être prise en compte lorsque l’on compare différents traitements. Tableau 4 – Évolution en fonction de la durée de suivi de la différence des risques et du NNT

5.2.3. NNT et différence de risque

Différence des risques et NNT véhiculent la même information et quantifient le nombre d’événements évités par nombres de patients traités. En effet, cette information peut être exprimée :

  • soit en nombre d’événements évités pour 100 (ou 1000) patients traités,
  • soit en nombre de patients à traiter pour éviter 1 événement.
  • exemple, une différence des risques de 3/100 signifie que le traitement de 100 sujets durant la période de suivi de l’essai a permis d'éviter la survenue de 3 événements. La même situation correspond à un NNT de 33 signifiant qu’il faut traiter 33 patients durant la période de suivi de l’essai pour éviter 1 événement.

5.2.4. Interprétation

Depuis son introduction par Sackett 3, cet indice obtient un grand succès, car il semble très « parlant » pour les praticiens. Par exemple, à partir du nombre de patients souffrant de la maladie étudiée présent dans la clientèle d'un médecin, il estime le nombre d'événements que le traitement pourrait éviter. Il mesure en quelque sorte « l'énergie » moyenne qu'il faut dépenser pour obtenir un succès thérapeutique.

Son expression en termes d’un événement évité pour NNT patients traités a cependant tendance à faire croire qu'il existe réellement un individu qui ne présentera pas l'événement avec le traitement alors qu'il l'aurait présenté sans traitement. Il y a individualisation du bénéfice, mais cette interprétation est fausse. Cet indice est issu d'un développement valable en moyenne, et l'interprétation la plus probable est que tous les patients bénéficient un peu du traitement (il y a réduction de leur probabilité de faire un événement) et que cette réduction se traduit en moyenne par une différence de 1 du nombre moyen d'événements attendus sans et avec traitement dans un groupe de NNT patients.

Lorsque l’on dit qu’il faut traiter, par exemple, 30 patients pour éviter un événement, la tentation est forte de traduire cela en : un patient bénéficie du traitement tous les 30 patients traités. Par extension, sur 30 patients traités, 29 n’en bénéficient pas. Cette interprétation est abusive en personnalisant trop le bénéfice. Par exemple, il se peut que tous les patients bénéficient un peu du traitement en ayant par exemple leur espérance de vie augmentée de quelques mois. Donc aucun patient ne bénéficie plus que les autres.

Exemple de sur-interprétation du NNT "There's a lot of expensive technology. Some of it provides benefit for only a tiny fraction of patients and at great cost" to everybody else, Sox says. With breast cancer, for example, 800 women must be screened for 13 years to prevent a single death. Yet, women aren't going to eschew mammography because of the cost to society of the test.

à voir ici.

Pour un même domaine thérapeutique, le NNT (comme le bénéfice absolu) varie plus d’un essai à l’autre que le bénéfice relatif (mesuré par un risque relatif ou odds ratio) car le risque de base varie souvent d’un essai à l’autre. Ce point a d’ailleurs été objectivé empiriquement 4. Le tableau 5 compare les risques relatifs et les NNT obtenus dans 4 essais comparant une statine au placebo dans la prévention des maladies cardiovasculaires 5.

Pour cette raison, les NNT ne doivent pas être utilisés pour comparer deux essais, encore moins pour comparer deux traitements concurrents pour une même pathologie. Des différences de NNT pouvant témoigner aussi bien d’une différence d’efficacité des traitements que de différences de risques de bases des patients entre les essais. La comparaison des NNT de deux traitements nécessite de se baser sur des NNT correspondant à un même risque base 6. Cette standardisation est obtenue en calculant les NNT à partir des risques relatifs et d’un risque de base de référence.

Tableau 5. Comparaison des risques relatifs et des NNT concernant les événements coronariens observés dans 4 essais de prévention du risque cardiovasculaire par les statines. Risque relatif NNT (DR) Risque de base WOSCOPS 0,70 44 (23‰) 7,5% CARE 0,77 33 (30‰) 13,1% LIPID 0,77 28 (35‰) 15,9% 4S 0,70 15 (67‰) 22,6% Pour un risque de base fixé Rc, le NNT s’obtient à partir du risque relatif RR par la formule :

Par exemple, avec un traitement caractérisé par un risque relatif de 0,8, le NNT correspondant à un risque de base de 10% est égal à 1/(0,1*0,2)=50. En effet, sous traitement, le risque est 0,1*0,8=8% ce qui donne une différence des risques de 10%-8%=2% soit un NNT=1/0,02=50.

La comparaison des bénéfices absolus de différents traitements doit s’effectuer à risque de base identique.

Le tableau 6 illustre les pièges tendus par la comparaison directe des NNT de deux traitements évalués dans des essais différents. À partir des NNT obtenus par les essais, on serait amené à conclure que le traitement A apporte un plus grand bénéfice absolu que le traitement B. Cependant, cette conclusion est erronée car le risque de base de l’essai évaluant le traitement B est plus petit que celui de l’essai du traitement A. En utilisant un NNT standardisé, par exemple pour un risque de base de 10% (qui se situe au milieu des risques des essais), il apparaît que le traitement B apporte un plus fort bénéfice absolu que le traitement A.

Tableau 6. Comparaison des NNT de deux traitements évalués dans des essais différents. NNT observé dans l’essai Risque relatif Risque de base NNT standardisé pour un Rc=10% Essai A (traitement A) 35 0,81 0,15 52 Essai B (traitement B) 53 0,69 0,06 32

5.2.5. NNH

La notion de NNT peut être étendue aux événements délétères. Il s’agit alors du « Number needed to harm (NNH) » qui quantifie le nombre de patients qu’il faut exposer au traitement pour observer, en moyenne, un effet indésirable du traitement (cf. chapitre Rapport bénéfice risque).

Figure 6 – Exemple de quantification des événements indésirables faisant appel au NNH. D’après ref. 7.

5.2.6. Calcul de l’intervalle de confiance d’un NNT

Il n’existe pas de méthode de calcul satisfaisante de l’intervalle de confiance du NNT Un autre problème posé par le NNT est que le calcul de son intervalle de confiance n’est pas direct. La première idée qui vient à l’esprit est de prendre comme borne de l’intervalle de confiance du NNT l’inverse des bornes de l’intervalle de confiance de la différence des risques. Ainsi à partir d’une différence des risques de 0,07 avec un IC95% = [0,02 ;0,12], on obtient un NNT de 14,3 avec comme borne de son intervalle de confiance 1/0,02=50 et 1/0,12=8,3 soit comme IC95% [8,3 ;50].

Un problème survient avec cette méthode lorsque les bornes de l’intervalle de confiance de la différence des risques sont de part et d’autre de zéro. En effet, avec une différence de risque de 0,01 dont l’IC95% est [–0,04 ;0,06] le calcul précédent donne comme borne 1/-0,04=-25 et 1/0,06=16,6 soit un IC95%=[-25 ;16,6] pour un NNT de 1/0,01=100. L’estimation ponctuelle (100) est située en dehors de l’intervalle de confiance. Ce phénomène provient de la nature hyperbolique de la transformation 1/x. Une méthode de calcul non entièrement satisfaisante a été proposée par Doug Altman 8, et une autre par R Bender 9.

5.3. Bibliographie

1. Randomised trial of efficacy and safety of inhaled zanamivir in treatment of influenza A and B virus infections. The MIST (Management of Influenza in the Southern Hemisphere Trialists) Study Group. Lancet 1998;352(9144):1877-81. 2. Lubsen J, Hoes A, Grobbee D. Implications of trial results: the potentially misleading notions of number needed to treat and average duration of life gained. Lancet 2000;356:1757-59. 3. Sackett DL. On some clinically useful measures of the effects of treatment. Evidence Based Medecine 1996;1:37-38. 4. Schmid CH, Lau J, McIntosh MW, Cappelleri JC. An empirical study of the effect of the control rate as a predictor of treatment efficacy in meta-analysis of clinical trials. Stat Med 1998;17:1923-42. 5. Cucherat M, Lièvre M, Gueyffier F. Clinical benefits of cholesterol lowering treatments. Meta-analysis of randomized therapeutic trials. Presse Med 2000;29:965-76. 6. McQuay HJ, Moore AR. Using numerical results from systematic review in clinical practice. Anns of Internal Medicine 1997;126:712-20. 7. Zhang WY, Po AL, Dua HS, Azuara-Blanco A. Meta-analysis of randomised controlled trials comparing latanoprost with timolol in the treatment of patients with open angle glaucoma or ocular hypertension. Br J Ophthalmol 2001;85(8):983-90. 8. Altman DG. Confidence intervals for the number needed to treat. BMJ 1998;317(7168):1309-12. 9. Bender R, Lange S. Adjusting for multiple testing - when and how? J Clin Epidemiol 2001;54(4):343-9.

6. NNT

7. Le rapport des taux et la différence des taux

La « fréquence de survenue » des critères binaires est parfois exprimée sous la forme de taux d’incidence plutôt qu’en termes de risque. Par rapport au risque, un taux est calculé en utilisant comme dénominateur la durée cumulée de suivi. Le taux d’incidence s’exprime donc en nombre d’événements par personnes-années de suivi. Cette approche est particulière utile quand les individus étudiés ont eu des durées de suivi très différentes. En effet, plus le temps de surveillance d’un sujet est important, plus la probabilité qu’il présente l’événement est élevé. L’utilisation de la durée cumulée de suivi permet donc de corriger le calcul du risque de l’hétérogénéité des durées de suivi. En effet, entre deux groupes de même taille et regroupant des sujets identiques, un plus grand nombre d’événements sera observé dans celui qui aura été observé sur une plus longue période. Le risque sera alors plus important dans ce groupe que dans l’autre. Par contre, les taux d’incidence seront identiques.

Tableau 8 – Expression des résultats d’un essai en termes de taux d’incidence Durée de suivi cumulée Nombre d’événements Risque Taux d’incidence Groupe 1 (n=100) 190 PA† 19 19/100=19% 19/190=10 pour 100 PA Groupe 2 (n=100) 110 PA† 11 11/100=11% 11/110=10 pour 100 PA † PA : personnes années

Le taux d’incidence est en quelque sorte la vitesse de survenue de l’événement. Les courbes de survie sont une autre approche permettant aussi de prendre en compte la vitesse de survenue des événements.

Le taux d’incidence ne peut pas être obtenu en divisant le risque par la durée de la période d’observation, même si tous les sujets ont été suivi durant cette période. En effet, la durée de suivi cumulée intègre le temps de survenue des décès et elle est donc inférieure à la durée de la période d’observation. Pour les patients décédés, le temps de suivi est inférieur à la durée de la période d’observation.

Lorsque les taux d’incidence sont utilisées, le rapport des taux mesure le bénéfice relatif du traitement et la différence des taux mesure le bénéfice absolu.

Exemple L’essai Syst-Eur [14] compare un traitement actif au placebo dans l’hypertension artérielle du sujet âgé. 2398 sujets ont été inclus dans le groupe nitrendipine et 2297 dans le groupe placebo (Figure 7). Le nombre de patients années dans le groupe traité est de 5995, il est de 5709 dans le groupe placebo. Les durées de suivi varient entre 1 et 97 mois avec une médiane de 2 ans. 123 décès sont survenus dans le groupe traité et 137 dans le groupe contrôle, conduisant à des risques de mortalité de respectivement 123/2398=5,13% et de 137/2297=5,96%. Les taux de mortalité dans les groupes traités et contrôle sont respectivement de 20.5 et 24.0 pour 1000 personnes années, ce qui donne une différence des taux de –14 avec un IC95% de [-33 ;9] (p=0,22).

Figure 7 – Résultats de l’essai Syst Eur rapportés sous forme de taux d’incidence (pour 1000 patients années) avec quantification de l’efficacité par la différence des taux.

7.1. Bibliographie

1. Sackett DL, Deeks JJ, Altman DG. Down with the odds ratio! Evidence Based Medicine 1996;1:164-6. PMID: 2. Bland JM, Altman DG. The odds ratio. BMJ 2000;320:1468. PMID: 3. Organised inpatient (stroke unit) care for stroke. Stroke Unit Trialists' Collaboration. Cochrane Database Syst Rev 2000(2):CD000197. PMID: 4. Randomised trial of efficacy and safety of inhaled zanamivir in treatment of influenza A and B virus infections. The MIST (Management of Influenza in the Southern Hemisphere Trialists) Study Group. Lancet 1998;352(9144):1877-81. PMID: 9863784. 5. Lubsen J, Hoes A, Grobbee D. Implications of trial results: the potentially misleading notions of number needed to treat and average duration of life gained. Lancet 2000;356:1757-59. PMID: 6. Sackett DL. On some clinically useful measures of the effects of treatment. Evidence Based Medecine 1996;1:37-38. PMID: 7. Schmid CH, Lau J, McIntosh MW, Cappelleri JC. An empirical study of the effect of the control rate as a predictor of treatment efficacy in meta-analysis of clinical trials. Stat Med 1998;17:1923-42. PMID: 8. Cucherat M, Lièvre M, Gueyffier F. Clinical benefits of cholesterol lowering treatments. Meta-analysis of randomized therapeutic trials. Presse Med 2000;29:965-76. PMID: 9. McQuay HJ, Moore AR. Using numerical results from systematic review in clinical practice. Anns of Internal Medicine 1997;126:712-20. PMID: 10. Zhang WY, Po AL, Dua HS, Azuara-Blanco A. Meta-analysis of randomised controlled trials comparing latanoprost with timolol in the treatment of patients with open angle glaucoma or ocular hypertension. Br J Ophthalmol 2001;85(8):983-90. PMID: 11466259. 11. Altman DG. Confidence intervals for the number needed to treat. BMJ 1998;317(7168):1309-12. PMID: 12. Bender R, Lange S. Adjusting for multiple testing - when and how? J Clin Epidemiol 2001;54(4):343-9. PMID: 13. McGettigan P, O'Connell D. The effect of information framing on the practice of physicians. A systematic review of the published literature. Journal of General Internal Medicine 1999;14:633-642. PMID: 14. Staessen JA, Fagard R, Thijs L, Celis H, Arabidze GG, Birkenhager WH, et al. Randomised double-blind comparison of placebo and active treatment for older patients with isolated systolic hypertension. The Systolic Hypertension in Europe (Syst-Eur) Trial Investigators. Lancet 1997;350(9080):757-64. PMID:



previous next