× ATTENTION - Ce site est un prototype proposé uniquement comme démonstrateur du concept. Ce document est un brouillon inachevé présent uniquement pour tester la cohérence technique du prototype. Merci de votre compréhension.

Test unilatéral, bilatéraux

1. Test statistique bilatéral - unilatéral

Les tests statistiques peuvent être soit bilatéraux (« two-tailed, two-sided ») soit unilatéraux (« one-tailed, one-sided ») en fonction des types de conclusions que l’on cherche à faire.

L’objectif d’un test statistique est de montrer qu’il existe une différence entre 2 groupes par exemple en termes de comparaisons de 2 moyennes m1 et m2. Deux moyennes peuvent être différentes de 2 manières : soit m1 est supérieure à m2 soit m1 est inférieure à m2. Avec un test bilatéral on pourra montrer que m1>m2 ou que m1m2. On utilise un test bilatéral quand les 2 sens de la différence nous intéresse et un test unilatéral quand seulement la supériorité nous intéresse (ou seulement l’infériorité).

Dans un essai thérapeutique (Figure 1), un test bilatéral donne la possibilité de conclure de façon statistiquement significative, en fonction de ce qui est observé, soit à la supériorité du traitement étudié soit à son infériorité. Aucune conclusion n’est possible quand la différence observée n’est pas suffisamment importante pour être statistiquement significative dans un sens ou dans un autre.

Avec un test unilatéral, une seule conclusion est possible : celle de la supériorité du traitement étudiée à son contrôle. Le test conclura à une différence non statistiquement significative dans deux situations : 1) la différence observée est trop petite pour être statistiquement significative ou 2) les résultats obtenus serait en faveur de l’infériorité du traitement étudiée à son contrôle (si l’on avait fait un test bilatéral).

1 - Figure 1 - Zone de conclusion à une différence statistiquement significative avec un test bilatéral et avec un test unilatéral.

Le test bilatéral permet de conclure de manière significative aussi bien en cas d’observation d’une différence positive ou d’une différence négative. Il permet donc de conclure, en fonction de ce qu’il sera effectivement observé, soit à la supériorité de A sur B, soit à l’infériorité de A.. Le test unilatéral permet de conclure de manière significative uniquement en cas d’observation d’une différence négative. Il ne permet donc de conclure qu’à la supériorité de A sur B. Pout toutes les autres valeurs de différences observées, le résultat est non significatif.

Avec un test bilatéral on cherche à montrer que le traitement étudié est soit supérieur, soit inférieur. Avant le test, ces deux conclusions diamétralement opposées sont potentiellement possibles et ce sont les résultats observés qui permettront de conclure à l’une ou à l’autre. Avec un test unilatéral on ne cherche à montrer que la supériorité. Si le traitement est inférieur le test ne sera pas significatif.

Ainsi dans un essai de supériorité utilisant un test bilatéral à 5%, le risque de conclure à tort à la supériorité est de 2.5% et celui de conclure à tort à l’infériorité est de 2.5%. Un essai de supériorité utilisant un test unilatéral à 5% a un risque de conclure à tort de 5% (ce qui est moins conservateur qu’un test bilatéral qui montre la supériorité).

Une différence non significative en bilatéral peut s’avérer significative en unilatéral (tableau 1 et Figure 2). Ainsi un test unilatéral possède une plus forte puissance qu’un test bilatéral. Le recours à un test unilatéral réduit le nombre de sujets nécessaires. Ce point peut être illustré grâce aux intervalles de confiance bilatéraux et unilatéraux (cf. section suivante).

Tableau 1 – Conclusions des tests bilatéraux et unilatéraux dans 4 situations différentes qui sont représentées graphiques dans la figure 2. Résultat observé p et conclusion avec un test bilatéral p et conclusion avec un test unilatéral RR = 0,70 p<0,05 Conclusion à la supériorité du traitement par rapport au placebo (effet bénéfique) p<0,025 Conclusion à la supériorité du traitement par rapport au placebo (effet bénéfique) RR = 0,79 p=0.09 Pas de conclusion possible p<0,05 Conclusion à un effet bénéfique RR = 0,98 p=0,89 Pas de conclusion possible p=0,86 Pas de conclusion possible RR = 1,45 p<0,05 Conclusion à l’infériorité du traitement par rapport au placebo (effet délétère) p=0,99 Pas de conclusion

2 - Figure 2 - Illustration des différents cas de figures décrits dans le tableau 1.

2. Intervalles de confiance

Les intervalles de confiance (IC) peuvent être aussi bilatéraux ou unilatéraux. Un IC unilatéral est défini par une seule borne (supérieure ou inférieure suivant le sens de la différence que l’on cherche à mettre en évidence).

Par exemple, un IC à 95% unilatéral de la réduction relative du risque (RRR) apporté par un nouveau traitement a pour borne supérieure une RRR de 20%. On peut raisonnablement exclure que l’efficacité du traitement soit inférieure à une réduction relative du risque de 20%. Il est raisonnable de conclure que la vraie efficacité du traitement est au moins une réduction relative de 20% du risque. Mais, on ne peut rien dire sur l’efficacité maximale.

Cette interprétation est à comparer avec celle d’un IC bilatéral, du type [20% ; 60%], avec lequel il est possible de conclure raisonnablement que la RRR apportée par le traitement est au moins de 20% et qu’elle n’excède pas 60%. La borne d’un IC unilatéral est inférieure à la borne correspondante d’un IC bilatéral comme l’illustre le schéma de la figure 3.

3 - Figure 3 - Comparaison des IC uni et bilatéraux.

La borne supérieure d’un IC unilatéral à 95% a la même valeur que la borne supérieure d’IC bilatéral à 90%. En simplifiant, il est possible de dire que l’IC bilatéral à 95% exclut de chaque coté 2,5% des valeurs possibles sous l’effet des fluctuations aléatoire, tandis que l’IC bilatéral à 90% exclu 5% de ces valeurs de chaque coté. Un IC unilatéral à 95% exclut les valeurs « peu vraisemblables » que d’un seul coté. Contrairement à l’IC bilatéral, les 5% de valeurs exclues ne sont pas réparties également de part et d’autre mais le sont en bloc que d’un seul coté.

4 - Figure 4 - Comparaisons des bornes supérieures d’un IC bilatéral à 90% et d’un IC unilatéral à 95%.

3. Choix du type de test

Au premier abord, les tests unilatéraux semblent correspondre le plus aux hypothèses thérapeutiques. Le but d’un essai thérapeutique est de montrer qu’un traitement est supérieur au placebo (ou supérieur à un traitement de référence) et ce n’est que si l’on montre cette supériorité de façon statistiquement significative que le nouveau traitement sera utilisé. Ainsi, mettre en évidence que le nouveau traitement est inférieur ou ne pas mettre en évidence sa supériorité (test non significatif) revient au même en pratique et s’accompagne des mêmes conséquences : le traitement n’est pas utilisé.

Cependant ce sont les tests bilatéraux qui sont utilisés de façon quasi exclusive en pratique et cela pour deux principales raisons. La première est qu’il peut être important de mettre en évidence qu’un traitement est délétère pour éviter d’entreprendre des essais supplémentaires.

La seconde est qu’un test bilatéral diminue le risque d’erreur alpha sur la conclusion de supériorité. Avec un test en 5%, le risque alpha de conclure à tort à la supériorité est en fait de 2,5%. Avec un test bilatéral, le même risque alpha serait de 5%. De ce fait utiliser un test bilatéral réduit le risque alpha de conclusion erronée à la supériorité du traitement étudié tout en conservant la valeur consacrée de 5%. Si un test unilatéral est utilisé, il est important que ce choix ait été fait avant de connaître les résultats. En effet, choisir a posteriori un test unilatéral afin de rendre significative une différence qui ne l’est pas avec un test bilatéral pose le problème de toute analyse post-hoc.

Exemple - Exemple 1

OBJECTIVE: The aims of this study were to substantiate the previously reported activity of ifosfamide in patients with advanced, persistent, or recurrent carcinosarcoma (mixed mesodermal sarcoma) of the uterus, and to determine whether the addition of cisplatin results in an improved response or survival. Secondarily, we sought to determine the toxicity of ifosfamide-cisplatin in this patient population. METHODS: Patients were randomized to receive ifosfamide (1.5 g/m(2)/day) times 5 days every 3 weeks for eight courses with mesna uroprotection, with or without cisplatin (20 mg/m(2)/day) times 5 days. No patient had received previous chemotherapy. RESULTS: Of 224 patients entered on this study, 30 were ineligible for a variety of reasons, leaving 194 evaluable patients. … Percentages of adverse effects reported in 191 patients receiving chemotherapy included (ifosfamide/cisplatin-ifosfamide) grade 3 or 4 granulocytopenia (36/60), grade 3 or 4 anemia (8/17), grade 3 or 4 central nervous system toxicity (19/14), and grade 3 or 4 peripheral neuropathy (1/12). Treatment may have contributed to the deaths of 6 patients treated with full doses of ifosfamide and cisplatin for 5 days. … The relative odds ratio of response adjusted for measurable sites of disease was 1.82 (P = 0.03, one-tailed test; 95% lower confidence limit, 1.06). Progression-free survival (PFS) and survival data suggest that the combination offers a slight prolongation of PFS (relative risk, 0.73; 95% upper confidence limit, 0.94; P = 0.02, one-tailed test), but no significant survival benefit (relative risk, 0.80, 95% upper confidence limit, 1.03; P = 0.071, one-tailed test). … (d’après réf (1)).

Exemple - Exemple 2

OBJECTIVE: To compare the effectiveness of 100 mg of HA-1A and placebo in reducing the 14-day all-cause mortality rate in patients with septic shock and gram-negative bacteremia in the Centocor: HA-1A Efficacy in Septic Shock (CHESS) trial, and to assess the safety of 100 mg of HA-1A given to patients with septic shock who did not have gram-negative bacteremia. DESIGN: Large, simple, group-sequential, randomized, double-blind, multicenter, placebo-controlled trial. … PATIENTS: Within 6 hours before enrollment, the patients had been in shock with a systolic blood pressure of less than 90 mm Hg after adequate fluid challenge or had received vasopressors to maintain blood pressure. These episodes of shock began within 24 hours of enrollment. A presumptive clinical diagnosis of gram-negative infection as the cause of the shock episode and a commitment from the patients' physicians to provide full supportive care were required. ... RESULTS: 2199 patients were enrolled; 621 (28.2%) met all enrollment criteria, received HA-1A or placebo, and had confirmed gram-negative bacteremia. Mortality rates in this group were as follows: placebo, 32% (95 and HA-1A, 33% (109 of 328) (P = 0.864, Fisher exact test, two-tailed; 95% CI for the difference, -6.2% to 8.6%). Mortality rates in the patients without gram-negative bacteremia were as follows: placebo, 37% (292 of 793) and HA-1A, 41% (318 of 785) (P = 0.073, Fisher exact test, one-tailed; CI, -0.8% to 8.8%). CONCLUSIONS: In this trial, HA-1A was not effective in reducing the 14-day mortality rate in patients with gram-negative bacteremia and septic shock. These data do not support using septic shock as an indication for HA-1A treatment. If HA-1A is effective in reducing the mortality rate in patients dying from endotoxemia, these patients must be identified using other treatment criteria. (D’après ref (2))

4. Bibliographie

1. Sutton G, Brunetto VL, Kilgore L, Soper JT, McGehee R, Olt G, et al. A phase III trial of ifosfamide with or without cisplatin in carcinosarcoma of the uterus: A Gynecologic Oncology Group Study. Gynecol Oncol 2000;79(2):147-53.

2. McCloskey RV, Straube RC, Sanders C, Smith SM, Smith CR. Treatment of septic shock with human monoclonal antibody HA-1A. A randomized, double-blind, placebo-controlled trial. CHESS Trial Study Group. Ann Intern Med 1994;121(1):1-5.



previous next