vendredi 5 juin 2009

Tests d’hypothèses- Généralités

Introduction

Les tests permettent de vériﬁer la validité de certaines hypothèses faites sur un ou plusieurs paramètres et peuvent être relatifs à une ou plusieurs populations. On peut diﬀerencier les tests suivant les hypothèses à tester :

– tests de conformité : comparer le paramètre inconnu à une valeur théorique.

– tests d’égalité : comparer entre eux les paramètres de diﬀérentes populations.

– tests d’ajustement : vériﬁer si la variable observée suit une loi théorique donnée.

– tests d’indépendance : contrôler l’indépendance de deux (ou plusieurs) variables issues d’une même population.

Les deux premiers sont des tests paramétriques alors que les deux derniers des tests non paramétriques.

Vocabulaire et Généralités

Test d’hypothèses

Un test consiste à confronter deux hypothèses sur la base de l’information dont on dispose grâce à l’observation de l’échantillon. Un test est compose de 4 éléments :

-observations

-le modèle statistique d’où proviennent les données dépendant d’un paramètre inconnu

-une hypothèse principale portant sur θ, appelée hypothèse nulle

-une règle de décision : on accepte H₀ si T (x₁, . . . , x_n) ∈ W, où W est une zone de valeurs improbable pour T (x₁, . . . , x_n) sous H₀, appelée région de rejet.

Hypothèses

On considère le modèle paramétrique (Ω, A{P_θ, θ ∈ Θ}) et T (x₁, . . . , x_n) une fonction des observations à valeurs dans E. On sélectionne deux parties de Θ : Θ₀ et Θ₁ disjointes, mais pas forcement complémentaires et on déﬁnit :

– H₀ : θ ∈ Θ₀ : hypothèse nulle

– H₁ : θ ∈ Θ₁ : hypothèse alternative, ie non H₀.

On dit que l’on teste H₀ contre H₁ .

Def : On dit que l’hypothèse H₀ est simple si Θ₀ = {θ₀}, sinon elle est dite multiple (ou composite).

En général on prendra comme hypothèse H₀ une hypothèse simple.

Def : Si on teste H₀ : θ = θ₀ contre H₁ : θ = θ₀, alors on dit que le test est bilatéral. Si on teste H₀ : θ = θ₀ contre H₁ : θ > θ₀ (resp. H₁ : θ < θ₀) , alors on dit que le test est unilatéral droit (resp. gauche).

A partir de l’échantillon on observe une valeur de T (x₁, . . . , x_n) sur laquelle on basera le choix de H₀ ou H₁. T (x₁, . . . , x_n) est appelée statistique de test.

Def. : Soit W une partie de E, appelée région critique ou région de rejet.

– Si T ∈ W , alors on rejette H₀ et on accepte H1.

– Si T ∈ W_c, alors on accepte H₀, La partie W_c = E\W est la région d’acceptation.

Risques associés aux hypothèses

On prend une décision qui dépend des observations, à chaque décision on prend le risque de commettre une erreur. Comme la décision est basée sur la variable aléatoire T , on caractérise chaque erreur par sa probabilité, que l’on appelle risque.

Def. :

1. On appelle risque de 1^re espèce la valeur α(θ) qui est : α(θ) = P_θ(T ∈ W ) = P_θ(T ∈ W |H₀)

avec θ ∈ Θ0, i.e. la probabilité de choisir H1 alors que H0 est vraie (avoir un faux positif),

2. On appelle risque de 2^e espèce la valeur β(θ) qui est : β(θ) = P_θ(T ∈ W ) = P_θ(T ∈ W |H₁)

avec θ ∈ Θ₁, i.e. la probabilité de choisir H₀ alors que H₁ est vraie.

3. Soit H₀ : θ ∈ Θ₀ hypothèse multiple et α(θ) le risque de première espèce pour θ ∈ Θ₀. On appelle niveau du test la valeur α telle que α = supθ∈Θ₀.

4. On appelle puissance d’un test la probabilité de rejeter H₀ alors qu’elle est eﬀectivement fausse c’est-à-dire η(θ) = P_θ(T ∈ W |H1) = 1 − β(θ). On parle de fonction puissance dans le cas d’une hypothèse alternative multiple.

Rq. :

1. Si H₀ est simple α = α(θ₀).

2. α et β sont interdépendants car ils dépendent de W et W_c.

3. Plus le risque β est petit, plus le test est puissant. On considérera plus souvent la puissance que l’espérance de 2^eme espèce.

4. Le niveau correspond à l’erreur maximum que l’on peut commettre en rejetant H₀.

On souhaite de faibles risques d’erreur. L’idéal α=β=0 est impossible donc on trouve un compromis.

APPLICATION AU TEST DU KHI2 :

http://alea.fr.eu.org/j/pdf/khi2.pdf

-test d’adéquation à une loi de probabilité

-test d’homogénéité : comparaison d’échantillons issus de populations différentes

-test d’indépendance sur données qualitatives

Cette entrée a été publiée le vendredi 5 juin 2009 à 15:18 et taguée probabilités, statistiques, test et publié dans Boulot. Vous pouvez suivre les commentaires liés à cette entrée par flux RSS 2.0.

Feenomenale's Weblog

Tests d’hypothèses- Généralités

Introduction

Vocabulaire et Généralités

Laisser un commentaire Annuler la réponse.

(My back) pages

(Dans les) nuages

Categories

(The Dis)connection

Articles les plus consultés

Meilleurs clics

Email Subscription

Feenomenale's Weblog

Tests d’hypothèses- Généralités

Introduction

Vocabulaire et Généralités

Partager :

Articles similaires

Laisser un commentaire Annuler la réponse.

(My back) pages

(Dans les) nuages

Categories

(The Dis)connection

Articles les plus consultés

Meilleurs clics

Email Subscription