On interroge un échantillon de 1000 élèves choisies de façon aléatoire dans un lycée. Sur ces 1000 élèves, 523 sont des filles, 300 ont moins de 17 ans.
Question 1
Partie A
D'après l'INSEE, la proportion de filles dans la population des élèves en France est de 55,7%. En utilisant un intervalle de fluctuation asymptotique au seuil de 95%, déterminer si l'échantillon est conforme à la répartition garçons-filles dans la population française.
Correction
On commence par déterminer la fréquence observée de fille dans notre échantillon. Ainsi : fobs=1000523≈0,523 Il faut vérifier les conditions suivantes n≥30 , np≥5 et n(1−p)≥5. Ici p=0,557 et n=1000
1000≥30 donc n≥30
1000×0,557=557 donc np≥5
1000×(1−0,557)=443 donc n(1−p)≥5
Les trois conditions sont réalisées, on peut donc calculer l'intervalle de fluctuation asymptotique au seuil de 95%. On a alors : I=[p−1,96×np×(1−p);p+1,96×np×(1−p)] I=[0,557−1,96×10000,557×(1−0,557);0,557+1,96×10000,557×(1−0,557)] I=[0,526;0,588] Ici 0,526 est une valeur approchée par défaut de 0,557−1,96×10000,557×(1−0,557) Ici 0,588 est une valeur approchée par excès de 0,557+1,96×10000,557×(1−0,557) Or fobs∈/[0,526;0,588], donc la fréquence fobs du nombre de filles dans ce lycée n'est pas dans l'intervalle, l'échantillon n'est pas conforme à la répartition garçons-filles dans la population française.
Question 2
D'après l'INSEE, la proportion de jeunes de moins de 17 ans dans la population française est de 27,6%. En utilisant un intervalle de fluctuation asymptotique au seuil de 95%, déterminer si l'échantillon est conforme à la proportion de jeunes de moins de 17 ans dans la population française.
Correction
On commence par déterminer la fréquence observée des jeunes de moins de 17 ans dans ce lycée. fobs=1000300≈0,3 Il faut vérifier les conditions suivantes n≥30 , np≥5 et n(1−p)≥5. Ici p=0,276 et n=1000
1000≥30 donc n≥30
1000×0,276=276 donc np≥5
1000×(1−0,276)=724 donc n(1−p)≥5
Les trois conditions sont réalisées, on peut donc calculer l'intervalle de fluctuation asymptotique au seuil de 95%. On a alors : I=[p−1,96×np×(1−p);p+1,96×np×(1−p)] I=[0,276−1,96×10000,276×(1−0,276);0,276+1,96×10000,276×(1−0,276)] I=[0,248;0,304] Ici 0,248 est une valeur approchée par défaut de 0,276−1,96×10000,276×(1−0,276) Ici 0,304 est une valeur approchée par excès de 0,276+1,96×10000,276×(1−0,276) Or fobs∈[0,248;0,304], donc la fréquence fobs des jeunes de moins de 17 ans dans ce lycée est dans l'intervalle, l'échantillon est conforme à la répartition garçons-filles dans la population française.
Question 3
Partie B On interroge les personnes de cet échantillon au sujet d'une émission de téléréalité. 403 personnes se disent intéressées par cette émission.
Déterminer un intervalle de confiance de niveau 95% pour la proportion des personnes intéressées par cette émission dans la population.
Correction
On sait que l'on a une chance sur deux d'avoir face, ainsi p=21 et que n=300. Dans l'exercice, nous avons fobs=1000403 donc fobs=0,403. De plus la taille de l'échantillon est n=1000
Or n=1000≥30
1000×0,403=403 donc n×fobs≥5
1000×(1−0,403)=597 donc n×(1−fobs)≥5
Les trois conditions sont réalisées, on peut donc calculer l'intervalle de confiance. Il vient alors : I=[0,403−10001;0,403+10001] donc I=[0,371;0,435] Ici 0,371 est une valeur approchée par défaut de 0,403−10001 Ici 0,435 est une valeur approchée par excès de 0,403+10001
Question 4
Comment doit-on augmenter la taille de l'échantillon, pour que l'amplitude de l'intervalle de confiance soit divisée par 2 ?
Correction
L'intervalle de confiance est I=[0,371;0,435] Son amplitude vaut alors 0,435−0,371=0,064 De manière générale, l'amplitude pour un intervalle de confiance est donnée par la formule n2. Nous devons résoudre l'inéquation n2≤20,064. Ainsi : n2≤20,064 équivaut successivement à n2≤0,032 2n≥0,0321 n≥0,0322 n≥(0,0322)2 n≥3906,25 Finalement n≥3907 Nous devons passer de 1000 à 3907 personnes interrogés afin pour que l'amplitude de l'intervalle de confiance soit divisée par 2.