Echantillonnage et estimation

Intervalle de fluctuation - Exercice 3

12 min
25
On interroge un échantillon de 1000 élèves choisies de façon aléatoire dans un lycée.
Sur ces 1000 élèves, 523 sont des filles, 300 ont moins de 17 ans.
Question 1
Partie A

D'après l'INSEE, la proportion de filles dans la population des élèves en France est de 55,7%55,7\%.
En utilisant un intervalle de fluctuation asymptotique au seuil de 95%95\%, déterminer si l'échantillon est conforme à la répartition garçons-filles dans la population française.

Correction
On commence par déterminer la fréquence observée de fille dans notre échantillon.
Ainsi :
fobs=52310000,523f_{obs} =\frac{523}{1000} \approx 0,523
Il faut vérifier les conditions suivantes n30n\ge 30 , np5np\ge 5 et n(1p)5n\left(1-p\right)\ge 5.
Ici p=0,557p=0,557 et n=1000n=1000
  • 1000301000\ge 30 donc n30n\ge 30
  • 1000×0,557=5571000\times 0,557=557 donc np5np\ge 5
  • 1000×(10,557)=4431000\times \left(1-0,557\right)=443 donc n(1p)5n\left(1-p\right)\ge 5

Les trois conditions sont réalisées, on peut donc calculer l'intervalle de fluctuation asymptotique au seuil de 95%95\% .
On a alors :
I=[p1,96×p×(1p)n;p+1,96×p×(1p)n]I=\left[p-1,96\times \frac{\sqrt{p\times \left(1-p\right)} }{\sqrt{n} } ;p+1,96\times \frac{\sqrt{p\times \left(1-p\right)} }{\sqrt{n} } \right]
I=[0,5571,96×0,557×(10,557)1000;0,557+1,96×0,557×(10,557)1000]I=\left[0,557-1,96\times \frac{\sqrt{0,557\times \left(1-0,557\right)} }{\sqrt{1000} } ;0,557+1,96\times \frac{\sqrt{0,557\times \left(1-0,557\right)} }{\sqrt{1000} } \right]
I=[0,526;0,588]I=\left[0,526;0,588\right]
Ici 0,5260,526 est une valeur approchée par défaut de 0,5571,96×0,557×(10,557)10000,557-1,96\times \frac{\sqrt{0,557\times \left(1-0,557\right)} }{\sqrt{1000} }
Ici 0,5880,588 est une valeur approchée par excès de 0,557+1,96×0,557×(10,557)10000,557+1,96\times \frac{\sqrt{0,557\times \left(1-0,557\right)} }{\sqrt{1000} }
Or fobs[0,526;0,588]f_{obs} \notin \left[0,526;0,588\right], donc la fréquence fobsf_{obs} du nombre de filles dans ce lycée n'est pas dans l'intervalle, l'échantillon n'est pas conforme à la répartition garçons-filles dans la population française.
Question 2

D'après l'INSEE, la proportion de jeunes de moins de 1717 ans dans la population française est de 27,6%27,6\%.
En utilisant un intervalle de fluctuation asymptotique au seuil de 95%95\%, déterminer si l'échantillon est conforme à la proportion de jeunes de moins de 17 ans dans la population française.

Correction
On commence par déterminer la fréquence observée des jeunes de moins de 1717 ans dans ce lycée.
fobs=30010000,3f_{obs} =\frac{300}{1000} \approx 0,3
Il faut vérifier les conditions suivantes n30n\ge 30 , np5np\ge 5 et n(1p)5n\left(1-p\right)\ge 5.
Ici p=0,276p=0,276 et n=1000n=1000
  • 1000301000\ge 30 donc n30n\ge 30
  • 1000×0,276=2761000\times 0,276=276 donc np5np\ge 5
  • 1000×(10,276)=7241000\times \left(1-0,276\right)=724 donc n(1p)5n\left(1-p\right)\ge 5

Les trois conditions sont réalisées, on peut donc calculer l'intervalle de fluctuation asymptotique au seuil de 95%95\% .
On a alors :
I=[p1,96×p×(1p)n;p+1,96×p×(1p)n]I=\left[p-1,96\times \frac{\sqrt{p\times \left(1-p\right)} }{\sqrt{n} } ;p+1,96\times \frac{\sqrt{p\times \left(1-p\right)} }{\sqrt{n} } \right]
I=[0,2761,96×0,276×(10,276)1000;0,276+1,96×0,276×(10,276)1000]I=\left[0,276-1,96\times \frac{\sqrt{0,276\times \left(1-0,276\right)} }{\sqrt{1000} } ;0,276+1,96\times \frac{\sqrt{0,276\times \left(1-0,276\right)} }{\sqrt{1000} } \right]
I=[0,248;0,304]I=\left[0,248;0,304\right]
Ici 0,2480,248 est une valeur approchée par défaut de 0,2761,96×0,276×(10,276)10000,276-1,96\times \frac{\sqrt{0,276\times \left(1-0,276\right)} }{\sqrt{1000} }
Ici 0,3040,304 est une valeur approchée par excès de 0,276+1,96×0,276×(10,276)10000,276+1,96\times \frac{\sqrt{0,276\times \left(1-0,276\right)} }{\sqrt{1000} }
Or fobs[0,248;0,304]f_{obs} \in \left[0,248;0,304\right], donc la fréquence fobsf_{obs} des jeunes de moins de 1717 ans dans ce lycée est dans l'intervalle, l'échantillon est conforme à la répartition garçons-filles dans la population française.
Question 3
Partie B
On interroge les personnes de cet échantillon au sujet d'une émission de téléréalité.
403403 personnes se disent intéressées par cette émission.

Déterminer un intervalle de confiance de niveau 95%95\% pour la proportion des personnes intéressées par cette émission dans la population.

Correction
On sait que l'on a une chance sur deux d'avoir face, ainsi p=12p=\frac{1}{2} et que n=300n=300.
Dans l'exercice, nous avons fobs=4031000f_{obs} =\frac{403}{1000} donc fobs=0,403f_{obs} =0,403.
De plus la taille de l'échantillon est n=1000n=1000
  • Or n=100030n=1000\ge 30
  • 1000×0,403=4031000\times 0,403=403 donc n×fobs5n\times f_{obs} \ge 5
  • 1000×(10,403)=5971000\times \left(1-0,403\right)=597 donc n×(1fobs)5n\times \left(1-f_{obs} \right)\ge 5

Les trois conditions sont réalisées, on peut donc calculer l'intervalle de confiance.
Il vient alors :
I=[0,40311000;0,403+11000]I=\left[0,403-\frac{1}{\sqrt{1000} } ;0,403+\frac{1}{\sqrt{1000} } \right] donc I=[0,371;0,435]I=\left[0,371;0,435\right]
Ici 0,3710,371 est une valeur approchée par défaut de 0,403110000,403-\frac{1}{\sqrt{1000} }
Ici 0,4350,435 est une valeur approchée par excès de 0,403+110000,403+\frac{1}{\sqrt{1000} }
Question 4

Comment doit-on augmenter la taille de l'échantillon, pour que l'amplitude de l'intervalle de confiance soit divisée par 22 ?

Correction
L'intervalle de confiance est I=[0,371;0,435]I=\left[0,371;0,435\right]
Son amplitude vaut alors 0,4350,371=0,0640,435-0,371=0,064
De manière générale, l'amplitude pour un intervalle de confiance est donnée par la formule 2n\frac{2}{\sqrt{n} } .
Nous devons résoudre l'inéquation 2n0,0642\frac{2}{\sqrt{n} } \le \frac{0,064}{2} .
Ainsi :
2n0,0642\frac{2}{\sqrt{n} } \le \frac{0,064}{2} équivaut successivement à
2n0,032\frac{2}{\sqrt{n} } \le 0,032
n210,032\frac{\sqrt{n} }{2} \ge \frac{1}{0,032}
n20,032\sqrt{n} \ge \frac{2}{0,032}
n(20,032)2n\ge \left(\frac{2}{0,032} \right)^{2}
n3906,25n\ge 3906,25
Finalement n3907n\ge 3907
Nous devons passer de 1000 à 3907 personnes interrogés afin pour que l'amplitude de l'intervalle de confiance soit divisée par 2.