Echantillonnage et estimation

Exercice 2 - Exercice 1

1 min
0
Cet exercice est un questionnaire à choix multiples.
Pour chacune de ces questions, une seule des réponses proposées est exacte.
On demande bien sûr de justifier.
Question 1

Pour estimer le pourcentage de personnes satisfaites d'une nouvelle émission de télévision, on a effectué un sondage.
Un intervalle de confiance au seuil de 0,950,95 de la proportion p d'opinions favorables dans l'échantillon aléatoire est [0,2975;0,3575]\left[0,2975;0,3575\right].
La taille nn de l'échantillon est :
  • 11121112
  • 11111111
  • 10001000

Correction
La bonne réponse est a.
  • L'amplitude pour un intervalle de confiance est donnée par la formule 2n\frac{2}{\sqrt{n} } .
L'amplitude de l'intervalle [0,2975;0,3575]\left[0,2975;0,3575\right] est : 0,35750,2975=0,060,3575-0,2975=0,06
Nous devons résoudre l'inéquation 2n=0,06\frac{2}{\sqrt{n} } =0,06.
Ainsi
2n=0,06\frac{2}{\sqrt{n} } =0,06 équivaut successivement à
2n=0,061\frac{2}{\sqrt{n} } =\frac{0,06}{1}
n2=10,06\frac{\sqrt{n} }{2} =\frac{1}{0,06} ( si a=ba=b alors 1a=1b\frac{1}{a} =\frac{1}{b} )
n=20,06\sqrt{n} =\frac{2}{0,06}
n=(20,06)2n=\left(\frac{2}{0,06} \right)^{2}
Finalement
n=1112n=1112
(n'oubliez pas d'arrondir à l'entier supérieur)
Question 2

Dans une classe de 3838 élèves, il y a 88 fans de Barcelone FC.
Dans le lycée (10001000 personnes), il y a 100100 fans.
La classe étudiée est-elle en conformité avec le lycée ?
Voici l'intervalle de fluctuation du lycée I=[0,08;0,12]I=\left[0,08;0,12\right]
  • Vrai
  • Faux

Correction
La bonne réponse est b.
La fréquence observée de fans de Barcelone FC est de fobs=8380,21f_{obs} =\frac{8}{38} \approx 0,21
Or fobs[0,08;0,12]f_{obs} \notin \left[0,08;0,12\right] donc la classe n'est pas en conformité avec le lycée.
Question 3

Lorsque l'on calcule un intervalle de confiance ou un intervalle de fluctuation, on prend nn égal à la population (par exemple le nombre de personnes de plus de 3030 ans, le nombre de personnes votant pour le candidat A, ect..) .
Que se passe-t-il lorsque nn augmente ?
  • La largeur entre les intervalles diminue
  • La largeur entre les intervalles augmente
  • La largeur entre les intervalles ne change pas

Correction
La bonne réponse est c.
La largeur diminue.
C'est pour cela que pour avoir un bon sondage, il faut avoir un maximum de personnes interrogées.
Si l'on regarde les formules, c'est plutôt simple à deviner : la partie que l'on ajoute ou que l'on retire à pp ou à ff est divisée par racine de nn donc plus nn est grand, plus la partie sera petite.
Question 4

Un réseau social FUSEBOOC affirme que 91%91\% de ses utilisateurs âgés entre 1414 et 2020 ans sont connectés 500500 minutes par semaine.
Pour vérifier cette affirmation, un cabinet indépendant a interrogé 100100 utilisateurs de FUSEBOOC.
Sur ce lot, on a constaté que 1313 utilisateurs sont connectés moins de 500500 minutes par semaine.
Le résultat de ce test remet-il en question l'affirmation du réseau social FUSEBOOC ?

Correction
La réponse est Vrai.
Il faut vérifier les conditions suivantes n30n\ge 30 , np5np\ge 5 et n(1p)5n\left(1-p\right)\ge 5. Ici p=0,91p=0,91 et n=100n=100
  • 10030100\ge 30 donc n30n\ge 30
  • 100×0,91=91100\times 0,91=91 donc np5np\ge 5
  • 100×(10,91)=9100\times \left(1-0,91\right)=9 donc n(1p)5n\left(1-p\right)\ge 5

Les trois conditions sont réalisées, on peut donc calculer l'intervalle de fluctuation asymptotique au seuil de 95%.
On a alors :
I=[p1,96×p×(1p)n;p+1,96×p×(1p)n]I=\left[p-1,96\times \frac{\sqrt{p\times \left(1-p\right)} }{\sqrt{n} } ;p+1,96\times \frac{\sqrt{p\times \left(1-p\right)} }{\sqrt{n} } \right]
I=[0,911,96×0,91×(10,91)100;0,91+1,96×0,91×(10,91)100]I=\left[0,91-1,96\times \frac{\sqrt{0,91\times \left(1-0,91\right)} }{\sqrt{100} } ;0,91+1,96\times \frac{\sqrt{0,91\times \left(1-0,91\right)} }{\sqrt{100} } \right]
I=[0,853;0,967]I=\left[0,853;0,967\right]
  • Ici 0,8530,853 est une valeur approchée par défaut de 0,911,96×0,91×(10,91)1000,91-1,96\times \frac{\sqrt{0,91\times \left(1-0,91\right)} }{\sqrt{100} }
  • Ici 0,9670,967 est une valeur approchée par excès de 0,91+1,96×0,91×(10,91)1000,91+1,96\times \frac{\sqrt{0,91\times \left(1-0,91\right)} }{\sqrt{100} }

Or fobs[0,853;0,967]f_{obs} \in \left[0,853;0,967\right], donc la machine à sous fonctionne correctement.
Dans l'échantillon, nous avons 13 utilisateurs qui sont connectés moins de 500 minutes par semaine.
Autrement dit, nous avons 87 utilisateurs qui sont connectés plus de 500 minutes par semaine.
Ainsi fobs=87100=0,87f_{obs} =\frac{87}{100} =0,87
Or fobs[0,853;0,967]f_{obs} \in \left[0,853;0,967\right], donc l'affirmation du réseau social FUSEBOOC est vraie.
Question 5

Une chocolaterie vend un lot de 1000010000 tablettes de chocolat à une enseigne de la grande distribution.
Elle affirme au responsable achat de l'enseigne que, dans ce lot, 90%90\% des tablettes ont un pourcentage de cacao appartenant à l'intervalle [0,817;0,883]\left[0,817;0,883\right].
Afin de vérifier si cette affirmation n'est pas mensongère, le responsable achat fait prélever 550550 tablettes au hasard dans le lot et constate que, sur cet échantillon, 8080 ne répondent pas au critère.
Au vu de l'échantillon prélevé, que peut-on conclure quant à l'affirmation de la chocolaterie ?
Utilisez un intervalle de fluctuation au seuil de 95%95\%.

Correction
Il faut vérifier les conditions suivantes n30n\ge 30 , np5np\ge 5 et n(1p)5n\left(1-p\right)\ge 5. Ici p=0,9p=0,9 et n=550n=550
  • 55030550\ge 30 donc n30n\ge 30
  • 550×0,9=495550\times 0,9=495 donc np5np\ge 5
  • 550×(10,9)=55550\times \left(1-0,9\right)=55 donc n(1p)5n\left(1-p\right)\ge 5

Les trois conditions sont réalisées , on peut donc calculer l'intervalle de fluctuation asymptotique au seuil de 95%95\% .
On a alors :
I=[p1,96×p×(1p)n;p+1,96×p×(1p)n]I=\left[p-1,96\times \frac{\sqrt{p\times \left(1-p\right)} }{\sqrt{n} } ;p+1,96\times \frac{\sqrt{p\times \left(1-p\right)} }{\sqrt{n} } \right]
I=[0,91,96×0,9×(10,9)550;0,9+1,96×0,9×(10,9)550]I=\left[0,9-1,96\times \frac{\sqrt{0,9\times \left(1-0,9\right)} }{\sqrt{550} } ;0,9+1,96\times \frac{\sqrt{0,9\times \left(1-0,9\right)} }{\sqrt{550} } \right]
I=[0,874;0,926]I=\left[0,874;0,926\right]
  • Ici 0,8740,874 est une valeur approchée par défaut de 0,91,96×0,9×(10,9)5500,9-1,96\times \frac{\sqrt{0,9\times \left(1-0,9\right)} }{\sqrt{550} }
  • Ici 0,9260,926 est une valeur approchée par excès de 0,9+1,96×0,9×(10,9)5500,9+1,96\times \frac{\sqrt{0,9\times \left(1-0,9\right)} }{\sqrt{550} }

Dans l'échantillon, nous avons 80 tablettes qui ne répondent pas au critère.
Autrement dit, nous avons 470 tablettes qui répondent pas au critère.
Ainsi fobs=4705500,854f_{obs} =\frac{470}{550} \approx 0,854
Or fobs[0,874;0,926]f_{obs} \notin \left[0,874;0,926\right].
Donc on peut remettre en cause l'affirmation de la chocolaterie.