Estimation et intervalles

Exercice 1 - Exercice 1

1 min
0
Cet exercice est un questionnaire à choix multiples.
Pour chacune de ces questions, une seule des réponses proposées est exacte.
On demande bien sûr de justifier.
  • On utilise l'intervalle de fluctuation asymptotique quand on connait une proportion « théorique » pp dans une population et qu'on veut savoir si un échantillon peut être considéré comme issu de cette population.
  • On utilise l'intervalle de confiance quand on connait une fréquence ff dans un échantillon et que l'on souhaite savoir si une proportion « théorique » pp dans une population générale est contenu dans cet intervalle.
Question 1

Dans un village de 900900 personnes, la fréquence de gagner à la tombola du village est de 0,0050,005.
Alors :
  • On ne peut pas définir un intervalle asymptotique au seuil de 95%95\%.
  • On peut définir un intervalle asymptotique au seuil de 95%95\%.
  • L'espérance mathématique est positive.

Correction
La proposition correcte est la proposition a.
Il faut vérifier les conditions suivantes : n30n\ge 30 , np5np\ge 5 et n(1p)5n\left(1-p\right)\ge 5
  • 90030900\ge 30 donc n30n\ge 30
  • 900×0,005=4,5900\times 0,005=4,5 donc np5np\ge 5 n'est pas vérifiée !
On ne peut pas définir un intervalle asymptotique au seuil de 95%95\%.
Question 2

Sur une population de malades, un gène est altéré dans 6%6\% des cas.
On prélève au hasard un échantillon de 100100 personnes malades.
L'intervalle de fluctuation asymptotique au seuil de 95%95\% de la proportion de personne malade ayant le gène altéré dans cet échantillon est :
  • [0,013;0,108]\left[0,013;0,108\right]
  • [0,014;0,108]\left[0,014;0,108\right]
  • [0,013;0,107]\left[0,013;0,107\right]

(Les bornes de chaque intervalle sont données à 10310^{-3} près)

Correction
La proposition correcte est la proposition c.
Il faut vérifier les conditions suivantes : n30n\ge 30 , np5np\ge 5 et n(1p)5n\left(1-p\right)\ge 5
  • 10030100\ge 30 donc n30n\ge 30
  • 100×0,06=6100\times 0,06=6 donc np5np\ge 5
  • 100×(10,06)=94100\times \left(1-0,06\right)=94 donc n(1p)5n\left(1-p\right)\ge 5

Les trois conditions sont réalisées, on peut donc calculer l'intervalle de fluctuation asymptotique au seuil de 95%.
On a alors :
I=[p1,96×p×(1p)n;p+1,96×p×(1p)n]I=\left[p-1,96\times \frac{\sqrt{p\times \left(1-p\right)} }{\sqrt{n} } ;p+1,96\times \frac{\sqrt{p\times \left(1-p\right)} }{\sqrt{n} } \right]
I=[0,061,96×0,06×(10,06)100;0,06+1,96×0,06×(10,06)100]I=\left[0,06-1,96\times \frac{\sqrt{0,06\times \left(1-0,06\right)} }{\sqrt{100} } ;0,06+1,96\times \frac{\sqrt{0,06\times \left(1-0,06\right)} }{\sqrt{100} } \right]
I=[0,013;0,107].I=\left[0,013;0,107\right] .
Ici 0,0130,013 est une valeur approchée par défaut de 0,061,96×0,06×(10,06)1000,06-1,96\times \frac{\sqrt{0,06\times \left(1-0,06\right)} }{\sqrt{100} }
Ici 0,1070,107 est une valeur approchée par excès de 0,06+1,96×0,06×(10,06)1000,06+1,96\times \frac{\sqrt{0,06\times \left(1-0,06\right)} }{\sqrt{100} }
Question 3

On sait que, si on lance un dé équilibré, la probabilité d'obtenir 11 est de 16\frac{1}{6} .
Lina a lancé 9090 fois un dé et obtenu 2727 fois 11.
Elle peut en conclure, au seuil de 95%95\% que :
  • Le dé est équilibré
  • Le dé est pipé
  • On ne peut rien conclure

Correction
La proposition correcte est la proposition b.
Il faut vérifier les conditions suivantes : n30n\ge 30 , np5np\ge 5 et n(1p)5n\left(1-p\right)\ge 5
  • 903090\ge 30 donc n30n\ge 30
  • 90×16=1590\times \frac{1}{6} =15 donc np5np\ge 5
  • 90×(116)=7590\times \left(1-\frac{1}{6} \right)=75 donc n(1p)5n\left(1-p\right)\ge 5

Les trois conditions sont réalisées, on peut donc calculer l'intervalle de fluctuation asymptotique au seuil de 95%.
On a alors :
I=[p1,96×p×(1p)n;p+1,96×p×(1p)n]I=\left[p-1,96\times \frac{\sqrt{p\times \left(1-p\right)} }{\sqrt{n} } ;p+1,96\times \frac{\sqrt{p\times \left(1-p\right)} }{\sqrt{n} } \right]
I=[161,96×16×(116)90;16+1,96×16×(116)90]I=\left[\frac{1}{6} -1,96\times \frac{\sqrt{\frac{1}{6} \times \left(1-\frac{1}{6} \right)} }{\sqrt{90} } ;\frac{1}{6} +1,96\times \frac{\sqrt{\frac{1}{6} \times \left(1-\frac{1}{6} \right)} }{\sqrt{90} } \right]
I=[0,089;0,244]I=\left[0,089;0,244\right]
Ici 0,0890,089 est une valeur approchée par défaut de 161,96×16×(116)90\frac{1}{6} -1,96\times \frac{\sqrt{\frac{1}{6} \times \left(1-\frac{1}{6} \right)} }{\sqrt{90} }
Ici 0,2440,244 est une valeur approchée par excès de 16+1,96×16×(116)90\frac{1}{6} +1,96\times \frac{\sqrt{\frac{1}{6} \times \left(1-\frac{1}{6} \right)} }{\sqrt{90} }
On rappelle que Lina a lancé 9090 fois un dé et obtenu 2727 fois 11 donc la fréquence observée de 11 est de fobs=2790=0,3f_{obs} =\frac{27}{90} =0,3.
Or fobs[0,089;0,244]f_{obs} \notin \left[0,089;0,244\right], le dé est donc pipé.
Question 4

Dans un village en inde, on a observé 700700 naissances de garçons sur 10801080 naissances.
On peut en conclure, au niveau de confiance à 95%95\%, que :
  • Il y a autant de naissances de garçons que de filles.
  • Il y a une différence significative entre le nombre de naissances de filles et de garçons.
  • On ne peut rien conclure.

Correction
La proposition correcte est la proposition b.
On sait que l'on a une chance sur deux d'avoir un garçon, ainsi p=12p=\frac{1}{2} et que n=700n=700.
Dans l'exercice, nous avons fobs=7001080f_{obs} =\frac{700}{1080} donc fobs=35540,65f_{obs} =\frac{35}{54} \approx 0,65.
  • Or n=108030n=1080\ge 30
  • 1080×3554=7001080\times \frac{35}{54} =700 donc n×fobs5n\times f_{obs} \ge 5
  • 1080×(13554)=3801080\times \left(1-\frac{35}{54} \right)=380 donc n×(1fobs)5n\times \left(1-f_{obs} \right)\ge 5

Les trois conditions sont réalisées, on peut donc calculer l'intervalle de confiance.
Il vient alors :
I=[355411080;3554+11080]I=\left[\frac{35}{54} -\frac{1}{\sqrt{1080} } ;\frac{35}{54} +\frac{1}{\sqrt{1080} } \right] donc I=[0,617;0,679]I=\left[0,617;0,679\right]
Ici 0,6170,617 est une valeur approchée par défaut de 355411080\frac{35}{54} -\frac{1}{\sqrt{1080} }
Ici 0,6790,679 est une valeur approchée par excès de 3554+11080\frac{35}{54} +\frac{1}{\sqrt{1080} }
Or p[0,617;0,679]p\notin \left[0,617;0,679\right] c'est à dire 0,5[0,617;0,679]0,5\notin \left[0,617;0,679\right]
Cet intervalle ne contient par 0,50,5 donc il n'y a pas autant de naissances de garçons que de filles.
Autrement dit, il y a une différence significative entre le nombre de naissances de filles et de garçons.
Question 5

Un professeur de mathématiques a constaté sur un trimestre que sur les 120120 élèves interrogés, 8080 n'avait pas correctement réalisés leurs exercices.
Le professeur peut en conclure, au niveau de confiance de 95%95\%, que :
  • Au moins 57%57\% des élèves n'avaient pas réalisé correctement leurs exercices.
  • 23\frac{2}{3} des élèves n'avaient pas réalisé correctement leurs exercices.
  • Que les élèves ne travaillent pas assez !

Correction
La proposition correcte est la proposition a.
On ne connaît pas la valeur de pp mais on connait la taille de l'échantillon n=120n=120.
Dans l'exercice, nous avons fobs=80120f_{obs} =\frac{80}{120} donc fobs=23f_{obs} =\frac{2}{3} .
  • Or n=12030n=120\ge 30
  • 120×23=80120\times \frac{2}{3} =80 donc n×fobs5n\times f_{obs} \ge 5
  • 120×(123)=40120\times \left(1-\frac{2}{3} \right)=40 donc n×(1fobs)5n\times \left(1-f_{obs} \right)\ge 5

Les trois conditions sont réalisées, on peut donc calculer l'intervalle de confiance.
Il vient alors :
I=[231120;23+1120]I=\left[\frac{2}{3} -\frac{1}{\sqrt{120} } ;\frac{2}{3} +\frac{1}{\sqrt{120} } \right] donc I=[0,575;0,758]I=\left[0,575;0,758\right]
Ici 0,5750,575 est une valeur approchée par défaut de 231120\frac{2}{3} -\frac{1}{\sqrt{120} }
Ici 0,7580,758 est une valeur approchée par excès de 23+1120\frac{2}{3} +\frac{1}{\sqrt{120} }
Le professeur peut en conclure, au niveau de confiance de 95%95\%, qu'au minimum 57,5%57,5\% des élèves n'avaient pas réalisé correctement leurs exercices.
Question 6

Un candidat à une élection commande un sondage portant sur n personnes choisies au hasard.
Lors de son précédent sondage la proportion de personnes votant pour ce candidat était de 52%52\%.
Quelle devrait être la taille nn de l'échantillon pour que, avec la même proportion de personnes favorables, le candidat soit quasiment sûr d'être élu ?
  • n2499n\ge 2499
  • n2500n\ge 2500
  • n2501n\ge 2501

Correction
La proposition correcte est la proposition b.
Ici on connaît la valeur de la fréquence observée sur l'échantillon qui est f=0,52f=0,52.
On souhaite donc construire un intervalle de confiance de la forme [f1n;f+1n]\left[f-\frac{1}{\sqrt{n} } ;f+\frac{1}{\sqrt{n} } \right] où la borne inférieure f1nf-\frac{1}{\sqrt{n} } doit être supérieure ou égale à 0,50,5 afin que le candidat soit quasiment sur d'être élu.
Ainsi :
f1n0,5f-\frac{1}{\sqrt{n} } \ge0,5 équivaut successivement à
0,521n0,50,52-\frac{1}{\sqrt{n} } \ge0,5
1n0,50,52-\frac{1}{\sqrt{n} } \ge0,5-0,52
1n0,02-\frac{1}{\sqrt{n} } \ge-0,02
1n0,02\frac{1}{\sqrt{n} } \le0,02 (on a multiplié par 1-1, on change donc le sens de l'inéquation )
n10,02\sqrt{n} \ge\frac{1}{0,02} (on inverse les quotients , on change donc aussi le sens de l'inéquation )
n(10,02)2n\ge\left(\frac{1}{0,02} \right)^{2}
n2500n\ge2500
Question 7

Un magicien affirme être capable, dans 75%75\% des cas, de deviner la carte tirée par une personne dans un jeu de 3232 cartes.
Lors de son spectacle, le magicien répond correctement 2626 fois sur 3535.
  • Le magicien a dit vrai.
  • Le magicien ment.
  • Ni l'un ni l'autre.

Correction
La proposition correcte est la proposition a.
Il faut vérifier les conditions suivantes n30n\ge 30 , np5np\ge 5 et n(1p)5n\left(1-p\right)\ge 5
  • 353035\ge 30 donc n30n\ge 30
  • 35×0,75=26,2535\times 0,75=26,25 donc np5np\ge 5
  • 35×(10,75)=8,7535\times \left(1-0,75\right)=8,75 donc n(1p)5n\left(1-p\right)\ge 5

Les trois conditions sont réalisées, on peut donc calculer l'intervalle de fluctuation asymptotique au seuil de 95%.
On a alors :
I=[p1,96×p×(1p)n;p+1,96×p×(1p)n]I=\left[p-1,96\times \frac{\sqrt{p\times \left(1-p\right)} }{\sqrt{n} } ;p+1,96\times \frac{\sqrt{p\times \left(1-p\right)} }{\sqrt{n} } \right]
I=[0,751,96×0,75×(10,75)35;0,75+1,96×0,75×(10,75)35]I=\left[0,75-1,96\times \frac{\sqrt{0,75\times \left(1-0,75\right)} }{\sqrt{35} } ;0,75+1,96\times \frac{\sqrt{0,75\times \left(1-0,75\right)} }{\sqrt{35} } \right]
I=[0,606;0,894]I=\left[0,606;0,894\right]
Ici 0,6060,606 est une valeur approchée par défaut de 0,751,96×0,75×(10,75)350,75-1,96\times \frac{\sqrt{0,75\times \left(1-0,75\right)} }{\sqrt{35} }
Ici 0,8940,894 est une valeur approchée par excès de 0,75+1,96×0,75×(10,75)350,75+1,96\times \frac{\sqrt{0,75\times \left(1-0,75\right)} }{\sqrt{35} }
Lors de son spectacle, le magicien répond correctement 2626 fois sur 3535, donc la fréquence observée de bonnes réponses est de fobs=26350,742f_{obs} =\frac{26}{35} \approx 0,742.
Or fobs[0,606;0,894]f_{obs} \in \left[0,606;0,894\right], le magicien a dit vrai.