Concours UE4 1991/1992 - Ex2
+2
Sergei
JuJuToulouse31
6 participants
Tutorat Licence Santé Lille Catho :: L1 - Statistiques :: Questions à propos des colles :: Très très ancien
Page 1 sur 1
Concours UE4 1991/1992 - Ex2
Bonjour!
J'ai un problème avec l'exercice 2 du concours de 1991
Le sujet est:
On évalue la valeur diagnostique d'un examen sur un échantillon représentatif de la pop (groupe A= 50 témoins et groupe B= 100malades)
Chez un sujet sain l'examen doit être négatif. Pourtant on a 7 résulats + chez les témoins et 86+ chez les malades.
Prévalence = 1.3/100 000
Calculer Se, Sp, Youden, VPP et VPN
En ce qui concerne la VPP, je vérifie d'abord si la prévalence est respectée.
On nous donne une prévalence de 1 pour 10^5, et on trouve 100 malades et 50 non malades. J'en déduis donc qu'elle n'est pas respectée à vue de nez; mais je fais quand même un chi2 qui confirme mes dires.
J'utilise donc la formule du théorème de Bayes pour calculer la VPP et je trouve environ 8*10^-5
Mon problème surgit lorsqu'il s'agit de calculer l'intervalle de confiance : je trouve S = 9,27*10^-4
En multipliant par 1,96 j'obtiens une borne négative pour mon intervalle de confiance...
Help ?
J'ai un problème avec l'exercice 2 du concours de 1991
Le sujet est:
On évalue la valeur diagnostique d'un examen sur un échantillon représentatif de la pop (groupe A= 50 témoins et groupe B= 100malades)
Chez un sujet sain l'examen doit être négatif. Pourtant on a 7 résulats + chez les témoins et 86+ chez les malades.
Prévalence = 1.3/100 000
Calculer Se, Sp, Youden, VPP et VPN
En ce qui concerne la VPP, je vérifie d'abord si la prévalence est respectée.
On nous donne une prévalence de 1 pour 10^5, et on trouve 100 malades et 50 non malades. J'en déduis donc qu'elle n'est pas respectée à vue de nez; mais je fais quand même un chi2 qui confirme mes dires.
J'utilise donc la formule du théorème de Bayes pour calculer la VPP et je trouve environ 8*10^-5
Mon problème surgit lorsqu'il s'agit de calculer l'intervalle de confiance : je trouve S = 9,27*10^-4
En multipliant par 1,96 j'obtiens une borne négative pour mon intervalle de confiance...
Help ?
JuJuToulouse31- Messages : 4
Date d'inscription : 03/11/2013
Re: Concours UE4 1991/1992 - Ex2
Salut !
En pensant commettre une erreur, tu en as fait deux Ce qui va me permettre de corriger les deux et j'espère te sera utile dans un futur proche ! (Ssssssss).
- S'il fallait juste répondre à ta question :
Je n'ai pas revérifié tes calculs, mais les bornes de l'IC d'une probabilité ne peuvent être comprises qu'entre 0 et 1.
Il faut en plus vérifier les conditions : np > 5 et n(1-p) > 5 à chaque borne.
Cela fait deux bonnes raisons pour te dire que si tu tombes là dessus un jour, on ne peut pas exprimer la borne en question de l'intervalle de confiance. (On pourra par contre peut-être exprimer l'autre !)
- En fait, y'a un souci plus haut dans le raisonnement (mais il est très intéressant et permet de remettre les choses au clair, donc c'est tout bénef pour toi !).
On fait des statistiques pour connaître, si possible, la population à partir d'un échantillon.
Le raisonnement classique, c'est : Je veux connaître X dans la population; je calcule x dans l'échantillon, et je lui donne un intervalle de confiance qui est l'intervalle centré sur x dans lequel j'ai 95% de chances de trouver X (qui est la "vraie" valeur, mais inconnue). Ça s'appelle de l'inférence statistique, ou de l'estimation.
On utilise un estimateur dans un échantillon pour estimer la vraie valeur dans la population, et c'est à cause des fluctuations d’échantillonnage qu'on a besoin d'un IC.
C'est ce que tu fais parfaitement quand tu calcules ici Se, Sp : calcul sur l'échantillon, puis IC qui est l'intervalle dans lequel on a 95% de chances de trouver Se et Sp dans la population (à cause des fluctuations d’échantillonnage).
C'est aussi le raisonnement que tu aurais utilisé si la prévalence avait été respectée et que tu avais calculé VPP et VPN à partir de ton échantillon.
Sauf qu'ici, la prévalence n'est pas respectée et tu vas utiliser le théorème de Bayes.
En faisant ça, tu utilises un calcul exact : tu calcules directement la probabilité d'être malade sachant qu'on a un test positif, parce que tu le calcules en y intégrant la valeur exacte de la prévalence (= sa valeur dans la population).
Il n'y a donc pas besoin d'IC parce que tu ne fais pas de l'estimation, mais tu fais un calcul de probabilités exact.
(Pour schématiser, 2 + 2 = 4 exactement, ça fait pas [3;5] ).
(Je devance une question que d'autres se poseront : Oui, mais dans le calcul supposé "exact" de VPP, on utilise une estimation de Se et Sp. Oui, bah c'est comme ça )
Tout ça pour expliquer un truc simple : Quand tu utilises Bayes pour connaître VPP ou VPN, ils n'ont pas d'intervalle de confiance.
(Autre argument en faveur de ça : tu n'as pas de N, parce que tu les calcule pour la population (en effet tu prends bien la prévalence sur la population) : donc N = l'infini, donc l'écart-type est nul, donc l'IC est égal à la valeur exacte calculé).
Si on veut pousser le problème jusqu'au bout, si on te demandait, connaissant VPP sur la population, quel est son intervalle de confiance sur un échantillon représentatif (donc avec la prévalence respectée) qui a un N donné : là, on lui donnera un IC parce qu'on fait de "l'estimation à l'envers" : connaissant le paramètre exact, quel est l'IC dans lequel on a 95% de chances de le voir à cause des fluctuations d’échantillonnage quand on l'applique à un échantillon.
C'est une notion un peu compliquée de comprendre quand est-ce qu'on fait de l'estimation / quand est-ce qu'on en fait pas...
Mais ça couvre en gros 2 notions dans ton programme :
- Le chapitre sur les probas (tu remarqueras qu'on ne t'y a pas parlé d'IC, puisqu'on ne fait que des calculs exacts)
- VPP et VPN calculés à partir de Bayes, puisque c'est une application du chapitre ci-dessus.
Voilà j'espère que je t'ai bien éclairé et remis les idées en place !
PS : Tu remarqueras que dans notre cours, on n'a pas donné d'IC pour VPP et VPN quand on les a calculés avec Bayes, on n'a juste pas expliqué pourquoi parce qu'on était sûr de perdre 90% de l'amphi sinon ^^
En pensant commettre une erreur, tu en as fait deux Ce qui va me permettre de corriger les deux et j'espère te sera utile dans un futur proche ! (Ssssssss).
- S'il fallait juste répondre à ta question :
Je n'ai pas revérifié tes calculs, mais les bornes de l'IC d'une probabilité ne peuvent être comprises qu'entre 0 et 1.
Il faut en plus vérifier les conditions : np > 5 et n(1-p) > 5 à chaque borne.
Cela fait deux bonnes raisons pour te dire que si tu tombes là dessus un jour, on ne peut pas exprimer la borne en question de l'intervalle de confiance. (On pourra par contre peut-être exprimer l'autre !)
- En fait, y'a un souci plus haut dans le raisonnement (mais il est très intéressant et permet de remettre les choses au clair, donc c'est tout bénef pour toi !).
On fait des statistiques pour connaître, si possible, la population à partir d'un échantillon.
Le raisonnement classique, c'est : Je veux connaître X dans la population; je calcule x dans l'échantillon, et je lui donne un intervalle de confiance qui est l'intervalle centré sur x dans lequel j'ai 95% de chances de trouver X (qui est la "vraie" valeur, mais inconnue). Ça s'appelle de l'inférence statistique, ou de l'estimation.
On utilise un estimateur dans un échantillon pour estimer la vraie valeur dans la population, et c'est à cause des fluctuations d’échantillonnage qu'on a besoin d'un IC.
C'est ce que tu fais parfaitement quand tu calcules ici Se, Sp : calcul sur l'échantillon, puis IC qui est l'intervalle dans lequel on a 95% de chances de trouver Se et Sp dans la population (à cause des fluctuations d’échantillonnage).
C'est aussi le raisonnement que tu aurais utilisé si la prévalence avait été respectée et que tu avais calculé VPP et VPN à partir de ton échantillon.
Sauf qu'ici, la prévalence n'est pas respectée et tu vas utiliser le théorème de Bayes.
En faisant ça, tu utilises un calcul exact : tu calcules directement la probabilité d'être malade sachant qu'on a un test positif, parce que tu le calcules en y intégrant la valeur exacte de la prévalence (= sa valeur dans la population).
Il n'y a donc pas besoin d'IC parce que tu ne fais pas de l'estimation, mais tu fais un calcul de probabilités exact.
(Pour schématiser, 2 + 2 = 4 exactement, ça fait pas [3;5] ).
(Je devance une question que d'autres se poseront : Oui, mais dans le calcul supposé "exact" de VPP, on utilise une estimation de Se et Sp. Oui, bah c'est comme ça )
Tout ça pour expliquer un truc simple : Quand tu utilises Bayes pour connaître VPP ou VPN, ils n'ont pas d'intervalle de confiance.
(Autre argument en faveur de ça : tu n'as pas de N, parce que tu les calcule pour la population (en effet tu prends bien la prévalence sur la population) : donc N = l'infini, donc l'écart-type est nul, donc l'IC est égal à la valeur exacte calculé).
Si on veut pousser le problème jusqu'au bout, si on te demandait, connaissant VPP sur la population, quel est son intervalle de confiance sur un échantillon représentatif (donc avec la prévalence respectée) qui a un N donné : là, on lui donnera un IC parce qu'on fait de "l'estimation à l'envers" : connaissant le paramètre exact, quel est l'IC dans lequel on a 95% de chances de le voir à cause des fluctuations d’échantillonnage quand on l'applique à un échantillon.
C'est une notion un peu compliquée de comprendre quand est-ce qu'on fait de l'estimation / quand est-ce qu'on en fait pas...
Mais ça couvre en gros 2 notions dans ton programme :
- Le chapitre sur les probas (tu remarqueras qu'on ne t'y a pas parlé d'IC, puisqu'on ne fait que des calculs exacts)
- VPP et VPN calculés à partir de Bayes, puisque c'est une application du chapitre ci-dessus.
Voilà j'espère que je t'ai bien éclairé et remis les idées en place !
PS : Tu remarqueras que dans notre cours, on n'a pas donné d'IC pour VPP et VPN quand on les a calculés avec Bayes, on n'a juste pas expliqué pourquoi parce qu'on était sûr de perdre 90% de l'amphi sinon ^^
Sergei- Messages : 222
Date d'inscription : 31/03/2012
Age : 30
Localisation : Lille
AHHHHHHHHHHHHHHHHHHHH tout s'explique
Rien à dire c'est tellement bien expliqué
Merci
Merci
JuJuToulouse31- Messages : 4
Date d'inscription : 03/11/2013
Re: Concours UE4 1991/1992 - Ex2
Bonjour! Je relance le sujet mais je n'arrive pas à vérifier la prévalence, car pour moi elle est respectée mais d'après les questions si dessus elle ne l'est pas.
J'ai réalisé un tableau de Khi 2 avec deux groupes malade (86) et non malade (47), et deux modalités observée et Théorique. En réalisant ainsi un KHi2 on trouve X2= 2,94 < X2th = 3,84.
Donc la prévalence serait respectée. Est ce qu'on pourrait m'aider à trouver l'erreur de mon raisonnement s'il vous plaît?
Merci!
J'ai réalisé un tableau de Khi 2 avec deux groupes malade (86) et non malade (47), et deux modalités observée et Théorique. En réalisant ainsi un KHi2 on trouve X2= 2,94 < X2th = 3,84.
Donc la prévalence serait respectée. Est ce qu'on pourrait m'aider à trouver l'erreur de mon raisonnement s'il vous plaît?
Merci!
Alix.c- Messages : 38
Date d'inscription : 25/09/2017
Re: Concours UE4 1991/1992 - Ex2
Salut !
Je pense que ton problème vient du calcul de tes effectifs théoriques.
On les calcule à partir de la prévalence qui est ici de "1,3 pour 100 000", soit de 0,000013 = 1,3.10-5 %.
Je pense que ton problème vient du calcul de tes effectifs théoriques.
On les calcule à partir de la prévalence qui est ici de "1,3 pour 100 000", soit de 0,000013 = 1,3.10-5 %.
Kaoline- Messages : 252
Date d'inscription : 14/01/2016
Age : 27
Re: Concours UE4 1991/1992 - Ex2
Hello, je me permet de relancer le sujet
J'ai un petit problème pour vérifier la prévalence : je ne comprend pas comment dans la correction que j'ai la personne a réussi a faire le tableau
Je pensais qu'il fallait multiplier le nombre de malade par la prévalence mais cela nous donne 0,0013
J'ai l'impression que pour trouver le 1,95 x 10^-3 il a fait 150 x prévalence
et pour l'autre 1-0,00195 = 0,998 et lorsqu'il multiplie cela par 150 jour avons 149,7
Mais je ne comprend pourquoi il a associé le 1,95 x 10^-3 au nombre de non malade et pas au nombre de malade
J'espère que j'ai écris un truc compréhensible
Merci beaucoup pour votre réponse !!
J'ai un petit problème pour vérifier la prévalence : je ne comprend pas comment dans la correction que j'ai la personne a réussi a faire le tableau
Je pensais qu'il fallait multiplier le nombre de malade par la prévalence mais cela nous donne 0,0013
J'ai l'impression que pour trouver le 1,95 x 10^-3 il a fait 150 x prévalence
et pour l'autre 1-0,00195 = 0,998 et lorsqu'il multiplie cela par 150 jour avons 149,7
Mais je ne comprend pourquoi il a associé le 1,95 x 10^-3 au nombre de non malade et pas au nombre de malade
J'espère que j'ai écris un truc compréhensible
Merci beaucoup pour votre réponse !!
hihi- Messages : 306
Date d'inscription : 25/09/2018
Re: Concours UE4 1991/1992 - Ex2
Salut :
En ce qui concerne le tableau celui-ci est inversé :
1) tu sais que ton échantillon est de 150 personnes
2) Que tu as 50 témoins (A) et 100 malades (B)
3) Tu vas donc calculer tes effectifs théoriques pour la comparaison
- Pour le nombre de malades théoriques cela sera 150*0,000013 = 0,00195
- Pour le nombre de témoins théoriques cela sera 150*(1 - 0,000013) = 150 - 0,00195 = 149,99805
Les cases théoriques ont donc été tout simplement inversées
En ce qui concerne le tableau celui-ci est inversé :
1) tu sais que ton échantillon est de 150 personnes
2) Que tu as 50 témoins (A) et 100 malades (B)
3) Tu vas donc calculer tes effectifs théoriques pour la comparaison
- Pour le nombre de malades théoriques cela sera 150*0,000013 = 0,00195
- Pour le nombre de témoins théoriques cela sera 150*(1 - 0,000013) = 150 - 0,00195 = 149,99805
Les cases théoriques ont donc été tout simplement inversées
Batmomo- Messages : 173
Date d'inscription : 25/09/2018
Localisation : Générateur nucléaire de la Batcave
Emploi/loisirs : Transporteur du Chevalier Noir la nuit et enseignant le jour
Sujets similaires
» Concours UE4 1991/1992 - Ex2
» Concours UE4 1991/1992 - Ex3
» Concours UE4 1991/1992 - Ex1
» Concours UE4 1991/1992 - Ex4
» Concours UE4 1991/1992 - Ex1
» Concours UE4 1991/1992 - Ex3
» Concours UE4 1991/1992 - Ex1
» Concours UE4 1991/1992 - Ex4
» Concours UE4 1991/1992 - Ex1
Tutorat Licence Santé Lille Catho :: L1 - Statistiques :: Questions à propos des colles :: Très très ancien
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum