{"id":2903,"date":"2020-01-09T17:27:19","date_gmt":"2020-01-09T16:27:19","guid":{"rendered":"http:\/\/www.mathnique.com\/site\/?page_id=2903"},"modified":"2020-01-11T13:17:44","modified_gmt":"2020-01-11T12:17:44","slug":"quelques-remarques-de-lig","status":"publish","type":"page","link":"https:\/\/www.mathnique.com\/site\/quelques-remarques-de-lig\/","title":{"rendered":"Quelques remarques de l'Inspection G\u00e9n\u00e9rale."},"content":{"rendered":"<p style=\"text-align: center;\"><span style=\"color: #ff0000;\"><strong>Les \u00e9preuves de statistiques dans les BTS.<\/strong><\/span><br \/><span style=\"color: #008000;\"><strong>(Note de l'Inspection g\u00e9n\u00e9rale de math\u00e9matiques)<\/strong><\/span><br \/><img loading=\"lazy\" decoding=\"async\" class=\"size-full wp-image-1561 aligncenter\" src=\"http:\/\/www.mathnique.com\/site\/wp-content\/uploads\/2017\/03\/stats.png\" alt=\"\" width=\"247\" height=\"160\" \/><\/p>\n<p style=\"text-align: left;\">On observe, dans les propositions de sujets qui sont faites pour les \u00e9preuves de math\u00e9matiques des diff\u00e9rents BTS, <strong>de nombreuses erreurs<\/strong> dans les exercices portant sur les statistiques.<br \/>Certaines d'entre elles se retrouvent d'ailleurs dans les \u00e9preuves propos\u00e9es aux candidats ce qui fait d\u00e9sordre.<br \/>La cr\u00e9dibilit\u00e9 de la formation dispens\u00e9e aux \u00e9l\u00e8ves est en cause.<br \/>De plus, il est bien connu que les annales r\u00e9gulent l'enseignement fait.<br \/>Des sujets correctement r\u00e9dig\u00e9s inciteront les professeurs \u00e0 am\u00e9liorer la qualit\u00e9 scientifique de leur cours.<\/p>\n<p><strong><em>L'objet de la pr\u00e9sente note <\/em><\/strong><strong><em>est d'attirer l'attention des professeurs sur les plus courantes de ces erreurs.<\/em><\/strong><\/p>\n<p style=\"text-align: left;\"><strong><i><span style=\"color: #008000;\">Objectif poursuivi :<\/span>\u00a0<\/i><br \/><\/strong><i>Il est indispensable, pour que les anciens \u00e9l\u00e8ves des BTS puissent suivre avec profit les cours de la formation permanente, que la formation initiale soit de qualit\u00e9 et donc que les professeurs ne r\u00e9p\u00e8tent pas des erreurs parce que pour eux les sujets d'examen sont \u00e0 priori sans t\u00e2che.<\/i><strong><br \/><\/strong><\/p>\n<ol>\n<li><strong><span style=\"color: #ff0000;\">Statistique Descriptive<\/span><\/strong>\n<ol>\n<li><span style=\"color: #008000;\"><strong>Le regroupement en classe des donn\u00e9es.<\/strong><\/span><br \/>Quand le nombre d'observations d'une variable r\u00e9elle est important, il est d'usage de faire des classes et de fournir un tableau o\u00f9 figurent les classes et le nombre d'observations par classe.<br \/>A noter qu'il s'agit d'une premi\u00e8re \u00e9tape de la d\u00e9marche statistique. On ne s'int\u00e9resse plus aux individus mais \u00e0 la population en donnant une id\u00e9e de la distribution de celle-ci. <br \/>En contre-partie, on perd de l'information.<br \/>Dans ces conditions, <strong>demander aux \u00e9l\u00e8ves de calculer m\u00e9diane, moyenne, \u00e9cart-type de la variable n'a pas de sens<\/strong>, car on ne conna\u00eet plus les valeurs prises par la variable mais seulement les intervalles dans lesquels elles se trouvent.<br \/>Tout au plus peut-on en calculer des valeurs approch\u00e9es.<br \/>La tradition veut que pour trouver une valeur approch\u00e9e de la m\u00e9diane on fasse l'approximation suivante : \u00e0 l'int\u00e9rieur d'une classe les observations sont distribu\u00e9es uniform\u00e9ment.<br \/>Cela veut dire que , si $n$ est le nombre d'observations, la fonction de r\u00e9partition dite empirique<br \/>$F : x \\mapsto \\dfrac{1}{n} \\times \\text{le nombre d'observations inferieures a } x$<br \/>qui n'est connue qu'aux extr\u00e9mit\u00e9s des classes , est approxim\u00e9e par une fonction continue affine par morceaux.<br \/>En revanche, pour trouver une valeur approch\u00e9e de la moyenne et de l'\u00e9cart-type, on proc\u00e8de \u00e0 l'approximation suivante : on fait comme si toutes les observations d'une classe avaient comme valeur commune le centre de la classe.<br \/>$F(x)$ est alors approxim\u00e9e par une fonction en escalier dont les points de discontinuit\u00e9 sont les centres des classes.<br \/>Pour le calcul de la moyenne, les deux approximations conduisent \u00e0 la m\u00eame valeur.<br \/>Il n'en est pas de m\u00eame pour le calcul de la variance. La variance est syst\u00e9matiquement sous-estim\u00e9e car on n\u00e9glige la variation \u00e0 l'int\u00e9rieur de chaque classe. <br \/>Si $\\sigma'$ est l'approximation de l'\u00e9cart-type $\\sigma$ de la s\u00e9rie statistique calcul\u00e9e ainsi , on a $\\sigma'&lt; \\sigma$.<br \/>Soit $\\sigma\"$ \u00a0l'approximation de $\\sigma$ faite en supposant, comme pour la m\u00e9diane, les observations uniform\u00e9ment distribu\u00e9es l'int\u00e9rieur de chaque classe. <br \/>S'il y a $k$ classes et si $I_j$ est la largeur de la classe $j$, un calcul simple montre que <br \/>$\\sigma^2 = \\sigma_1^2 + \\dfrac{1}{12n} \\sum n_j I_i^2$<br \/>sigma2 au carr\u00e9 est en g\u00e9n\u00e9ral plus proche de sigma2 au carr\u00e9 que sigma1 au carr\u00e9. <br \/>Cela permet d'avoir une id\u00e9e de l'erreur faite en rempla\u00e7ant sigma par sigma1 et <strong>d'\u00e9viter des questions du type : les r\u00e9sultats sont tomb\u00e9s \u00e0 $10^{-2}$ pr\u00e8s alors que l'erreur de m\u00e9thode ainsi calcul\u00e9e montre que l'on ne peut obtenir qu'une approximation de l'ordre de l'unit\u00e9.<\/strong><\/li>\n<li><strong><span style=\"color: #008000;\">La r\u00e9gression lin\u00e9aire.<br \/><\/span><\/strong><span style=\"color: #000000;\">On consid\u00e8re $n$ observations\u00a0<span style=\"caret-color: #008000;\">bigarr\u00e9es $(x,y)$.<br \/>Dans de nombreux cas, on a entre $y$ et $x$ une liaison qui peut \u00eatre repr\u00e9sent\u00e9e par une\u00a0<\/span>relation affine aux fluctuations pr\u00e8s.<br \/>On pose alors $yi =\u00a0a xi + b +ei$ o\u00f9 $a$ et $b$ sont deux\u00a0coefficients \u00e0 d\u00e9terminer.<br \/>La m\u00e9thode des moindres carr\u00e9s consiste \u00e0 d\u00e9terminer $a$ et $b$ tels que $\\sum$ ei soit minimum. $x$ est appel\u00e9\u00a0variable explicative et $y$ une\u00a0variable \u00e0 expliquer.<br \/>Cette m\u00e9thode est li\u00e9e la description euclidienne des donn\u00e9es. <br \/>Si dans l'espace euclidien \u00e0 $n$ dimensions $E_n$ $y$ et $x$ sont les vecteurs de coordonn\u00e9es respectives $(y1,y2,\\cdots,yn)$, $(y1,y2,\\cdots,yn)$,$\\bar{x}$ et $\\bar{y}$ les vecteurs ayant toutes leurs coordonn\u00e9es \u00e9gales respectivement \u00e0 la moyenne de $y$ et \u00e0 la moyenne de $x$ le vecteur\u00a0<\/span><span style=\"color: #000000;\">$a(x - \\bar{x})$\u00a0<\/span><span style=\"color: #000000; font-size: 1rem;\">est la projection orthogonale de $(y - \\bar{y})$ sur <span style=\"color: #000000;\">$(x - \\bar{x})$<\/span>.<br \/><\/span><span style=\"color: #000000;\">Le vecteur $e$ de coordonn\u00e9es $(e1,e2,\\cdots ,en)$ est donc orthogonal \u00e0 $(x - \\bar{x})$.<br \/>Si l'on pose $xi = \\alpha yi + \\beta + \\eta i$, $y$ devient la variable explicative et $x$ la variable \u00e0 expliquer. La m\u00eame m\u00e9thode consiste \u00e0 d\u00e9terminer $\\alpha$ et $\\beta$ tels que $\\eta$ soit minimum.<br \/>Les deux droites repr\u00e9sentatives sont \u00e9videmment distinctes et elles secouent en $G$ point moyen de coordonn\u00e9es $(\\bar{x},\\bar{y})$.<br \/>Dans $E$, on projette alors orthogonalement $(x - \\bar{x})$ sur<\/span><br \/><span style=\"color: #000000;\">$(y - \\bar{y})$.<br \/><strong>Il est donc absurde de faire d\u00e9terminer dans une premi\u00e8re question l'\u00e9quation de la droite des moindres carr\u00e9s o\u00f9 $y$ est la variable \u00e0 expliquer puis \u00e0 faire pr\u00e9voir $x$ quand $y$ prend une valeur donn\u00e9e. Il fallait alors faire la r\u00e9gression de $x$ en $y$ et non celle de $y$ en $x$<\/strong>.<br \/>Il doit y avoir une coh\u00e9rence entre le mod\u00e8le et son utilisation.<br \/>La d\u00e9termination de $a$ et $b$ (ou de $\\alpha$ et $\\beta$) n\u00e9cessitait avant l'usage des calculatrices des calculs longs et p\u00e9nibles.<br \/>Aussi avait-on cherch\u00e9 des m\u00e9thodes empiriques donnant un ajustement affine approximatif dans les \u00e7a o\u00f9 <br \/>$\\sum \\varepsilon_i^2&lt;&lt;\\sum(y_i - \\bar{y})^2$<br \/>L'une des plus c\u00e9l\u00e8bres est la M\u00e9thode de MAYER : <br \/>On coupe le nuage des $n$ points dans $E_2$ <br \/>(le point $M_i$ a pour coordonn\u00e9es $(x_i,y_i)$ en deux ou trois sous-nuages).<br \/>Par exemple, celui qui correspond \u00e0 des abscisses inf\u00e9rieures \u00e0 $t_1$ , celui qui correspond \u00e0 des abscisses sup\u00e9rieures \u00e0 $t_2$, les deux sous-nuages \u00e9tant de m\u00eame effectif.<br \/>Si $G1$ et $G2$ sont les points moyens de ces deux sous-nuages, la droite repr\u00e9sentative de la relation affine est la parall\u00e8le \u00e0 $(G1G2)$ passant par $G$ voire $(G1G2)$.<br \/>cette m\u00e9thode pla\u00eet \u00e0 des professeurs de math\u00e9matiques car elle fait faire des calculs de moyenne mais elle ne repose sur aucune mod\u00e9lisation.<br \/><strong>Elle est donc \u00e0 proscrire<\/strong>, les calculatrices effectuant les calculs sans difficult\u00e9.<br \/>A la limite, autant faire ajuster \u00e0 l'oeil une droite sur une repr\u00e9sentions graphique de nuage.<br \/>Le coefficient de corr\u00e9lation $\\rho$ repr\u00e9sente le cosinus de l'angle des vecteurs $(y - \\bar{y},x - \\bar{x})$ dans $E_n$, il est donc caract\u00e9ristique de la qualit\u00e9 de la repr\u00e9sentation.<br \/><strong>Dans trop de sujets, $\\rho &gt; 0,98$ ce qui dans beaucoup des cas dits concrets est trop beau pour \u00eatre vrai. Ce sont des donn\u00e9es artificielles qu'il vaut mieux \u00e9viter.<\/strong><\/span><\/li>\n<\/ol>\n<\/li>\n<li><strong><span style=\"color: #ff0000;\">Statistique inductive<br \/><\/span><\/strong>\n<ol>\n<li><span style=\"color: #008000;\"><strong>Mod\u00e8le probabiliste et statistique.<br \/><\/strong><span style=\"color: #000000;\">Dans les BTS industriels, la statistique inductive est une partie importante du programme.<br \/>Elle trouve son application en contr\u00f4le de fabrication et en fiabilit\u00e9. Dans l'industrie, il existe des proc&amp;dures normalis\u00e9es dont la description est faite dans les publications de l'AFNOR(normes ISO ou normes AFNOR).<br \/>Pour les mettre en oeuvre nul besoin de comprendre la statistique inductive, il suffit d'ex\u00e9cuter les instructions d'un algorithme.<br \/>Trop souvent les sujets sont du type \"faites comme on vous appris de faire\" et n\u00e9gligent la partie \"comprendre\", la plus int\u00e9ressante.<br \/>Rappellons que la situation concr\u00e8te est caract\u00e9ris\u00e9e par un mod\u00e8le probabiliste dont certains param\u00e8tres sont inconnus.<br \/>L'observation faite est consid\u00e9r\u00e9e comme une r\u00e9alisation de la situation concr\u00e8te al\u00e9atoire mod\u00e9lis\u00e9e.<br \/>L'objet de la statistique est de dire des choses sur les param\u00e8tres inconnus du mod\u00e8le donc de les mesurer au sens large du terme.<br \/><strong>Il est donc absurde de demander aux \u00e9l\u00e8ves de mettre en oeuvre une proc\u00e9dure sans sp\u00e9cifier le mod\u00e8le pour lequel elle est ad\u00e9quate<\/strong>.<br \/>Au niveau du BTS, sauf en maintenance, les seuls mod\u00e8les consid\u00e9r\u00e9s sont $n$ tirages ind\u00e9pendants dans une urne \u00e0 deux cat\u00e9gories ou $n$ r\u00e9p\u00e9titions ind\u00e9pendantes d'une variable gaullienne de moyenne et\/ou de variance inconnue.<br \/>La cr\u00e9dibilit\u00e9 du mod\u00e8le d\u00e9pend des conditions exp\u00e9rimentales. Il importe donc de rappeler le mod\u00e8le, ou bien au moins en partie, les conditions de l'exp\u00e9rience qui le valident. Cela est vrai en particulier pour l'ind\u00e9pendance des observations.<br \/>Il faut aussi \u00eatre rigoureux au niveau du langage; 3,5 n'est pas une variable al\u00e9atoire et si $\\mu$ est le param\u00e8tre inconnu, \u00e9crire $Pr(\\mu &lt; 3,5)$ n'a pas de sens: 3,5 est la r\u00e9alisation d'une variable al\u00e9atoire suivant par exemple une loi normale de moyenne $\\mu$ et d'\u00e9cart-type 1.\u00a0<br \/>Il ne faut pas confondre une variable al\u00e9atoire et sa r\u00e9alisation. Une fois la r\u00e9alisation faite, il n'y a plus de probabilit\u00e9, le mod\u00e8le probabiliste est dans l'action.<\/span><\/span><\/li>\n<li><strong><span style=\"color: #008000;\">Les proc\u00e9dures statistiques<br \/><\/span><\/strong><span style=\"color: #000000;\"><em>Les deux seules proc\u00e9dures statistiques enseign\u00e9es sont l'estimation et le test.<\/em><br \/><em><span style=\"color: #008000;\"><strong>Pour l'estimation<\/strong><\/span><\/em> on distingue l'estimation ponctuelle et l'estimation par intervalle.<br \/>L'estimation ponctuelle ne pose pas probl\u00e8me ; en revanche l'estimation par intervalle est l'occasion de nombreuses fautes. Souvent on confond confiance et probabilit\u00e9.<br \/>L'intervalle de confiance avant r\u00e9sultat exp\u00e9rimental est al\u00e9atoire.<br \/>On cherche deux variables al\u00e9atoires L et L' telles que si $\\mu$ est le param\u00e8tre \u00e0 estimer on ait $P_{\\mu}(\\mu \\in [L,U])=1 - \\alpha$ o\u00f9 $\\alpha$ est fix\u00e9.<br \/>En g\u00e9n\u00e9ral, $\\alpha =$0,05 et $\\mu$ est inconnu mais fix\u00e9, $P_{\\mu}$ est la loi qui r\u00e9git le ph\u00e9nom\u00e8ne.<\/span><br \/>On a un constat exp\u00e9rimental que l'on note $\\omega$ , $L(\\omega)$ et $U(\\omega)$ sont les r\u00e9alisations de L et de U.<br \/>On dit que $L(\\omega) &lt; \\mu &lt; U(\\omega)$ avec la confiance $1 - \\alpha$ pour rappeler que la proc\u00e9dure utilis\u00e9e est telle que l'intervalle al\u00e9atoire dont $[L(\\omega) , U(\\omega)]$ est une r\u00e9alisation, avait une probabilit\u00e9 $1 - \\alpha$ de recouvrir la valeur $\\mu$ inconnue.<br \/><strong>Il faut bien distinguer confiance et probabilit\u00e9<\/strong>.<br \/><em><span style=\"color: #008000;\"><strong>De m\u00eame pour les tests<\/strong><\/span>.<br \/><\/em>On choisit arbitrairement une hypoth\u00e8se nulle. <br \/>On d\u00e9termine dans l'ensemble des observations une zone de probabilit\u00e9 sup\u00e9rieure \u00e0 $1 - alpha$ si l'hypoth\u00e8se nulle est vraie \u00a0et de probabilit\u00e9 la plus petite possible lorsqu'elle est fausse.<br \/>Si l'issue observ\u00e9e est dans cette zone, cela ne veut pas dire que l'hypoth\u00e8se nulle est vraie, cela veut dire qu'avec cette hypoth\u00e8se l'issue observ\u00e9e est vraisemblable au niveau $1 - \\alpha$ et qu'il n'est pas utile de changer l'hypoth\u00e8se, celle-ci ayant \u00e9t\u00e9 choisie en fonction de sa commodit\u00e9.<br \/><strong>Il est indispensable dans un test de pr\u00e9ciser l'hypoth\u00e8se nulle, l'alternative(souvent la n\u00e9gation de la prmei\u00e8re) et le seuil choisi et d'employer un vocabulaire pr\u00e9cis<\/strong> :<br \/>\"Est-ce que $\\mu = \\mu_0$\u00a0n'a pas le m\u00eame sens que \"Tester l'hypoth\u00e8se $\\mu =\\mu_0$\".<br \/><strong>Dans une proc\u00e9dure statistique, seule la deuxi\u00e8me formulation a un sens.<\/strong><br \/>Dans le but de ne pas surcharger les programmes, la notion de <strong>param\u00e8tre nuisible<\/strong> n'est pas abord\u00e9e.<br \/>Par contre, elle appara\u00eet dans les probl\u00e8mes lors de la situation suivante :<br \/>$X_1,X_2,\\cdots,X_n$ sont $n$ variables al\u00e9atoires ind\u00e9pendantes de m\u00eame loi, la loi normale de moyenne $\\mu$ et d'\u00e9cart-type $\\sigma$, tous deux inconnus mais l'inf\u00e9rence porte sur $\\mu$. <br \/>$\\sigma$ est appel\u00e9 param\u00e8tre nuisible.<br \/>On introduit la moyenne \u00a0$\\bar{X} = \\dfrac{1}{n} \\sum X_i$ et la variance $S^2 = \\dfrac{1}{n - 1} \\sum (X_i - \\bar{X})^2$ de l'\u00e9chantillon.<br \/>On montre que $\\bar{X}$ suit une loi normale de moyenne $\\mu$ et d'\u00e9cart-type $\\dfrac{\\sigma}{\\sqrt{n}}$.<br \/>$\\dfrac{S^2}{\\sigma^2}$ suit une loi dite du khi-deux \u00e0 $n - 1$ degr\u00e9s de libert\u00e9.<br \/>Pour trouver un intervalle de confiance pour $\\mu$ ou pour ex\u00e9cuter un test dont l'hypoth\u00e8se nulle est par exemple $\\mu =\\mu_0$, on besoin de la \u00a0quantit\u00e9 $\\dfrac{\\overline{X}- \\mu}{S}$ dont la loi de probabilit\u00e9 est connue : c'est la loi de Student \u00e0 $n - 1$ degr\u00e9s de libert\u00e9 ind\u00e9pendante de $\\mu$ et de $\\sigma$.<br \/>Cela permet d'ex\u00e9cuter la proc\u00e9dure sans se pr\u00e9occuper de $\\sigma$ inconnu et nuisible.<br \/>Mais la loi de Student n'est pas u programme. La proc\u00e9dure enseign\u00e9e aux \u00e9l\u00e8ves est de faire connue si $\\dfrac{\\overline{X}- \\mu}{s}$ suivait une loi normale de moyenne 0 et d'\u00e9cart-type 1 o\u00f9 $s$ est la r\u00e9alisation de $S$ par les observations faites.<br \/><strong>Pour \u00eatre exact, il importe dans l'\u00e9nonc\u00e9 de signaler que l'on a fait cette approximation qui n'est valide que si $n \\geq 20$.<\/strong><br \/>L\u00e0 aussi, on observe trop souvent que les observations num\u00e9riques figurant dans les \u00e9nonc\u00e9s sont telles que que par exemple $\\overline{X}$ et le $\\mu$ suppos\u00e9 sont tr\u00e8s pr\u00e8s l'un de l'autre.<br \/>L\u00e0 encore, cela sent les exemples fabriqu\u00e9s, c'est trop beau pour \u00eatre vrai.<\/li>\n<\/ol>\n<\/li>\n<\/ol>\n\n\n<p><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Les \u00e9preuves de statistiques dans les BTS.(Note de l'Inspection g\u00e9n\u00e9rale de math\u00e9matiques) On observe, dans les propositions de sujets qui sont faites pour les \u00e9preuves de math\u00e9matiques des diff\u00e9rents BTS, de nombreuses erreurs dans les exercices portant sur les statistiques.Certaines d'entre elles se retrouvent d'ailleurs dans les \u00e9preuves propos\u00e9es aux candidats ce qui fait d\u00e9sordre.La &hellip; <a href=\"https:\/\/www.mathnique.com\/site\/quelques-remarques-de-lig\/\" class=\"more-link\">Continuer la lecture<span class=\"screen-reader-text\"> de &laquo;&nbsp;Quelques remarques de l'Inspection G\u00e9n\u00e9rale.&nbsp;&raquo;<\/span><\/a><\/p>\n","protected":false},"author":1,"featured_media":0,"parent":0,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"_monsterinsights_skip_tracking":false,"_monsterinsights_sitenote_active":false,"_monsterinsights_sitenote_note":"","_monsterinsights_sitenote_category":0,"footnotes":""},"class_list":["post-2903","page","type-page","status-publish","hentry"],"_links":{"self":[{"href":"https:\/\/www.mathnique.com\/site\/wp-json\/wp\/v2\/pages\/2903","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.mathnique.com\/site\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/www.mathnique.com\/site\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/www.mathnique.com\/site\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.mathnique.com\/site\/wp-json\/wp\/v2\/comments?post=2903"}],"version-history":[{"count":44,"href":"https:\/\/www.mathnique.com\/site\/wp-json\/wp\/v2\/pages\/2903\/revisions"}],"predecessor-version":[{"id":2954,"href":"https:\/\/www.mathnique.com\/site\/wp-json\/wp\/v2\/pages\/2903\/revisions\/2954"}],"wp:attachment":[{"href":"https:\/\/www.mathnique.com\/site\/wp-json\/wp\/v2\/media?parent=2903"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}