====== Rappels de probabilités et statistique + quelques applications ====== ===== Évènements, probabilités : définitions ===== * **Épreuve ou expérience aléatoire** : processus dont le résultat est incertain (tirage au hasard , jets de pièces, de dès,...) * **Évènement** : ensemble de résultats d'une épreuve aléatoire * **Évènement élémentaire ou simple** : événement constitué d'un seul élément (//e.g.// avoir un 6 pour le lancer d'un seul dé) * **Évènement composé** : union de plusieurs évènements élémentaires (//e.g.// avoir un multiple de 3 lors du lancer d'un seul dé ou de plusieurs dés) * **Évènement certain** : union de tous les évènements élémentaires. Sa probabilité vaudra 1 * **Évènement impossible** : ensemble vide d'évènement {} dont la probabilité sera nulle * **Événements incompatibles** : 2 événements sont incompatibles si et seulement si leur réalisation simultanée est impossible * **Événements compatibles** : événements dont la réalisation simultanée est possible * **Événements indépendants** : évènements tels que la réalisation de l'un n'influence pas la probabilité de réalisation de l'autre * Deux événements incompatibles, de probabilité non nulle ne sont jamais indépendants * **Espace des observables** $\Omega$ : ensemble de tous les évènements élémentaires d'une expérience aléatoire (//e.g.// {1,2,3,4,5,6} pour le lancer d'un seul dé) * **Probabilité** : quantification du caractère probable d'un évènement, nombre réel compris entre 0 et 1. Plus ce nombre est grand, plus le risque, ou la chance, que l'événement se produise est grand. * À tout événement élémentaire, $E_i$ correspond une probabilité d'obtenir cet événement, $p(E_i)$ * $0
fr:Combinatoire|analyse combinatoire]] étudie les configurations de collections finies d'objets, et les dénombrements.
* **Permutations sans répétition d'objets discernables** : si vous avez //e.g.// 5 objets différents à placer à 5 emplacements, vous avez 5 possibilités pour placer un des objets en premier lieu, puis, indépendamment 4 autres pour le second objet, 3 pour le troisième, et 2 pour le quatrième. Le cinquième n'a plus qu'une seule possibilité. L'indépendance des placements induit une multiplication des différentes possibilités, soit ici $5\times4\times3\times2\times1$ possibilités. Par généralisation, le nombre de permutations d'un nombre $n$ d'objets discernables vaut [[http://fr.wikipedia.org/wiki/Factorielle|factorielle]] de n et est noté $n!$, avec $n! = \prod_{1\le i\le n} i = 1\times 2\times 3\times \cdots \times (n-1) \times n$
* **[[wp>fr:Combinatoire#Permutations_avec_r.C3.A9p.C3.A9tition_d.27objets_discernables|Permutations avec répétition d'objets discernables]]** : si on veut déterminer le nombre total de dispositions de 9 lettres dont précisément 4 A, 3 B et 2 C, il faut réduire les $9!$ permutations en tenant compte qu'il s'agit de 3 lettres discernables, mais qu'entre elles, les lettres A, B et C sont absolument indiscernables. Dans l'exemple, il faut donc diviser par $4!$, $3!$ et $2!$. En généralisant, le nombre de permutations de //n// éléments, répartis dans //k// classes dont //n//1 sont de classe 1, //n//2 sont de classe 2, …, //n//k sont de classe //k//, indiscernables dans chaque classe, ou le nombre de permutations de //n// éléments avec //n//1, //n//2, …, //n//k répétitions, avec $\left( \sum^k_{i=1} n_i = n \right)$, est égal à : $\frac{n!}{n_1! n_2! \ldots n_k!}$
* **[[wp>fr:Arrangement|Arrangements]]** de $p$ éléments parmi $n$ : si on effectue p tirages successifs parmi un ensemble de $p$ objets différents, le nombre d'arrangements vaut $n (n-1) (n-2) ... (n-p+1)$ et est noté $A_n^p$. En utilisant les notations factorielles, on a $A_n^p= {n! \over (n-p)}\quad\mbox{avec }p\leq n!$
* Par exemple, au [[http://www.lotto.be/FR/Jouer_et_Gagner/Jeux_de_tirage/Lotto/|Lotto]], sept boules sont prélevées une par une parmi 45 boules numérotées (de 1 à 45). Cela donne donc $45\times 44\times 43\times 42\times 41\times 40\times 39 = {45! \over 38!}=228713284800$ ou deux cent vingt-huit milliards sept cent treize millions deux cent quatre-vingt-quatre mille huit cents arrangements ou tirages possibles !
* **Combinaisons sans répétition**
* En poursuivant l'exemple du lotto, ce jeu attribue des gains ((en fait statistiquement des "pertes" puisque le taux de redistribution est d'environ 50%)) en fonction des numéros des 6 premières boules tirées quelque soit l'ordre de tirage de ces boules, et du numéro de la septième (numéro bonus). Les joueurs remplissent des grilles dont l'unité de base (combinaison de jeu) consiste à indiquer 6 numéros dans une série de 45 avec une mise de 1€. Si on s'intéresse uniquement au "gros lot", le "rang 1" pour lequel les 6 numéros de la grille correspond exactement au 6 boules tirées, le nombre de combinaisons possibles est obtenu en divisant le nombre d'arrangements de 6 boules tirées parmi 45, divisé par le nombre de permutations de ces 6 boules qui donnent toutes la même combinaison. On a donc ${45! \over {39! \times 6!}}=(45\times 44\times 43\times 42\times 41\times 40)/(6\times 5\times 4\times 3\times 2) = 8145060$ possibilités !
* En généralisant, le nombre de combinaison est donc obtenu en divisant le nombre d'arrangement par la factorielle du nombre d'objets tirés. On utilise les relations et notations suivantes : $C_n^p = {A_n^p \over p!} = {n! \over (n-p)! p!} = \binom{n}{p}$
* L'exemple du Lotto permet d'introduire une **interprétation des combinaisons sans répétition comme des permutations avec répétitions de 2 objets discernables**. C'est très clair si on considère qu'une [[http://www.loterie-nationale.be/FR/Jouer_et_Gagner/Jeux_de_tirage/Lotto/Comment_Jouer/lotto_classique.aspx|grille]] reprenant les 45 possibilités indique une combinaison de jeu par 6 "croix", et 39 cases vierges. Le nombre de permutation de 6 croix et 39 cases vides vaut bien ${45! \over {39! \times 6!}}$.
* **Propriétés de** $C_n^p$ :
* Symétrie : $C_n^p = C_n^{n-p}$
* Triangle de Pascal : $C_n^p = C_{n-1}^{p} + C_{n-1}^{p-1}$
* Binôme de Newton : $(x + y)^n = \sum_{p=0}^n C_n^p \ x^p \ y^{n-p}$
* Démonstration par récurrence, considérant que la relation est vraie pour $n=0, 1$ et en utilisant la formule du triangle de Pascal, \begin{eqnarray*}
(x + y)^{n+1} &=& (x+y) \ \sum_{p=0}^n C_n^p \ x^p \ y^{n-p}\\
&=& x^{n+1} + x \sum_{p=0}^{n-1} C_n^p \ x^p \ y^{n-p} + y^{n+1} + y \sum_{p=1}^n C_n^p \ x^p \ y^{n-p}\\
&=& x^{n+1} + y^{n+1} + \sum_{p=1}^n \left[ C_n^p + C_n^{p-1}\right] \ x^p \ y^{n-p+1} \\
&=& x^{n+1} + y^{n+1} + \sum_{p=1}^n C_{n+1}^p \ x^p \ y^{n+1-p} \\
&=& \sum_{p=0}^{n+1} C_{n+1}^p \ x^p \ y^{n+1-p}
\end{eqnarray*}
===== Variable aléatoire et distributions =====
* **Variable aléatoire** : une variable aléatoire $X$ est définie sur l'espace des observables (espace des événements possibles). À chaque valeur possible $x$ correspond une probabilité $P(x)$ que $X$ soit égale à $x$
* Variable aléatoire discrète : si $x_1, x_2, x_3, ...$ constitue l'ensemble discret des valeurs possibles de $X$, les $P(x_i)$ forment la **distribution de probabilité** de la variable aléatoire $X$
* Variable aléatoire continue : si $x$ peut varier continûment, $P(x)$ est la densité de probabilité que la variable prenne une valeur comprise entre $x$ et $x+dx$. L'unité de $P(x)$ est donc en inverse de celle de l'espace des $x$ et seul $P(x) dx$ a la dimension d'une probabilité (nombre) : $P(x) dx = P(x \le X < x+dx)$
* Positivité :
* $P(x_i) \ge 0$ pour tout $x_i$ (variable aléatoire discrète)
* $P(x) \ge 0$ pour tout $x$ (variable aléatoire continue)
* Normalisation :
* $\sum_{x_i} P(x_i) =1$ (variable aléatoire discrète)
* $\int_{\Omega} P(x) dx = 1$ (variable aléatoire continue)
* Toute l'information sur une expérience est contenue dans la distribution $P(x)$}
* Une description **équivalente** est donnée par l'ensemble de toutes les grandeurs caractéristiques appelées {\bf moments de la distribution} :
* $