Bonjour,
l'écart-type mesure en quelque sort l'écart moyen entre les valeurs d'une série et la moyenne de celle-ci.
Pourquoi ne peut-on alors pas simplement calculer l'écart type en mesurant toutes les distances (en valeur absolue) des valeurs à la moyenne et en en faisant la moyenne? Pourquoi considérer les écarts au carré pour ensuite prendre la racine carrée? (ce qui ne donne pas la même valeur)
Ah et deuxième question : Il n'y a pas d'équivalent de l'écart-type mais pour la médiane?
Tu peux prendre la valeur absolue, ca te donne aussi une mesure de la distribution de tes points. L'écart-type est plus utilisé car il a des propriétés intéressantes (des formules de proba sympas, la fonction carrée est continûment différentiable, ...) que n'a pas la somme des écarts en valeur absolue.
Pour la médiane, tu as tous les percentiles qui te permettent d'avoir une idée de la distribution, mais je ne connais pas d'équivalent a la std
J'ai trouvé en anglais "Average absolute deviation"
https://en.wikipedia.org/wiki/Average_absolute_deviation
mais je ne trouve pas d'équivalent français.
Ok pour les pourcentiles, effectivement pour la médiane ça ne sert à rien de mesurer un écart moyen vu qu'on peut directement situer les valeurs de la série avec les pourcentiles.
dans L^2, l'écart-type représente la distance entre une variable aléatoire et son projeté sur $\operatorname{Vect}(1)$
Pourquoi ne peut-on alors pas simplement calculer l'écart type en mesurant toutes les distances (en valeur absolue) des valeurs à la moyenne et en en faisant la moyenne?
Tu peux faire ça mais c'est pas l'écart-type, c'est l'écart absolu moyen. Mais en fait il n'est pas vraiment utilisé parce qu'il n'a pas de propriété intéressantes, contrairement à l'écart-type. Choisir un écart quadratique et non un écart absolu permet d'avoir des interprétations géométriques très sympa, des bonnes décompositions, les calculs se passent bien, c'est dérivable... etc. Avec la valeur absolue c'est souvent plus chiant. Et puis y'a des raisons plus profondes qui viennent des probas.
Ah et deuxième question : Il n'y a pas d'équivalent de l'écart-type mais pour la médiane?
Si, c'est l'écart médian absolu : la moyenne arithmétique des valeurs absolues des différences avec la médiane. Là ça a déjà un peu plus d'intérêt.
En fait on peut montrer que la valeur c qui minimise somme((x_i -c)²), c'est la moyenne des x_i, et que la valeur c qui minimise la somme des |x_i - c|.
(ces propriétés ont des analogues probabilistes en remplaçant les sommes par des espérances et les x_i par une variable aléatoire)
Autrement dit la meilleure approximation de ta série par une constante au sens de l'écart quadratique, c'est sa moyenne. La meilleure approximation de ta série pas une constante au sens de l'écart absolu c'est la médiane.
En gros la fonction carré est à la moyenne ce que la médiane est à la valeur absolue.
Cela dit la médiane a tout de même un intérêt par rapport à la moyenne c'est qu'elle est plus robuste. Si dans ta série t'as une valeur exceptionnellement élevée, ta moyenne va exploser. La médiane ne changera pas, ou très peu.
Salut, j'ajouterai au message de Prauron que l'écart-type à l'avantage d'être beaucoup plus sensible aux valeurs très écartés de la moyenne (puisqu'un carré est d'autant plus grand que la valeur d'origine l'est).
De toute manière, comme dans beaucoup d'études statistiques, on choisit aussi les outils selon beaucoup de critères et l'écart-type peut ne pas être pertinent. Si on étudie statistiquement une mesure de longueur infime (qui ne peut être négative), ni l'écart-moyen, ni l'écart-type, ne sont vraiment des indicateurs intéressants à exploiter.
L'écart-type est très souvent employé lorsqu'on sait a priori que les erreurs se comportent de façon normale (au sens de Gauss) ce qui est souvent le cas.