CONNEXION
  • RetourJeux
    • Tests
    • Soluces
    • Previews
    • Sorties
    • Hit Parade
    • Les + attendus
    • Tous les Jeux
  • RetourActu
    • Culture Geek
    • Astuces
    • Réalité Virtuelle
    • Rétrogaming
    • Toutes les actus
  • RetourHigh-Tech
    • Actus JVTECH
    • Bons plans
    • Tutoriels
    • Tests produits High-Tech
    • Guides d'achat High-Tech
    • JVTECH
  • RetourVidéos
    • A la une
    • Gaming Live
    • Vidéos Tests
    • Vidéos Previews
    • Gameplay
    • Trailers
    • Chroniques
    • Replay Web TV
    • Toutes les vidéos
  • RetourForums
    • Hardware PC
    • PS5
    • Switch
    • Xbox Series
    • Overwatch 2
    • FUT 23
    • League of Legends
    • Genshin Impact
    • Tous les Forums
  • PC
  • PS5
  • Xbox Series
  • PS4
  • One
  • Switch
  • Wii U
  • iOS
  • Android
  • MMO
  • RPG
  • FPS
En ce moment Genshin Impact Valhalla Breath of the wild Animal Crossing GTA 5 Red dead 2
Etoile Abonnement RSS

Sujet : Covariance et corrélation ? :(

News culture
La Planète des Singes : Le Nouveau Royaume - la révolution simienne est en marche !
DébutPage précedente
1
Page suivantePage suivante
Gluandouille Gluandouille
MP
Niveau 10
15 avril 2014 à 00:54:45

Bonjour à tous :)
Je ne sais pas si c'est le meilleur endroit pour poster, ni si ma requête n'est pas trop chiante :noel:
Mais voilà, le fait est que j'ai entendu pas mal de conneries à propos de ces deux concepts statistiques définissant une relation réciproque entre 2 variables !

Déjà, j'ai bon jusqu'ici, n'est ce pas :) ?

Alors, je poursuis : pour savoir si 2 variables sont liées (et, le cas échéant, à quel point elles sont liées), on affiche leur courbe puis on calcule d'une manière que j'ignore leur degré d'évolution commune (formule un peu maladroite, je ne connais pas les termes adéquats), négatif ou positif, pour peu que celui-ci ne soit pas trop faible afin de tenter d'éliminer les faux positifs (c'est-à-dire une covariance/corrélation "trouvée" sans doute uniquement à cause de la part de hasard, dont on dirait par prudence qu'elle n'est pas statistiquement significative).
Tout ça en partant de l'hypothèse "toutes choses égales par ailleurs".

J'ai encore bon ? Alors je poursuis :)

Une covariance et une corrélation statistiquement significative ont un indice compris entre [-1;-0,15]U[0,15;1], ce qui signifie selon les intervalles respectifs qu'elle sont négatives pour le premier et positives pour le second (divergence/convergence).

Une covariance/corrélation de -1 serait par exemple modélisée par un graphique en X, avec -autre exemple- la quantité d'eau contenue dans une carafe remplie de 50 cl servant mon verre pouvant en contenir autant, non :( ?
Une covariance/corrélation de 1 serait par exemple modélisée par un graphique en //, par exemple entre deux verres communicants de 25 cl de capacité chacun servis par une carafe contenant 50 cl d'eau dont on se contrefout statistiquement, c'est bien ça :-( ?

Alors, je demande à n'importe qui pouvant et voulant m'aider si :
- ce que j'ai dit est correct, dans le cas contraire, quelles sont mes erreurs
- quelle est la différence entre covariance et corrélation ?
La covariance est causalité, implication, de manière certaine car directe tandis que la corrélation peut ne pas l'être ?
Ainsi, une corrélation peut naître de covariances "reliées" ?
- "Selon une étude, le Quotient Intellectuel est très fortement lié à l'étendue du vocabulaire (0,85)"
Ce 0,85 a-t-il une signification dans le langage courant, ou ne permet-il que de se donner un ordre d'idée de l'importance de la covariance/corrélation ?
On l'a calculé comment ?
Et la phrase signifie simplement que :
- meilleur est le QI d'une personne, plus son vocabulaire est riche, de manière étroite.
Et, inversement, plus le vocabulaire d'une personne est riche, meilleur est son QI, de manière étroite.
- une corrélation ne se vérifie pas infailliblement, il s'agit d'une tendance (ce qui ferait que la phrase plus haut pourrait se lire : les gens à QI élevé tendent à avoir un vocabulaire plus riche que les gens à faible QI; les gens à vocabulaire riche ont généralement un QI plus élevé que ceux qui ont un vocabulaire pauvre) contrairement à ce qu'une prof de SES avait affirmé ?

Merci beaucoup :)
Signé :
Un fan de maths/statistiques ;)

Prauron Prauron
MP
Niveau 15
15 avril 2014 à 21:26:07

Bonjour,

"Mais voilà, le fait est que j'ai entendu pas mal de conneries à propos de ces deux concepts statistiques définissant une relation réciproque entre 2 variables !

Déjà, j'ai bon jusqu'ici, n'est ce pas :) ? "

Jusqu'ici tu as bon.

"Alors, je poursuis : pour savoir si 2 variables sont liées (et, le cas échéant, à quel point elles sont liées), on affiche leur courbe puis on calcule d'une manière que j'ignore leur degré d'évolution commune"

Si tu as 2 séries (x1,...,xn) et (y1,...yn) tu peux effectivement dessiner le nuage de points des (xi,yi) pour essayer de déceler une dépendance entre les variables X et Y, mais ça n'est pas comme ça qu'on calcule une covariance et une corrélation.

"pour peu que celui-ci ne soit pas trop faible afin de tenter d'éliminer les faux positifs (c'est-à-dire une covariance/corrélation "trouvée" sans doute uniquement à cause de la part de hasard, dont on dirait par prudence qu'elle n'est pas statistiquement significative). "

Je n'ai pas bien compris ce que tu voulais dire, mais ça n'a aucun rapport avec les "faux positifs".

"Une covariance et une corrélation statistiquement significative ont un indice compris entre [-1;-0,15]U[0,15;1], ce qui signifie selon les intervalles respectifs qu'elle sont négatives pour le premier et positives pour le second (divergence/convergence). "

Oui, après le choix d'un seuil de 0.15 est discutable.

"Une covariance/corrélation de -1 serait par exemple modélisée par un graphique en X, avec -autre exemple- la quantité d'eau contenue dans une carafe remplie de 50 cl servant mon verre pouvant en contenir autant, non :( ? "

Oui, par exemple. Si tu verses dans ton verre une quantité d'eau aléatoire X, et si on appelle Y la quantité d'eau qu'il reste dans la carafe, alors X et Y ont un coefficient de corrélation de -1. Ton second exemple est bon aussi.

Concernant la différence entre covariance et corrélation, en fait c'est pratiquement la même chose, enfin leur interprétation est identique.
Mathématiquement, le coefficient de corrélation est défini comme la covariance divisée par le produit des écart-type : r(X,Y) = Cov(X,Y)/(s(X)s(Y)).
Pourquoi fait-on ça ? Pour s'affranchir des problèmes d'échelle. Imagine que l'une des deux variables varie sur un très grand intervalle (elle peut prendre facilement de très grandes valeurs) et l'autre non. On trouve une covariance de 2000. C'est impossible à interpréter. C'est grand ? C'est petit ? On n'en sait rien. Pour éviter ce problème, on divise par les écart-types (valeur qui représente les fluctuations de la variable, en gros) de façon à obtenir une valeur qui tombe toujours entre -1 et 1, ce qui permet de comparer tous les couples de variables sur une même base.
En gros le coefficient de corrélation est juste une normalisation de la covariance.
Il existe une belle interprétation géométrique de tout ça en considérant les variables aléatoires comme des vecteurs, mais je vais passer là-dessus pour l'instant, c'est pas l'essentiel.

D'autres choses importantes à savoir là-dessus :

- une corrélation élevée n'implique absolument pas la présence de causalité, tout bon cours de proba/stat insiste là-dessus. Les ventes de climatiseurs et de glaces sont fortement corrélées. Pourtant il n'y aucune relation de causalité entre les deux, ces deux phénomènes sont juste deux conséquences d'un même fait : il fait chaud.

- une corrélation non nulle implique que les variables ne sont pas indépendantes, mais la réciproque est fausse. Si on trouve une corrélation de 0, ça ne veut pas dire qu'il y a indépendance. Deux variables peuvent avoir un lien très fort (par exemple Y = X²) tout en ayant une corrélation nulle. Ceci me mène à ma 3ème remarque.

- la covariance et la corrélation ne nous informent que sur les dépendances linéaires entre variables (du style Y = aX+b). Une relation non linéaire (comme Y = X²) n'est pas détectée par le coefficient de corrélation. Il ne faut donc pas croire que la coefficient de corrélation linéaire (d'où son nom d'ailleurs) est l'outil ultime pour étudier les relations entre variables, il en existe bien d'autres !

Voilà, si tu as d'autres questions n'hésite pas. :)

expert]hydra expert]hydra
MP
Niveau 10
15 avril 2014 à 22:52:04

Oula ça me rappelle le cours de proba qu'on a en ce moment, quel horreur, j'arrive vraiment pas à accrocher à tous ces concepts. Au début cela allait, on avait la variance, l'espérance...etc puis après c'est parti (dans le décor) avec la covariance, corrélation, la vraissemblance, estimateur,biais) .

Je relirais ton post d'ailleurs, peut-être ça m'éclairera sur ces 2 notions, merci bien.

Gluandouille Gluandouille
MP
Niveau 10
22 avril 2014 à 01:20:00

Merci Pirlout :)

Merci Prauron :) ;
mais je poursuis :noel: :
déjà, pour la phrase que tu n'as pas comprise, je voulais dire :
imaginons, le professeur Pissenlit de trouver une corrélation entre 2 variables a priori non liées, par exemple le nombre de lettres du nom de famille de quelqu'un et sa taille. Il trouve, pour des raisons de sélection statistique, une corrélation de 0,08. Pour éviter de semblables écueils, on a défini un seuil statistiquement significatif à 0,15. Ainsi, Monsieur Pissenlit ne figurera pas dans les magazines scientifiques pour sa prétendue découverte.
D'où l'analogie avec les faux positifs.

Sinon, pour ta première précision, je le savais parfaitement, et pour la seconde, je l'avais lu, mais merci pour la troisième et donc l'explication de la deuxième :)

Mais j'ai d'autres questions :
- pourquoi, pour tes 2 premières précisions, tu ne parles que des corrélations ? Cela ne s'applique pas aux covariances ? J'avais pourtant compris que si :(

- tu n'as pas répondu aux questions de la partie sur le QI et le vocabulaire (après, je pourrais essayer d'en déduire les réponses à partir de ce que tu as dit, mais en ce moment mes neurones crient "au secours" :honte: )

- ai-je bien fait de parler de covariance pour exprimer le concept statistique dont je parle sur ce topic : https://www.jeuxvideo.com/forums/1-51-50902600-1-0-1-0-attirance-systeme-de-points-et-covari.htm ?

Merci beaucoup :)

Prauron Prauron
MP
Niveau 15
23 avril 2014 à 19:22:18

Pour la première je parle de corrélation parce que "covariance élevée" ça ne veut rien dire.
Pour la deuxième, tu peux remplacer corrélation par covariance, c'est strictement équivalent (si l'une est nulle l'autre aussi).

si t'as une corrélation de 0.85 entre le QI et l'étendue du vocabulaire (nombre de mots connus je suppose), ca veut seulement dire que ces deux quantités sont très liées linéairement. Si tu dessines le nuage de points correspondant il aura une firme très allongée. Donc en règle générale les personnes à haut qi ont beaucoup de vocabulaire, et réciproquement. Il ne faut pas cependant y voir de relation de causalité, c'est juste une observation statistique, qui dépend de l'échantillon.

DébutPage précedente
1
Page suivantePage suivante
Répondre
Prévisu
?
Victime de harcèlement en ligne : comment réagir ?
Sous-forums
Infos 0 connecté(s)

Gestion du forum

Modérateurs : foundernoob
Contacter les modérateurs - Règles du forum

Sujets à ne pas manquer

  • Aucun sujet à ne pas manquer
La vidéo du moment