Salut,
J'ai deux questions sur la corrélation d'une série de données avec une loi théorique.
Pour l'exemple je prend la loi théorique V(x) = racine(x).
Les données sont:
x V
9 4
16 5
25 5
=== Question 1 ===
Cela a-t-il du sens de calculer l'écart type de cette distribution ?
Je le calcule ainsi:
somme du carré des écarts aux prévision théoriques = (3-4)^2 + (4-5)^2 + (5-5)^2 = 2
division par le nombre de données : 2 / 3 = 0.66
racine de 0.66 = 0.81 = Ecart type des données par rapport aux prévisions théoriques.
=== Question 2 ===
Comment calculer le R^2 de cette distribution ? Cela fait-il sens ?
Merci!
je ne comprends pas la question. C'est quoi ce n'est pas une distribution que tu as.
Je pense que ce que tu essaies de faire c'est la régression polynomiale x = V^2 + e (je préfère l'écrire comme ça, ça évite de prendre une racine carrée).
Auquel cas ton premier calcul correspond à un estimateur de l'écart-type de e. Mais tu ne peux pas dire que c'est l'écart-type de la distribution (d'ailleurs quelle distribution ? Là tu as juste 2 séries de 3 données), ça n'a pas de sens.
Après tu peux théoriquement calculer le R^2 de ce modèle (le R^2 d'une distribution ça n'a pas de sens), mais comme dit mon vdd, de toute façon avec 3 valeurs on fait pas de stats.
Pour l'exemple, je considère uniquement 3 points (= couples (x;V)). Ce n'est qu'un exemple qui permet de faire des calculs concrets ici sur le forum.
Ma question est : j'ai des données, je veux les confronter à une loi théorique. Pour quantifier la corrélation de ces données à la loi théorique, puis-je utiliser l'écart type ? puis-je définir un R^2 ?
Un exemple concret : Je veux vérifier la loi d'Ohm U = R*I. Je fais une expérience avec une résistance constante de 10 ohms, je fais varier le courant I et j'observe la tension U.
J'obtiens trois points de données expérimentales : (I=3 ampères; U = 32 volts), (I=6 ampères; U = 60 volts), (I = 1 ampère; U = 9 volts). Comment quantifier la corrélation entre mes données et la loi d'Ohm ?
J'espère que c'est plus clair, merci de votre aide
P.S J'ai choisi n'importe quoi comme valeurs, je sais que 1 ampère est énorme.
Désolé du double post Trop courts ces délais d'edit.
J'ajoute que ma question initiale ne portait pas sur une loi théorique linéaire. Dans mon dernier exemple avec la loi d'ohm, la relation U(I) est linéaire. Mais ce qui m'intéresse est le cas général, c'est pourquoi dans mon exemple du début j'ai pris une loi théorique qui va comme la racine d'un nombre.
L'ecart type est defini sur une distribution en particulier. Donc calculer l'ecart type de U et I n'a pas de sens.
Apres, tu pourrais calculer l'ecart type de la variable (U-I). C'est ce que je voulais dire dans mon premier commentaire.
Pour ton cas en particulier, tu dois d'abors emmetre l'hypothese que U et I sont relie par une loi lineaire. Ensuite faire un calcul de regression lineaire pour estimer le facteur de proportionalite. Et finalement tu peux calculer la difference entre le modele lineaire constuit et tes value pour estimer la qualite du modele.
Dans ce cas, comment transposer la méthode à une relation non-linéaire ?
Imaginons que je veuille vérifier la loi sur la chute des corps : d = 1/2 g * t^2. Pour ce faire, je lâche un objet et je prend note de la distance qu'il parcourt dans sa chute en fonction du temps. Bref je constitue des données expérimentales.
Ensuit, je peux tracer le graphe d(t) à partir de la loi énoncée ci-dessus. Sur ce graphe, j'ajoute les points obtenus dans mon expérience de lâcher de corps. Le graphe se présente sous la forme d'une parabole. Les points obtenus sont plus ou moins bien sur cette parabole. Comment quantifier la corrélation entre mes données expérimentales et la loi à vérifier ? (pas de régression linéaire possible)
Avec excel : je fais un fit polynominale de degré 2 et bim, j'ai plein de valeurs m'aidant à apprécier la corrélation. Mais que sont-elles, comment sont-elles calculées ?
Pareil qu'en lineaire, mais en plus complique:
https://en.wikipedia.org/org/wiki/Polynomial_regression
Si je ne me trompe pas, ceci marche pour les polynomes... Qu'en est-il du cas général (j'en reviens à mon exemple initial, qui traitait d'une fonction du type racine carrée) ?
Triple, fait attention avec ce que tu appelles "le cas general". Essayer d'avoir le modele qui matche tes donnees parfaitement est souvent une course futile. Le modele qui matche le mieux est celui donne directement par tes donnees. Et c'est un modele qui n'est pas utile. Si ton modele overfit les donnees alors ton modele ne dit rien d'interessant parcequ'il ne sera pas predictif.
Sinon, si le but est d'avoir un modele tres general, ce qui est tres populaire recement ce sont les modeles de deep learning. Mais l'interepretation de ces modeles laisse souvent a desire; au sens ou ca permet de classifier/predire assez bien. Mais la raison pour laquelle le modele fonctionne n'est pas forcement comprehensible au regard des poids du modele.