Je bosse actuellement sur un problème d'estimation sparse d'inverse de matrice de variance, en utilisant une régularisation L1, dans le cadre d'un modèle gaussien multivarié. En gros l'idée est de supposer qu'on a des données gaussiennes, et qu'on a beaucoup d'indépendance entre les couples de 2 variables conditionnelement aux autres, et donc d'estimer la matrice inverse de variance en supposant de la sparsité (si l'entrée ij de la matrice de précision d'un modèle gaussien est nulle, alors Xi est indépendante de Xj conditionnelement aux autres variables)
J'ai implémenté un algorithme qui marche bien, j'obtiens de bons résultats, mais je bloque sur le choix du paramètre de régularisation.
Quand je simule les données moi même en créant une gaussienne avec une matrice de covariance sparse, je peux déduire le paramètre optimal en calculant par exemple la distance de Hamming entre la vraie matrice qui a générée mes données, et son estimation obtenue par l'algorithme.
Mais évidement, en vrai, on n'a pas accès à la vraie matrice, donc je dois faire autremement. Et là j'ai pas d'idée. Je m'en remets à vous donc !
Ah et autre chose : quand je calcule le paramètre optimal en minimisant la distance de Hamming, j'obtiens des résultats différents (de l'ordre d'un facteur 2) en fonction de si je regarde la distance entre la matrice de covariance et son estimation, ou l'INVERSE de la matrice de covariance et l'inverse de l'estimation de la variance. Comment interpréter cela? Erreur de ma part à un endroit?
Merci beaucoup !