Comment faire du sentiment analysis avec Python ? sur le forum Programmation - 01-02-2021 23:49:13

Liste des sujets

Comment faire du sentiment analysis avec Python ?

Bargios

Niveau 7

01 février 2021 à 23:49:13

Bonjour,

Y a-t-il quelqu'un parmi vous qui sait comment faire de l'Opinion mining (Sentiment analysis) de qualité avec Python ?
Actuellement j'utilise le paquet textblob en version française ( https://pypi.org/project/textblob-fr/ ) pour analyser des tweets francophones mais les résultats sont décevant; j’obtiens beaucoup de valeurs nuls alors que certains messages contiennent des mots sans équivoque.

Merci

godrik

Niveau 30

02 février 2021 à 05:33:16

Ces trucs la ont toujours ete un peu douteux. Ca me parait pas clair comment text blob fait la classification.

La question fondamentale est as tu une tetra chie de tweet pre-tagge pour pouvoir faire l'apprentissage? Si tu n'as pas ca, il te faut un modele pre-entrainer.

Si tu as ca, c'est relativement facil. Tu decoupe les tweet en adjective+nom et adverbe+verbe apres avoir degager les url et ce genre de conneriw. Et j'ai envie de dire qu'un modele lineaire devrait faire l'affaire.

Azerban

Niveau 16

02 février 2021 à 10:20:59

Va voir du côté de spaCy pour ta besogne, c'est la nouvelle librairie à la mode qui est pas mal du tout. https://realpython.com/sentiment-analysis-python/

Bargios

Niveau 7

02 février 2021 à 22:50:50

Le 02 février 2021 à 05:33:16 godrik a écrit :
Ces trucs la ont toujours ete un peu douteux. Ca me parait pas clair comment text blob fait la classification.
La question fondamentale est as tu une tetra chie de tweet pre-tagge pour pouvoir faire l'apprentissage? Si tu n'as pas ca, il te faut un modele pre-entrainer.
Si tu as ca, c'est relativement facil. Tu decoupe les tweet en adjective+nom et adverbe+verbe apres avoir degager les url et ce genre de conneriw. Et j'ai envie de dire qu'un modele lineaire devrait faire l'affaire.

Ça me parait être une solution idéale mais comment parvenir à créer modèle pré-entraîné ?
J'ai lu quelques articles sur le sujet et je suis tombé sur des exemples très théorique.

Le 02 février 2021 à 10:20:59 Azerban a écrit :
Va voir du côté de spaCy pour ta besogne, c'est la nouvelle librairie à la mode qui est pas mal du tout. https://realpython.com/sentiment-analysis-python/

Génial ! C'est parfait pour analyser la construction des phrases. Je vais tester ça, merci.

Message édité le 02 février 2021 à 22:52:06 par Bargios

godrik

Niveau 30

03 février 2021 à 01:52:04

Le 02 février 2021 à 22:50:50 Bargios a écrit :
Le 02 février 2021 à 05:33:16 godrik a écrit :
Ces trucs la ont toujours ete un peu douteux. Ca me parait pas clair comment text blob fait la classification.
La question fondamentale est as tu une tetra chie de tweet pre-tagge pour pouvoir faire l'apprentissage? Si tu n'as pas ca, il te faut un modele pre-entrainer.
Si tu as ca, c'est relativement facil. Tu decoupe les tweet en adjective+nom et adverbe+verbe apres avoir degager les url et ce genre de conneriw. Et j'ai envie de dire qu'un modele lineaire devrait faire l'affaire.
Ça me parait être une solution idéale mais comment parvenir à créer modèle pré-entraîné ?
J'ai lu quelques articles sur le sujet et je suis tombé sur des exemples très théorique.

Tu ne cree pas un modele pre entraine. Tu trouve quelqu'un qui a fait l'entrainement et qui veut bien te passer le modele.
A mon avis c'est le future business model des boites comme google. Ils vont vendre l'access a des modele pre entraine.

Azerban

Niveau 16

03 février 2021 à 10:55:33

Le 03 février 2021 à 01:52:04 godrik a écrit :
Le 02 février 2021 à 22:50:50 Bargios a écrit :
Le 02 février 2021 à 05:33:16 godrik a écrit :
Ces trucs la ont toujours ete un peu douteux. Ca me parait pas clair comment text blob fait la classification.
La question fondamentale est as tu une tetra chie de tweet pre-tagge pour pouvoir faire l'apprentissage? Si tu n'as pas ca, il te faut un modele pre-entrainer.
Si tu as ca, c'est relativement facil. Tu decoupe les tweet en adjective+nom et adverbe+verbe apres avoir degager les url et ce genre de conneriw. Et j'ai envie de dire qu'un modele lineaire devrait faire l'affaire.
Ça me parait être une solution idéale mais comment parvenir à créer modèle pré-entraîné ?
J'ai lu quelques articles sur le sujet et je suis tombé sur des exemples très théorique.
Tu ne cree pas un modele pre entraine. Tu trouve quelqu'un qui a fait l'entrainement et qui veut bien te passer le modele.
A mon avis c'est le future business model des boites comme google. Ils vont vendre l'access a des modele pre entraine.

Heu, google fournit déjà gratuitement des dizaines de modèles pré-entraînés par eux-mêmes sur leurs données : https://www.tensorflow.org/hub?hl=fr

Bargios

Niveau 7

03 février 2021 à 19:28:43

Après quelques recherches, je confirme qu'il existe des modèles gratuits en français. Reste plus qu'à voir ce qu'ils valent vraiment.
Merci à tous les deux pour votre aide !

El_Camino

Niveau 10

03 février 2021 à 20:00:56

Sinon la solution c'est de faire ton propre modèle si t'as un dataset.

godrik

Niveau 30

03 février 2021 à 20:23:34

Le 03 février 2021 à 10:55:33 Azerban a écrit :
Le 03 février 2021 à 01:52:04 godrik a écrit :
Le 02 février 2021 à 22:50:50 Bargios a écrit :
Le 02 février 2021 à 05:33:16 godrik a écrit :
Ces trucs la ont toujours ete un peu douteux. Ca me parait pas clair comment text blob fait la classification.
La question fondamentale est as tu une tetra chie de tweet pre-tagge pour pouvoir faire l'apprentissage? Si tu n'as pas ca, il te faut un modele pre-entrainer.
Si tu as ca, c'est relativement facil. Tu decoupe les tweet en adjective+nom et adverbe+verbe apres avoir degager les url et ce genre de conneriw. Et j'ai envie de dire qu'un modele lineaire devrait faire l'affaire.
Ça me parait être une solution idéale mais comment parvenir à créer modèle pré-entraîné ?
J'ai lu quelques articles sur le sujet et je suis tombé sur des exemples très théorique.
Tu ne cree pas un modele pre entraine. Tu trouve quelqu'un qui a fait l'entrainement et qui veut bien te passer le modele.
A mon avis c'est le future business model des boites comme google. Ils vont vendre l'access a des modele pre entraine.
Heu, google fournit déjà gratuitement des dizaines de modèles pré-entraînés par eux-mêmes sur leurs données : https://www.tensorflow.org/hub?hl=fr

Tout a fait. Mais c'est de la demo tout ca. Rien de tout ces modele la n'utilise vraiment la masse de donnee que google a.

Note que google ne met pas a disposition de modele de speech to text ou text to speech entrainer a partir tous les film dont ils ont les sous titres, ou toutes les videos youtubes dont ils ont les sous titres. Alors qu'on sait que c'est un modele qui est tres bon. STT et TTS d'android est bon, mais c'est pas celui la qu'ils vont te donner.

Non, il te donne des embeddings de texte extrait de wikipedia que tu pourrais faire toi meme. Alors c'est cool que tu n'as pas a booker 30 GPU sur EC2 pendant une semaine. Mais ce sont des modeles essentiellement publique.

Ce qu'ils vont vendre, c'est l'utilisation ou l'access construit a partir de leur donnees interne.

Aide à l'achat Mac
Création de Jeux
Linux
Création de sites web
Programmation
Internet
Steam Deck
Macintosh
Hardware

La vidéo du moment

News jeu

107 849 spectateurs

Zelda : le choix frustrant de Nintendo pour sa franchise phare

Regardons les choses en face : dès qu'il s'agit de ressortir ses classiques du placard, la firme de Kyoto a une cible bien précise en tête. Les aventures de Link en trois dimensions ont droit à tous les honneurs, saison après saison, console après console. À l'inverse, toute la sainte trinité des épisodes en vue du dessus semble condamnée à rester bloquée dans le passé. Ce déséquilibre flagrant commence sérieusement à faire grincer des dents au sein d'une communauté qui aimerait tant voir ses premiers amours pixelisés briller à nouveau.

Toutes les news jeu