CONNEXION
  • RetourJeux
    • Sorties
    • Hit Parade
    • Les + populaires
    • Les + attendus
    • Soluces
    • Tous les Jeux
    • Gaming
  • RetourActu Gaming
    • News
    • Astuces
    • Tests
    • Previews
    • Toute l'actu gaming
  • RetourBons plans
    • Bons plans
    • Bons plans Smartphone
    • Bons plans Hardware
    • Bons plans Image et Son
    • Bons plans Amazon
    • Bons plans Cdiscount
    • Bons plans Decathlon
    • Bons plans Fnac
    • Tous les Bons plans
  • RetourJVTech
    • Actus High-Tech
    • Intelligence Artificielle
    • Smartphones
    • Mobilité urbaine
    • Hardware
    • Image et son
    • Tutoriels
    • Tests produits High-Tech
    • Guides d'achat High-Tech
    • JVTech
  • RetourCulture
    • Actus Culture
    • Culture
  • RetourVidéos
    • A la une
    • Gaming Live
    • Vidéos Tests
    • Vidéos Previews
    • Gameplay
    • Trailers
    • Chroniques
    • Replay Web TV
    • Toutes les vidéos
  • RetourForums
    • Hardware PC
    • PS5
    • Switch 2
    • Xbox Series
    • Switch
    • Pokemon pocket
    • FC 25 Ultimate Team
    • League of Legends
    • Tous les Forums
  • PC
  • PS5
  • Xbox Series
  • Switch 2
  • PS4
  • One
  • Switch
  • iOS
  • Android
  • MMO
  • RPG
  • FPS
En ce moment Genshin Impact Valhalla Breath of the wild Animal Crossing GTA 5 Red dead 2
Liste des sujets

Comment faire du sentiment analysis avec Python ?

Bargios
Bargios
Niveau 7
01 février 2021 à 23:49:13

Bonjour,

Y a-t-il quelqu'un parmi vous qui sait comment faire de l'Opinion mining (Sentiment analysis) de qualité avec Python ?
Actuellement j'utilise le paquet textblob en version française ( https://pypi.org/project/textblob-fr/ ) pour analyser des tweets francophones mais les résultats sont décevant; j’obtiens beaucoup de valeurs nuls alors que certains messages contiennent des mots sans équivoque.

Merci

godrik
godrik
Niveau 30
02 février 2021 à 05:33:16

Ces trucs la ont toujours ete un peu douteux. Ca me parait pas clair comment text blob fait la classification.

La question fondamentale est as tu une tetra chie de tweet pre-tagge pour pouvoir faire l'apprentissage? Si tu n'as pas ca, il te faut un modele pre-entrainer.

Si tu as ca, c'est relativement facil. Tu decoupe les tweet en adjective+nom et adverbe+verbe apres avoir degager les url et ce genre de conneriw. Et j'ai envie de dire qu'un modele lineaire devrait faire l'affaire.

Azerban
Azerban
Niveau 16
02 février 2021 à 10:20:59

Va voir du côté de spaCy pour ta besogne, c'est la nouvelle librairie à la mode qui est pas mal du tout. https://realpython.com/sentiment-analysis-python/

Bargios
Bargios
Niveau 7
02 février 2021 à 22:50:50

Le 02 février 2021 à 05:33:16 godrik a écrit :
Ces trucs la ont toujours ete un peu douteux. Ca me parait pas clair comment text blob fait la classification.

La question fondamentale est as tu une tetra chie de tweet pre-tagge pour pouvoir faire l'apprentissage? Si tu n'as pas ca, il te faut un modele pre-entrainer.

Si tu as ca, c'est relativement facil. Tu decoupe les tweet en adjective+nom et adverbe+verbe apres avoir degager les url et ce genre de conneriw. Et j'ai envie de dire qu'un modele lineaire devrait faire l'affaire.

Ça me parait être une solution idéale mais comment parvenir à créer modèle pré-entraîné ?
J'ai lu quelques articles sur le sujet et je suis tombé sur des exemples très théorique.

Le 02 février 2021 à 10:20:59 Azerban a écrit :
Va voir du côté de spaCy pour ta besogne, c'est la nouvelle librairie à la mode qui est pas mal du tout. https://realpython.com/sentiment-analysis-python/

Génial ! C'est parfait pour analyser la construction des phrases. Je vais tester ça, merci.

Message édité le 02 février 2021 à 22:52:06 par Bargios
godrik
godrik
Niveau 30
03 février 2021 à 01:52:04

Le 02 février 2021 à 22:50:50 Bargios a écrit :

Le 02 février 2021 à 05:33:16 godrik a écrit :
Ces trucs la ont toujours ete un peu douteux. Ca me parait pas clair comment text blob fait la classification.

La question fondamentale est as tu une tetra chie de tweet pre-tagge pour pouvoir faire l'apprentissage? Si tu n'as pas ca, il te faut un modele pre-entrainer.

Si tu as ca, c'est relativement facil. Tu decoupe les tweet en adjective+nom et adverbe+verbe apres avoir degager les url et ce genre de conneriw. Et j'ai envie de dire qu'un modele lineaire devrait faire l'affaire.

Ça me parait être une solution idéale mais comment parvenir à créer modèle pré-entraîné ?
J'ai lu quelques articles sur le sujet et je suis tombé sur des exemples très théorique.

Tu ne cree pas un modele pre entraine. Tu trouve quelqu'un qui a fait l'entrainement et qui veut bien te passer le modele.
A mon avis c'est le future business model des boites comme google. Ils vont vendre l'access a des modele pre entraine.

Azerban
Azerban
Niveau 16
03 février 2021 à 10:55:33

Le 03 février 2021 à 01:52:04 godrik a écrit :

Le 02 février 2021 à 22:50:50 Bargios a écrit :

Le 02 février 2021 à 05:33:16 godrik a écrit :
Ces trucs la ont toujours ete un peu douteux. Ca me parait pas clair comment text blob fait la classification.

La question fondamentale est as tu une tetra chie de tweet pre-tagge pour pouvoir faire l'apprentissage? Si tu n'as pas ca, il te faut un modele pre-entrainer.

Si tu as ca, c'est relativement facil. Tu decoupe les tweet en adjective+nom et adverbe+verbe apres avoir degager les url et ce genre de conneriw. Et j'ai envie de dire qu'un modele lineaire devrait faire l'affaire.

Ça me parait être une solution idéale mais comment parvenir à créer modèle pré-entraîné ?
J'ai lu quelques articles sur le sujet et je suis tombé sur des exemples très théorique.

Tu ne cree pas un modele pre entraine. Tu trouve quelqu'un qui a fait l'entrainement et qui veut bien te passer le modele.
A mon avis c'est le future business model des boites comme google. Ils vont vendre l'access a des modele pre entraine.

Heu, google fournit déjà gratuitement des dizaines de modèles pré-entraînés par eux-mêmes sur leurs données : https://www.tensorflow.org/hub?hl=fr :(

Bargios
Bargios
Niveau 7
03 février 2021 à 19:28:43

Après quelques recherches, je confirme qu'il existe des modèles gratuits en français. Reste plus qu'à voir ce qu'ils valent vraiment.
Merci à tous les deux pour votre aide !

El_Camino
El_Camino
Niveau 10
03 février 2021 à 20:00:56

Sinon la solution c'est de faire ton propre modèle si t'as un dataset.

godrik
godrik
Niveau 30
03 février 2021 à 20:23:34

Le 03 février 2021 à 10:55:33 Azerban a écrit :

Le 03 février 2021 à 01:52:04 godrik a écrit :

Le 02 février 2021 à 22:50:50 Bargios a écrit :

Le 02 février 2021 à 05:33:16 godrik a écrit :
Ces trucs la ont toujours ete un peu douteux. Ca me parait pas clair comment text blob fait la classification.

La question fondamentale est as tu une tetra chie de tweet pre-tagge pour pouvoir faire l'apprentissage? Si tu n'as pas ca, il te faut un modele pre-entrainer.

Si tu as ca, c'est relativement facil. Tu decoupe les tweet en adjective+nom et adverbe+verbe apres avoir degager les url et ce genre de conneriw. Et j'ai envie de dire qu'un modele lineaire devrait faire l'affaire.

Ça me parait être une solution idéale mais comment parvenir à créer modèle pré-entraîné ?
J'ai lu quelques articles sur le sujet et je suis tombé sur des exemples très théorique.

Tu ne cree pas un modele pre entraine. Tu trouve quelqu'un qui a fait l'entrainement et qui veut bien te passer le modele.
A mon avis c'est le future business model des boites comme google. Ils vont vendre l'access a des modele pre entraine.

Heu, google fournit déjà gratuitement des dizaines de modèles pré-entraînés par eux-mêmes sur leurs données : https://www.tensorflow.org/hub?hl=fr :(

Tout a fait. Mais c'est de la demo tout ca. Rien de tout ces modele la n'utilise vraiment la masse de donnee que google a.

Note que google ne met pas a disposition de modele de speech to text ou text to speech entrainer a partir tous les film dont ils ont les sous titres, ou toutes les videos youtubes dont ils ont les sous titres. Alors qu'on sait que c'est un modele qui est tres bon. STT et TTS d'android est bon, mais c'est pas celui la qu'ils vont te donner.

Non, il te donne des embeddings de texte extrait de wikipedia que tu pourrais faire toi meme. Alors c'est cool que tu n'as pas a booker 30 GPU sur EC2 pendant une semaine. Mais ce sont des modeles essentiellement publique.

Ce qu'ils vont vendre, c'est l'utilisation ou l'access construit a partir de leur donnees interne.

Sous forums
  • Aide à l'achat Mac
  • Création de Jeux
  • Linux
  • Création de sites web
  • Programmation
  • Internet
  • Steam Deck
  • Macintosh
  • Hardware
La vidéo du moment