Python: reconnaissance d'objet sur le forum Programmation - 10-02-2022 21:05:19 - page 2

Liste des sujets

Python: reconnaissance d'objet

VeraRubin

Niveau 8

10 février 2022 à 21:05:19

Kdo l'op https://www.tensorflow.org/tutorials/images/classification

Y'a énormément d'autres tutoriels sur leur site si jamais

Talkbet

Niveau 2

10 février 2022 à 23:11:40

Le 10 février 2022 à 21:05:19 :
Kdo l'op https://www.tensorflow.org/tutorials/images/classification
Y'a énormément d'autres tutoriels sur leur site si jamais

merci

shittynickname

Niveau 27

11 février 2022 à 21:03:15

commence par des cours de stats et d'analyse, pas besoin d'avoir bac+8 en maths pour comprendre comment ça marche mais faut avoir la base. Ensuite le cours de 40h Yann LeCun (excellent et très compétent ingénieur/chercheur) sur youtube (bien que je ne sais pas s'il prend en compte le machine learning, ou se focus juste sur le deep learning) et orienté pytorch qui, de très, très loin est mieux que tensorflow.

shittynickname

Niveau 27

11 février 2022 à 21:08:49

Le 10 février 2022 à 18:34:18 :
Le 10 février 2022 à 11:38:23 :
Salut, alors si tu veux trouver des cartes pokemon sur une image avec python t'as plein de choix possibles. Si tu veux que ta carte soit n'importe où et que ton programme te retourne le nom ou la référence exacte de ta carte voilà la pipeline que je ferais, en admettant que t'aies pas un gpu trop claqué, et de chez nvidia :
detection model style ssd si tu veux pas te faire chier ou efficientdet-lite0/lite1 entraîné sur coco, le problème que t'aurais c'est que coco n'a pas de classes 'cartes' mais entraîner sur coco te permettrait de juste fine-tune ton modèle, tu peux ensuite télécharger des milliers d'images de cartes pokémons soit en utilisant un dataset tout fait sinon en scrappant des sites de ventes de cartes.
Pour fine tune ton model sur des cartes pokémons, avec opencv et des transformations pour la généralisation style albumentation ou plus simplement pytorch transforms, tu fais de la transormation spatial de ta carte pour éviter d'avoir toujours une carte parfaitement droite sur ton image, sinon en production, ton IA trouvera jamais une carte légèrement pas droite. Tu places tes cartes de manière random sur des images de coco, tu t'en fous du background, je pense pas que ça posera problème, en enregistrant les coordonées de la position pour créer un dataset comme ça :
image1.jpg -> carte : [39,204,5,500], les coordonnées seraient soit [x,y,w,h] ou [x1,x2,y1,y2] en fonction du model que t'utilises, oublie ne serait ce que de faire l'entraînement et l'IA toi même si t'as pas de l'expérience dedans, ce sera une perte de temps, tu comprendrais même pas comment ça marche. Check efficientdet sur le git d'automl, c'est pas si compliqué.
Là t'aurais ton model qui te permet de trouver de manière fiable une carte sur une image.
Suite de la pipeline : un model de classification qui te permettra de déterminer quel type de carte c'est. Je pense qu'il y a trop de cartes pokemon pour ne serait-ce avoir qu'un seul model classifiant les cartes elles-même, donc tu peux faire une hiérarchie de classification, efficientnet est bien car précis et rapide. Première classification pour déterminer quelle catégorie de carte c'est, disons, quelle génération, et ensuite t'utitlises un autre modèle pour déterminer la sous-catégorie de la carte.
La deuxième partie est selon quasi impossible si t'as pas 7-8k€ à envoyer à une start-up chinoise pour annoter des images donc ce que je ferais plutôt c'est utiliser des modèles OCR pour reconnaître le texte qu'il y a sur une carte. ça paraît peut être plus facile mais les modèles de text recognition sont vraiment pas si précis que ça si tu veux que ça tourne en temps réel donc il y aura un gros traitement de texte à la fin pour faire matcher une image avec les vraies caractéristiques d'une carte.
Ensuite, dans tous les cas, tu pourrais avoir un A100, AGX ou même une RTX, si t'as pas cuda et que t'es pas familier avec tensorrt tu feras jamais tourner ta pipeline en temps réel, donc pour ça il faudra quantize ton modèle de détection en int8 pour que ça tourne bien puis quantize en fp16 ton model OCR pour espérer au moins avoir > 20fps selon ton GPU.
Franchement c'est très faisable si t'as de l'expérience en IA et que t'es chômeur parce que crée ce dataset de détection de cartes seul, selon ça prend 80h facile (2 semaines) juste à récupérer toutes les données, sinon, oublie simplement.
merci pour ton long message, vu que je n'ai aucune experience dans l'IA, ou pourrais je trouver des projets debutants dans l'IA alors ?
je veux dire par la que je n'ai jamais créé mes propres models

Sinon, si t'es à l'aise avec les maths, tu peux directement aller checker tous les modules sur pytorch. Genre nn.sigmoid, nn.conv2d, nn. ce que tu veux, regarder comment ça marche, ce que ça fait, comment et pourquoi on l'utilise. Ensuite tu passes à un réseau simple style vgg16 qui est vraiment très basique, lent mais facile à comprendre et tu regardes ce qui se passe puis tu checkes l'état de l'art de réseaux plus complexes comme efficientnet pour la classification. Pourquoi on utilise pas certains trucs tout le temps alors que ça marche bien dans d'autres cas, quelle est la différence entre classifier une image et détecter des objets dans une image, qu'est ce que la segmentation. Dans une IA, comment on évalue du mieux possible le résultat (de manière qualitative & quantitative), quelle est la différence entre une fonction de perte et une cost function. Toutes ces questions que viens de poser ne sont pas tant abordées pendant des études spécifiques sur les IA et viennent avec la pratique même si selon moi, passer directement sur du deep learning sans avoir une base sur les régressions linéaires, optimisation & estimation. c'est chaud.

Talkbet

Niveau 2

18 février 2022 à 19:46:09

Le 11 février 2022 à 21:03:15 :
commence par des cours de stats et d'analyse, pas besoin d'avoir bac+8 en maths pour comprendre comment ça marche mais faut avoir la base. Ensuite le cours de 40h Yann LeCun (excellent et très compétent ingénieur/chercheur) sur youtube (bien que je ne sais pas s'il prend en compte le machine learning, ou se focus juste sur le deep learning) et orienté pytorch qui, de très, très loin est mieux que tensorflow.

tu as un lien pls

Talkbet

Niveau 2

18 février 2022 à 19:46:50

Le 11 février 2022 à 21:08:49 :
Le 10 février 2022 à 18:34:18 :
Le 10 février 2022 à 11:38:23 :
Salut, alors si tu veux trouver des cartes pokemon sur une image avec python t'as plein de choix possibles. Si tu veux que ta carte soit n'importe où et que ton programme te retourne le nom ou la référence exacte de ta carte voilà la pipeline que je ferais, en admettant que t'aies pas un gpu trop claqué, et de chez nvidia :
detection model style ssd si tu veux pas te faire chier ou efficientdet-lite0/lite1 entraîné sur coco, le problème que t'aurais c'est que coco n'a pas de classes 'cartes' mais entraîner sur coco te permettrait de juste fine-tune ton modèle, tu peux ensuite télécharger des milliers d'images de cartes pokémons soit en utilisant un dataset tout fait sinon en scrappant des sites de ventes de cartes.
Pour fine tune ton model sur des cartes pokémons, avec opencv et des transformations pour la généralisation style albumentation ou plus simplement pytorch transforms, tu fais de la transormation spatial de ta carte pour éviter d'avoir toujours une carte parfaitement droite sur ton image, sinon en production, ton IA trouvera jamais une carte légèrement pas droite. Tu places tes cartes de manière random sur des images de coco, tu t'en fous du background, je pense pas que ça posera problème, en enregistrant les coordonées de la position pour créer un dataset comme ça :
image1.jpg -> carte : [39,204,5,500], les coordonnées seraient soit [x,y,w,h] ou [x1,x2,y1,y2] en fonction du model que t'utilises, oublie ne serait ce que de faire l'entraînement et l'IA toi même si t'as pas de l'expérience dedans, ce sera une perte de temps, tu comprendrais même pas comment ça marche. Check efficientdet sur le git d'automl, c'est pas si compliqué.
Là t'aurais ton model qui te permet de trouver de manière fiable une carte sur une image.
Suite de la pipeline : un model de classification qui te permettra de déterminer quel type de carte c'est. Je pense qu'il y a trop de cartes pokemon pour ne serait-ce avoir qu'un seul model classifiant les cartes elles-même, donc tu peux faire une hiérarchie de classification, efficientnet est bien car précis et rapide. Première classification pour déterminer quelle catégorie de carte c'est, disons, quelle génération, et ensuite t'utitlises un autre modèle pour déterminer la sous-catégorie de la carte.
La deuxième partie est selon quasi impossible si t'as pas 7-8k€ à envoyer à une start-up chinoise pour annoter des images donc ce que je ferais plutôt c'est utiliser des modèles OCR pour reconnaître le texte qu'il y a sur une carte. ça paraît peut être plus facile mais les modèles de text recognition sont vraiment pas si précis que ça si tu veux que ça tourne en temps réel donc il y aura un gros traitement de texte à la fin pour faire matcher une image avec les vraies caractéristiques d'une carte.
Ensuite, dans tous les cas, tu pourrais avoir un A100, AGX ou même une RTX, si t'as pas cuda et que t'es pas familier avec tensorrt tu feras jamais tourner ta pipeline en temps réel, donc pour ça il faudra quantize ton modèle de détection en int8 pour que ça tourne bien puis quantize en fp16 ton model OCR pour espérer au moins avoir > 20fps selon ton GPU.
Franchement c'est très faisable si t'as de l'expérience en IA et que t'es chômeur parce que crée ce dataset de détection de cartes seul, selon ça prend 80h facile (2 semaines) juste à récupérer toutes les données, sinon, oublie simplement.
merci pour ton long message, vu que je n'ai aucune experience dans l'IA, ou pourrais je trouver des projets debutants dans l'IA alors ?
je veux dire par la que je n'ai jamais créé mes propres models
Sinon, si t'es à l'aise avec les maths, tu peux directement aller checker tous les modules sur pytorch. Genre nn.sigmoid, nn.conv2d, nn. ce que tu veux, regarder comment ça marche, ce que ça fait, comment et pourquoi on l'utilise. Ensuite tu passes à un réseau simple style vgg16 qui est vraiment très basique, lent mais facile à comprendre et tu regardes ce qui se passe puis tu checkes l'état de l'art de réseaux plus complexes comme efficientnet pour la classification. Pourquoi on utilise pas certains trucs tout le temps alors que ça marche bien dans d'autres cas, quelle est la différence entre classifier une image et détecter des objets dans une image, qu'est ce que la segmentation. Dans une IA, comment on évalue du mieux possible le résultat (de manière qualitative & quantitative), quelle est la différence entre une fonction de perte et une cost function. Toutes ces questions que viens de poser ne sont pas tant abordées pendant des études spécifiques sur les IA et viennent avec la pratique même si selon moi, passer directement sur du deep learning sans avoir une base sur les régressions linéaires, optimisation & estimation. c'est chaud.

jai une licence en mathématiques je pense que les maths ne seront pas un soucis

shittynickname

Niveau 27

20 février 2022 à 19:43:40

https://www.youtube.com/watch?v=0bMe_vCZo30&list=PL80I41oVxglKcAHllsU0txr3OuTTaWX2v

Talkbet

Niveau 2

20 février 2022 à 23:55:05

Le 20 février 2022 à 19:43:40 :
https://www.youtube.com/watch?v=0bMe_vCZo30&list=PL80I41oVxglKcAHllsU0txr3OuTTaWX2v

merci

TaZ_YT

Niveau 6

25 février 2022 à 11:41:00

Sinon, pour détecter des choses assez simples (comme la couleur de la carte), tu peut utiliser du traitement d'image avec opencv de façon très simple.

Si tu veut détecter quel carte pokemon c'est, je te conseille d'utiliser du traitement d'image pour faire "ressortir" le texte de la carte (le nom du pokemon quoi) et d'utiliser tesseract pour transformer l'image du text en text exploitable :

ta un exemple hyper complet sur tesseract ici :

https://nanonets.com/blog/ocr-with-tesseract/

Je fait beaucoup d'ai, mais autant parfois c'est hyper impressionnant et ça simplifie énormément la vie, autant parfois c'est pas si adaptés que ça (quoi que tesseract, c'est de l'ai mais pas un modèle de réseau de neurones profond.

Aide à l'achat Mac
Macintosh
Création de Jeux
Programmation
Création de sites web
Linux
Internet
Steam Deck
Hardware

La vidéo du moment

News jeu

44 951 spectateurs

Blood Message : la claque venue de Chine nous met KO pendant le Summer Game Fest

On avait déjà l’habitude de voir le Summer Game Fest dégainer des surprises bien senties, mais Blood Message a réussi à se faire une place de choix parmi les grosses annonces. Le titre, actuellement en développement sur PC, PS5 et Xbox Series X|S, vient de dévoiler un nouveau trailer baptisé “Hold Till Dawn”, et il n’a pas fait dans la demi-mesure. Développé par 24 Entertainment, studio rattaché à NetEase, ce jeu d’action-aventure solo et narratif se présente comme le premier triple-A solo de l’éditeur chinois.

Toutes les news jeu