Python: reconnaissance d'objet sur le forum Programmation - 07-02-2022 22:32:24

Talkbet

Niveau 2

07 février 2022 à 22:32:24

Bonjour j'aimerai reconnaitre des objets automatiquements en ouvrant ma camera, mais je veux que ce soit des objets que j'ai directement dans ma librairie d'image. En gros je ne veux pas utiliser un algo qui me permettrait de reconnaitre une voiture ou une lampe

Des idees ?

Bonne soirée a tous

Magrozz

Niveau 7

08 février 2022 à 01:03:02

Bah google reconnaissance d'objet python

Azerban

Niveau 16

08 février 2022 à 09:45:20

Dans ce cas il faut que tu génères un fichier Haar Cascade qui sera utilisé pour détecter les objets sur lesquels tu l'as entraîné. Tu peux faire ça en Python avec la bibliothèque OpenCV.

https://hmf.enseeiht.fr/travaux/projnum/2019/d%c3%a9tection-dobjets-avec-python-opencv/cr%c3%a9er-votre-propre-haar-cascade-opencv-python

Talkbet

Niveau 2

08 février 2022 à 17:34:46

Le 08 février 2022 à 01:03:02 :
Bah google reconnaissance d'objet python

ils me proposent tout le temps une bibliotheque avec des objets deja pre enregistré.

Je veux tout faire moi meme

Merci a vous

Talkbet

Niveau 2

09 février 2022 à 03:26:27

Le 08 février 2022 à 09:45:20 :
Dans ce cas il faut que tu génères un fichier Haar Cascade qui sera utilisé pour détecter les objets sur lesquels tu l'as entraîné. Tu peux faire ça en Python avec la bibliothèque OpenCV.
https://hmf.enseeiht.fr/travaux/projnum/2019/d%c3%a9tection-dobjets-avec-python-opencv/cr%c3%a9er-votre-propre-haar-cascade-opencv-python

Derniere question est ce qu'on est obligé de proposer des images negatives?

Moi je voudrais mettre 3 images s'il la retrouve quand je prend une photo qu'ils me disent le nom de l'objet sinon rien, sinon rien

si ce n'est pas possible ton tuto est tres bien mais je ne peux acceder a image.net

Message édité le 09 février 2022 à 03:27:14 par Talkbet

Magrozz

Niveau 7

09 février 2022 à 03:31:51

Le 09 février 2022 à 03:26:27 :
Le 08 février 2022 à 09:45:20 :
Dans ce cas il faut que tu génères un fichier Haar Cascade qui sera utilisé pour détecter les objets sur lesquels tu l'as entraîné. Tu peux faire ça en Python avec la bibliothèque OpenCV.
https://hmf.enseeiht.fr/travaux/projnum/2019/d%c3%a9tection-dobjets-avec-python-opencv/cr%c3%a9er-votre-propre-haar-cascade-opencv-python
Derniere question est ce qu'on est obligé de proposer des images negatives?
Moi je voudrais mettre 3 images s'il la retrouve quand je prend une photo qu'ils me disent le nom de l'objet sinon rien, sinon rien
si ce n'est pas possible ton tuto est tres bien mais je ne peux acceder a image.net

Je pense que tu as des lacunes en IA.
C'est pas avec 3 images que tu vas faire un bon modèle.

godrik

Niveau 30

09 février 2022 à 06:14:00

Le 09 février 2022 à 03:26:27 :
Le 08 février 2022 à 09:45:20 :
Dans ce cas il faut que tu génères un fichier Haar Cascade qui sera utilisé pour détecter les objets sur lesquels tu l'as entraîné. Tu peux faire ça en Python avec la bibliothèque OpenCV.
https://hmf.enseeiht.fr/travaux/projnum/2019/d%c3%a9tection-dobjets-avec-python-opencv/cr%c3%a9er-votre-propre-haar-cascade-opencv-python
Derniere question est ce qu'on est obligé de proposer des images negatives?

Oui

Moi je voudrais mettre 3 images s'il la retrouve quand je prend une photo qu'ils me disent le nom de l'objet sinon rien, sinon rien

Tu ne peux pas entraîner un modèle avec seulement 3 images et avoir un modèle qui prédit correctement avec un précision utile.

Talkbet

Niveau 2

09 février 2022 à 19:43:28

Le 09 février 2022 à 06:14:00 :
Le 09 février 2022 à 03:26:27 :
Le 08 février 2022 à 09:45:20 :
Dans ce cas il faut que tu génères un fichier Haar Cascade qui sera utilisé pour détecter les objets sur lesquels tu l'as entraîné. Tu peux faire ça en Python avec la bibliothèque OpenCV.
https://hmf.enseeiht.fr/travaux/projnum/2019/d%c3%a9tection-dobjets-avec-python-opencv/cr%c3%a9er-votre-propre-haar-cascade-opencv-python
Derniere question est ce qu'on est obligé de proposer des images negatives?
Oui
Moi je voudrais mettre 3 images s'il la retrouve quand je prend une photo qu'ils me disent le nom de l'objet sinon rien, sinon rien
Tu ne peux pas entraîner un modèle avec seulement 3 images et avoir un modèle qui prédit correctement avec un précision utile.

tres bien merci

Talkbet

Niveau 2

09 février 2022 à 20:08:30

Le 09 février 2022 à 03:31:51 :
Le 09 février 2022 à 03:26:27 :
Le 08 février 2022 à 09:45:20 :
Dans ce cas il faut que tu génères un fichier Haar Cascade qui sera utilisé pour détecter les objets sur lesquels tu l'as entraîné. Tu peux faire ça en Python avec la bibliothèque OpenCV.
https://hmf.enseeiht.fr/travaux/projnum/2019/d%c3%a9tection-dobjets-avec-python-opencv/cr%c3%a9er-votre-propre-haar-cascade-opencv-python
Derniere question est ce qu'on est obligé de proposer des images negatives?
Moi je voudrais mettre 3 images s'il la retrouve quand je prend une photo qu'ils me disent le nom de l'objet sinon rien, sinon rien
si ce n'est pas possible ton tuto est tres bien mais je ne peux acceder a image.net
Je pense que tu as des lacunes en IA.
C'est pas avec 3 images que tu vas faire un bon modèle.

mais admettons que je veuille trouver la couleur de chaque image, comment je peux pas mettre des images negatives vu que chaque image donne une couleur

Talkbet

Niveau 2

09 février 2022 à 20:45:39

ou que je veuille reconnaitre chaque carte pokemon en me disant quelle carte c'est

Magrozz

Niveau 7

09 février 2022 à 23:22:37

Le 09 février 2022 à 20:08:30 :
Le 09 février 2022 à 03:31:51 :
Le 09 février 2022 à 03:26:27 :
Le 08 février 2022 à 09:45:20 :
Dans ce cas il faut que tu génères un fichier Haar Cascade qui sera utilisé pour détecter les objets sur lesquels tu l'as entraîné. Tu peux faire ça en Python avec la bibliothèque OpenCV.
https://hmf.enseeiht.fr/travaux/projnum/2019/d%c3%a9tection-dobjets-avec-python-opencv/cr%c3%a9er-votre-propre-haar-cascade-opencv-python
Derniere question est ce qu'on est obligé de proposer des images negatives?
Moi je voudrais mettre 3 images s'il la retrouve quand je prend une photo qu'ils me disent le nom de l'objet sinon rien, sinon rien
si ce n'est pas possible ton tuto est tres bien mais je ne peux acceder a image.net
Je pense que tu as des lacunes en IA.
C'est pas avec 3 images que tu vas faire un bon modèle.
mais admettons que je veuille trouver la couleur de chaque image, comment je peux pas mettre des images negatives vu que chaque image donne une couleur

T'as pas compris ce que c'est des images "négatives". C'est pas un filtre négatif d'où les guillemets.
Je cite ce qui est écrit sur le site :

Les images "négatives"  peuvent être n'importe quoi  et sont des images d'arrière-plan qui ne contiennent pas l'objet qu'on recherche.

Talkbet

Niveau 2

09 février 2022 à 23:42:08

Le 09 février 2022 à 23:22:37 :
Le 09 février 2022 à 20:08:30 :
Le 09 février 2022 à 03:31:51 :
Le 09 février 2022 à 03:26:27 :
Le 08 février 2022 à 09:45:20 :
Dans ce cas il faut que tu génères un fichier Haar Cascade qui sera utilisé pour détecter les objets sur lesquels tu l'as entraîné. Tu peux faire ça en Python avec la bibliothèque OpenCV.
https://hmf.enseeiht.fr/travaux/projnum/2019/d%c3%a9tection-dobjets-avec-python-opencv/cr%c3%a9er-votre-propre-haar-cascade-opencv-python
Derniere question est ce qu'on est obligé de proposer des images negatives?
Moi je voudrais mettre 3 images s'il la retrouve quand je prend une photo qu'ils me disent le nom de l'objet sinon rien, sinon rien
si ce n'est pas possible ton tuto est tres bien mais je ne peux acceder a image.net
Je pense que tu as des lacunes en IA.
C'est pas avec 3 images que tu vas faire un bon modèle.
mais admettons que je veuille trouver la couleur de chaque image, comment je peux pas mettre des images negatives vu que chaque image donne une couleur
T'as pas compris ce que c'est des images "négatives". C'est pas un filtre négatif d'où les guillemets.
Je cite ce qui est écrit sur le site :
Les images "négatives"  peuvent être n'importe quoi  et sont des images d'arrière-plan qui ne contiennent pas l'objet qu'on recherche.

si javais compris donc je mets juste des images lambda qui ne sont pas des cartes pokemons alors

Magrozz

Niveau 7

10 février 2022 à 03:23:43

Le 09 février 2022 à 23:42:08 :
Le 09 février 2022 à 23:22:37 :
Le 09 février 2022 à 20:08:30 :
Le 09 février 2022 à 03:31:51 :
Le 09 février 2022 à 03:26:27 :
> Le 08 février 2022 à 09:45:20 :
>Dans ce cas il faut que tu génères un fichier Haar Cascade qui sera utilisé pour détecter les objets sur lesquels tu l'as entraîné. Tu peux faire ça en Python avec la bibliothèque OpenCV.
>
> https://hmf.enseeiht.fr/travaux/projnum/2019/d%c3%a9tection-dobjets-avec-python-opencv/cr%c3%a9er-votre-propre-haar-cascade-opencv-python
Derniere question est ce qu'on est obligé de proposer des images negatives?
Moi je voudrais mettre 3 images s'il la retrouve quand je prend une photo qu'ils me disent le nom de l'objet sinon rien, sinon rien
si ce n'est pas possible ton tuto est tres bien mais je ne peux acceder a image.net
Je pense que tu as des lacunes en IA.
C'est pas avec 3 images que tu vas faire un bon modèle.
mais admettons que je veuille trouver la couleur de chaque image, comment je peux pas mettre des images negatives vu que chaque image donne une couleur
T'as pas compris ce que c'est des images "négatives". C'est pas un filtre négatif d'où les guillemets.
Je cite ce qui est écrit sur le site :
Les images "négatives"  peuvent être n'importe quoi  et sont des images d'arrière-plan qui ne contiennent pas l'objet qu'on recherche.
si javais compris donc je mets juste des images lambda qui ne sont pas des cartes pokemons alors

Bah oui c'est le principe. C'est pour ça que je dis que tu as des lacunes.
Je pense que tu ne sais pas comment un modèle fonctionne. Tu devrais regarder un cours ou des vidéos pour comprendre un peu, car j'ai même pas l'impression que tu aies une idée de quoi donner en entrée et pourquoi.

Message édité le 10 février 2022 à 03:24:45 par Magrozz

shittynickname

Niveau 27

10 février 2022 à 11:38:23

Salut, alors si tu veux trouver des cartes pokemon sur une image avec python t'as plein de choix possibles. Si tu veux que ta carte soit n'importe où et que ton programme te retourne le nom ou la référence exacte de ta carte voilà la pipeline que je ferais, en admettant que t'aies pas un gpu trop claqué, et de chez nvidia :
detection model style ssd si tu veux pas te faire chier ou efficientdet-lite0/lite1 entraîné sur coco, le problème que t'aurais c'est que coco n'a pas de classes 'cartes' mais entraîner sur coco te permettrait de juste fine-tune ton modèle, tu peux ensuite télécharger des milliers d'images de cartes pokémons soit en utilisant un dataset tout fait sinon en scrappant des sites de ventes de cartes.

Pour fine tune ton model sur des cartes pokémons, avec opencv et des transformations pour la généralisation style albumentation ou plus simplement pytorch transforms, tu fais de la transormation spatial de ta carte pour éviter d'avoir toujours une carte parfaitement droite sur ton image, sinon en production, ton IA trouvera jamais une carte légèrement pas droite. Tu places tes cartes de manière random sur des images de coco, tu t'en fous du background, je pense pas que ça posera problème, en enregistrant les coordonées de la position pour créer un dataset comme ça :
image1.jpg -> carte : [39,204,5,500], les coordonnées seraient soit [x,y,w,h] ou [x1,x2,y1,y2] en fonction du model que t'utilises, oublie ne serait ce que de faire l'entraînement et l'IA toi même si t'as pas de l'expérience dedans, ce sera une perte de temps, tu comprendrais même pas comment ça marche. Check efficientdet sur le git d'automl, c'est pas si compliqué.

Là t'aurais ton model qui te permet de trouver de manière fiable une carte sur une image.

Suite de la pipeline : un model de classification qui te permettra de déterminer quel type de carte c'est. Je pense qu'il y a trop de cartes pokemon pour ne serait-ce avoir qu'un seul model classifiant les cartes elles-même, donc tu peux faire une hiérarchie de classification, efficientnet est bien car précis et rapide. Première classification pour déterminer quelle catégorie de carte c'est, disons, quelle génération, et ensuite t'utitlises un autre modèle pour déterminer la sous-catégorie de la carte.

La deuxième partie est selon quasi impossible si t'as pas 7-8k€ à envoyer à une start-up chinoise pour annoter des images donc ce que je ferais plutôt c'est utiliser des modèles OCR pour reconnaître le texte qu'il y a sur une carte. ça paraît peut être plus facile mais les modèles de text recognition sont vraiment pas si précis que ça si tu veux que ça tourne en temps réel donc il y aura un gros traitement de texte à la fin pour faire matcher une image avec les vraies caractéristiques d'une carte.

Ensuite, dans tous les cas, tu pourrais avoir un A100, AGX ou même une RTX, si t'as pas cuda et que t'es pas familier avec tensorrt tu feras jamais tourner ta pipeline en temps réel, donc pour ça il faudra quantize ton modèle de détection en int8 pour que ça tourne bien puis quantize en fp16 ton model OCR pour espérer au moins avoir > 20fps selon ton GPU.

Franchement c'est très faisable si t'as de l'expérience en IA et que t'es chômeur parce que crée ce dataset de détection de cartes seul, selon ça prend 80h facile (2 semaines) juste à récupérer toutes les données, sinon, oublie simplement.

Talkbet

Niveau 2

10 février 2022 à 18:34:18

Le 10 février 2022 à 11:38:23 :
Salut, alors si tu veux trouver des cartes pokemon sur une image avec python t'as plein de choix possibles. Si tu veux que ta carte soit n'importe où et que ton programme te retourne le nom ou la référence exacte de ta carte voilà la pipeline que je ferais, en admettant que t'aies pas un gpu trop claqué, et de chez nvidia :
detection model style ssd si tu veux pas te faire chier ou efficientdet-lite0/lite1 entraîné sur coco, le problème que t'aurais c'est que coco n'a pas de classes 'cartes' mais entraîner sur coco te permettrait de juste fine-tune ton modèle, tu peux ensuite télécharger des milliers d'images de cartes pokémons soit en utilisant un dataset tout fait sinon en scrappant des sites de ventes de cartes.
Pour fine tune ton model sur des cartes pokémons, avec opencv et des transformations pour la généralisation style albumentation ou plus simplement pytorch transforms, tu fais de la transormation spatial de ta carte pour éviter d'avoir toujours une carte parfaitement droite sur ton image, sinon en production, ton IA trouvera jamais une carte légèrement pas droite. Tu places tes cartes de manière random sur des images de coco, tu t'en fous du background, je pense pas que ça posera problème, en enregistrant les coordonées de la position pour créer un dataset comme ça :
image1.jpg -> carte : [39,204,5,500], les coordonnées seraient soit [x,y,w,h] ou [x1,x2,y1,y2] en fonction du model que t'utilises, oublie ne serait ce que de faire l'entraînement et l'IA toi même si t'as pas de l'expérience dedans, ce sera une perte de temps, tu comprendrais même pas comment ça marche. Check efficientdet sur le git d'automl, c'est pas si compliqué.
Là t'aurais ton model qui te permet de trouver de manière fiable une carte sur une image.
Suite de la pipeline : un model de classification qui te permettra de déterminer quel type de carte c'est. Je pense qu'il y a trop de cartes pokemon pour ne serait-ce avoir qu'un seul model classifiant les cartes elles-même, donc tu peux faire une hiérarchie de classification, efficientnet est bien car précis et rapide. Première classification pour déterminer quelle catégorie de carte c'est, disons, quelle génération, et ensuite t'utitlises un autre modèle pour déterminer la sous-catégorie de la carte.
La deuxième partie est selon quasi impossible si t'as pas 7-8k€ à envoyer à une start-up chinoise pour annoter des images donc ce que je ferais plutôt c'est utiliser des modèles OCR pour reconnaître le texte qu'il y a sur une carte. ça paraît peut être plus facile mais les modèles de text recognition sont vraiment pas si précis que ça si tu veux que ça tourne en temps réel donc il y aura un gros traitement de texte à la fin pour faire matcher une image avec les vraies caractéristiques d'une carte.
Ensuite, dans tous les cas, tu pourrais avoir un A100, AGX ou même une RTX, si t'as pas cuda et que t'es pas familier avec tensorrt tu feras jamais tourner ta pipeline en temps réel, donc pour ça il faudra quantize ton modèle de détection en int8 pour que ça tourne bien puis quantize en fp16 ton model OCR pour espérer au moins avoir > 20fps selon ton GPU.
Franchement c'est très faisable si t'as de l'expérience en IA et que t'es chômeur parce que crée ce dataset de détection de cartes seul, selon ça prend 80h facile (2 semaines) juste à récupérer toutes les données, sinon, oublie simplement.

merci pour ton long message, vu que je n'ai aucune experience dans l'IA, ou pourrais je trouver des projets debutants dans l'IA alors ?

je veux dire par la que je n'ai jamais créé mes propres models

Message édité le 10 février 2022 à 18:38:35 par Talkbet

Magrozz

Niveau 7

10 février 2022 à 18:57:42

Déjà, je pense que tu devrais lire des cours pour comprendre comment ça fonctionne derrière.
Et pour ça Google ou YouTube.

Talkbet

Niveau 2

10 février 2022 à 19:44:58

Le 10 février 2022 à 18:57:42 :
Déjà, je pense que tu devrais lire des cours pour comprendre comment ça fonctionne derrière.
Et pour ça Google ou YouTube.

tu as des liens

Talkbet

Niveau 2

10 février 2022 à 19:47:30

j'ai deja utilisé des modeles pour des reconnaissances faciales ou d'objets. j'ai compris le principe. le soucis est de pouvoir faire la meme chose sur autre chose que des visages ou des objets deja enregistré ca je ne sais pas faire

Magrozz

Niveau 7

10 février 2022 à 20:07:33

Le 10 février 2022 à 19:47:30 :
j'ai deja utilisé des modeles pour des reconnaissances faciales ou d'objets. j'ai compris le principe. le soucis est de pouvoir faire la meme chose sur autre chose que des visages ou des objets deja enregistré ca je ne sais pas faire

Je suis pas sûr que tu comprennes le principe vu que tu ne comprends pas qu'il faille donner des images "négatives" à ton modèle et que tu penses que ça va fonctionner en donnant 3 images. Je pense que t'as juste C/c du code et que ça a fonctionné comme dans le tutoriel.

Pour les liens, j'en ai pas particulièrement, mais tu peux trouver ça facilement sur Google.

Talkbet

Niveau 2

10 février 2022 à 20:54:58

Le 10 février 2022 à 20:07:33 :
Le 10 février 2022 à 19:47:30 :
j'ai deja utilisé des modeles pour des reconnaissances faciales ou d'objets. j'ai compris le principe. le soucis est de pouvoir faire la meme chose sur autre chose que des visages ou des objets deja enregistré ca je ne sais pas faire
Je suis pas sûr que tu comprennes le principe vu que tu ne comprends pas qu'il faille donner des images "négatives" à ton modèle et que tu penses que ça va fonctionner en donnant 3 images. Je pense que t'as juste C/c du code et que ça a fonctionné comme dans le tutoriel.
Pour les liens, j'en ai pas particulièrement, mais tu peux trouver ça facilement sur Google.

non je comprends tres bien quil faille des images negatives pour entrainer le modele.