[OCR] Image - Taille variable sur le forum Programmation - 17-12-2009 14:07:07

Liste des sujets

[OCR] Image - Taille variable

Penta_Penguin

Niveau 9

17 décembre 2009 à 14:07:07

bonjour,

dans le cadre d'un mini projet, j'ai pour mission le developpement d'un OCR ou Optical character recognition en utilisant un réseau de neurone, cependant je bloque déjà sur la manière dont je dois extraire l'échantillion de données pour les entrées (input layer)du réseau... car les caractères sont de taille variable de 10x10 pixel à 20x20 pixel.

l'input layer contient 100 neurone (je vais lui passer un tableau de pixel) donc j'aurai un problème si le caractère ferait 15x18 pixel ou 13*19 car ça va dépasser les 100neurone et j'aurai ainsi un mauvais échantillion.

n'avez vous pas une technique pour l'extraction de l'échantiollion qui me renverra le même nombre d'entrée quelque soit la taille du caractère? merci

Kaoron

Niveau 9

17 décembre 2009 à 18:48:50

Au pif... redimensionner chaque image ?

L'idée avec l'apprentissage, c'est de normaliser tes entrées systématiquement. en imagerie médicale par exemple, tous les cerveaux n'ont pas la même taille ni exactement la même forme au quart de poil près, mais l'imagerie IRM passe par un mapping sur un cerveau étalon pour que les données soient comparables.

Là c'est pareil, tes caractères sont de taille différente en entrée ? Tu normalises ! Mets tout le monde à la même taille en conservant l'aspect ratio, plus la taille est élevée moins tu perds en info, mais ton réseau sera plus gros.
Là, si tu fixes la taille de l'entrée de ton réseau à 100, tu vas lui donner du 10x10 en entrée.
Un truc intéressant serait de tester avec plusieurs algos de redimensionnement, et voir si ça a une incidence sur les résultats (et le cas échéant, quel est le meilleur algo).

Kaoron

Niveau 9

17 décembre 2009 à 19:00:24

sans conserver l'aspect ratio*

Penta_Penguin

Niveau 9

23 décembre 2009 à 13:33:10

des algos de de redimensionnement!!
ça va plus compliquer le problème

Kaoron

Niveau 9

23 décembre 2009 à 19:15:14

Meunan, une lib graphique, ou même gimp. Tu ajustes tes images de manière à virer les blancs, tu redimensionnes en batch et t'as tes données à la bonne dimension.

Si t'en es à apprendre les réseaux neuronaux et l'apprentissage statistique, ça devrait pas vraiment poser problème .

Penta_Penguin

Niveau 9

25 décembre 2009 à 14:36:11

merci

Aide à l'achat Mac
Création de Jeux
Linux
Création de sites web
Programmation
Internet
Steam Deck
Macintosh
Hardware

La vidéo du moment

News jeu

136 202 spectateurs

Halo: Campaign Evolved, le remake incontournable de l'été

La première aventure du Master Chief, qui a donné naissance à l’une des franchises les plus emblématiques de l’histoire du jeu vidéo, fait son retour avec Halo: Campaign Evolved. Disponible dès maintenant, ce remake fidèle mais modernisé reconstruit la campagne culte avec des graphismes améliorés, du nouveau contenu et des fonctionnalités pensées pour les joueurs d’aujourd’hui.

Toutes les news jeu