CONNEXION
  • RetourJeux
    • Sorties
    • Hit Parade
    • Les + populaires
    • Les + attendus
    • Soluces
    • Tous les Jeux
    • Gaming
  • RetourActu Gaming
    • News
    • Astuces
    • Tests
    • Previews
    • Toute l'actu gaming
  • RetourBons plans
    • Bons plans
    • Bons plans Smartphone
    • Bons plans Hardware
    • Bons plans Image et Son
    • Bons plans Amazon
    • Bons plans Cdiscount
    • Bons plans Decathlon
    • Bons plans Fnac
    • Tous les Bons plans
  • RetourJVTech
    • Actus High-Tech
    • Intelligence Artificielle
    • Smartphones
    • Mobilité urbaine
    • Hardware
    • Image et son
    • Tutoriels
    • Tests produits High-Tech
    • Guides d'achat High-Tech
    • JVTech
  • RetourCulture
    • Actus Culture
    • Culture
  • RetourVidéos
    • A la une
    • Gaming Live
    • Vidéos Tests
    • Vidéos Previews
    • Gameplay
    • Trailers
    • Chroniques
    • Replay Web TV
    • Toutes les vidéos
  • RetourForums
    • Hardware PC
    • PS5
    • Switch 2
    • Xbox Series
    • Switch
    • Pokemon pocket
    • FC 25 Ultimate Team
    • League of Legends
    • Tous les Forums
  • PC
  • PS5
  • Xbox Series
  • Switch 2
  • PS4
  • One
  • Switch
  • iOS
  • Android
  • MMO
  • RPG
  • FPS
En ce moment Genshin Impact Valhalla Breath of the wild Animal Crossing GTA 5 Red dead 2
Liste des sujets

[OCR] Image - Taille variable

Penta_Penguin
Penta_Penguin
Niveau 9
17 décembre 2009 à 14:07:07

bonjour,

dans le cadre d'un mini projet, j'ai pour mission le developpement d'un OCR ou Optical character recognition en utilisant un réseau de neurone, cependant je bloque déjà sur la manière dont je dois extraire l'échantillion de données pour les entrées (input layer)du réseau... car les caractères sont de taille variable de 10x10 pixel à 20x20 pixel.

l'input layer contient 100 neurone (je vais lui passer un tableau de pixel) donc j'aurai un problème si le caractère ferait 15x18 pixel ou 13*19 car ça va dépasser les 100neurone et j'aurai ainsi un mauvais échantillion.

n'avez vous pas une technique pour l'extraction de l'échantiollion qui me renverra le même nombre d'entrée quelque soit la taille du caractère? merci :ok:

Kaoron
Kaoron
Niveau 9
17 décembre 2009 à 18:48:50

Au pif... redimensionner chaque image ?

L'idée avec l'apprentissage, c'est de normaliser tes entrées systématiquement. en imagerie médicale par exemple, tous les cerveaux n'ont pas la même taille ni exactement la même forme au quart de poil près, mais l'imagerie IRM passe par un mapping sur un cerveau étalon pour que les données soient comparables.

Là c'est pareil, tes caractères sont de taille différente en entrée ? Tu normalises ! Mets tout le monde à la même taille en conservant l'aspect ratio, plus la taille est élevée moins tu perds en info, mais ton réseau sera plus gros.
Là, si tu fixes la taille de l'entrée de ton réseau à 100, tu vas lui donner du 10x10 en entrée.
Un truc intéressant serait de tester avec plusieurs algos de redimensionnement, et voir si ça a une incidence sur les résultats (et le cas échéant, quel est le meilleur algo).

Kaoron
Kaoron
Niveau 9
17 décembre 2009 à 19:00:24

sans conserver l'aspect ratio*

Penta_Penguin
Penta_Penguin
Niveau 9
23 décembre 2009 à 13:33:10

des algos de de redimensionnement!! :ouch2:
ça va plus compliquer le problème :-(

Kaoron
Kaoron
Niveau 9
23 décembre 2009 à 19:15:14

Meunan, une lib graphique, ou même gimp. Tu ajustes tes images de manière à virer les blancs, tu redimensionnes en batch et t'as tes données à la bonne dimension.

Si t'en es à apprendre les réseaux neuronaux et l'apprentissage statistique, ça devrait pas vraiment poser problème :).

Penta_Penguin
Penta_Penguin
Niveau 9
25 décembre 2009 à 14:36:11

merci :ok:

Sous forums
  • Aide à l'achat Mac
  • Macintosh
  • Création de Jeux
  • Programmation
  • Création de sites web
  • Linux
  • Internet
  • Steam Deck
  • Hardware
La vidéo du moment