Ciao a tutti, sto cercando di addestrare tesseract v.3 a riconoscere i numeri presi da delle immagini reali dei contatori del gas.
Le immagini che uso per l'addestramento sono immagini fatte con delle macchine fotografiche quindi presentano problemi legati alla luminosità,scarsa risoluzione, ombre, eccetera...
Per il training uso questa immagine (la trovate su questo link)
http://imageshack.us/photo/my-images/708/numcontatori.png cioè una serie di cifre prese dalle varie foto fatte ai contatori del gas, creo manualmente il file box indicando esattamente il numero e il riquadro che lo identifica (vedi link)
http://imageshack.us/photo/my-images/845/figura1om.jpg per poi mandarlo in pasto all'addestramento di tesseract per generare i vari file che andranno a comporre la mia nuova lingua.
Il risultato è che quando eseguo tesseract con il nuovo linguaggio che ho creato, il software riesce a riconoscere abbastanza bene le cifre più nitide mentre quelle che presentano problemi dovuti alla scarsa qualità dell'immagine, non vengono per niente interpretate.
Chiedo aiuto per poter perfezionare l'addestramento, se c'è qualcuno che pensa di essere in grado di aiutarmi può scrivere a
alexlatti@libero.it .
Grazie, Alessandro.