main

Internet ChineLe chinoisold

Chinois : Logiciel de reconnaissance des caractères (OCR)

31/10/2011 — par Cédric BEAU

Facile de taper des caractères trouvés sur le Web dans votre dictionnaire en ligne favori (pour ma part c’est Chine Nouvelle, je lui jalouse son dico). Mais comment faire si l’on n’est pas sinisant, que l’on ne sait pas repérer des “clés” ou autres “radicaux” dans un caractère, pour traduire ce petit prospectus que vous avez récupéré au restaurant chinois, ou cet article de journal du “Europe News Weekly” écrit en chinois traditionnel que vous avez piqué au Paris Store du coin?

Il nous faudrait pouvoir scanner le texte en question, alors que le site d’OCR en ligne gratuit, et chinois, NETOCR.net semble être HS

Par ailleurs, il nous faudrait un logiciel gratuit d’OCR de préférence en français ou en anglais, permettant de reproduire les caractères chinois, car nous l’avons bien dit : on suppose que l’on ne connais rien au chinois.

Après quelques recherches, j’ai trouvé mon bonheur : sciweavers.org, le service i2OCR. Je l’ai donc testé pour vous, et le résultat est plutôt potable. Il conviendra de faire un scan de la meilleure qualité possible, j’ai en effet essayé avec des photos issues du net, qui devaient originalement être des screenshots, et le rendu devait donc être moins bon que du 72 DPI. Le logiciel demande une qualité minimum de 200DPI.

OCR Chinois

Un nouveau test avec une meilleure résolution m’a tout de même donné des caractères improbables, et donc des phrases hilarantes et dénuées de sens, mais l’outil semble adapté pour comprendre l’essentiel du sens d’un texte. Cela pourra même être utile à mes élèves ayant perdu leurs traductions de textes de bacs!

J’ai particulièrement aimé l’aperçu en double affichage avec l’original, qui permet de se rendre compte du rendu avant le téléchargement. Ce qui m’a évité d’avoir à le télécharger puis de l’ouvrir avant de me rendre compte que les images issues du net n’étaient pas terribles.