Google a rendu disponible en open-source un logiciel de reconnaissance de caractères, Terrasact OCR, développé par Hewlett Packard de 1985 à 1995. S’il est moins performant que certains logiciels commerciaux (il est par exemple limité à la langue anglaise et n’a pas de module de mise en page permettant le traitement d’un document multi colonne), il s’agirait du logiciel open-source disponible le plus performant. Google recrute par ailleurs des spécialistes dans ce domaine, probablement utiles dans le cadre de son projet de numérisation de documents Google Print, mais potentiellement aussi pour d’autres applications (traduction de texte photographié, reconnaissance des spams sous forme d’image, etc.).
Google ne s’intéresse pas qu’à la reconnaissance de texte : il a récemment acquis Neven Vision, une société spécialisé dans la reconnaissance d’objets et de visages ; côté sonore, Google a annoncé un prototype permettant de d’identifier l’émission télévisée regardée au moyen d’un microphone placé dans la pièce du téléviseur et d’une comparaison d’empreintes sonores. L’objet de la reconnaissance peut être multiple : offrir un service pour du contenu personnel (traduction de texte photographié, gestion d’albums de photo), indexer le contenu multimédia disponible sur le web, connaître le contenu des médias consultés ainsi que des échanges (mails, téléphonie) et le profil d’un utilisateur (pour entre autre diffuser des publicités adaptées).
Source :
– https://google-code-updates.blogspot.com/2006/08/announcing-tesseract-ocr.html
– https://googleblog.blogspot.com/2006/08/better-way-to-organize-photos.html
– https://www.technologyreview.com/read_article.aspx?id=17354&ch=infotech&sc=&pg=1
Pour en savoir plus, contacts :
Google tous azimuts, Revue des STIC,
https://www.bulletins-electroniques.com/rapports/smm05_103.htm
Code brève
ADIT : 38980
Rédacteur :
Sébastien Morbieu, [email protected]