L’éditeur belge Creaceed, qui ne propose que des apps de qualités loin du bullshit marketing, sort Prizmo 5 sur iOS. Le logiciel transforme votre iPhone ou votre tablette en scanner de poche, capable de numériser très rapidement de grandes quantités de documents, et même de reconnaitre le texte de ceux-ci. Cette nouvelle version est qualifiée de « plpus gros projet à ce jour » par l’éditeur, qui a travaillé deux ans sur cette refonte intégrale. Au menu, nouvelle interface, qui mise sur la rapidité de mise en action, fonctions débrayables d’amélioration du scan, reconnaissance du texte par un moteur d’OCR local, ou en ligne (Microsoft Azure) et mode lecteur multilangues pour l’accessibilité.

Prizmo 5 est gratuit, achat in-app à 14,99 € pour débloquer l’OCR (9,99 € pendant la semaine de sortie)

Tour d’horizon vidéo

Prizmo 5 scanne et reconnait vos documents à l’aide du Machine Learning

Nous testons depuis plusieurs jours cette nouvelle mouture, qui remplit très efficacement deux grands usages : permettre de scanner rapidement des documents pour les conserver, sous forme d’image, et être la source d’un travail d’édition à partir du texte reconnu depuis les documents ; il dispose d’un système spécialisé pour les cartes de visite, qui remplit automatiquement les champs de la vCard à partir des données reconnues. Car même si Prizmo se montre très performant, localement et en ligne, sur le plan de l’OCR, la reconnaissance automatique des textes demeure nécessairement imparfaite. On parle de taux de reconnaissance de l’ordre de 90 à 95 % à l’optimal, mais de nombreux paramètres influent.

Interface : tout pour la vitesse

Creaceed a beaucoup bossé sur l’interface de son logiciel pour le rendre très rapide à l’utilisation, tout en conservant des possibilités de réglages fins par l’utilisateur.

Ainsi, depuis l’interface de prise de vue peut-on activer la fonction « autoshoot » qui détecte automatiquement le document à scanner et prend la photo dès que l’iPhone est jugé assez stable. Pour scanner un autre document, il suffit de pointer l’appareil photo dans sa direction. Ce mode de fonctionnement est assez classique, notamment utilisé sur Scanbot ou Scanner Pro, deux des points lourds du domaine. Certains utilisateurs, qui ont des besoins de scan important, peuvent même réfléchir à mettre en place une table de reproduction. L’idée est de poser l’iPhone à la distance requise sur un support bien éclairé, et de glisser une par une les feuilles à scanner. On peut arriver à un numérisation par lot très rapide dans ce contexte.

Après la prise de vue, il est possible d’effectuer manuellement les réglages sur l’image : recadrage, choix du mode photo (couleur, gris, noir et blanc), notamment. L’algorithme de « réparation des bords » qui se charge d’affiner la coupe des pages se montre parfois un peu agressif.

Pour accélérer encore les choses, un icône de boussole permet d’activer l’auto-orientation, qui se charge de déterminer automatiquement le sens du document, pour le faire tourner ou le retourner automatiquement dans le sens de lecture.

L’interface est claire, mais parfois un peu déroutante. Par exemple, lors d’une prise de vue, l’app enregistre une vignette du nouveau document, qui incite l’utilisateur à la tapoter : elle ouvre le mode d’édition de l’image, pour corriger la capture. Mais elle ne permet pas d’accéder à l’OCR. Pour cela, il faut finaliser le scan en tapotant « Ok » sur la fenêtre. On accède alors à tout le nécessaire. Cependant, une fois l’organisation de l’interface comprise, Prizmo 5 est un bonheur à utiliser.

Core ML mis à l’essai

Pour ce développement Creaceed a utilisé Core ML, l’API d’apprentissage des machines (Machine Learning) proposée par Apple. « C’est notre premier développement Core ML, après plusieurs mois à expérimenter cette technologie », explique Raphaël Sebbe, le boss de Creaceed. Pour fonctionner, c’est toujours le même principe : le développeur fait « ingérer » des documents au moteur ML, en indiquant la solution au problème posé pour chacun de ces exemples. Dans ce cas, ce sont près de 5000 scans de documents qui ont été associés, l’équipe se chargeant d’indiquer pour chacun d’eux l’orientation réelle de l’image, pour nourrir le moteur. L’échantillon demeure important, mais finalement pas si monstrueux que ça : une fonction d’accentuation des données est proposée par Core ML qui permet, à partir d’une seule image, de générer plusieurs variantes pour mieux nourrir le moteur. « Nous avons utilisé des images d’iPhone à 12 millions de pixels, et le moteur a très bien fonctionné ; il est plus rapide et plus précis que nous désormais », assure Raphaël.

OCR : en ligne ou local

LA reconnaissance des caractères s’opère de deux manières : soit à l’aide du moteur interne à l’application, soit en ligne, Prizmo utilisant alors le moteur d’OCR de Microsoft Azure, plus performant. Il est notamment capable de reconnaitre l’écriture manuscrite, mais uniquement en anglais. Ce mode de reconnaissance est optionnel, et suppose la prise d’un abonnement, à partir de 1 €/mois. « Les service nous est facturé à chaque utilisation par Microsoft, ce qui explique que nous ayons choisi un mode d’abonnement pour en bénéficier », précise Creaceed.

Cependant, sorti de besoins spécifiques, l’OCR interne nous semble être un bon choix, nettement moins coûteux : le déblocage de l’app s’opère via un paiement unique à 14,99 € (9,99 € prix de lancement pendant quelques jours). Avec ce paiement, vous disposez de l’app de scan, et de l’OCR local. LEs utilisateurs de la version 4 bénéficient d’un tarif de mise à jour préférentiel à 5,49 € pendant une semaine, puis 9,99 €.

Lors de nos essais, nous sommes parvenus à un taux de reconnaissance correct, mais qui demeure imparfait. N’escomptez pas obtenir un texte directement utilisable après un OCR, il exigera nécessairement une relecture. Cependant, avec ses algorithmes avancés de détection de la maquette du document – que l’on peut débrayer – Prizmo 5 fait un excellent boulot.

Les petits plus !

Prizmo regorge de fonctionnalités pointues, qui en font une des solutions les plus souple dans le domaine du scan OCR. Par exemple, il intègre un lecteur de carte de visite, qui vient remplir automatiquement une vCard pour le correspondant. Il propose aussi des « actions intelligentes », qui sont un équivalent des events detectors d’Apple. Si sur une page Prizmo reconnait un numéro de téléphone, ou un rendez-vous, il vous proposera d’appeler celui-ci, ou de noter celui-là. Pratique !

Prizmo 5 gère aussi un format de compression avancé du PDF, qui fait tomber le poids de captures PDf à environ 50 Ko : de quoi voire venir et de pas saturer les espaces de stockage dans les nuages que gère le logiciel (les principaux, y compris iCloud et Dropbox).

Au final, Prizmo 5 s’impose comme une refonte majeure d’un logiciel qui était déjà performant. Il gagne à l’occasion une rapidité de mise en œuvre qui le fait rivaliser avec les meilleurs, et permet l’accès à des moteurs de reconnaissance optique de qualité. Un excellent choix.

  • Prizmo 5, gratuit, achat in-app à 14,99 € pour débloquer l’OCR (9,99 € pendant la semaine de sortie). OCR en ligne optionnel sur abonnement.
NOTRE VERDICT
Intérêt
Richesse fonctionnelle
Ergonomie
Rapport qualité / prix
Arnaud joue du clavier comme d'autres du xylophone, mais le résultat demeure peu musical. Il conduit la rédac à la baguette et essaye d'éviter les fausses notes. Geek avec de la patine, il officie aussi dans la presse généraliste.

1 COMMENTAIRE

À vous la parole !

Fermer
*
*

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.