<img height="1" width="1" style="display:none;" alt="" src="https://dc.ads.linkedin.com/collect/?pid=565596&amp;fmt=gif">

L'OCR : un de ces termes techniques à la mode dont nous entendons beaucoup parler ces derniers temps.  Il présente un intérêt notable dans la FinTech (un autre nouvel acronyme à la mode qui signifie « Financial Technology », ou technologies financières) et plus particulièrement pour les fonctions comptables. De quoi s’agit-il ?

Plus important encore, de quoi ne s’agit-il pas ? Comment cela fonctionne ? Et en quoi cela peut-il impacter la gestion des processus comptables ? Dans ce premier article, nous vous donnerons quelques indices pour comprendre l'OCR.

 
OCR (Optical Character Recognition) signifie reconnaissance optique de caractères. 

La reconnaissance optique de caractères est la conversion mécanique ou électronique d'images de textes dactylographiés, imprimés ou même manuscrits, en textes codés par machine. Le texte peut provenir d'un document scanné, d’une image, ou de textes sous-titrés superposés à une image (comme dans une émission télévisée).

Premier indice : Voici comment cela se présente1 :

 

En termes simples, il s'agit d'un ordinateur qui, en examinant une image ou un fichier, est capable d'identifier son contenu.

Deuxième indice : ne pas confondre OCR avec extraction de données.

L’OCR est une technique qui permet la conversion d’une image en texte. La brique suivante est l'extraction intelligente de données qui reconnaît et traite le texte extrait de l'OCR pour le transformer ensuite en données pertinentes. Vous êtes nombreux à vous tourner vers des fournisseurs de solutions de dématérialisation et vous vous demandez peut-être s’ils disposent de la technologie OCR ? Bonne question. Mais en réalité, ce que vous souhaitez savoir est si la solution offre une technologie complète , qui combine à la fois OCR, extraction intelligente de données et Machine Learning.

Aujourd'hui, il existe trois principales technologies d'extraction de données :

  1. Extraction vérifiée par l'homme ou externalisée ;
  2. Extraction par zones à partir de modèles prédéfinis ;
  3. Systèmes reposant sur l'intelligence artificielle (IA) ou le Machine Learning

Troisième indice : Ces méthodes sont toutes nécessaires car l'OCR seul ignore ce qu'il doit faire des informations qu'il lit. Certains fournisseurs utilisent la reconnaissance optique de caractères (OCR), mais ont recours ensuite à des méthodes d’extraction manuelle, en externalisant cette tâche, également appelée « vérification par une tierce partie ». L'extraction OCR, qui nécessite le contrôle humain, fait intervenir des opérateurs pour saisir les données lues par l'OCR dans des champs prédéfinis. Dans ce cas de figure, la saisie manuelle des données est externalisée et peut s'avérer particulièrement longue, généralement de 24 à 72 heures ouvrables. Ce qui, vous en conviendrez, est contraire à l'objectif visant à passer d'un processus manuel à un processus automatisé pour gagner en efficacité et en productivité.

Dans la deuxième partie de cette série d'articles, nous vous dévoilerons d'autres indices qui vous aideront à élucider le mystère de l'OCR.

En attendant, vous pouvez d'ores et déjà en savoir plus sur nos technologies Yooz :

Calendrier Demo Live

 

Source : 

Hewlett Packard Enterprise Development LP. 2018. Extrait le 29 juin 2018 de https://dev.havenondemand.com/apis/ocrdocument#overview

 

 Tags: Tendances Numériques Corporate

N'hésitez pas à nous
donner votre avis sur cet
article !
Vous pouvez poster votre
commentaire ci-dessous :

S'abonner aux news du Blog

trone-fer