Digitale

Acquisire i testi con i lettori ottici

L’intelligenza artificiale compare in sempre più settori, mettendo in evidenza come ci sia in atto una vera e propria rivoluzione digitale nuova. L’acquisizione del testo scritto è uno dei settori dove questa è più attiva.

Dopo alcuni tipi di tentativi in passato il mercato ha cominciato a diventare maturo e a consentire l’accesso a tecnologie a basso costo ed alta efficienza per ridurre i costi di gestione i tempi morti e le difficoltà da parte degli operatori.

Come funziona un sistema di lettura

La base su cui si fonda il sistema di lettura è il software. A partire da un’immagine acquisita da una fotocamera con buona definizione per non introdurre artefatti, cioè per non pixelare l’immagine, il programma effettua una scansione basata su algoritmi e pattern.

Questi vengono imparati durante un procedimento di machine learning prima dell’acquisizione del device, che cioè si compra già istruito, anche se alcuni dettagli devono essere definiti in presenza.

L’intelligenza artificiale riconosce le tipologie di simbolo grafico e le riconduce a modelli previsti. Ciò che può essere letto dai software https://www.softwareletturaottica.it/ destinati all’impiego commerciale comprende molte categorie.

I caratteri stampati sono facili da riconoscere per il software perché predicibili. Nella stragrande maggioranza dei casi, fanno parte di un insieme di font disponibili on-line che possono essere acquisiti, come quelli utilizzati nella stampa dei libri.

Questo tipo di applicativo consente di scannerizzare rapporti e documenti, libri e altro e ha radici antiche, perché per esempio anche i vecchi PDF consentivano in molti casi di ritrovare le parole persino su copie scannerizzate molto pesanti.

La scrittura manuale è un po’ più faticosa per le macchine. In questo caso l’algoritmo deve elaborare un po’ di più l’immagine, perché la scrittura manuale è molto personale anche nel caso di stampatelli.

Il software riconosce le forme probabili e provvede con un sistema euristico a stabilire il carattere o a proporre correzioni se due icone dovessero risultare simili per grafia. È il caso, per esempio, di Z e 2.

Per il corsivo occorre un po’ più di machine learning per riuscire a trovare i punti cospicui dei pattern e ricondurre così lo scansionato ad un modello.

Per le spunte e i simboli semplici su modello prestampato dove la parte grafica da interpretare è limitata a quadretti anneriti, crocette o simili è molto più facile per il programma riconoscere ciò che è stato immesso come dato.

Infine per i codici, creati appositamente per le macchine la lettura risale agli anni 70 e, attualmente, qualsiasi oggetto commerciale riporta informazioni sotto forma pattern in bianco e nero. Ne sono un esempio i QR Code.

Lo scanner deve limitarsi a ricondurre le deformazioni dell’immagine fotografata alla forma prevista e effettuare la lettura dell’alternanza di bianchi e neri.

Dove si utilizza un software di lettura

L’acquisizione dei dati può essere fatta in molti ambiti. Si va dal data entry soft, per esempio le bolle di scarico dove quasi tutto è formattato e le uniche informazioni difficoltose sono le contro firme.

L’acquisizione è rapida, perché la quantità di dati da trattare è piccola. Si tende ad avere un singolo foglio con informazioni concentrate, che fanno riferimento a database online su cui verificare.

Un altro ambiente è quello dell’acquisizione di informazioni di tipo medicali, sanitarie, scolastiche e durante corsi e sondaggi. Qua bisogna fare i conti con la grafia e con le aggettive difficoltà dell’acquisizione di un’informazione molto aleatoria che fa parte dell’insieme massivo dei dati statistici.

Un altro ambito è quello della digitalizzazione di faldoni e documenti nativi in forma stampata, o peggio ancora scritti a mano.

Si può trattare di archivi aziendali, deposizioni in tribunale e altro. Vista la delicatezza del compito all’intelligenza artificiale viene affiancata la supervisione di un incaricato per una rilettura e per verificare inconsistenze.

È un lavoro più pesante rispetto agli altri, ma in cui un errore di scrittura può essere fonte di molti problemi di difficile risoluzione.

Attualmente le intelligenze artificiali che controllano i sistemi di acquisizione grafica hanno abbattuto quasi completamente il tasso di errore, che comunque può essere presente, introducendo sistemi di sottolineatura delle parti sospette.

Similar Posts