ABBYY FineReader Engine

L’OCR SDK più completo per sviluppatori software.

Integrare le funzionalità OCR basate sull’IA nelle proprie applicazioni.

Riconoscimento

Un set completo di tecnologie

Per la fase di riconoscimento del testo vera e propria, ABBYY FineReader Engine offre una serie completa di tecnologie di riconoscimento. Le tecnologie fornite comprendono il riconoscimento ottico dei caratteri (OCR), il riconoscimento dei caratteri manoscritti (ICR) e il riconoscimento di codici a barre (OBR). In qualità di leader di mercato, ABBYY offre il maggior numero di lingue OCR, che possono essere combinate individualmente. Si veda di seguito l'elenco delle tecnologie e delle opzioni di elaborazione disponibili.

Factoids 026 77X77

Optical Character Recognition (OCR)

Tecnologia OCR: il riconoscimento di testo stampato è disponibile in 202 lingue, tra cui:

  • lingue europee (caratteri latini, cirillici, armeni, greci)
  • lingue non europee: cinese, giapponese, coreano, arabo, farsi, thai, vietnamita, ebraico, Birmano (anteprima)
  • FineReader XIX – per vecchi documenti, libri e giornali pubblicati dal 1600 al 1937 in inglese, francese, tedesco, italiano e spagnolo in font antichi come Fraktur, Schwabacher e font gotici
  • Riconoscimetno OCR-A, OCR-B, MICR (E13B) e font CMC7 e documenti stampati da stampanti a matrice di punti o digitati con macchina da scrivere
Factoids 024 77X77

Intelligent Character Recognition (ICR)

Tecnologia ICR: il riconoscimento di testo scritto a mano in stampatello è disponibile in più di 120 lingue:

  • Europee e non europee
  • 22 stili regionali di scrittura a mano
  • Riconoscimento dei caratteri scritti a mano nei campi e nelle cornici
  • ICR per le cifre indiane utilizzate negli Stati arabi

È possibile il riconoscimento di informazioni scritte a mano in diverse lingue (ICR multilingue).

Factoids 017 77X77

Optical Barcode Recognition (OBR)

  • Tipi di codice a barre 1D e 2D
  • Rapida estrazione dei codici a barre Questa funzione permette l’identificazione automatizzata e il riconoscimento di codici a barre su un documento indipendentemente dalla posizione sulla pagina.

Modalità di riconoscimento

Definendo una modalità di riconoscimento, gli sviluppatori possono impostare e regolare rapidamente la velocità di elaborazione e la precisione. Oltre alla modalità di elaborazione predefinita, il riconoscimento OCR e ICR può essere eseguito in modalità di riconoscimento normale, veloce e bilanciata:

Benefits 119B 77X77

Modalità di riconoscimento preciso

La modalità più precisa per ottenere i massimi risultati di riconoscimento, ad esempio quando si vuole riutilizzare il contenuto riconosciuto.

Benefits 102V 77X77

Riconoscimento in modalità “Fast”

Questa modalità aumenta la velocità di elaborazione del 200-250%, rendendo la tecnologia ideale per la gestione dei contenuti (CMS), la gestione dei documenti (DMS) e i sistemi di archiviazione.

Riconoscimento full text e a livello di campo

In generale, sono possibili due tipi di riconoscimento: riconoscimento full text e a livello di campo. Il riconoscimento full text viene utilizzato per la conversione dei documenti e di solito include l'uso della tecnologia OCR. Il riconoscimento a livello di campo viene utilizzato per estrarre dati particolari e comprende l'utilizzo di OCR, ICR e altre tecnologie.
La tabella che segue mostra le differenze:

Specifica Riconoscimento full text Riconoscimento field level / zonale
Scenario di applicazione: Conversione documenti, archiviazione libri Data Capture (acquisizione dati)
Analisi dei documenti: Generale, per fatture, per indicizzazione full text Specifica manuale dei blocchi per riconoscimento a livello di campo
Riconoscimento: OCR con una precisione generale di circa il 96-99% OCR, ICR, riconoscimento di caselle di selezione (OMR), riconoscimento di codici a barre con tipi di dati e possibili valori predefiniti. Precisione del 100% circa
Verifica: Consigliata se si deve riutilizzare il contenuto Obbligatoria nella maggior parte dei casi
Sintesi: Applicata per il ritrovamento di documenti Non applicata
Risultati di riconoscimento: File (RTF, DOC, PDF, ecc.) Esportazione verso file XML o banca dati
Riconoscimento full text

Il tipo di riconoscimento base per diverse operazioni, ad esempio:

  • conversione di documenti e libri per l’archiviazione
  • conversione di documenti per il riutilizzo del contenuto
  • estrazione basilare del testo per l’identificazione di caselle e la classificazione dei documenti

Tutte richiedono il riconoscimento (OCR) di tutto il testo. il testo risultante viene esportato come testo normale o come documento completo nel formato richiesto.

Riconoscimento a livello di campo

Per supportare processi aziendali chiave come l'elaborazione di moduli, la classificazione delle parole chiave, la visione artificiale o l'automazione dei processi robotizzati, ABBYY FineReader Engine estrae testo da campi o zone. Le funzionalità chiave includono OCR e ICR multilingue, OMR, riconoscimento di codici a barre e una serie di funzioni specifiche, come ad esempio:

  • Estrazione dati da campi con bordi e contorni diversi
  • Definizione del contenuto dei campi stabilendo set di caratteri, dizionari, espressioni regolari, stili di caratteri manoscritti, ecc.
  • Rilevamento della spaziatura sul campo
  • Elaborazione intelligente di blocchi con parti e linee divisorie
  • Despeckling di blocchi di testo, con la possibilità di specificare la dimensione delle "imperfezioni"
  • Il riconoscimento a livello di campo è supportato anche da strumenti speciali per sviluppatori come Voting API e "On-the-Fly" Recognition Tuning.

Lingue dell'utente

Per aumentare la qualità del riconoscimento, ABBYY FineReader Engine fornisce un'API per creare e modificare le lingue di riconoscimento, modificando le lingue di riconoscimento predefinite e aggiungendo nuove parole alle lingue degli utenti. Esempi:

  • Per migliorare la qualità del riconoscimento ICR nei moduli, è possibile utilizzare le lingue dell'utente per descrivere il tipo di informazioni che possono essere inserite in ciascun campo (codici di avviamento postale, codici prodotto, numeri).
  • Per migliorare il riconoscimento di codici prodotto, numeri di telefono o numeri di passaporto, è possibile creare una nuova lingua di riconoscimento, che aiuta il programma a leggere tipi specifici di dati.

Pattern training

Nella maggior parte dei casi FineReader Engine riesce a leggere testi anche senza previo apprendimento. Tuttavia, quando si effettua il riconoscimento di font decorativi o con contorno o documenti di bassa qualità di stampa, è possibile addestrare i propri modelli e aumentare la qualità di riconoscimento.

Richiedi informazioni

Versione di prova

Compila il modulo sottostante e ti contatteremo al più presto.

Sono consapevole che il mio consenso potrebbe essere revocato in qualsiasi momento facendo clic su "annulla iscrizione" all'interno di qualsiasi e-mail ricevuta da ABBYY Solutions Ltd. o tramite il modulo ABBYY Data Subject Access Rights Form relativo ai diritti di accesso ai dati di ABBYY.

Inoltrando questo formulario acconsento all'utilizzo delle mie informazioni personali per gli scopi descritti nella Privacy Notice.

Grazie per l'interesse per i prodotti ABBYYY!

Vi risponderemo a breve. Se vuoi contattarci nella tua regione, visita la pagina dei contatti.

Con i migliori saluti,
il team di ABBYYY