ABBYY FineReader Engine

L’OCR SDK più completo per sviluppatori software.

Integrare le funzionalità OCR basate sull’IA nelle proprie applicazioni.

Classificazione dei documenti utilizzando l'apprendimento automatico (Machine Learning)

A proposito di tecnologie

ABBYYY FineReader Engine fornisce un'API per la classificazione dei documenti, che consente di creare applicazioni che suddividono automaticamente i documenti in categorie predefinite. La classificazione avanzata dei documenti sfrutta tecnologie moderne come l'apprendimento automatico. Queste tecnologie sono in grado di rilevare differenze anche minime tra le singole categorie di documenti e consentono di impostare processi di classificazione flessibili e scalabili in grado di distinguere in modo granulare tra molte categorie di documenti.

Il nuovo Classificatore di immagini intelligente è in grado di raccogliere ed elaborare informazioni visive sulle immagini dei documenti e fornisce risultati di classificazione rapidi. Il Text Classifier avanzato è in grado di estrarre ed elaborare le informazioni sul contenuto dei documenti, aumentando così l'accuratezza della classificazione. Il Classificatore di immagini e il Classificatore di testo possono essere utilizzati singolarmente o in combinazione.

Come funziona?

In linea di principio, il processo di classificazione si articola in tre fasi:

Factoids 025 77X77

Preparazione dei set di dati per l'addestramento alla classificazione

In questa fase, vengono definite le classi di documenti richiesti. Per ogni classe di documento, vengono selezionati diversi esempi di documenti con aspetto e/o contenuto simile. Con l'aiuto degli algoritmi di Machine Learning, la tecnologia ABBYYY analizza i documenti di formazione all'interno di ogni classe del documento e definisce i parametri che devono essere utilizzati per identificare la rispettiva classe del documento.

Factoids 020 77X77

Formazione del modello di classificazione

Durante questa fase, le informazioni sulle classi dei documenti e i relativi parametri vengono importati nel modello di classificazione e il modello di classificazione viene addestrato. Il modello può utilizzare Image Classifier, Text Classifier o una combinazione di entrambi. Le prestazioni possono essere ottimizzate definendo l'equilibrio tra alto richiamo e alta precisione. La convalida incrociata dei dati è disponibile per testare la qualità del modello di classificazione.

Factoids 018 77X77

Distribuzione della classificazione

Durante il processo di classificazione, il modello di classificazione analizza ogni documento in arrivo. Per determinare correttamente il tipo di documento, il modello di classificazione calcola i parametri richiesti per ogni documento e li confronta con le informazioni ricevute durante la fase di formazione. Gli sviluppatori possono creare una routine, che consente agli utenti di aggiornare in modo flessibile il set di dati di formazione e di riqualificare il modello di classificazione.

Oltre alle informazioni sulle categorie di documenti rilevati, vengono fornite informazioni sulla probabilità che i documenti appartengano ad esse. Le informazioni sulla probabilità possono essere utilizzate per determinare le fasi successive di elaborazione, come l'invio o la riclassificazione dei documenti alle funzioni aziendali competenti.

Nella documentazione di ABBYYY FineReader Engine, il processo di classificazione è illustrato da un campione di codice che può essere utilizzato per le prove, adattato e integrato nelle proprie applicazioni.

Modalità di classificazione

A seconda dello scenario d'uso, la classificazione può essere ottimizzata per un'alta precisione, un alto richiamo o un equilibrio tra questi.

Benefits 118V 77X77

Modalità ad alta precisione

Questa modalità è raccomandata negli scenari in cui è importante classificare con precisione i documenti nelle categorie giuste e limitare al minimo l'assegnazione di classi errate.

I documenti identificati come appartenenti alla classe A, in realtà dovrebbero appartenere alla classe A e non alla classe B, mentre è accettabile che i documenti "incerti" appartenenti alla classe A non siano classificati come tali e possano essere tralasciati.

Punto focale: Classificare esattamente i documenti e limitare il rischio di assegnare i documenti a classi di documenti sbagliate.

Benefits 165R 77X77

Modalità di richiamo elevato

Questa modalità è raccomandata in scenari in cui è importante rilevare tutti i documenti appartenenti ad una certa categoria tra tutti i documenti disponibili e limitare il rischio che non vengano mancati.

I documenti appartenenti alla classe A non devono rimanere inosservati nel batch di documenti, mentre è accettabile che alcuni dei documenti classificati come appartenenti alla classe A possano in realtà appartenere alla classe B.

Punto focale: All'interno di un batch di documenti, individuare tutti i documenti appartenenti ad una certa classe e limitare il rischio di non essere esposti.

Richiedi informazioni

Versione di prova

Compila il modulo sottostante e ti contatteremo al più presto.

Sono consapevole che il mio consenso potrebbe essere revocato in qualsiasi momento facendo clic su "annulla iscrizione" all'interno di qualsiasi e-mail ricevuta da ABBYY Solutions Ltd. o tramite il modulo ABBYY Data Subject Access Rights Form relativo ai diritti di accesso ai dati di ABBYY.

Inoltrando questo formulario acconsento all'utilizzo delle mie informazioni personali per gli scopi descritti nella Privacy Notice.

Grazie per l'interesse per i prodotti ABBYYY!

Vi risponderemo a breve. Se vuoi contattarci nella tua regione, visita la pagina dei contatti.

Con i migliori saluti,
il team di ABBYYY