Exportación del texto y reconstrucción del documento
Una vez analizado el documento y reconocidas las áreas de texto, se exportarán los resultados según las opciones predefinidas.
La API de OCR de ABBYY FineReader Engine ofrece una amplia variedad de opciones de exportación de los resultados del reconocimiento como, por ejemplo, en forma de texto plano, XML, varios tipos de formatos PDF y PDF/A, numerosos formatos de solo imagen y documentos editables de Microsoft® Office, entre otros. En caso necesario, ofrece un documento reconstruido totalmente (con todo el formato y recreando la estructura del documento original).
Durante la fase de exportación, es posible:
especificar varios niveles de reconstrucción de la distribución y de conservación del formato del texto (desde texto sencillo sin formato hasta la conservación de toda la distribución de las páginas), incluidos columnas, tablas, marcos, fuentes, tamaños de fuente, estilos de los párrafos, bordes, etc.;
acceder a información detallada sobre cada uno de los caracteres reconocidos;
aprovechar las funciones de edición y formato del texto reconocido antes de la exportación;
exportar el texto reconocido a una variedad de formatos de guardado;
mantener totalmente la distribución del documento, incluidos la estructura lógica y los elementos de formato como tablas de contenidos, encabezados, pies de página, notas al pie y otros elementos;
sustituir los caracteres no reconocidos con certeza por imágenes de los caracteres correspondientes al guardar como PDF;
conservar plenamente el color de las imágenes y el texto.