Biblioteca

Descubra como funcionan las tecnologías
de ABBYY y como ayudan a incrementar
la productividad
.

Estándares PDF

Lo que es importante entender sobre el estándar PDF y sus diferentes especificaciones es que las versiones siguientes no eliminan las anteriores. Cada nueva versión amplia las capacidades de formato, pero eso no significa que todas deban usarse al crear documentos PDF, ni que los documentos creados según las especificaciones anteriores se vuelvan obsoletos con la introducción de PDF 2.0. De hecho, todavía no circulan demasiados documentos PDF 2.0 y aún son menos los que utilizan las últimas funciones del formato, mientras que la mayoría de documentos, incluso los creados ahora, son PDF 1.7 o incluso anteriores. La razón es simple y básicamente responde al propósito y filosofía del formato PDF: si una especificación anterior es suficiente para representar bien el contenido de un documento, es mejor que se use para ofrecer la máxima compatibilidad con diferentes software de PDF.

PDF 2.0

Sin embargo, publicado en julio de 2017, PDF 2.0 es un paso significativo en la evolución del formato. Es una actualización importante y un perfeccionamiento de las especificaciones de PDF acumuladas a lo largo de los últimos años. A pesar de que se haya añadido compatibilidad para una serie de funciones nuevas, el objetivo principal al crear PDF 2.0 y su principal resultado fue consolidar, aclarar y limpiar la especificación. La misma se revisó a consciencia para que fuera más fácil de entender, se limpió de funciones heredadas y ahora ofrece indicaciones más claras para los desarrolladores que creen software de PDF, lo que tendrá como resultado una mejor experiencia del usuario con los documentos PDF. La especificación ha sido desarrollada por un grupo independiente de expertos en el sector de acuerdo con los procedimientos ISO (International Organization for Standardization) y ha sentado la base para que en el futuro puedan añadirse innovaciones de manera más efectiva. PDF 2.0 define el potencial del formato PDF para los próximos años y qué potencial aún está por desarrollarse, y seguro que en el futuro presenciaremos más actualizaciones.

PDF/UA

«UA» significa accesibilidad universal («Universal Accessibility» en inglés), y PDF/UA es una especificación que define cómo hacer que las tecnologías de ayuda (software especiales o incluso dispositivos) puedan leer un documento PDF, de manera que un ordenador pueda leer en voz alta el contenido de tal documento a cualquier persona que dependa de estas tecnologías. Debido a que los documentos PDF se han vuelto muy frecuentes en nuestras vidas, en especial en ámbitos como los servicios públicos, la banca, los servicios básicos, el empleo, la medicina, la educación y muchos otros, asegurar una accesibilidad fácil y por igual a los mismos es realmente crucial.

Un documento PDF/UA tiene una estructura lógica definida con claridad y corrección, y correctamente descrita. Al usar esta descripción de estructura, la tecnología de ayuda sabrá y podrá decir cuál es el encabezado del documento, en qué orden leer los párrafos y las columnas del texto, cuáles son las listas, dónde están las imágenes y qué muestran, saltarse la lectura de los encabezados y pies de página con numeración que se repiten, etc.

FineReader puede tanto convertir documentos PDF existentes de cualquier tipo en PDF/UA como crear documentos PDF/UA a partir de archivos de otros formatos como DOCX, XLSX, PPTX, RTF, archivos de imagen y otros. Esto es posible gracias a la tecnología OCR de ABBYY, que es capaz de analizar la estructura de cualquier documento independientemente de su formato.

PDF/A

PDF se creó como un formato que podía ofrecer interoperabilidad a través de diferentes software, ordenadores y plataformas. PDF/A amplia la idea en el tiempo: asegura que los documentos PDF seguirán pudiéndose abrir en el futuro.

PDF/A es un formato PDF destinado al archivado, a la conservación a largo plazo y al intercambio de documentos electrónicos. La aspecto visual de los documentos electrónicos se mantiene en el tiempo, independientemente de las herramientas y sistemas que se hayan utilizado para su producción, almacenamiento y reproducción. Los documentos fuente pueden ser de papel, correos electrónicos, documentos PDF «normales», páginas web y muchos más. PDF/A realiza una captura digital instantánea y fiable de cualquier documento que sigue permitiendo realizar búsquedas y sigue siendo plenamente procesable para:

  • La gestión de documentos
  • Los flujos de trabajo automatizados
  • La gestión de registros legales
  • El archivado de correo: papel, fax o correo electrónico
  • El archivado de documentos, migración de archivos (sede electrónica, documentos legales, etc.)

Debido a su capacidad de ofrecer una representación uniforme y estable de los documentos a través del tiempo y en todas las plataformas, PDF/A también se utiliza como el formato para la gestión de documentos y el intercambio continuado de documentos. Es «papel digital», tan fiable, inalterado y permanente como los documentos en papel de los que estamos acostumbrados a fiarnos.

Variantes de PDF/A: designaciones y sus significados

1, 2 o 3 significan componentes de compatibilidad de PDF/A, que son, básicamente, estados de la evolución del formato. El primero fue PDF/A-1; mientras que PDF/A-3 es el último. Cuanto mayor sea el número, más serán las capacidades permitidas en un documento compatible con PDF/A.

b, u y a significan niveles de compatibilidad y definen para qué fin exacto está asegurada la compatibilidad. Es interesante ver que la compatibilidad aumenta exactamente en este orden: de b, que asegura la mínima, a a, que requiere toda la compatibilidad posible según la especificación PDF/A:

  • b (de «básica»): asegura la preservación visual de un documento al visualizarlo o imprimirlo;
  • u (de «unicode»): además de b, requiere mapear todos los caracteres a Unicode. Esto garantiza que los textos se puedan visualizar correctamente y que se siguen pudiendo realizar búsquedas en los documentos. ‘u’ se introdujo como nivel separado y empieza solo a partir de PDF/A-2;
  • a (de «accesible»): además de b, requiere mapear todos los caracteres a Unicode y tener información de la estructura del documento. Esto asegura la preservación y correcta interpretación del contenido del documento y de la estructura lógica (orden de lectura), cuando es interpretada, por ejemplo, por las tecnologías de ayuda.
  PDF/A-1 PDF/A-2 PDF/A-3
En función de: PDF 1.4 PDF 1.7
Niveles de compatibilidad: b, a b, u, a
Esencia: Define restricciones de uso y requisitos para las fuentes, colores, anotaciones y otros elementos para que un documento PDF sea autónomo y capaz de reproducir la imagen durante mucho tiempo.
Anexos: No se permiten anexos. Se permiten anexos PDF/A. Permite anexos de cualquier formato de archivo (modelos CAD, audio, vídeo, datos XML, hojas de cálculo de Excel, documentos de Word, etc.)1 Los anexos deben enlazarse a partes específicas del documento y hay que especificar las relaciones entre ellos y el documento.
Protección con contraseña: No se permite la protección con contraseña.
Detalles del uso:   Los anexos PDF/A permiten mantener conjuntos de documentos relacionados, logrando así que todo el conjunto PDF/A sea compatible. Los anexos de varios tipos permiten el archivado o el intercambio unificador incluso para conjuntos de documentación compleja que contengan información en formatos que no se pueden convertir a PDF. Otras aplicaciones o sistemas pueden trabajar directamente con los anexos en sus propios formatos.2

1 El uso de PDF/A-3 no garantiza que esos anexos sigan siendo utilizables en el futuro, tan solo permite su presencia en el documento.

2 Por ejemplo, la representación XML del contenido de una factura puede adjuntarse a la representación visual convencional de la factura, lo que permite procesar esa factura en los sistemas ERP tanto manualmente basándose en su «imagen» como automáticamente usando esos datos XML.

¿Cómo comprobar la compatibilidad PDF/A?

ABBYY FineReader, como otros software de PDF consolidados, indica si un documento es compatible con PDF/A y evita así que el usuario realice acciones que lo puedan invalidar, como por ejemplo, añadir una protección con contraseña. Si fuera necesaria una verificación exhaustiva de la compatibilidad PDF/A, existen herramientas de validación de terceros.

ABBYY FineReader 14 admite la creación o conversión de documentos a cualquiera de las variantes PDF/A. La elección de la variante depende de las tareas, los flujos de trabajo y los requisitos del usuario.

Encontrará más información sobre estos y otros tipos de PDF aquí