O Instituto Nacional de Meteorologia (INMET) é uma agência responsável pelo monitoramento e previsão das condições climáticas no Brasil. Foi criado em 1909 e, desde então, as suas inúmeras estações de monitoramento espalhadas por todo o país, registram continuamente os fenômenos meteorológicos e climáticos.
Não é preciso dizer que o INMET agora possui uma coleção impressionante de registros meteorológicos que datam do final do século XIX. Esses dados podem ser usados para determinar padrões climáticos a longo prazo, analisar mudanças nas condições climáticas e produzir previsões mais precisas. É inegável a sua importância para uso científico e prático, em particular nas atividades do Ministério da Agricultura, Pecuária e Abastecimento.
Infelizmente, até recentemente o acesso ao banco de dados meteorológicos era complicado, se não inviável, pelo fato de ele existir apenas no papel; era realmente difícil classificar e procurar partes específicas de informações sem benefícios das tecnologias modernas.
campos em algumas páginas
de caracteres reconhecidos
de pessoal a menos
Em 2012, o INMET realizou um processo de licitação para o projeto de transferir as informações em papel (livros digitados em formato A3 e folhetos manuscritos em vários formatos) para um banco de dados eletrônico, a fim de garantir a continuidade das informações e permitir fácil tabulação e análise dos dados meteorológicos. O contrato foi assinado com a Flexdoc Tecnologia da Informação Ltda, uma empresa especializada em fornecimento de soluções completas end-to-end na área de automação de processos de fluxos de trabalho. Dispondo de uma área de 1500m² para o armazenamento de documentos, ela implementou projetos com um volume superior a 30 milhões de documentos tratados. A tarefa definida pelo INMET foi um desafio, devido à sua escala (mais de 3 milhões de páginas a seres processadas) e da variedade de documentos em papel que diferiam em termos de estrutura, complexidade e até mesmo condições físicas. No início, a Flexdoc testou uma série de soluções e finalmente optou pelo ABBYY FlexiCapture Engine, por graças às referências de sucesso na indústria, escalabilidade e flexibilidade, o que permite o processamento de vários tipos de documentos. Reconhecendo a necessidade de incorporar o OCR no processo, a Flexdoc testou uma série de soluções, antes de escolher o ABBYY FlexiCapture Engine. Foi uma combinação perfeita entre precisão excepcional de dados e avançada escalabilidade. Mas a característica decisiva foi a sua flexibilidade, pois o ABBYY FlexiCapture Engine fornece uma série de ferramentas e utilidades que permitem um fácil “zoneamento” de formulários e capacidade de definir e modificar os modelos. Desta forma, toda a gama de documentos produzidos ao longo de décadas pôde ser processada por um único sistema.
Em primeiro lugar, os documentos digitalizados são importados e imediatamente enviados para o ABBYY FlexiCapture Engine para o reconhecimento dos tipos de formulários e correspondência de templates, a fim de localizar cada campo.
A automatização deste passo acelera muito o processamento do documento, como há mais de 20 tipos de brochuras, cada uma composta por pelo menos 6 tipos de páginas. Algumas páginas contém mais de 150 campos. Os dados impressos são extraídos utilizando as tecnologias de OCR da ABBYY. Quanto aos campos com dados escritos à mão, devido à má condição física (alguns dos documentos datam de 1900) e por serem ilegíveis para uma máquina, os mesmos são enviados para operadores que digitaram os dados manualmente. Ao detectar os campos e os seus tipos, o ABBYY FlexiCapture Engine acelera e facilita muito o trabalho dos operadores que se especializaram em determinados campos.
Depois disso, todos os campos vão à verificação. 100% de precisão é uma necessidade, porque os dados serão posteriormente utilizados para cálculos científicos, pesquisas e previsões. Em caso de divergências ou dúvidas, os campos com resultados incomparáveis são enviados para os supervisores para uma análise mais abrangente. A validação de situações conflituosas e o controle de qualidade antes da exportação ainda requerem a participação de profissionais capacitados e especializados em meteorologia.
Finalmente, os metadados são exportados para supercomputadores de previsão climática do INMET. Um total de 85 pessoas estão envolvidas em todo o fluxo operacional: desde a importação e extração dos dados até a verificação e tratamento dos erros
A incorporação do ABBYY FlexiCapture Engine no fluxo de trabalho trouxe um aumento significativo da produtividade. Graças à solução de automação da ABBYY, a Flexdoc reduziu o número de digitadores e especialistas envolvidos no projeto em 30%. Os documentos agora são analisados automaticamente, o que torna as tarefas dos digitadores tão fáceis que poderiam ser feitas por uma criança. O trabalho de profissionais qualificados é reduzido à mera verificação, o que lhes permitiu dedicar mais tempo a atividades criativas e valiosas. O projeto involve processamento de mais de 3 milhões de páginas e 4 bilhões de caracteres foram processados. Graças às tecnologias da ABBYY, a digitalização de toda a informação de tempo e clima do Brasil, anteriormente considerada um empreendimento complicado a longo prazo, agora será concluída até o ano de 2017.