Estudo de Técnicas de Processamento e Análise de Imagens para Leitura e Interpretação de Formulários.
Por Márcio de Carvalho Saraiva
(marcio@dsc.ufcg.edu.br)
Atualmente, é cada vez mais comum a troca de documentos impressos por documentos digitalizados. Mas, em diversas ocasiões, por enquanto, ainda são necessários documentos não eletrônicos, como por exemplo, em avaliações, provas e no vestibular. Pensando na análise desses tipos de documentos, o Laboratório de Visão Computacional (LVC) da UFCG está desenvolvendo um projeto que conheceremos um pouco melhor nesta matéria.

Mesmo com o aumento dos processos de informatização, os documentos impressos e manuscritos ainda continuam sendo bastante utilizados como, por exemplo, provas de uma disciplina em uma universidade. Entretanto, esses documentos não eletrônicos apresentam uma série de desvantagens, a saber: a busca pelas informações neles contidas é lenta (verificar onde cada aluno respondeu cada questão, observar se a questão está certa ou não, até mesmo completa), os documentos ocupam um grande espaço físico, podem ser extraviados, danificados, dentre outras.

Como solução para esse problema, sistemas conhecidos como Gerenciadores Eletrônicos de Documentos (GED) vêm sendo desenvolvidos. Um GED permite ao usuário controle sobre o documento, podendo realizar operações como compartilhamento, armazenamento e recuperação do conteúdo do documento.

Inserido no contexto acima, o principal objetivo da pesquisa (ainda não intitulada) do Laboratório de Visão Computacional, da Unidade Acadêmica de Sistemas e Computação (DSC), da Universidade Federal de Campina Grande (UFCG) é estudar e desenvolver algoritmos que, de posse de um documento digitalizado contendo informações registradas em formulários, identifiquem a estrutura do documento e as marcações humanas (letras, rabiscos, assinaturas etc.) e, posteriormente, analise essas marcações.

Basicamente, na pesquisa, são adaptadas técnicas de visão computacional que auxiliam na detecção de informações em imagens. Como exemplo, cálculo da integral da imagem, transformada de Hough e análise da projeção de histogramas. Essas técnicas auxiliam, por exemplo, no rastreamento de esferas, elipses e retas, que são extremamente úteis na leitura e interpretações de formulários.

Exemplo de provas utilizadas para estudos no desenvolvimento do projeto.

A pesquisa é realizada pela aluna do 5º período, Catharine Quintans Bezerra, sob a orientação do professor Dr. Herman Martins Gomes.

Ao final da pesquisa, ter-se-á a análise e o desenvolvimento de diversos algoritmos  que,  de  posse  de um  documento  digitalizado  contendo  informações  registradas  em formulários, identifiquem a estrutura do documento e as marcações humanas. Posteriormente, a partir da análise dessas marcações, será possível identificar o indivíduo que realizou as marcações, verificar padrões na escrita ou em desenhos, e até confirmar se em uma prova a questão foi respondida corretamente.

Se você tem curiosidade por obter mais informações sobre essa pesquisa ou gostaria de colaborar no seu desenvolvimento, visite o LVC ou acesse: http://lvc.dsc.ufcg.edu.br. Assim, poderá conhecer também outras pesquisas desse laboratório.