Computação por Humanos

Por Lesandro Ponciano
(lesandrop@lsd.ufcg.edu.br)

Com o crescimento da oferta e da demanda de computação por humanos, cresceu também o interesse de pesquisadores, que atuam na indústria e na academia, em entender melhor as peculiaridades e oportunidades desse novo tipo de computação. Nesta edição conheça mais sobre os projetos desenvolvidos pelo LSD nessa área, como uma aplicação de computação por humanos para transcrição de tabelas; a versão atual da aplicação está disponível aqui

Computação por humanos é um modelo de computação que utiliza o poder cognitivo de seres humanos para resolver problemas para os quais ainda não existe uma solução satisfatória com o uso de máquinas, mas que seres humanos são capazes de resolver de forma rápida e precisa [1]. Esses problemas surgem frequentemente em domínios como processamento de linguagem natural, compreensão de imagens e criatividade. Um sistema de computação por humanos pode ser visto como um sistema distribuído que agrega o poder computacional de um grupo de seres humanos conectados a Internet. Nesse sistema, os processadores são seres humanos ao invés de máquinas.

Os primeiros sistemas a fazerem uso desse modelo de computação foram desenvolvidos no início dos anos 2000. Os precursores foram reCAPTCHA (recaptcha.net) [6] e Amazon Mechanical Turk (Mturk, mturk.com) [7]. No sistema reCAPTCHA, computação por humanos é um subproduto. O foco principal do sistema reCAPTCHA está em impedir ataques de spammers verificando se o usuário é um ser humano. Para fazer isso, ele exige que o usuário transcreva caracteres distorcidos extraídos de digitalizações de livros antigos. O sistema é projetado de modo que a transcrição desses caracteres permite tanto identificar se o usuário é um ser humano quanto transcrever os livros de onde os caracteres foram extraídos. Mturk, por sua vez, é um sistema de computação por humanos de propósito geral, pois ele não foca em apenas um tipo de tarefa como a transcrição de livros. Mturk funciona como um mercado de computação que une pessoas que têm tarefas de computação por humanos para serem executadas e pessoas dispostas a executar esse tipo de tarefa em troca de uma remuneração.

Com o crescimento da oferta e da demanda de computação por humanos, cresceu também o interesse de pesquisadores que atuam na indústria e na academia em entender melhor as peculiaridades e oportunidades desse novo tipo de computação. Assim, computação por humanos tomou dimensão de uma área de pesquisa que experimenta atualmente uma intensa atividade. O grande desafio tratado nesta área é desenvolver sistemas de computação por humanos que sejam eficazes e eficientes tanto para as pessoas que atuam no sistema submetendo tarefas para serem executadas, quando para as pessoas que executam tarefas no sistema. Isso envolve inúmeros subproblemas que incluem: projetar tarefas de modo a usar adequadamente da capacidade cognitiva dos seres humanos; incentivar os seres humanos a atuarem no sistema executando tarefas e permanecerem engajados ao longo do tempo; e tratar erros intencionais e não intencionais que eles podem cometer durante a execução das tarefas.

No Laboratório de Sistemas Distribuídos (LSD), sistemas de computação por humanos são tratados com maior ênfase nos problemas relativos à sua característica distribuída. Diversas pessoas atuam nesta linha de pesquisa no LSD: os professores Francisco Brasileiro, Lívia Sampaio e Nazareno Andrade; os alunos de doutorado Ianna Ferreira e Lesandro Ponciano; o aluno de mestrado José Farias; o bolsista de desenvolvimento tecnológico e industrial Adabriand Furtado e de iniciação tecnológica industrial Guilherme Gadelha. Essa equipe atua tanto no desenvolvimento de aplicações de computação por humanos quanto na pesquisa de soluções para problemas que surgem no desenvolvimento de sistemas que utilizam esse tipo de computação.

As principais aplicações que têm sido desenvolvidas no LSD estão no contexto dos projetos Memória Estatística do Brasil (MEB) e Socientize. O projeto MEB objetiva selecionar, digitalizar e transcrever para arquivos editáveis, publicações históricas relevantes para a história estatística do Brasil. Neste contexto, o LSD está implementando uma aplicação de computação por humanos que permite que voluntários ajudem a transcrever tabelas que contêm informações sobre demografia, economia, finanças, administração pública, transporte, educação, saúde, entre outras. A versão atual da aplicação está disponível no site http://alfa2.pybossa.socientize.eu/mb. O projeto Socientize, por sua vez, envolve diversas aplicações, como Sun4All e Mind Paths. Na aplicação Sun4All, seres humanos ajudam a mapear manchas solares em fotografias do sol. Na aplicação Mind Paths, por sua vez, seres humanos ajudam a encontrar relações semânticas entre palavras. Essas e outras aplicações do projeto Socientize podem ser acessadas no site https://pybossa.socientize.eu/pybossa/app.

No que se refere a produção científica, os resultados mais recentes de pesquisas desenvolvidas no LSD são: (i) um estudo sobre como projetar aplicações de computação por humanos capazes de obter resultados satisfatórios ao mesmo tempo que usa de forma otimizada o poder computacional dos seres humanos disponíveis [2]; (ii) estudos sobre como reduzir o custo de tolerar respostas erradas recebidas dos seres humanos [3][5]; (iii) uma caracterização e modelagem do padrão de engajamento de voluntários que contribuem executando tarefas em dois dos maiores projetos de computação por humanos em Astronomia no mundo: Galaxy Zoo e The Milky Way Project [4]. Resultados das pesquisas desenvolvidas no LSD que tratam da participação de voluntários em projetos científicos que utilizam computação por humanos foram apresentados recentemente pelo prof. Francisco Brasileiro na cúpula de ciência cidadã (Citizen Cyberscience Summit 2014).

Editado por: Maria Leticia Barbosa

REFERÊNCIAS

[1] A. J. Quinn and B. B. Bederson (2011) “Human computation: a survey and taxonomy of a growing field,” in ACM Conference on Human Factors in Computing Systems (CHI). ACM, 2011, pp. 1403–1412.

[2] Oliveira, Jeymisson, Ponciano, Lesandro, Andrade, Nazareno., and Brasileiro, Francisco. (2013). “Estratégias de obtenção de um item máximo em computação por humanos”. In XXXI Simpósio Brasileiro de Redes Computadores e Sistemas Distribuídos (SBRC), Sociedade Brasileira de Computação. 2013, pp. 253–266.

[3] Ponciano, Lesandro.; Brasileiro, Francisco; Gadelha, Guilherme, (2013) “Task redundancy strategy based on volunteers’ credibility for volunteer thinking projects,” in First AAAI Conference on Human Computation and Crowdsourcing (HCOMP). AAAI, 2013, pp. 60–61.

[4] Ponciano, Lesandro; Brasileiro, Francisco; Simpson, Robert; Smith, Arfon, "Volunteers' Engagement in Human Computation Astronomy Projects," Computing in Science & Engineering, vol. PP, no.99, (2014). IEEE Computer Society.

[5] Ponciano, Lesandro ; Brasileiro, Francisco; Gadelha, Guilherme; Furtado, Adabriand (2014) “Estratégia de Replicação Adaptativa para Tarefas de Computação por Humanos”. In XXXII Simpósio Brasileiro de Redes de Computadores e Sistemas Distribuídos (SBRC). Sociedade Brasileira de Computação. (Aceito para publicação)

[6] Von Ahn, L., Maurer, B., McMillen, C., Abraham, D., & Blum, M. (2008) "reCAPTCHA: Human-based character recognition via web security measures." Science 321.5895 (2008): pp. 1465-1468.

[7] Paolacci, Gabriele, Jesse Chandler, and Panagiotis G. Ipeirotis. "Running experiments on amazon mechanical turk." Judgment and Decision making 5.5 (2010): pp. 411-419.