Por Alana Morzelli e Artur Lira
Edição: Priscila Murr
Fotos: Banco de Imagem e divulgação
Supervisão: Maíra Gioia
O modelo possui o diferencial de analisar individualmente os casos, a partir de como a pessoa expressa a verdade
Detectores de mentira estão presentes na cultura pop e no imaginário social há muito tempo. A história indica que os primeiros estudos que relacionam mudanças corporais e o ato de mentir surgiram na década de 1850. Essa antiga inquietação humana aparece com a utilização de dispositivos e também com técnicas de leitura de linguagem corporal em séries como “Engana-me se puder”, em cenas icônicas de filmes como “Infiltrado na Klan”, documentários como “The Lie Detector” e até em canais famosos como o do influenciador brasileiro “Metaforando”.
E foi com a mesma curiosidade dos pesquisadores de quase dois séculos atrás, que Alex Sebastião Constâncio, doutor em Gestão e Tecnologia da Informação pela Universidade Federal do Paraná (UFPR), desenvolveu o primeiro Detector Multimodal de Mentiras para o português do Brasil. A pesquisa é resultado da sua Tese de doutorado e trata-se de um modelo pioneiro de análise.
Diferente dos polígrafos tradicionais, o programa criado por Constâncio é o primeiro a utilizar o Modelo de Sinceridade, que é uma forma de Aprendizado de Máquina -método de análise de dados que automatiza a construção de elementos base. Esse modelo possui o diferencial de analisar individualmente os casos, a partir de como a pessoa expressa a verdade. Na sequência, o sistema compara o discurso com os padrões de fala.
“A nossa tentativa foi focada em desenvolver um método que se baseasse nas pistas individuais de cada um. É uma proposta que difere em relação a todas as outras”, explica o pesquisador, ao citar que os demais estudos analisam pistas coletivas.
O modelo utiliza diversos aspectos do português do Brasil, como os paraverbais (tempo das palavras e a presença de hesitações na fala) e os fatores de especificidade, como números, quantidades, nomes próprios e vocábulos adverbiais. O pesquisador afirma que essas são pistas importantes na análise de informações.
E aí, funciona?
O modelo final do software atingiu mais de 70% de exatidão, 16% a mais do que o índice médio de um ser humano comum conseguir detectar uma mentira. Apesar do resultado, o detector ainda não pode ser usado de maneira totalmente confiável. Isso só será possível, de acordo com o pesquisador, quando os índices chegarem perto de 100%. Constâncio destaca que o investimento na área ainda é pequeno e ocorre de maneira lenta.
“Ainda que o rápido desenvolvimento das tecnologias nos forneça ferramentas para atingir melhores resultados, o investimento na área ainda é pequeno”, conclui.
A pesquisa foi realizada sob a orientação das professoras Deborah Ribeiro Carvalho, Helena de Fátima Nunes Silva e Jocelaine Martins da Silveira.
Na entrevista a seguir, concedida de maneira on-line, o pesquisador explica como funciona o software para detectar mentiras e quais as inovações trazidas pelo Modelo da Sinceridade.
AGÊNCIA ESCOLA [AE]: Quais as diferenças do detector elaborado na tese com os desenvolvidos anteriormente?
ALEX SEBASTIÃO CONSTÂNCIO [ASC]: A principal diferença está na abordagem individual. No início da pesquisa, fizemos uma revisão de literatura dos últimos 10 anos e estudamos 81 diferentes artigos científicos. Ao longo do tempo, foram várias estratégias utilizadas pelos autores, mas todas elas tinham algo em comum: eram uma tentativa de solucionar o problema com base em sinais coletivos de mentira. No entanto, um livro bastante renomado na área, chamado “Telling Lies”, do Dr. Paul Ekman, assim como outros estudos dele e de sua equipe, atestam que existem muitos sinais que são individuais e não coletivos. Ou seja, são sinais próprios de um indivíduo, que não necessariamente se manifestam em grandes coletividades. A nossa tentativa foi então focada em procurar desenvolver um método que se baseasse nas pistas individuais do sujeito. É uma proposta que difere diametralmente em relação a todas as outras.
AGÊNCIA ESCOLA [AE]: Você poderia explicar melhor como funciona o detector? Ele é um tipo de software? Ocupa algum espaço físico?
ALEX SEBASTIÃO CONSTÂNCIO [ASC]: Sim, é um software, portanto não ocupa espaço físico a não ser do computador onde executa, que utiliza técnicas de Aprendizado de Máquina para identificar os caracteres particulares de um discurso sincero de uma certa pessoa. Ao aprender como essa pessoa se expressa quando diz a verdade, uma representação dessas formas de expressão é armazenada no que chamamos de “Modelo de Sinceridade”. Outros discursos são então comparados com esta representação e se diferirem significativamente, são interpretados como expressões não-sinceras. Este “Modelo de Sinceridade” é uma rede neural artificial profunda, mas não está ainda na forma de um aplicativo que possa ser instalado e operado por um usuário leigo.
AGÊNCIA ESCOLA [AE]: O quanto você acredita no funcionamento do detector de mentiras?
ALEX SEBASTIÃO CONSTÂNCIO [ASC]: Como é um modelo de Aprendizado de Máquina especialmente criado para o português do Brasil, ele precisou ser treinado e avaliado com discursos sinceros e não-sinceros de brasileiros. O problema é que não existia nenhum conjunto de dados que oferecesse esses discursos e os tivesse já classificados como verdade e mentira. Assim, tivemos que desenvolver esse conjunto de dados, que foi o primeiro do mundo para o português do Brasil. Trata-se, ainda, de um conjunto restrito, com apenas 12 pessoas e 61 discursos. Embora os resultados tenham sido promissores ao longo da pesquisa, a pequena variedade deste conjunto de dados nos faz ter cautela, e ainda não podemos afirmar que o modelo de solução possa ser aplicado fora de um cenário de pesquisa. Mas acredito que a expansão do conjunto de dados deva levar a uma elevação do grau de confiança. A nossa ideia é coletar mais dados e realizar mais experimentos ao longo deste ano.
AGÊNCIA ESCOLA [AE]: Qual a metodologia empregada para desenvolver o detector?
ALEX SEBASTIÃO CONSTÂNCIO [ASC]: A metodologia científica, o que significou fazer um apanhado do estado da ciência no tema, por meio da revisão de literatura, seguida de uma avaliação de lacunas onde a pesquisa ainda poderia ser desenvolvida. Foi nesse momento que percebemos que a proposta de Ekman (um modelo individual de detecção) ainda não havia sido experimentada. A partir disso, passamos a procurar, na literatura, por modelos de aprendizado de máquina que pudessem oferecer bons resultados nessa abordagem. Foi quando percebemos que se a sinceridade fosse entendida como um padrão de comportamento normal, a mentira seria uma anomalia. Assim, procuramos as arquiteturas de redes neurais que melhor poderiam contribuir para a resolução do problema de Detecção de Anomalias. Depois disso, foi necessário construir o conjunto de dados (já que ainda não existia) e realizar muitos experimentos para coletar quais modelos poderiam oferecer maiores níveis de desempenho.
AGÊNCIA ESCOLA [AE]: Quanto seria o custo para implementar o detector? Tem dilemas éticos que devem ser enfrentados?
ALEX SEBASTIÃO CONSTÂNCIO [ASC]: Durante a pesquisa, utilizamos diversas ferramentas gratuitas. Algumas dessas ferramentas são grátis apenas para uso acadêmico,; a produção de um produto comercial exigiria licenciamento, que teria custo financeiro. Outras ferramentas são interessantes unicamente em um contexto de pesquisa. Quando se pensa em um produto acabado, para uso por usuário final, essas ferramentas teriam de ser substituídas por outras mais adequadas. Ainda assim, insistindo em converter o protótipo em um produto final, uma das dificuldades seria a extração de tempos de palavras, que é um dos sinais utilizados para realizar a detecção. As ferramentas gratuitas não oferecem um nível alto de qualidade nesse quesito, exigindo uma boa dose de trabalho manual, que não seria aceitável em um caso de produto comercial, portanto ao menos este componente teria que ser significativamente melhorado. Com relação à ética, o mais importante seria alimentar o modelo com mais e mais casos para que a detecção fosse mais e mais confiável, afinal, não é nada interessante ter um falso positivo nesse caso (interpretar uma verdade como mentira), mas nos nossos experimentos isso ocorreu. É principalmente nesse ponto que precisamos investir, para garantir que ninguém seja acusado injustamente de mentir.
AGÊNCIA ESCOLA [AE]: Em que níveis o projeto tem relação com semântica e pragmática da língua?
ALEX SEBASTIÃO CONSTÂNCIO [ASC]: Esses são dois aspectos não diretamente abordados pela pesquisa. Utilizamos algumas pistas da modalidade verbal, como aspectos paraverbais (tempo das palavras e a presença de hesitações na fala) além de fatores de especificidade (números, quantidades, nomes próprios e vocábulos adverbiais), que são referidos na literatura do campo como pistas importantes. No entanto, diversos outros aspectos verbais não puderam ser explorados por falta de dados, entre eles o grau de linguagem formal versus coloquial (pragmática) assim como emoção e negatividade da linguagem (que estariam presentes no aspecto semântico). São aprimoramentos que ainda precisam ser feitos, mas que carecem de suporte para a nossa língua, já que quase todos os recursos existentes estão dedicados ao inglês.
AGÊNCIA ESCOLA [AE]: Qual foi a descoberta mais surpreendente que você teve durante o desenvolvimento da tese?
ALEX SEBASTIÃO CONSTÂNCIO [ASC]: Na minha opinião, a descoberta mais surpreendente é paradoxal. Se, por um lado, temos mais de 20 anos de pesquisa nessa área, por outro, ainda temos muito pouco de resultados concretos que nos deem segurança nos conhecimentos já produzidos, especialmente em se tratando de abordagens baseadas em Aprendizado de Máquina. Temos, hoje, um produto como o ChatGPT, que oferece um desempenho notável, exemplificando o que se pode fazer com o Aprendizado de Máquina, mas ainda estamos longe de poder afirmar que conseguimos detectar mentiras de forma confiável, mesmo aplicando técnicas similares. A conclusão final é que o investimento no tema é pequeno e, portanto, seu desenvolvimento ocorre mais lentamente, ainda que o estado da ciência pareça sugerir que hoje já dispomos de ferramentas para atingir melhores resultados.