NOVIDADES

ATENTOS: OS ALGORITMOS ESTÃO ESPIONANDO O NOSSO HUMOR

Todo mundo quer saber quem são esses novos “donos” de nossas mentes, os algoritmos. A revista italiana “Internazionale” postou no portal dela na internet, um artigo interessante sobre o tema. “Golguei”para nós!

TECNOLOGIA
Os algoritmos que espionam nosso humor
Dana Mackenzie, Knowable, Estados Unidos
15 de outubro de 2020

Muitas pessoas estão convencidas de que 2020 é o pior ano de todos os tempos. Superficialmente, pode parecer uma definição irremediavelmente subjetiva, mas pelo menos de acordo com um instrumento está correta.

O instrumento em questão é o edonômetro, um sistema informatizado para avaliar nossa felicidade e nosso desespero. O edonômetro funciona dia e noite nos computadores da Universidade de Vermont (UVM), onde analisa cerca de cinquenta milhões de tweets por dia para fazer uma leitura rápida da opinião pública. De acordo com o edônometro, 2020 é de longe o pior ano desde 2008, ou desde que os dados foram coletados (no início de março foi alcançado um recorde negativo, coincidindo com a eclosão da pandemia covid-19. recorde foi destruído em maio após o assassinato de George Floyd).

O edonômetro é uma ferramenta relativamente recente em um campo no qual os cientistas da computação vêm tentando avaliar o estado emocional do mundo usando computadores há cinquenta anos. Para construí-lo, o cientista da computação da UVM Chris Danforth teve que ensinar uma máquina a entender as emoções por trás dos tweets analisados ​​(nenhum ser humano poderia ler todos eles). Esse processo, chamado de análise de sentimento, teve um grande progresso nos últimos anos, encontrando várias aplicações.

Felicidade incomensurável
Além de detectar a temperatura emocional dos usuários do Twitter, os pesquisadores estudam a análise de sentimento para avaliar a tendência da opinião pública sobre as mudanças climáticas e para testar algumas ideias profundamente enraizadas, como a de que um pequeno acordo é mais triste. de um acorde maior (e em que medida). As empresas interessadas no humor do consumidor estão usando a análise de sentimento para avaliar as avaliações em plataformas como o Yelp. Outros também estão medindo o estado emocional de seus funcionários, coletando dados em redes sociais internas. Essa técnica pode ter aplicações na área médica, por exemplo, identificando pessoas que sofrem de depressão e precisam de ajuda.

De acordo com Danforth, a análise de sentimentos permite que os pesquisadores examinem uma enorme massa de dados que no passado eram difíceis de coletar e impossíveis de estudar. “Nas ciências sociais, tendemos a medir elementos simples, como o produto interno bruto. A felicidade é um elemento importante mas muito difícil de medir ”.

O computador conta o número de palavras positivas e subtrai o número de palavras negativas. Mas tem problemas

Alguns podem pensar que o primeiro passo na análise dos sentimentos é ensinar o computador a entender o que os humanos escrevem. Mas os cientistas da computação são incapazes de fazer isso. Compreender a linguagem é um dos problemas mais complexos no campo da inteligência artificial. No entanto, dentro de um texto escrito, existem sinais emocionais abundantes que os computadores podem reconhecer, mesmo sem compreender o significado das palavras.

A primeira abordagem para a análise de sentimentos é baseada na contagem de palavras. Esta é uma ideia bastante simples: o computador conta o número de palavras positivas e subtrai o número de palavras negativas. Uma medida melhor pode ser obtida pesando as palavras: o termo “excelente”, por exemplo, transmite um sentimento mais intenso do que “bom”. O peso das palavras geralmente é estabelecido por experts na carne, e desempenha um papel na criação de dicionários de léxico, aqueles que traduzem palavras em emoticons (e vice-versa) e são amplamente utilizados na análise de sentimentos.

Mas a contagem de palavras tem alguns problemas. Por exemplo, ele ignora a ordem das palavras, tratando uma frase como uma espécie de sopa de termos diferentes desconectados uns dos outros. Considere esta análise: “Estou feliz que meu iPhone não tem nada do meu velho telefone Android horrível”. A frase contém três palavras negativas (nada, velho, horrível) e apenas uma positiva (feliz). O olho humano rapidamente reconhece que, neste caso antigo e feio, eles estão se referindo a um telefone diferente, mas para o computador parece um julgamento negativo. A comparação apresenta outras dificuldades: o que significa “não ter nada”? Isso significa que o revisor não está comparando o iPhone ao telefone Android? A linguagem humana pode ser muito confusa às vezes.

Para resolver esses problemas, os cientistas da computação criaram abordagens cada vez mais sofisticadas, a fim de excluir o fator humano da análise. Hoje eles usam algoritmos de aprendizagem para ensinar um programa a reconhecer as relações entre as palavras. Por exemplo, o computador pode aprender que as palavras lidas e rio freqüentemente ocorrem em relação uma à outra. Essas associações podem oferecer pistas sobre o significado ou sentimento subjacente de uma frase. Se for lido na mesma frase à noite, provavelmente terá um significado diferente.

Ferver o oceano
Um grande avanço nessa área veio em 2013, quando Tomas Mikolov, do Google Brain, usou o aprendizado de máquina para converter cada palavra em uma série de números de 50 a 300, chamados de vetor. Os vetores são como impressões digitais que descrevem uma determinada palavra e também as outras palavras que tendem a aparecer junto com ela.

Para obter esses vetores, o programa de Mikolov analisou milhões de palavras contidas em artigos de jornal, tentando prever a próxima palavra com base na que a precedeu. As articulações de Mikolov reconhecem sinônimos: palavras como dinheiro e dinheiro têm vetores semelhantes. Mais sutilmente, as articulações captam analogias elementares – o rei é para a rainha o que o menino é para a menina, por exemplo – mesmo que não consigam definir as palavras. É um resultado notável, visto que essas semelhanças fizeram parte da avaliação dos vestibulares.

Os encaixes de Mikolov são gerados por uma rede neural com uma única camada oculta. As redes neurais, grosseiramente modeladas no cérebro humano, possibilitaram grandes avanços no aprendizado de máquina, como evidenciado pelo caso do AlphaGo (um software que aprendeu a jogar Go melhor que o campeão mundial). A rede de Mikolov era deliberadamente superficial, de modo a se prestar a várias aplicações, como tradução e análise de argumento.

Redes neurais mais profundas, com mais camadas de “córtex”, podem extrair mais informações de uma palavra no contexto de uma frase ou documento específico. Uma tarefa muito comum é fazer com que o computador analise uma crítica de um filme no banco de dados de filmes da Internet e peça a ele para prever se, no final, o revisor colocará seus polegares “para baixo” ou “para cima”. Os primeiros métodos baseados em léxico obtiveram resultados precisos em cerca de 74 por cento dos casos. Os mais sofisticados chegam a 87%. As primeiras redes neurais, criadas em 2011, alcançaram 89 por cento. Hoje ultrapassam os 94 por cento e estão próximos dos resultados do ser humano (o humor e o sarcasmo continuam a ser obstáculos difíceis de superar, pois a palavra escrita pode indicar um sentimento diametralmente oposto ao expresso pelo autor).

A análise de sentimentos tem suas raízes na psicologia

Apesar das vantagens das redes neurais, o método baseado em léxico ainda é bastante popular. O edonômetro, por exemplo, usa um léxico e a Danforth não tem intenção de mudar sua abordagem. Embora as redes neurais possam ser mais precisas, elas têm um custo. O período de treinamento representa um dos processos computacionais mais complexos para um computador.
“Você está essencialmente ligado à eletricidade que possui”, explica Robert Stine, da escola Wharton. Stine abordou a evolução da análise de sentimento na revisão anual de estatísticas de 2019 e sua aplicação. “Quanta eletricidade o Google usou para formar o AlphaGo? Alguns dizem que foi o suficiente para ferver o oceano ”, diz Stine.

Além da eletricidade, as redes neurais precisam de equipamentos muito caros e de muitas habilidades técnicas. Além disso, devemos ter em mente a falta de transparência, pois o computador tende a encontrar uma maneira de completar a tarefa atribuída ao invés de seguir as instruções explícitas do programador. “Com os léxicos, os erros são muito mais fáceis de remediar”, confirma Bing Liu, da Universidade de Illinois em Chicago, um dos pioneiros da análise de sentimento.

Medindo saúde mental
Apesar de cair no campo da tecnologia da informação, a análise de sentimentos tem suas raízes na psicologia. Em 1962, o psicólogo de Harvard Philip Stone desenvolveu o General inquirer, o primeiro programa computadorizado de análise de texto no campo da psicologia. Nos anos 90, o psicólogo social James Pennebaker criou um programa de ponta para a análise de sentimentos (a investigação lingüística e a contagem de palavras) na tentativa de analisar o universo psicológico do ser humano. Essas avaliações iniciais revelaram e confirmaram tendências que os especialistas observavam há muito tempo: os pacientes com depressão tinham um estilo de escrita distinto, com maior presença do pronome “eu”. Eles também usaram palavras mais negativas, geralmente referindo-se à morte.

Hoje, pesquisadores estão analisando a expressão do estado mental na escrita e na fala por meio da análise de intervenções em redes sociais. Danforth e o psicólogo de Harvard Andrew Reece, por exemplo, revisaram tweets de pessoas que foram subsequentemente diagnosticadas com transtorno depressivo ou síndrome de estresse pós-traumático (com o consentimento dos participantes). Sinais de depressão apareceram em tweets escritos até nove meses antes do diagnóstico. O Facebook atualmente usa um algoritmo capaz de identificar usuários que parecem estar em risco de suicídio. Uma equipe examina os casos relatados e decide se convida os usuários a entrar em contato com a assistência especializada.

Após cinco anos de aumento das temperaturas, os usuários do Facebook não estão mais preocupados com uma onda de calor

Mas ainda estamos muito longe do momento em que os dados coletados nas redes sociais serão utilizados na área da saúde. As questões de privacidade são um obstáculo óbvio. Além disso, muito trabalho ainda terá de ser feito para demonstrar a utilidade dessas análises. Vários estudos sobre a avaliação do estado mental não definem adequadamente seus termos ou não fornecem informações suficientes para replicar as descobertas, explica Stevie Chancellor, especialista da Universidade Northwestern de Relações entre Computador e Homem e coautor. de uma análise recente de 75 desses estudos. Em qualquer caso, o Chancellor está convencido de que a análise de sentimentos pode ser útil no campo clínico, por exemplo, na triagem de novos pacientes. Mesmo sem dados pessoais, a análise de sentimento pode identificar tendências como os níveis gerais de estresse de estudantes universitários durante uma pandemia ou os tipos de interação nas redes sociais que podem levar as pessoas com transtornos alimentares à recaída.

Leia os sentimentos
A análise de sentimentos também trata de questões mais leves, como os efeitos do clima sobre o humor. Em 2016, Nick Obradovich, agora funcionário do Instituto de Desenvolvimento Humano de Berlim, analisou dois bilhões de postagens no Facebook e um bilhão de tuítes, descobrindo que três centímetros de chuva causaram uma redução de 1 por cento na felicidade expressa pelos usuários. , percentual que dobrou no caso de temperaturas abaixo de zero. Em um estudo posterior (e mais desmoralizante), Obradovich e seus colegas analisaram tweets para entender o sentimento do usuário sobre a mudança climática, descobrindo que após cinco anos de aumento das temperaturas, o senso de “normalidade” dos usuários mudou e não mudou eles se preocuparam mais com uma onda de calor. A sensação de bem-estar, porém, ainda foi alterada pelo fenômeno. “É como a anedota da rã sendo fervida”, enfatiza Obradovich. “Foi uma das descobertas empíricas mais alarmantes que já fiz.”

Os cientistas da computação também testaram a reputação de segunda-feira como o dia mais triste da semana. De acordo com uma análise inicial dos tweets através do edonómetro Danforth, embora a palavra segunda-feira tenha suscitado as reacções mais negativas entre as que indicam os dias da semana, na realidade as pessoas expressavam emoções mais tristes às terças-feiras. Sexta-feira e sábado, é claro, foram os dias mais felizes. No entanto, essa tendência semanal mudou desde as eleições presidenciais de 2016. Provavelmente ainda há um impacto dos dias da semana, “mas é coberto em eventos que chamam a nossa atenção e são discutidos mais do que os aspectos básicos da vida.” Tradução: A política nunca pára no Twitter. “Qualquer dia da semana pode ser o mais triste”, ressalta Danforth.

Outra “verdade” posta à prova é que, no campo da música, os acordes maiores são mais alegres do que os menores. Yong-Yeol Ahn, especialista em ciências sociais computacionais da Universidade de Indiana, verificou essa crença analisando o sentimento das letras que acompanhavam cada acorde de 123.000 canções. Os acordes maiores, na verdade, foram associados a palavras mais felizes, pontuando 6,3 contra 6,2 para acordes menores (em uma escala de 1 a 9). Essa diferença pode parecer mínima, mas na realidade corresponde à metade da diferença de humor entre o Natal e um dia normal de trabalho no edônomo. Ann também comparou diferentes gêneros musicais e descobriu que o rock dos anos 60 é o mais alegre, enquanto o mais triste é o heavy metal.

Senso de negócios
O mundo empresarial está cada vez mais interessado nesta ferramenta. A análise de sentimento agora é amplamente usada pelas empresas, mas muitas não falam sobre isso, por isso é difícil avaliar sua popularidade. “Todo mundo faz isso: Microsoft, Google, Amazon, todos. Alguns têm grupos de pesquisa diferentes ”, explica Liu. Uma medida acessível desse interesse é o grande número de programas comerciais e acadêmicos disponíveis. Um estudo de 2018 listou 28.

Algumas empresas usam a análise de sentimento para avaliar as mensagens postadas por clientes nas redes sociais. Um exemplo (possivelmente apócrifo) é o da Expedia Canadá, que em 2013 lançou uma campanha de marketing que se tornou viral pelo motivo errado: as pessoas odiavam o som estridente do violino ao fundo. A Expedia rapidamente substituiu o anúncio por novos vídeos que zombavam do anterior, por exemplo, convidando um usuário do Twitter enfurecido a destruir o violino. Muitos argumentam que a Expedia descobriu críticas nas redes sociais graças à análise de sentimentos. Por mais difícil que seja confirmar, é claro que esse é exatamente o tipo de sentimento que pode ser detectado.

Outras empresas usam a análise de sentimento para avaliar a satisfação dos funcionários, por exemplo, monitorando as redes sociais internas. A IBM, por exemplo, desenvolveu um programa chamado Social Pulse que monitora a intranet da empresa para identificar queixas de funcionários. Por motivos de privacidade, o software analisa apenas as intervenções compartilhadas com a empresa. No entanto, essa tendência preocupa Danforth. “Acho que a privacidade dos funcionários vai contra os objetivos da empresa. É uma manobra antiética ”.

Com a crescente difusão da análise de sentimentos, é provável que a ética continue a representar um problema. Empresas, profissionais de saúde mental e outros setores que devem avaliar seu uso não devem esquecer que a análise de sentimentos, por mais promissora que seja, não é uma ciência exata. O aspecto matemático é relativamente simples. Compreender os seres humanos é muito menos. “No momento, nem entendemos o que é compreensão”, admite Liu.

(Tradução para o italiano de Andrea Sparacino)

Este artigo saiu em Knowable.

Texto em italiano:

https://www.internazionale.it/notizie/dana-mackenzie/2020/10/15/algoritmi-umore-social