Já parou para pensar na complexidade envolvida na programação de tradutores de texto, assistentes pessoais virtuais e/ou mesmo nos Chatbots? Fazer com que as máquinas consigam se comunicar coerentemente (e naturalmente) com os seres humanos é desafiador e envolve, entre diversas técnicas, a PLN.
Processamento de Linguagem Natural (PLN) é uma subárea da IA, que de forma simplista pode ser conceituada como um “tradutor” ou ferramenta usada para ajudar a máquina a entender e processar a linguagem natural humana. Ela busca “soluções” para problemas que requerem o tratamento computacional de uma língua natural. Entre outras técnicas, a PLN envolve o reconhecimento de entidades nomeadas (uma espécie de identificação de nomes próprios, locais e outras informações relevantes do texto), análise de sentimentos e a geração em si da linguagem natural.
No entanto, embora já bastante desenvolvido e amplamente utilizado (com inúmeras aplicações), o Processamento de Linguagem Natural ainda enfrenta desafios e obstáculos complexos e segue sendo aperfeiçoado. Isso se deve principalmente ao fato de a linguagem humana seguir em constante transformação. O Oxford English Dictionary, por exemplo, incluiu 700 novas palavras em sua atualização de 2021. Só a Língua Portuguesa conta com aproximadamente 370.000 palavras!
Além desse cenário complexo e mutável, outro desafio gigantesco é o contexto. “Pense que dentro de um contexto de linguagem específico, levando-se em conta nuances como entonação da fala, escolha de vocábulos e intervalos de pausa, o cérebro humano é capaz de processar o sentido e significado de um texto em milésimos de segundos. A máquina, por outro lado, ainda que com modelos avançados de PLN, tem dificuldade em reconhecer todos esses pontos”, lembra Simone Faquineli, Especialista em Inteligência Artificial da Matrix do Brasil.
Palavras com duplo sentido (também chamado de polissemia; são inúmeras em nosso vocabulário) dificultam a vida das máquinas, porque o sentido dependerá justamente do contexto. Outro ponto de complicação são as gírias e expressões – altamente empregadas no dia a dia, quando usadas por usuários na interação com tecnologias, podem gerar confusão e erros. O termo “velho” ou “véio” é sinônimo de “cara” em muitas situações; lembrando que “cara” nesse sentido, significa “amigo”, e embora um substantivo masculino, pode ser empregado para mulheres. “Velho”, portanto, em determinado contexto, nem de longe representaria uma pessoa de idade avançada. Sentiu o drama?!
Mais um desafio da PLN são os erros gramaticais. A máquina segue programada com base na língua culta, seguindo de forma certeira a ortografia e gramática. Os usuários, por outro lado, são passíveis de erros e/ou abreviações. “Na configuração de nossos Chatbots levamos em conta erros de digitação, concordância e/ou gramática mais comuns, o que ajuda fortemente na compreensão da máquina. Além disso, o que conhecemos por ‘aprendizado de máquina’ ajuda a tecnologia a se capacitar a cada nova interação, deixando-a mais esperta”, completa Simone.
Justamente esse aprendizado de máquina que possibilitou (e possibilita) uma evolução tão grande assim das tecnologias de Inteligência Artificial. Seria praticamente impossível fomentar a máquina com todas as inúmeras possibilidades e variações linguísticas e semânticas existentes. A operação e as interações da tecnologia garantem uma absorção muita mais generalista e fiel da realidade da língua, incluindo, por exemplo, regionalismos.
Ainda assim, desafios semânticos, como as ironias e o sarcasmo humano ainda representam obstáculos – mesmo para IA altamente treinadas. Conversas com Assistentes de Voz e Chatbots de atendimento ao cliente, por exemplo, podem nem sempre captar reclamações, tais como “Que beleza de atendimento!”. “Nestes casos, o que fazemos para mitigar tais confusões é, através da análise de sentimentos e de um sistema de pontuação, programar a máquina para ler o contexto anterior e posterior, observar pontuação e identificar emojis para captar o real sentido da conversa”, pontua Simone.
Quais então as perspectivas e previsões que podemos fazer para a evolução do Processamento da Linguagem Natural como subcampo da Inteligência Artificial?
É fato que as técnicas de PLN estão cada dia mais avançadas e seus modelos mais inteligentes. Assistentes virtuais, tradutores, chatbots e outras tecnologias seguem também cada vez mais treinados, surpreendendo-nos. No entanto, é fato também notar que a complexidade linguística só aumenta. Novas técnicas, subáreas e tecnologias prometem surgir com o tempo para dar conta de tamanha complexidade e do desejo latente da humanidade em se comunicar com as máquinas. Simone finaliza, “(…) estamos preparados e munidos com experiência e tecnologia para acompanhar essa evolução e o que está por vir”.
Simone Faquineli,
Profissional com ampla experiência em desenvolvimento de sistemas web e mobile, especializada em Inteligência Artificial e Machine Learning. Com mais de 15 anos de atuação em diversas áreas, ela atualmente ocupa o cargo de Chief Artificial Intelligence Officer na Matrix Brasil.