Por que é tão difícil implantar chatbots

Volume de dados é barreira em projetos de chatbots / langfordw
Compartilhe

Volume de dados é barreira em projetos de chatbots / langfordw
Volume de dados é barreira em projetos de chatbots / langfordw

Depois de uma onda inicial em que se afirmava que a inteligência artificial (IA) resolveria tudo, aprenderia com facilidade, substituiria ou otimizaria uma série de tarefas num período curto de tempo, a realidade de centenas de implementações ao redor do mundo se mostrou muito mais árida que a expectativa inicial, com provedores e clientes passando pelas dificuldades inerentes ao pioneirismo, à medida que os sistemas escalavam em volume e custos.

Neste artigo, quero me focar nos sistemas conversacionais, uma pequena parte do universo da inteligência artificial, mas que tem grande visibilidade em razão do nosso deslumbramento por robôs, físicos ou lógicos, que imitam a maneira como nos comportamos.

Nos projetos em que trabalhei inicialmente, a barreira encontrada nas implementações foi o volume de dados presentes.

De maneira geral, redes neurais reconhecem padrões, sejam sons, imagens ou palavras.

No entanto, a linguagem humana não se forma apenas por padrões, mas por conexões.

Ela não é eminentemente lógica (2+2=4), porém semântica, que leva em conta o significado da palavra.

Nuances e contexto

Alex Winetzki, da Stefanini / Divulgação

Quando o cantor Michel Teló canta “Nossa, nossa, assim você me mata”, ele não está preocupado com uma ameaça iminente á sua vida.

Nesse trecho da música, conseguimos perceber que a linguagem humana é cheia de nuances, e o contexto do que falamos importa tanto quanto o formato, algo inerente à sensibilidade humana, e que não tem paralelo no universo computacional, construído sobre linguagem binária (sim ou não; ligado ou desligado).

Outra barreira é o que chamamos de ambiguação, que se refere aos múltiplos sentidos ou significados de uma expressão.

Tomaremos como exemplos as palavras nacional e internacional. Numa visão binária, as palavras não apenas são similares foneticamente e na escrita, mas uma contém a outra.

Isso apresenta grande desafio para uma rede neural, que se baseia em similaridade.

Diferenciar o sentido de ambas exige grande treinamento, isto é, retroalimentação contínua de uma rede até que ela consiga entender essa diferença.

Redes semânticas

Acrescente milhares de palavras e processos a esse mix, e então conseguimos entender porque é tão difícil treinar chatbots e unidades de resposta audível (URAs) inteligentes baseadas em redes neurais.

Existem outras maneiras de resolver o problema, no entanto. Quando o enfrentamos, optamos por um caminho completamente novo, e que tem rendido resultados reconhecidos internacionalmente.

Ao invés das tradicionais redes neurais, decidimos pelo uso de redes semânticas. Mas o que são elas?

Diferentemente das redes neurais, as redes semânticas não buscam padrões genéricos, mas associações entre palavras, de maneira muito similar ao cérebro humano.

O desafio é alimentar essas associações, mas esse caminho foi encurtado quando nos unimos ao projeto Concept.net do MIT, que já mapeou três milhões de termos e as conexões entre eles.

Apenas como referência, um adulto com ótimo domínio do seu idioma nativo conhece de 35 mil a 50 mil palavras, e raramente usa mais de 10 mil ao longo de um ano.

Isso faz com que o cérebro que criamos seja capaz não apenas de entender similaridades (sinônimos), mas de estabelecer combinações muito mais complexas como entidades que dão origem ou são parte uma da outra.

Essas combinações permitem que o treinamento de nossa rede seja incomparavelmente mais rápido, pois ele se aproveita de inter-relações já existentes e cria outras num processo sináptico, mostrando graficamente como nosso cérebro está pensando em tempo real.

Aprendizado de máquina

Outras soluções, como o machine learning, tornam os processos mais fluidos e efetivos, permitindo um processamento mais rico de dados gerais e específicos, melhorando a experiência de cada usuário e as métricas de qualidade de resposta.

No final, a decisão sobre o provedor e a tecnologia adequada à realidade de seu negócio terá impacto fundamental no sucesso de sua implantação de sistemas cognitivos, daí nosso orgulho dos mais de 200 profissionais ao redor do mundo dedicados ao crescimento e melhoria da plataforma Sophie.

  • Alex Winetzki é diretor de P&D da Stefanini


Compartilhe
Publicação Anterior

Aos 30 anos, web enfrenta desafio do combate à desinformação

Próxima Publicação

Sonda inaugura centro de inovação em Joinville

Veja também

O programa Start Eldorado vai ao ar às quartas-feiras, às 22h, Eldorado FM / Renato Cruz/inova.jor

Ouça o jornalista Renato Cruz na Rádio Eldorado

Compartilhe

CompartilheO jornalista Renato Cruz, editor do inova.jor, estreia nesta quarta-feira (14/3), às 22h, como comentarista no programa Start Eldorado, na Rádio Eldorado FM (107,3), em São Paulo. Os entrevistados do programa são Eduarda Leoni e […]


Compartilhe