Stefanini: Por que é tão difícil implantar chatbots

Volume de dados é barreira em projetos de chatbots / langfordw

Depois de uma onda inicial em que se afirmava que a inteligência artificial (IA) resolveria tudo, aprenderia com facilidade, substituiria ou otimizaria uma série de tarefas num período curto de tempo, a realidade de centenas de implementações ao redor do mundo se mostrou muito mais árida que a expectativa inicial, com provedores e clientes passando pelas dificuldades inerentes ao pioneirismo, à medida que os sistemas escalavam em volume e custos.

Neste artigo, quero me focar nos sistemas conversacionais, uma pequena parte do universo da inteligência artificial, mas que tem grande visibilidade em razão do nosso deslumbramento por robôs, físicos ou lógicos, que imitam a maneira como nos comportamos.

Nos projetos em que trabalhei inicialmente, a barreira encontrada nas implementações foi o volume de dados presentes.

De maneira geral, redes neurais reconhecem padrões, sejam sons, imagens ou palavras.

No entanto, a linguagem humana não se forma apenas por padrões, mas por conexões.

Ela não é eminentemente lógica (2+2=4), porém semântica, que leva em conta o significado da palavra.

Nuances e contexto

Alex Winetzki, da Stefanini / Divulgação

Quando o cantor Michel Teló canta “Nossa, nossa, assim você me mata”, ele não está preocupado com uma ameaça iminente á sua vida.

Nesse trecho da música, conseguimos perceber que a linguagem humana é cheia de nuances, e o contexto do que falamos importa tanto quanto o formato, algo inerente à sensibilidade humana, e que não tem paralelo no universo computacional, construído sobre linguagem binária (sim ou não; ligado ou desligado).

Outra barreira é o que chamamos de ambiguação, que se refere aos múltiplos sentidos ou significados de uma expressão.

Tomaremos como exemplos as palavras nacional e internacional. Numa visão binária, as palavras não apenas são similares foneticamente e na escrita, mas uma contém a outra.

Isso apresenta grande desafio para uma rede neural, que se baseia em similaridade.

Diferenciar o sentido de ambas exige grande treinamento, isto é, retroalimentação contínua de uma rede até que ela consiga entender essa diferença.

Redes semânticas

Acrescente milhares de palavras e processos a esse mix, e então conseguimos entender porque é tão difícil treinar chatbots e unidades de resposta audível (URAs) inteligentes baseadas em redes neurais.

Existem outras maneiras de resolver o problema, no entanto. Quando o enfrentamos, optamos por um caminho completamente novo, e que tem rendido resultados reconhecidos internacionalmente.

Ao invés das tradicionais redes neurais, decidimos pelo uso de redes semânticas. Mas o que são elas?

Diferentemente das redes neurais, as redes semânticas não buscam padrões genéricos, mas associações entre palavras, de maneira muito similar ao cérebro humano.

O desafio é alimentar essas associações, mas esse caminho foi encurtado quando nos unimos ao projeto Concept.net do MIT, que já mapeou três milhões de termos e as conexões entre eles.

Apenas como referência, um adulto com ótimo domínio do seu idioma nativo conhece de 35 mil a 50 mil palavras, e raramente usa mais de 10 mil ao longo de um ano.

Isso faz com que o cérebro que criamos seja capaz não apenas de entender similaridades (sinônimos), mas de estabelecer combinações muito mais complexas como entidades que dão origem ou são parte uma da outra.

Essas combinações permitem que o treinamento de nossa rede seja incomparavelmente mais rápido, pois ele se aproveita de inter-relações já existentes e cria outras num processo sináptico, mostrando graficamente como nosso cérebro está pensando em tempo real.

Aprendizado de máquina

Outras soluções, como o machine learning, tornam os processos mais fluidos e efetivos, permitindo um processamento mais rico de dados gerais e específicos, melhorando a experiência de cada usuário e as métricas de qualidade de resposta.

No final, a decisão sobre o provedor e a tecnologia adequada à realidade de seu negócio terá impacto fundamental no sucesso de sua implantação de sistemas cognitivos, daí nosso orgulho dos mais de 200 profissionais ao redor do mundo dedicados ao crescimento e melhoria da plataforma Sophie.

Alex Winetzki é diretor de P&D da Stefanini

Compartilhe

Cookie	Duração	Descrição
__cfduid	1 month	The cookie is used by cdn services like CloudFare to identify individual clients behind a shared IP address and apply security settings on a per-client basis. It does not correspond to any user ID in the web application and does not store any personally identifiable information.
cookielawinfo-checbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-advertisement	1 year	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Advertisement".
cookielawinfo-checkbox-advertisement	1 year	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Advertisement".
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-necessary	11 months	Este cookie é definido pelo plugin GDPR Cookie Consent. É usado para armazenar a autorização para os cookies na categoria "Necessária".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
gdpr_status	6 months 2 days	This cookie is set by the provider Media.net. This cookie is used to check the status whether the user has accepted the cookie consent box. It also helps in not showing the cookie consent box upon re-entry to the website.
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.
viewed_cookie_policy	11 meses	O cookie é definido pelo plugin GDPR Cookie Consent e é usado para registrar se o usuário consentiu ou não o uso de cookies. Não armazena nenhum dado pessoal.

Cookie	Duração	Descrição
language		Este cookie é usado para armazenar a preferência de idioma do usuário.
sp_landing	1 day	Este cookie é definido pelo Spotify. Este cookie é usado para implementar conteúdo de áudio do Spotify no site. Ele também ajuda a coletar informação na interação do usuário com esse conteúdo de áudio.
sp_t	1 year	This cookie is set by the provider Spotify. This cookie is used to implement audio content from spotify on the website. It also helps in collecting information on user interaction with this audio content.

Cookie	Duração	Descrição
__gads	1 year 24 days	Este cookie é definido pelo Google e armazenado sob o nome dounleclick.com. Este cookie é usado para rastrear quantas vezes os usuários veem um anúncio particular, o que ajuda a medir o sucesso da campanha e a calcular a receita gerada pela campanha. Este cookie só pode ser lido a partir do domínio em que é definido, e portanto não vai rastrear qualquer dado enquanto o usuário navega em outros sites.
_ga	2 years	This cookie is installed by Google Analytics. The cookie is used to calculate visitor, session, campaign data and keep track of site usage for the site's analytics report. The cookies store information anonymously and assign a randomly generated number to identify unique visitors.
_ga	2 years	This cookie is installed by Google Analytics. The cookie is used to calculate visitor, session, campaign data and keep track of site usage for the site's analytics report. The cookies store information anonymously and assign a randomly generated number to identify unique visitors.
_gat_gtag_UA_38100168_1	1 minute	This cookie is set by Google and is used to distinguish users.
_gid	1 day	This cookie is installed by Google Analytics. The cookie is used to store information of how visitors use a website and helps in creating an analytics report of how the website is doing. The data collected including the number visitors, the source where they have come from, and the pages visted in an anonymous form.
_gid	1 day	This cookie is installed by Google Analytics. The cookie is used to store information of how visitors use a website and helps in creating an analytics report of how the wbsite is doing. The data collected including the number visitors, the source where they have come from, and the pages viisted in an anonymous form.
CONSENT	16 years 5 months 5 days 7 hours 2 minutes	These cookies are set via embedded youtube-videos. They register anonymous statistical data on for example how many times the video is displayed and what settings are used for playback.No sensitive data is collected unless you log in to your google account, in that case your choices are linked with your account, for example if you click “like” on a video.
vuid	2 years	O domínio deste cookie pertence ao Vimeo. Este cookie é usado pelo Vimeo para coletar informações de rastreamento. Ele define uma identidade única para incorporar vídeos ao site.

Cookie	Duração	Descrição
IDE	1 year 24 days	Used by Google DoubleClick and stores information about how the user uses the website and any other advertisement before visiting the website. This is used to present users with ads that are relevant to them according to the user profile.
IDE	1 year 24 days	Used by Google DoubleClick and stores information about how the user uses the website and any other advertisement before visiting the website. This is used to present users with ads that are relevant to them according to the user profile.
test_cookie	15 minutes	This cookie is set by doubleclick.net. The purpose of the cookie is to determine if the user's browser supports cookies.
test_cookie	15 minutes	This cookie is set by doubleclick.net. The purpose of the cookie is to determine if the user's browser supports cookies.
VISITOR_INFO1_LIVE	5 months 27 days	This cookie is set by Youtube. Used to track the information of the embedded YouTube videos on a website.
VISITOR_INFO1_LIVE	5 months 27 days	This cookie is set by Youtube. Used to track the information of the embedded YouTube videos on a website.
YSC	session	This cookies is set by Youtube and is used to track the views of embedded videos.

Cookie	Duração	Descrição
_gat_gtag_UA_66269201_1	1 minute	No description
CONSENT	16 years 9 months 11 days 1 hour 17 minutes	No description
guest	never	No description available.
UID	2 years	No description
UIDR	2 years	This cookie is set by scorecardresearch.com. The cookie is used to tracks the users activity across the internet on the browser such as visit timestamp, IP address, and most recently visited webpages and may the data send to 3rd party for analysis and reporting to help their clients better understand user preferences.
yt-remote-connected-devices	never	No description available.
yt-remote-device-id	never	No description available.

Quais são os melhores filmes de 2025

Diálogo Entre Solos: Agricultura e Florestas

Mesa-redonda sobre celular nas escolas

Destaques

Quais são os melhores filmes de 2025

Diálogo Entre Solos: Agricultura e Florestas

Mesa-redonda sobre celular nas escolas

Conversa sobre telecomunicações com Elinor Cotait e Katia Pedroso

Por que é tão difícil implantar chatbots

Nuances e contexto

Redes semânticas

Aprendizado de máquina

2 respostas a “Por que é tão difícil implantar chatbots”

Destaques

Quais são os melhores filmes de 2025

Diálogo Entre Solos: Agricultura e Florestas

Mesa-redonda sobre celular nas escolas

Conversa sobre telecomunicações com Elinor Cotait e Katia Pedroso