E o hype do Hype Cycle?

Cezar Taurion
6 min readOct 10, 2024

--

Uma das mais conhecidas representações gráficas dos estágios do ciclo de vida de uma tecnologia é o Hype Cycle, criado pelo Gartner, nos anos 90. É hoje quase uma instituição usada pelos executivos de TI nas suas discussões e apresentações para o público.

Entretanto, o ciclo não tem embasamento científico e não há dados ou análises concretos que justifiquem a inserção de determinada tecnologia em uma fase desse ciclo. É mais uma constatação, com fases definidas em termos subjetivos, como desilusão e expectativas, que não podem ser descritos de forma objetiva onde determinada tecnologia realmente está em um determinado momento. Na verdade, a curva é desenhada explorando duas outras curvas conhecidas: uma curva em sino, a primeira parte, que é emocional, onde a tecnologia é superestimada (um entusiasmo excessivo) e depois, despenca, quando a realidade se faz presente e acontece um desapontamento também exacerbado. E a segunda parte, uma curva em “s”, que mais ou menos descreve a adoção real de uma tecnologia no tempo, que geralmente acontece de forma gradual. Além disso, os termos são enganosos no sentido de que podem levar a uma ideia errada de quando usar uma tecnologia: o usuário deveria ficar longe da tecnologia no Vale da Desilusão? Ou deverá seguir o “efeito manada” e adotar a tecnologia quando há otimismo exagerado? Ou aguardar a maturidade dela, e adotá-la quando o mercado já a utiliza de forma ampla? É, claro, uma decisão afeita unicamente à cada empresa, e essa decisão não pode e nem deve ser tomada apenas com base em um gráfico simples assim. Além disso, nenhuma perspectiva de ação é oferecida para fazer com que a tecnologia avance para a próxima fase.

Uma análise dos ciclos de hype do Gartner desde 2000 mostra que poucas tecnologias realmente viajam pelas fases propostas e que, na prática, a maioria das tecnologias importantes adotadas desde 2000 não foram identificadas no início de seus ciclos de adoção. Por exemplo, a tecnologia mais badalada em 1995 eram os Agentes Inteligentes. Dois anos depois, o Office 97 apresentou o Clippy, um assistente entusiasmado, mas incompetente, que foi tão mal-recebido que efetivamente matou a ideia por uma geração. Hoje, trinta anos depois, estamos mais uma vez a tentar construir assistentes inteligentes, e agora os chamamos de Chatbots, e a tecnologia central, raciocínio contextual num domínio amplo, ainda é um problema difícil de resolver. Mas, também é um fato que muitas das tecnologias em uso hoje, foram exageradas quando surgiram, mas acabaram encontrando seu caminho para o uso generalizado.

Bem, e que isso tem a ver com a IA, principalmente com as técnicas de IA generativa? Também sem base científica, mas, apenas olhando os gráficos de hype cycle como auxílio visual e minha própria percepção sobre o mercado, observo que ainda estamos na fase do otimismo exagerado. Basta ver o número de eventos e cursos sobre o assunto, quase todos apontando potencial futuro, com pouquíssimos casos reais de uso. IA se tornou o termo da moda e como ainda existe pouco conhecimento do que é e o que não é IA, muita coisa que não tem nada a ver com IA é rotulado de IA. Aliás, volta e meia me deparo com frases do tipo “IA vai resolver isso”. Como se IA fosse a varinha mágica de Harry Potter. A IA (leia-se IA generativa) está, para a maioria das empresas, na fase das expectativas exageradas.

Mas, essa fase emocional de otimismo exagerado, será desmanchada quando a realidade aparecer. Usar um sistema LLM como os oferecidos pelas grandes empresas de tecnologia, através de acessos via APIs, é relativamente fácil, mas colocar os sistemas que usam IA (qualquer modelo, generativa ou não) de forma mais sofisticada, em produção não o é.

Além dos desafios naturais de treinamento dos algoritmos, como dispor de base de dados adequada em volume e variedade suficientes para evitar distorções, existem desafios próprios dos sistemas de Machine Learning (ML). Por exemplo, em sistemas de software tradicionais, os desenvolvedores escrevem o código que interage com os dados para produzir o resultado desejado. Os testes de software ajudam a garantir que a lógica escrita no código esteja alinhada com o comportamento real esperado. No entanto, em sistemas de ML, os desenvolvedores fornecem o comportamento desejado como exemplos durante o treinamento e o processo de otimização do modelo produz a lógica do sistema. Como podemos garantir que essa lógica aprendida produzirá de forma consistente o comportamento desejado? Pois é, os sistemas de ML são, portanto, mais complicados de testar pelo fato de que não estamos escrevendo explicitamente a lógica do sistema.

Além disso, sistemas de ML também falham. E os LLMs alucinam, o que não é erro, mas resposta inerente ao modelo. Existem diferenças entre IA e um sistema de software tradicional. No software tradicional, como folha de pagamento, por ser determinístico, se o salário de um funcionário sair errado, é fácil identificar. Em um sistema de IA, por ser probabilístico, é muito mais difícil. Em estatística “Todos os modelos estão errados, mas alguns são úteis”, o que nos leva a pensar de forma diferente na questão da identificação de falhas. Nenhum sistema de IA consegue ser 100% correto, pois joga com probabilidade.

Um sistema de IA degrada assim que entra em produção, pois o contexto onde ele atua provavelmente já será diferente do contexto de onde ele foi treinado. O planejamento para atuar na identificação e correção de falhas é uma etapa que deve ser incluída no planejamento do projeto de IA. É inevitável e esperado. Faz parte do jogo.

Mas, além disso, algumas limitações dos modelos de ML, como serem “black boxes” e muitas vezes embutirem vieses ocultos e não intencionais vão gerar desconforto e decepção em muitos sistemas de IA, quando eles entrarem em produção. E quando usando LLMs existem problemas adicionais como potenciais violações de direitos autorais.

Toda tecnologia transformadora, como a IA, tende a ser superestimada no curto prazo e subestimada no médio e longo prazo. A IA vai provocar muitas decepções no curto prazo, exatamente pelas limitações e escassez de talentos que consigam resolver de forma adequadas essas limitações.

Mas, o que isso tem a ver com o Hype Cycle? Como estamos na fase do entusiasmo desenfreado e IA é visto como hype, pelo menos para a maioria das empresas e startups, pouca atenção é dada às questões que vão pegar logo ali na frente: identificar adequadamente onde usar IA e que tipo de modelo, se será IA generativa ou outra técnica, mais tradicional, mitigando alucinações, vieses e falhas; colocar em produção, minimizando fenômenos como “deriva” e “cauda longa”; evoluir os modelos com novos dados e versões; adequar à regulações e critérios de desenvolvimento responsável e ético; e assim por diante. Isso implica que muita coisa que está sendo feita no atropelo vai gerar insatisfação e até mesmo decepção. Pelo Hype Cycle do Gartner, será a descida para o vale da desilusão. Entretanto, IA não é tão simplista assim, e sabendo disso, para evitar essa frustração, as empresas devem investir budget e contratar talentos realmente preparados.

Provavelmente muitas empresas terão que refazer o caminho que fizeram até agora com IA, mas, seguindo outra trilha. E essa trilha é mais longa e sinuosa que parecia no início. IA é importantíssimo para as empresas e vai mudar e moldar a sociedade, como a eletricidade e os motores a combustão criaram e moldaram a atual sociedade que conhecemos. Mas, não será com hype que isso vai acontecer. Portanto, ao invés de seguir o “efeito manada” entrando em IA por que é “cool”, que tal começar com uma estratégia de negócios que embuta IA em produtos e serviços; que contrate talentos internos e externos adequados; e reserve budget suficiente? Sair do hype e cair na real! Projetos decididos pelo emocional não vão dar certo!

--

--

Cezar Taurion
Cezar Taurion

Responses (1)