Em 2023, a Inteligência Artificial (IA) Generativa saiu do laboratório e trouxe-nos inovações inesperadas, que despertaram a curiosidade do mundo e desafiaram aquilo que até então sabíamos sobre IA. O chatGPT, lançado no final de 2022, foi o primeiro exemplo, atingiu 100 milhões de pessoas em apenas dois meses, mas houve muitos outros desenvolvimentos durante 2023. Além da Open AI, várias startups como a Stability AI, a Midjourney, a Anthropic, entre outras, viram a sua valorização multiplicar-se durante o último ano.
A nível empresarial, 2023 foi um ano com um ritmo de inovação espantoso. Na Europa, mais de 2/3 das empresas já usam soluções de IA no seu core business, e em 2024 mais 21% irá fazê-lo também. Mas o potencial da IA Generativa só está a começar. A primeira metade de 2023 foi fundamentalmente focada na exploração de uses cases de negócio, de forma transversal a várias industrias. Em Portugal tivemos vários exemplos: no Ministério da Justiça foi criada uma solução baseada em chatGPT para serviço ao cidadão, a Agência da Modernização Administrativa criou um avatar com IA Generativa para apoiar os cidadão no uso da chave móvel digital, no sector privado, a Helena, o chatbot com IA Generativa disponibilizado pelos CTT para atendimento ao cliente, e a Talkdesk que passou a integrar os serviços de Azure Open AI no seu CRM.
Em 2024 espera-se uma democratização na utilização de IA Generativa, seja em termos individuais com tecnologias como o Microsoft Copilot, em que estes modelos estão totalmente integrados nas ferramentas que usamos diariamente, como o Excel ou o PowerPoint, seja em termos empresarias, com uma expansão dos uses cases a soluções end-to-end mais sofisticadas, que permitirão passar dos chatbots que vimos surgir em 2023, para aplicações mais inteligentes, hiperpersonalizadas e com uma capacidade de interação muito mais intuitiva e contextualizada, que passará apenas do texto, para a imagem, voz e vídeo.
Este artigo aborda algumas das principais tendências para 2024 na área da IA Generativa, com uma perspetiva prática da utilização da tecnologia e do impacto que daí advém para as empresas e para todos nós enquanto utilizadores. Hoje mais do que nunca, as organizações precisam de recursos especializados, ferramentas mais abrangentes e novas competências para criar a próxima onda de aplicações inteligentes baseados em IA Generativa:
1. A democratização e sofisticação da IA Generativa
Depois da aceleração, a democratização. De acordo com estimativas da Gartner, mais de 80% das empresas terão modelos de IA Generativa em produção até 2026, um salto quântico, uma vez que no início de 2023 o mesmo índice estava abaixo de 5%.
A democratização dever-se-á largamente à acessibilidade aos diversos LLMs, através de serviços Cloud, que disponibilizam infraestruturas de GPUs escaláveis, um fator critico para o deployment destas soluções de computação intensiva, e através da disponibilização dos próprios LLMs, já pre-treinados, como um serviço (Model-as-a-Service), prontos a ser integrados em aplicações e processos de negócio mais complexos.
Por último, também a disponibilização de LLMs em modelo open-source será um fator de democratização, especialmente em cenários especializados ou menos exigentes em termos de precisão dos modelos. Exemplos como a Llama 2 da Meta, o Phi2 da Microsoft e outras centenas de modelos open-source disponíveis na Hugging Face permitem hoje antever esta tendência.
2. IA Generativa multimodal, onde a voz, a imagem e o vídeo serão "reis"
Apesar da inovação dos modelos fundacionais durante 2023, a nova onda da IA Generativa permitirá realizar atividades muito mais complexas que se caraterizarão pela multimodalidade, ou seja, pela capacidade de compreender, processar e gerar vários tipos de informação, incluindo texto, voz, imagem, vídeo, entre outras. Estas capacidades avançadas abrem oportunidades mais criativas e experiências mais abrangentes, em que a IA vai obter uma melhor perceção do mundo, tal como nós o conhecemos.
Esta tendência já arrancou em 2023, com a inclusão do modelo do DALLE-3 da Open AI no Bing Chat, permitindo a análise e geração de imagens, seguido da componente de voz, e mais recentemente a inclusão da visão nos modelos GPT-4 da Open AI, nomeadamente o GPT-4 Turbo with Vision. A mesma tendência foi seguida com o recente lançamento da Google do seu modelo multimodal Gemini, capaz de processar imagem e vídeo.
A interação multimodal vai revolucionar a forma como interagimos com os computadores, e será um pilar fundamental para o desenvolvimento de novas aplicações inteligentes, que não só nos entenderão melhor e mais naturalmente mas sobretudo irão ampliar as nossas capacidades.
3. A era dos Copilotos e o impacto no novo mundo do trabalho
Outra tendência dominante para 2024 envolve a utilização de IA Generativa em assistentes virtuais que nos ajudam a fazer parte das tarefas do dia-a-dia, agilizar processos, aumentar a eficiência e a produtividade. Um estudo recente da Microsoft sobre o futuro do trabalho, conclui que passamos 57% do nosso tempo em tarefas administrativas, como a gestão de emails, videoconferências, chats, e apenas 43% em tarefas criativas.
O conceito do Copiloto, que a Microsoft anunciou durante 2023 e que passados 9 meses se concretizou na inclusão de um assistente pessoal - o Microsoft Copilot - nas ferramentas que todos usamos, como o PowerPoint, o Excel ou o Teams -, recorre à IA Generativa (em particular aos modelos GPT-4 e DALLE-3) e aplica-a ao nosso domínio específico de informação empresarial, como documentos, emails, gravações de reuniões, entre muitos outros. O Copilot representa a nova interface homem-máquina para o conhecimento que reside nas organizações e que nos ajudará a atuar com base nesse conhecimento.
O ano de 2024 será sem dúvida o ano em que o florescimento de modelos especializados, sejam embebidos em ferramentas de produtividade ou em aplicações de negócio, terão um impacto direto na produtividade e satisfação de todos nós, mas também na forma como iremos fazer negócios no futuro.
4. O poder surpreendente dos Small Language Models (SLMs)
Os LLMs como o GPT-4 da Open AI, o PaLm 2 da Google, ou o Claude da Anthropic, têm demonstrado uma notável capacidade de raciocinar, respondendo a perguntas complexas, e até mesmo resolvendo problemas que exigem raciocínio em várias etapas, capacidades que antes eram consideradas fora do alcance da IA. O desafio consiste em saber se tais habilidades emergentes poderão ser alcançadas em modelos de menor escala, usando diferentes estratégias para o treino, que vão desde a seleção de dados de elevada qualidade, a utilização de dados sintéticos, às arquiteturas dos próprios modelos.
O lançamento pela Microsoft Research dos modelos de linguagem Orca (13 biliões de parâmetros) e, vários meses depois, Orca 2 (7 biliões e 13 biliões de parâmetros) demonstraram como métodos de treino aprimorados, como a criação de dados sintéticos, podem elevar o raciocínio de SLMs a um nível equivalente ao de modelos 10 vezes maiores. Outro exemplo da Meta foi o lançamento, em junho 2023, do modelo Llama 2, uma coleção de modelos open-source que variam em escala de 7 a 70 biliões de parâmetros e que estão disponíveis gratuitamente para uso comercial e de pesquisa. O Llama 2 supera outros modelos de linguagem open-source em muitos benchmarks externos, incluindo testes de raciocínio, codificação, proficiência e conhecimento.
Recentemente a Microsoft expandiu sua família de SLMs com o Phi-2, de 2,7 bilhões de parâmetros, que eleva o nível de raciocínio e compreensão de linguagem entre modelos base com até 13 bilhões de parâmetros. O Phi-2 também atingiu ou excedeu o desempenho de modelos 25 vezes o seu tamanho, obtendo um desempenho notável numa variedade de benchmarks, graças à utilização de dados de elevada qualidade, cuidadosamente selecionados que são filtrados com base no valor educacional e na qualidade do conteúdo.
5. IA Generativa Empresarial - dos chatbots às aplicações inteligentes
A IA Generativa irá revolucionar a forma como as empresas operam. Da analítica avançada à automação de tarefas trabalhosas, as organizações irão medir o impacto da IA na produtividade e na criatividade dos seus colaboradores. Uma das tendências apontadas pela Gartner são as aplicações inteligentes, definidas como aplicações capazes de responder de forma adequada, dinâmica e autônoma, e que começa com dados. Muitas organizações já têm os dados de que precisam para gerar insights significativos com IA, mas, a menos que integrem esses dados em aplicações inteligentes, não serão capazes de tirar pleno partido deles para crescer, inovar e fornecer um serviço de excelência.
Em 2024, a IA Generativa irá redefinir a forma como as empresas criam aplicações de negócio. Se até hoje a maioria das aplicações que suportam o negócio são estáticas, com interfaces predefinidos, programados para cenários conhecidos, e com elevados custos de mudança, o novo paradigma levar-nos-á a aplicações inteligentes, que usam a linguagem natural como meio de interação, com experiências personalizadas, que melhoram ao longo do tempo e com uma impressionante capacidade de processamento semântico.
Os chatbots podem ter sido a porta de entrada das organizações no mundo da IA Generativa, mas foram apenas o começo. Com o introdução de IA Generativa nas soluções de negócio, muitas das aplicações serão totalmente redefinidas.
Por Manuel Dias
Microsoft Portugal