Apocalipse robótico ou inovação explosiva? É inegável que a inteligência artificial (IA) ganhou a estrada e continua se revolucionando em 2023. As inovações mais recentes foram além da simples geração de textos. Agora, se você der instruções, esses modelos podem criar imagens e até vídeos. Vamos dar uma olhada em cinco das maiores inovações de IA nesse ano.
A OpenAI, gigante da tecnologia, varreu o mercado em março com a nova versão do ChatGPT, um programa incrível que gera textos usando IA para responder a qualquer pergunta do usuário. O GPT-4, mais inovador e criativo, responde com um limite de 25 mil palavras. Isso é muito mais do que o seu antecessor, o GPT-3.5, que tinha um limite de 3 mil palavras.
De acordo com a OpenAI, o ChatGPT-4 também é muito mais assertivo e colaborativo, superando as críticas da versão anterior que costumavam receber por dar respostas imprecisas e às vezes até inadequadas. A OpenAI afirma também que o novo modelo é “40% mais provável” de fornecer respostas baseadas em fatos reais.
Novembro trouxe mais uma novidade, a OpenAI revelou o GPT-4 Turbo para ampliar ainda mais a potência dessa ferramenta. Ao contrário do modelo anterior, o GPT-4 Turbo foi ‘treinado’ com dados divulgados até abril de 2023. Isso significa que agora ele pode gerar texto sobre eventos subsequêntes a Copa do Mundo de 2022 e a Guerra na Ucrânia, que o GPT-4 original não era capaz de abordar.
A nova versão ainda aumentou o limite máximo das instruções que o usuário pode fornecer de 8 mil caracteres para 128 mil. Também passou a reconhecer imagens. Portanto, o usuário pode desenhar a interface de um site e mostrar ao programa, que irá criar o site de acordo com as instruções visuais.
Não é só a OpenAI que está revolucionando. A gigante Google lançou o Gemini no dia 6 de dezembro. Segundo representantes da Google, essa nova ferramenta é mais poderosa do que o ChatGPT-4, podendo organizar, entender, operar e combinar diferentes tipos de informação, incluindo comandos de texto, imagens, vídeos, áudios ou códigos de programação.
A Google afirma que o Gemini obteve 90% no teste MMLU (Massive Multitask Language Understanding), que avalia o desempenho em história, matemática, medicina, física e ética. A nota mais alta alcançada por um modelo da OpenAI foi de 86%.
Outra empresa apoiada pela Google, a start-up Runway, criou a Gen-2, uma IA que pode criar vídeos a partir de textos, imagens e vídeos. Esta ferramenta foi útil na produção do filme vencedor de dez Oscars 'Tudo em Todo o Lugar ao Mesmo Tempo'.
Para aqueles que se aventuram na edição de imagens no Photoshop e às vezes se sentem frustrados por não poderem adicionar ou remover elementos facilmente, o Adobe Firefly surge como uma solução revolucionária. O usuário precisa apenas selecionar uma área da imagem e descrever o elemento que deseja adicionar ou remover. O programa então faz o resto, economizando muito tempo e esforço.
A OpenAI também lançou o Dall-E 3, um gerador inovador de imagens a partir de texto, que pode ajudar empresas na criação de logos, por exemplo. Devido a preocupações de segurança e privacidade, o Dall-E 3 possui algumas limitações, como a incapabilidade de emular o estilo de artistas atuais e a existência de mecanismos de detecção de conteúdo impróprio. Isso pode evitar o plágio e a criação de conteúdo ofensivo.
Deixe um Comentário!