• NoFinn
  • Posts
  • Llama 4: Meta lança dois novos modelos! 🦙

Llama 4: Meta lança dois novos modelos! 🦙

DeepSeek diz que a evolução de IA dependerá menos de dados, Trump e suas tarifas ameaçam a produção de chips de IA nos EUA & mais

E aí curioso, seja bem vindo a Nofinn, sua newsletter diária sobre IA!

Para começar a semana, a Meta não quer ficar atrás das novidades apresentadas pela OpenAI na semana passada e lançou novos modelos do Llama 4, mas será que eles são tudo o que a Meta está prometendo? Venha conferir 👇

🏃TLDR

🦙 Meta lança LLaMA 4, mas com benchmarks duvidosos. A Meta lançou novos modelos LLaMA 4 com promessa de potência e integração no WhatsApp e Instagram, mas especialistas apontam benchmarks inflados e licenças abertas com restrições….

🐋 DeepSeek propõe revolução via inferência, não dados. A DeepSeek quer mudar o jogo da IA usando mais computação na resposta (inferência) em vez de depender de megatreinamento. O próximo salto da IA pode estar na forma de pensar, não no quanto ela sabe…

🇺🇸 Tarifas de Trump ameaçam setor de chips nos EUA. Novas tarifas sobre semicondutores podem encarecer servidores, data centers e IA nos EUA. Efeito colateral: até Taiwan e Sudeste Asiático saem prejudicados…

🌍 Estudo de Stanford mostra IA cada vez mais global. A nova edição do AI Index revela que a corrida por IA não é mais só dos EUA: China, Europa, América Latina e até o Oriente Médio entram no jogo e os modelos abertos estão quase no mesmo nível dos fechados…

O que aconteceu na semana passada

Segunda-Feira: Amazon entra para a briga dos agentes de IA. Manus AI apresenta seu app e planos pagos, DeepSeek ultrapassa ChatGPT como a ferramenta de IA com o crescimento mais rápido & mais

Terça-Feira: OpenAI fecha rodada de investimento histórica de US$40 bi. Isomorphic Labs, spin-off de descoberta de medicamentos do Google, fecha rodada de $600mi, Anthropic fecha o cerco a usos maliciosos & mais.

Quarta-Feira: Alibaba planeja lançar Qwen 3 ainda este mês! Saiba o porque você deve se importar. OpenAI atinge marca de 20 milhões de usuários pagantes, Meta está desenvolvendo um novo modelo de vídeo com geração de fala integrada & mais.

Quinta-Feira: Inteligente mas caro demais: saiba como a OpenAI subestimou os custos do ‘o3’. Anthropic quer que os alunos pensem mais ao utilizar o Claude, NotebookLM agora pode encontrar fontes de conteúdo sozinho & mais.

Sexta-Feira: Midjourney não quer ficar para trás e lança seu novo gerador de imagens V7. Devin lança a sua nova versão mais rápida e barata, OpenAI investe US$ 43mi em startup de cibersegurança & mais.

Além disso, olha o que você verá hoje:

Bora lá?

🛠 Caixa de Ferramentas 🛠

Aqui estão as ferramentas que separei para você iniciar a semana:

  • Llama 4 - A coleção de modelos Llama 4 são modelos de IA nativamente multimodais que permitem experiências de texto e multimodais. Esses modelos aproveitam uma arquitetura de mistura de especialistas para oferecer desempenho líder do setor em compreensão de texto e imagem.

  • Novo Microsoft Copilot - Conheça o novo Microsoft Copilot, seu companheiro de IA que lembra detalhes, toma medidas e vê seu o que você vê.

  • Flow by Laminar - Mecanismo de tarefas dinâmico de código aberto para criar agentes de IA.

  • Day - Automatiza CRMs sincronizando seus contatos e conversas.

  • Superads - Análise criativa baseada em IA para profissionais de marketing e equipes criativas.

Meta anuncia Llama 4 em duas novas versões

A Meta anunciou oficialmente a nova família de modelos de IA LLaMA 4, com destaque para o Scout (leve e eficiente) e o Maverick (robusto e comparável ao GPT-4o). Ambos já estão integrados ao Meta AI, presente no WhatsApp, Messenger, Instagram e web, marcando a entrada da empresa no universo de assistentes em tempo real e multipropósito. Além disso, um terceiro modelo, ainda em treinamento, chamado Behemoth, promete ser o “modelo base mais poderoso do mundo”, segundo Zuckerberg, com 288 bilhões de parâmetros ativos, um gigante que ainda não tem data de estreia.

Embora os números e promessas impressionem, análises recentes colocam em dúvida a forma como a Meta apresenta seus benchmarks de desempenho. Os testes que comparam o LLaMA 4 com rivais como GPT-4.5, Gemini 2.0 e Claude 3.7 podem estar sendo “ajustados para favorecer a Meta”, segundo especialistas, seja escolhendo tarefas mais favoráveis, seja omitindo limitações importantes. O modelo Scout, por exemplo, cabe em uma única GPU H100 e se destaca pela eficiência, mas seu “open source” vem com restrições comerciais pesadas, o que já gerou críticas da comunidade técnica.

Na prática, o lançamento reposiciona a Meta como uma das protagonistas na corrida global da IA, usando uma abordagem que une acessibilidade técnica (modelos compactos), ambição de escala (com Behemoth) e distribuição massiva via suas redes sociais.

DeepSeek afirma que o próximo passo da IA vai depender mais computação de inferência

A DeepSeek está reformulando o jogo da inteligência artificial ao propor que o próximo salto da IA não depende mais de “mais dados”, mas de mais computação no momento da inferência ou seja, quando o modelo gera a resposta, não durante o treinamento. Essa abordagem, conhecida como Test-Time Compute (TTC), pode permitir ganhos significativos de desempenho, mesmo em modelos que não foram treinados com volumes massivos de dados. O impacto foi tão grande que chegou a afetar o mercado: ações da Nvidia, ligada à demanda por data centers, caíram 17% após o lançamento do modelo DeepSeek-R1, mais leve e eficiente. A lógica agora se inverte: não é só sobre treinar o modelo maior, mas sobre deixá-lo “pensar mais” na hora de responder, mesmo que isso custe alguns segundos a mais.

Além disso, em colaboração com a Universidade Tsinghua, a empresa lançou uma nova técnica chamada Generative Reward Modeling (GRM) combinada com Self-Principled Critique Tuning, que ajuda os modelos a se alinharem melhor às preferências humanas, aprimorando a qualidade e velocidade do raciocínio. Os resultados dos primeiros testes superaram outros métodos atuais, segundo artigo publicado no arXiv. Esses avanços alimentam a expectativa pelo DeepSeek-R2, próximo modelo da startup chinesa que pode elevar ainda mais o padrão técnico e estratégico da IA, especialmente em aplicações de raciocínio estruturado.

As tarifas de Trump estão ameaçando a produção de semicondutores nos EUA

As novas tarifas comerciais anunciadas por Donald Trump podem sufocar os avanços recentes da indústria de chips nos EUA. Embora uma pequena exceção tenha sido feita para certos semicondutores, a maioria dos produtos relevantes, como GPUs, servidores de IA e equipamentos de fabricação de chips não foi incluída nas isenções.

Isso significa que empresas como Nvidia, que dependem fortemente da importação desses itens, enfrentam tarifas de até 40%, encarecendo a construção de data centers e o treinamento de modelos de IA no país. Analistas temem que o impacto vá além dos custos imediatos, prejudicando a cadeia de suprimentos e a competitividade global dos EUA em tecnologia.

Além disso, os aliados dos EUA também estão sendo afetados. Taiwan, por exemplo, exporta majoritariamente produtos que não se enquadram nas isenções, como servidores, que agora podem sofrer tarifas adicionais de até 32%. Já países do Sudeste Asiático, como Vietnã e Tailândia, foram atingidos com taxas ainda mais altas, o que pode desincentivar o movimento de fábricas para fora da China, exatamente o oposto do objetivo declarado de Trump de promover a “relocalização” industrial. Com isso, especialistas alertam para um efeito dominó que pode gerar caos na cadeia global de suprimentos de semicondutores, atingindo desde carros e geladeiras até computação em nuvem e segurança nacional.

🇧🇷 Novidade do setor para o Brasil 🇧🇷

Mais notícias ao redor do mercado de IAs

Corrida da IA: China se aproxima dos EUA

O novo relatório do Instituto de IA Centrada no Humano de Stanford mostra que a corrida por inteligência artificial deixou de ser um duelo entre EUA e Google/OpenAI, o mercado agora é global, descentralizado e lotado de novos competidores. Modelos chineses, como o DeepSeek-R1, já aparecem nos benchmarks ao lado dos melhores americanos, e o país lidera em volume de publicações científicas e patentes de IA. Enquanto isso, regiões como o Oriente Médio, América Latina e Sudeste Asiático também começam a produzir modelos de ponta, revelando um cenário cada vez mais distribuído.

O estudo também destaca a ascensão dos modelos open-weight, como o LLaMA 4 da Meta e os da Mistral e DeepSeek, que podem ser baixados e personalizados. Essa abertura reduziu o gap entre modelos fechados e abertos de 8% para apenas 1,7%. Ao mesmo tempo, a eficiência da IA vem melhorando: o hardware ficou 40% mais potente e modelos mais leves já rodam em dispositivos pessoais. O problema? A fonte de dados humanos pode se esgotar até 2032, o que deve acelerar o uso de dados sintéticos gerados por outras IAs.

Por fim, o relatório aponta para um impacto estrutural: com investimento recorde de US$ 150,8 bilhões em 2024, aumento na demanda por profissionais com habilidades em machine learning e crescimento na legislação sobre IA, fica claro que a tecnologia não é só uma tendência, é um novo eixo de transformação econômica e geopolítica. AGI ainda não chegou, mas em benchmarks específicos, alguns modelos já superam humanos. E o que antes era ficção especulativa agora está, literalmente, em versão beta.

Conteúdos extras para você

Isso é tudo por hoje

Me conta: o que você achou do conteúdo de hoje?

Faça Login ou Inscrever-se para participar de pesquisas.

Não perca nada!

Para mais notícias sobre IA, fique atento na sua caixa de entrada todos os dias!

Caso tenha interesse, tenho outros conteúdos já publicados. Dê uma olhada.

Reply

or to participate.