• NoFinn
  • Posts
  • Startup indiana torna possível usar LLMs em computadores comuns 🇮🇳

Startup indiana torna possível usar LLMs em computadores comuns 🇮🇳

Novidades na OpenAI, Grande resultado da Genspark, Google quer juntar seus modelos de IA & mais

E aí curioso, seja bem vindo novamente a NoFinn, a sua newsletter diária sobre IA.

Aqui está o que separei pra você nesta sexta-feira 👇

🏃TLDR

🇮🇳 Índia dribla escassez de chips com IA que roda em CPU comum. A startup Ziroh Labs criou uma estrutura capaz de rodar modelos como LLaMA 2 e Qwen em notebooks comuns, sem depender de GPUs, uma solução promissora para democratizar o acesso à IA.

📱 ChatGPT bate recordes, ganha memória e se despede do GPT-4 clássico. O app mais baixado do mundo agora tem memória contextual e se prepara para novos modelos. O GPT-4 será retirado do ChatGPT em 30 de abril.

🧠 Genspark atinge US$ 10 milhões de ARR em 9 dias. A startup Genspark, de Eric Jing, explodiu em receita com seu Super Agent, prometendo mais novidades nas próximas semanas.

🤝 Google quer unir Gemini e Veo em um supermodelo multimodal. Segundo o CEO da DeepMind, a fusão vai criar um assistente universal capaz de compreender texto, imagem, som e vídeo.

🌍 Geopolítica da IA generativa: EUA lidera, China encosta e o resto corre atrás. BCG aponta que a corrida da IA é liderada por EUA e China, mas potências intermediárias como UE, Japão, Oriente Médio e Singapura buscam seus espaços com talento, capital e infraestrutura.

Além disso, olha o que você verá hoje:

Bora lá?

🛠 Caixa de Ferramentas 🛠

Aqui estão algumas das ferramentas que separei hoje pra você:

  • EverTutor - Ferramenta que atua como um tutor de voz de IA que é personalizável conforme o seu estilo de pilotagem.

  • Cognee - Camada de memória de código aberto para agentes de IA, construída em bancos de dados. Ela constrói gráficos de conhecimento a partir dos dados recuperados, permitindo que aplicativos e agentes de IA forneçam respostas precisas.

  • Genspark - Um mecanismo de pesquisa com inteligência artificial.

  • Kompas AI - Uma alternativa à pesquisa profunda do ChatGPT.

  • Simplehuman - Extensão do Chrome que adiciona barra de comando e atalhos de teclado avançados ao Gmail.

Startup Indiana desenvolveu estrutura para rodar grandes modelos de IA em CPUs ‘comuns’

A Ziroh Labs, em parceria com o Instituto de Tecnologia de Madras, desenvolveu o Kompact AI, uma estrutura que permite executar grandes modelos de IA em CPUs comuns, dispensando GPUs avançadas como as da Nvidia. O foco da solução está na fase de inferência (quando o modelo já está treinado), e a ideia é democratizar o acesso à IA, especialmente em países onde o custo e a escassez de chips de ponta limitam a inovação. Em demonstrações públicas, a plataforma conseguiu rodar modelos robustos como LLaMA 2 da Meta e Qwen2.5 da Alibaba em notebooks com processadores Intel Xeon padrão de prateleira.

A abordagem da Ziroh surge em meio a uma onda de alternativas que buscam eficiência computacional e acessibilidade, inspiradas por modelos como o DeepSeek da China, que ganhou destaque por oferecer alto desempenho com baixo custo. Segundo os criadores, o Kompact AI foi testado por grandes fabricantes como Intel e AMD, e demonstrou resultados de alta qualidade. Para os idealizadores, a proposta quebra o mito de que só é possível competir no setor de IA com supercomputadores: “Você não precisa de um revólver para matar um mosquito”, provocou o diretor do instituto parceiro.

A iniciativa aponta para um novo capítulo na corrida global por IA, onde a inovação não depende apenas de infraestrutura cara, mas de soluções criativas para incluir mais países e equipes no jogo. Com escassez de GPUs afetando até mercados maduros, alternativas como a da Ziroh podem abrir espaço para um futuro mais descentralizado e acessível e, quem sabe, mudar a lógica de poder na era da inteligência artificial.

OpenAI: Aposentadoria do GPT-4, Memória Aprimorada e Recorde de Downloads

A OpenAI está promovendo uma reformulação no ChatGPT. A partir de 30 de abril, o modelo GPT-4 será descontinuado na plataforma, dando lugar definitivo ao GPT-4o, mais rápido, mais barato e melhor avaliado em escrita, programação e fluidez de conversa. Segundo a empresa, os usuários nem sentirão falta do modelo antigo e quem ainda precisar do GPT-4, poderá acessá-lo apenas via API. O movimento prepara terreno para o lançamento de uma nova geração: a linha GPT-4.1, com versões Mini e Nano, além do misterioso modelo o4-mini, voltado a raciocínio.

Além disso, entre os novos recursos lançados, o mais impactante é a memória aprimorada, que agora permite que o ChatGPT use informações de conversas anteriores automaticamente. Isso torna as interações mais fluidas e personalizadas, sem precisar repetir tudo a cada nova sessão. Por enquanto, a novidade está sendo liberada apenas para usuários pagos fora da Europa, devido a restrições regulatórias. Usuários podem desativar a memória nas configurações ou usar o “chat temporário” para conversas que não serão registradas.

Enquanto isso, o ChatGPT atingiu um novo marco: foi o aplicativo mais baixado do mundo em março de 2025, superando gigantes como Instagram e TikTok. Foram 46 milhões de downloads em um único mês, puxados por recursos virais como a geração de imagens no estilo Studio Ghibli e a remoção de algumas barreiras de moderação. Para muitos, o termo “IA” já se confunde com “ChatGPT”, o que explica sua popularidade crescente mesmo diante de concorrentes como Claude, DeepSeek ou Grok.

Genspark Super Agent alcança US$10 mi em receita anual recorrente, em apenas nove dias, segundo seu fundador

Ele também adiantou que uma nova funcionalidade “emocionante” será lançada em duas semanas, reforçando o compromisso da equipe com desenvolvimento contínuo e operação 24/7.

Google pretende combinar Gemini com o modelo de vídeo, Veo

Durante participação no podcast Possible, o CEO da DeepMind, Demis Hassabis, revelou que a Google pretende combinar seus modelos Gemini (multimodal) com o Veo (gerador de vídeos). O objetivo é criar um assistente digital mais completo e útil no mundo físico, capaz de compreender e gerar conteúdo em texto, imagem, áudio e vídeo.

A fusão representa um passo estratégico em direção ao conceito de modelos “omni”, que integram diferentes tipos de mídia, uma tendência que também vem sendo seguida por OpenAI e Amazon.

Hassabis destacou que o Veo 2 aprende “assistindo YouTube”, interpretando física e contexto do mundo real com base em grandes volumes de vídeo, algo viabilizado graças ao controle do Google sobre a plataforma. A empresa teria ampliado seus termos de uso para permitir esse tipo de treinamento. Para Hassabis, quanto mais completo o modelo, mais próximo se chega de um assistente verdadeiramente universal, um conceito que pode redefinir a forma como interagimos com IA no futuro próximo.

🇧🇷 Novidade do setor para o Brasil 🇧🇷

Mais notícias ao redor do mercado de IAs

Analisando a geopolítica de GenAI

A inteligência artificial generativa está rapidamente se tornando uma peça central da competição geopolítica global, com Estados Unidos e China liderando a corrida. Segundo a BCG, os EUA mantêm ampla vantagem graças a uma combinação poderosa de capital, talentos (meio milhão de especialistas), infraestrutura computacional (45 GW) e histórico em desenvolvimento de modelos de linguagem, dominando 67% dos modelos relevantes desde 1950. A China, por sua vez, cresce rapidamente, mesmo com acesso limitado a chips de última geração, graças ao alto volume de dados, investimentos massivos em pesquisa acadêmica, patentes e centros de dados. Modelos como o DeepSpeech surgem como exemplo da eficiência chinesa com menos recursos.

Fora das superpotências, “potências intermediárias” como a União Europeia, Japão, Coreia do Sul, Emirados Árabes, Arábia Saudita e Singapura estão construindo seus próprios caminhos. A Europa aposta em talento e pesquisa científica, mas precisa acelerar a integração entre IA, defesa e energia renovável. O Oriente Médio usa seus fundos soberanos e energia barata como alavanca para atrair infraestrutura e especialistas, enquanto países asiáticos investem pesado em ecossistemas locais, com forte apoio governamental e grandes players privados como Samsung e SoftBank. Singapura também ganha destaque ao lançar seu primeiro LLM regional e investir em capacitação.

Para empresas globais, o cenário é complexo: 44% delas operam com times de IA distribuídos em vários países, o que as torna vulneráveis a regulações e tensões políticas cada vez mais voláteis. A corrida não é apenas por computação e modelos, mas por soberania tecnológica, onde cada país precisa escolher: desenvolver sua própria IA ou depender de soluções externas. Com o aumento dos custos de P&D e a pressão por segurança digital, governos e corporações precisarão equilibrar inovação, risco e estratégia nacional. A era da IA generativa não é só tecnológica, ela é cada vez mais, geopolítica.

Conteúdos extras para você

Isso é tudo por hoje!

Me conta: o que você achou do conteúdo de hoje?

Faça Login ou Inscrever-se para participar de pesquisas.

Não perca nada!

Para mais notícias sobre IA, fique atento na sua caixa de entrada todos os dias!

Caso tenha interesse, tenho outros conteúdos já publicados. Dê uma olhada.

Reply

or to participate.