NoFinn
Posts
OpenAI + Microsoft + Harvard = Muitos dados para treinar IA de graça 😮

OpenAI + Microsoft + Harvard = Muitos dados para treinar IA de graça 😮

A nova era da IA do Google, ChatGPT e Sora offline & mais

Finn Puklowski
12 de dezembro de 2024

E aí curioso, seja bem vindo à Nofinn, sua newsletter diária sobre Inteligência Artificial!

Vem conferir as principais novidades do setor! Se quiser escutar os conteúdos é simples:

🌐 Se você está na versão web ou no aplicativo basta dar clicar no player no topo da página, logo abaixo do título da postagem.

📧 Caso você esteja no e-mail é só clicar aqui, ou no banner no topo do e-mail e você será direcionado para a postagem na web, após isso é só dar play no topo da página.

🎧 E pra você que já está escutando o conteúdo, maravilha! Bora lá para o resumo de hoje.

🏃TLDR⌚

🎓 A Universidade de Harvard anunciou o lançamento de um vasto dataset de treinamento de IA, financiado pela OpenAI e Microsoft. O conjunto inclui quase 1 milhão de livros de domínio público digitalizados pelo projeto Google Books, abrangendo clássicos literários e materiais técnicos em diversos idiomas. A iniciativa, liderada pelo Institutional Data Initiative de Harvard, visa democratizar o acesso a dados de alta qualidade, permitindo que pesquisadores e startups desenvolvam modelos de IA sem recorrer a materiais protegidos por direitos autorais. A abordagem é comparada ao impacto transformador do Linux como sistema operacional de código aberto.

🤖 💭 O Google DeepMind revelou dois novos projetos de IA avançados, Project Astra e Project Mariner, que marcam o início de sua "era agêntica". O Astra, apresentado inicialmente no Google I/O, é um assistente universal capaz de processar texto, imagens, vídeos e áudio em tempo real, com memória contextual de até 10 minutos para interações mais naturais. Agora em fase de testes expandidos, o Astra será integrado a produtos como Google Search, Lens e Maps, permitindo uma interação mais rica e intuitiva.

📴 Os serviços da OpenAI, incluindo ChatGPT, Sora e a API para desenvolvedores, enfrentaram uma grande interrupção global na quarta-feira, dia 11/12. A empresa relatou o problema em sua página de status e anunciou às 19h (horário do Pacífico, 00h horário de Brasília) que estava implementando uma solução. Embora a causa exata não tenha sido esclarecida, a interrupção coincidiu com o lançamento do Sora e a integração de ChatGPT com o Apple Intelligence no iOS 18.2, possivelmente gerando um aumento de tráfego que sobrecarregou os servidores. Muitos usuários enfrentaram dificuldades, recebendo mensagens de erro ou enfrentando limitações de capacidade nos serviços.

🤨 Existe muitos desafios de confiança em sistemas de IA, especialmente os modelos de linguagem como ChatGPT, destacando suas diferenças fundamentais em relação a ferramentas tradicionais, como calculadoras e algoritmos. Enquanto calculadoras oferecem consistência e confiabilidade inquestionáveis, a IA opera com incertezas e erros inerentes devido à sua natureza emergente e probabilística. Diferentemente de algoritmos que transferem a confiança para seus criadores, a IA exige confiança direta do usuário, mesmo quando suas respostas podem ser enganosas ou imprecisas. Isso é agravado pela sua capacidade de apresentar informações com uma confiança que muitas vezes mascara suas limitações.

Além disso, olha o que você verá hoje:

🛠 Caixa de Ferramentas
🆕 Novidades ao redor do mercado
📚 Conteúdos Extras

Bora lá?

🛠 Caixa de Ferramentas 🛠

Aqui estão algumas das ferramentas que separei hoje pra você:

Height.app - Ferramenta autônoma de gerenciamento de projetos.
Latitude - Plataforma de engenharia de prompts de código aberto para criar, avaliar e refinar seus prompts com IA.
Kvistly - Questionários de IA para melhorar o treinamento e formação de equipes.
Marqo - Crie prototipos rapidamente, acelere a iteração e implante aplicativos de IA poderosos sem problemas.
Adsby - Selecione as palavras-chave corretas, filtre as negativas e crie campanhas de alto desempenho com IA

OpenAI e Microsoft financiam um enorme conjunto de dados de treinamento de IA gratuito que será lançado por Harvard

A Universidade de Harvard anunciou o lançamento de um vasto dataset de treinamento de IA, financiado pela OpenAI e Microsoft. O conjunto inclui quase 1 milhão de livros de domínio público digitalizados pelo projeto Google Books, abrangendo clássicos literários e materiais técnicos em diversos idiomas. A iniciativa, liderada pelo Institutional Data Initiative de Harvard, visa democratizar o acesso a dados de alta qualidade, permitindo que pesquisadores e startups desenvolvam modelos de IA sem recorrer a materiais protegidos por direitos autorais. A abordagem é comparada ao impacto transformador do Linux como sistema operacional de código aberto.

Embora o dataset represente um passo importante na criação de alternativas éticas para treinamento de IA, especialistas apontam que seu impacto dependerá do uso em substituição a materiais protegidos por copyright. Harvard também está explorando colaborações com bibliotecas e instituições culturais para expandir a disponibilidade de dados de domínio público. Com iniciativas semelhantes, como o Common Corpus na França, o projeto busca transformar a maneira como a IA é treinada, reduzindo riscos legais e promovendo maior transparência no setor.

A nova era “agêntica” da IA do Google

O Google DeepMind revelou dois novos projetos de IA avançados, Project Astra e Project Mariner, que marcam o início de sua "era agêntica". O Astra, apresentado inicialmente no Google I/O, é um assistente universal capaz de processar texto, imagens, vídeos e áudio em tempo real, com memória contextual de até 10 minutos para interações mais naturais. Agora em fase de testes expandidos, o Astra será integrado a produtos como Google Search, Lens e Maps, permitindo uma interação mais rica e intuitiva.

O Project Mariner, por sua vez, é um agente de IA que utiliza extensões no navegador Chrome para executar tarefas automatizadas, como navegação e ações online. Embora esteja em fase inicial de testes, Mariner demonstra o potencial de IA para simplificar tarefas digitais complexas. Ambos os projetos são protótipos de pesquisa sem previsão de lançamento ao público, mas destacam o avanço da Google em criar agentes de IA com capacidades multimodais e maior aplicabilidade no dia a dia.

ChatGPT e Sora ficaram offline

Os serviços da OpenAI, incluindo ChatGPT, Sora e a API para desenvolvedores, enfrentaram uma grande interrupção global na quarta-feira, dia 11/12. A empresa relatou o problema em sua página de status e anunciou às 19h (horário do Pacífico, 00h horário de Brasília) que estava implementando uma solução.

Embora a causa exata não tenha sido esclarecida, a interrupção coincidiu com o lançamento do Sora e a integração de ChatGPT com o Apple Intelligence no iOS 18.2, possivelmente gerando um aumento de tráfego que sobrecarregou os servidores. Muitos usuários enfrentaram dificuldades, recebendo mensagens de erro ou enfrentando limitações de capacidade nos serviços.

Este incidente ocorreu durante a “12 Days of Shipmas,” uma campanha da OpenAI que promove lançamentos consecutivos de produtos. A interrupção levantou questões sobre a infraestrutura da empresa em meio ao crescimento da demanda por seus serviços. Apesar do contratempo, a OpenAI afirmou estar trabalhando ativamente para restaurar o funcionamento normal de suas plataformas e melhorar sua capacidade para lidar com futuros aumentos de tráfego.

Mais notícias ao redor do mercado de IAs

A geração de voz de IA da ElevenLabs é 'muito provavelmente' usada em uma operação de influência russa.
Albert Invent espera revolucionar o setor químico com sua plataforma de IA.
Finny, apoiado pela YC, está usando IA para conectar consultores financeiros com clientes em potencial.
As visões gerais de IA do Google em breve poderão responder a perguntas de matemática e codificação.
Google revela assistente de codificação de IA 'Jules', prometendo correções de bugs autônomas e ciclos de desenvolvimento mais rápidos.
Veja como o OpenAI usa seus dados quando você usa o ChatGPT por meio das integrações da Apple.
Como o Apple Intelligence muda a maneira como você usa a Siri no iPhone.
M12 da Microsoft investe outros US$ 22,5 milhões na NeuBird, meses após sua rodada inicial de US$ 22 milhões.
Lam Research lança robôs colaborativos para otimizar a manutenção crítica em fábricas de chips.

Confiabilidade na Era da IA

Existe muitos desafios de confiança em sistemas de IA, especialmente os modelos de linguagem como ChatGPT, destacando suas diferenças fundamentais em relação a ferramentas tradicionais, como calculadoras e algoritmos. Enquanto calculadoras oferecem consistência e confiabilidade inquestionáveis, a IA opera com incertezas e erros inerentes devido à sua natureza emergente e probabilística. Diferentemente de algoritmos que transferem a confiança para seus criadores, a IA exige confiança direta do usuário, mesmo quando suas respostas podem ser enganosas ou imprecisas. Isso é agravado pela sua capacidade de apresentar informações com uma confiança que muitas vezes mascara suas limitações.

Com o avanço acelerado da IA, a tecnologia está sendo aplicada em problemas que ultrapassam a capacidade de avaliação dos desenvolvedores e usuários. Os modelos de IA, ao serem implementados em cenários complexos, como recomendações personalizadas ou raciocínios avançados, muitas vezes ultrapassam os limites de suas capacidades. Para resolver isso, os engenheiros responsáveis por estes modelos devem avaliar rigorosamente as aplicações da IA, questionando sua adequação para cada problema, reconhecendo seus limites e implementando processos para mitigar erros antes de aplicá-los em larga escala. Essa abordagem seria essencial para evitar a dependência excessiva de sistemas falíveis em questões críticas.

Por fim, o artigo ressalta que, apesar da sua aparência convincente, a IA deve ser tratada como uma ferramenta imperfeita, comparável a um banco com pernas instáveis. Seu uso requer responsabilidade e transparência por parte de seus criadores, que devem se esforçar para garantir que a tecnologia seja aplicada com segurança e clareza. Isso inclui o desenvolvimento de práticas rigorosas de avaliação e uma comunicação honesta sobre suas limitações. Essa abordagem, argumenta o autor, é essencial para evitar falhas persistentes que comprometam a confiança dos usuários e a eficácia dos sistemas.

Conteúdos extras para você

ℹ️ Evento de 2024 da OpenAI: atualizações ao vivo para revelações e demonstrações de produtos ChatGPT | Acesse o conteúdo completo.
▶️ Assista ao Genie 2 do Google DeepMind gerar mundos 3D jogáveis | Acesse o conteúdo completo.
📄 Abu Dhabi lança empreendimento de tecnologia climática de IA e robótica | Acesse o conteúdo completo.
🧠 ServiceNow abre o código Fast-LLM em uma tentativa de ajudar as empresas a treinar modelos de IA 20% mais rápido | Acesse o conteúdo completo.
📄 OpenAI expande ChatGPT Canvas para todos os usuários | Acesse o conteúdo completo.
📄 O modelo o1 da OpenAI não mostra seu pensamento, dando uma vantagem ao código aberto | Acesse o conteúdo completo.
🧠 Sapient estreia com novas arquiteturas de IA, visando superar o raciocínio dos Transformers com redes neurais recorrentes | Acesse o conteúdo completo.
🧠 O novo chip Trillium AI do Google oferece velocidade 4x e alimenta o Gemini 2.0 | Acesse o conteúdo completo.
📄 Ainda não chegamos lá': o lançamento do Sora recebe respostas mistas dos cineastas de IA, citando resultados inconsistentes e restrições de conteúdo | Acesse o conteúdo completo.
🧠 Treinando grandes modelos de linguagem para raciocinar em um espaço latente contínuo | Acesse o conteúdo completo.
📄 Por que os próximos saltos em direção à AGI podem “nascer em segredo” | Acesse o conteúdo completo.
ℹ️ O que devemos fazer se a IA se tornar consciente? Esses cientistas dizem que é hora de um plano | Acesse o conteúdo completo.

Isso é tudo por hoje, pessoal!

Me conta: o que você achou do conteúdo de hoje?

Faça Login ou Inscrever-se para participar de pesquisas.

Não perca nada!

Para mais notícias sobre IA, fique atento aos próximos conteúdos!

Caso tenha interesse, possuo alguns conteúdos já publicados em meu site. Dê uma olhada:

Confira mais conteúdos!

Reply

or to participate.