• NoFinn
  • Posts
  • OpenAI + Microsoft + Harvard = Muitos dados para treinar IA de graça 😮

OpenAI + Microsoft + Harvard = Muitos dados para treinar IA de graça 😮

A nova era da IA do Google, ChatGPT e Sora offline & mais

E aí curioso, seja bem vindo à Nofinn, sua newsletter diária sobre Inteligência Artificial!

Vem conferir as principais novidades do setor! Se quiser escutar os conteúdos é simples:

🌐 Se você está na versão web ou no aplicativo basta dar clicar no player no topo da página, logo abaixo do título da postagem.

📧 Caso você esteja no e-mail é só clicar aqui, ou no banner no topo do e-mail e você será direcionado para a postagem na web, após isso é só dar play no topo da página.

🎧 E pra você que já está escutando o conteúdo, maravilha! Bora lá para o resumo de hoje.

🏃TLDR

🎓 A Universidade de Harvard anunciou o lançamento de um vasto dataset de treinamento de IA, financiado pela OpenAI e Microsoft. O conjunto inclui quase 1 milhão de livros de domínio público digitalizados pelo projeto Google Books, abrangendo clássicos literários e materiais técnicos em diversos idiomas. A iniciativa, liderada pelo Institutional Data Initiative de Harvard, visa democratizar o acesso a dados de alta qualidade, permitindo que pesquisadores e startups desenvolvam modelos de IA sem recorrer a materiais protegidos por direitos autorais. A abordagem é comparada ao impacto transformador do Linux como sistema operacional de código aberto.

🤖 💭 O Google DeepMind revelou dois novos projetos de IA avançados, Project Astra e Project Mariner, que marcam o início de sua "era agêntica". O Astra, apresentado inicialmente no Google I/O, é um assistente universal capaz de processar texto, imagens, vídeos e áudio em tempo real, com memória contextual de até 10 minutos para interações mais naturais. Agora em fase de testes expandidos, o Astra será integrado a produtos como Google Search, Lens e Maps, permitindo uma interação mais rica e intuitiva.

📴 Os serviços da OpenAI, incluindo ChatGPT, Sora e a API para desenvolvedores, enfrentaram uma grande interrupção global na quarta-feira, dia 11/12. A empresa relatou o problema em sua página de status e anunciou às 19h (horário do Pacífico, 00h horário de Brasília) que estava implementando uma solução. Embora a causa exata não tenha sido esclarecida, a interrupção coincidiu com o lançamento do Sora e a integração de ChatGPT com o Apple Intelligence no iOS 18.2, possivelmente gerando um aumento de tráfego que sobrecarregou os servidores. Muitos usuários enfrentaram dificuldades, recebendo mensagens de erro ou enfrentando limitações de capacidade nos serviços.

🤨 Existe muitos desafios de confiança em sistemas de IA, especialmente os modelos de linguagem como ChatGPT, destacando suas diferenças fundamentais em relação a ferramentas tradicionais, como calculadoras e algoritmos. Enquanto calculadoras oferecem consistência e confiabilidade inquestionáveis, a IA opera com incertezas e erros inerentes devido à sua natureza emergente e probabilística. Diferentemente de algoritmos que transferem a confiança para seus criadores, a IA exige confiança direta do usuário, mesmo quando suas respostas podem ser enganosas ou imprecisas. Isso é agravado pela sua capacidade de apresentar informações com uma confiança que muitas vezes mascara suas limitações.

Além disso, olha o que você verá hoje:

Bora lá?

🛠 Caixa de Ferramentas 🛠

Aqui estão algumas das ferramentas que separei hoje pra você:

  • Height.app - Ferramenta autônoma de gerenciamento de projetos.

  • Latitude - Plataforma de engenharia de prompts de código aberto para criar, avaliar e refinar seus prompts com IA.

  • Kvistly - Questionários de IA para melhorar o treinamento e formação de equipes.

  • Marqo - Crie prototipos rapidamente, acelere a iteração e implante aplicativos de IA poderosos sem problemas.

  • Adsby - Selecione as palavras-chave corretas, filtre as negativas e crie campanhas de alto desempenho com IA

OpenAI e Microsoft financiam um enorme conjunto de dados de treinamento de IA gratuito que será lançado por Harvard

A Universidade de Harvard anunciou o lançamento de um vasto dataset de treinamento de IA, financiado pela OpenAI e Microsoft. O conjunto inclui quase 1 milhão de livros de domínio público digitalizados pelo projeto Google Books, abrangendo clássicos literários e materiais técnicos em diversos idiomas. A iniciativa, liderada pelo Institutional Data Initiative de Harvard, visa democratizar o acesso a dados de alta qualidade, permitindo que pesquisadores e startups desenvolvam modelos de IA sem recorrer a materiais protegidos por direitos autorais. A abordagem é comparada ao impacto transformador do Linux como sistema operacional de código aberto.

Embora o dataset represente um passo importante na criação de alternativas éticas para treinamento de IA, especialistas apontam que seu impacto dependerá do uso em substituição a materiais protegidos por copyright. Harvard também está explorando colaborações com bibliotecas e instituições culturais para expandir a disponibilidade de dados de domínio público. Com iniciativas semelhantes, como o Common Corpus na França, o projeto busca transformar a maneira como a IA é treinada, reduzindo riscos legais e promovendo maior transparência no setor.

A nova era “agêntica” da IA do Google

O Google DeepMind revelou dois novos projetos de IA avançados, Project Astra e Project Mariner, que marcam o início de sua "era agêntica". O Astra, apresentado inicialmente no Google I/O, é um assistente universal capaz de processar texto, imagens, vídeos e áudio em tempo real, com memória contextual de até 10 minutos para interações mais naturais. Agora em fase de testes expandidos, o Astra será integrado a produtos como Google Search, Lens e Maps, permitindo uma interação mais rica e intuitiva.

O Project Mariner, por sua vez, é um agente de IA que utiliza extensões no navegador Chrome para executar tarefas automatizadas, como navegação e ações online. Embora esteja em fase inicial de testes, Mariner demonstra o potencial de IA para simplificar tarefas digitais complexas. Ambos os projetos são protótipos de pesquisa sem previsão de lançamento ao público, mas destacam o avanço da Google em criar agentes de IA com capacidades multimodais e maior aplicabilidade no dia a dia.

ChatGPT e Sora ficaram offline

Os serviços da OpenAI, incluindo ChatGPT, Sora e a API para desenvolvedores, enfrentaram uma grande interrupção global na quarta-feira, dia 11/12. A empresa relatou o problema em sua página de status e anunciou às 19h (horário do Pacífico, 00h horário de Brasília) que estava implementando uma solução.

Embora a causa exata não tenha sido esclarecida, a interrupção coincidiu com o lançamento do Sora e a integração de ChatGPT com o Apple Intelligence no iOS 18.2, possivelmente gerando um aumento de tráfego que sobrecarregou os servidores. Muitos usuários enfrentaram dificuldades, recebendo mensagens de erro ou enfrentando limitações de capacidade nos serviços.

Este incidente ocorreu durante a “12 Days of Shipmas,” uma campanha da OpenAI que promove lançamentos consecutivos de produtos. A interrupção levantou questões sobre a infraestrutura da empresa em meio ao crescimento da demanda por seus serviços. Apesar do contratempo, a OpenAI afirmou estar trabalhando ativamente para restaurar o funcionamento normal de suas plataformas e melhorar sua capacidade para lidar com futuros aumentos de tráfego.

Mais notícias ao redor do mercado de IAs

Confiabilidade na Era da IA

Existe muitos desafios de confiança em sistemas de IA, especialmente os modelos de linguagem como ChatGPT, destacando suas diferenças fundamentais em relação a ferramentas tradicionais, como calculadoras e algoritmos. Enquanto calculadoras oferecem consistência e confiabilidade inquestionáveis, a IA opera com incertezas e erros inerentes devido à sua natureza emergente e probabilística. Diferentemente de algoritmos que transferem a confiança para seus criadores, a IA exige confiança direta do usuário, mesmo quando suas respostas podem ser enganosas ou imprecisas. Isso é agravado pela sua capacidade de apresentar informações com uma confiança que muitas vezes mascara suas limitações.

Com o avanço acelerado da IA, a tecnologia está sendo aplicada em problemas que ultrapassam a capacidade de avaliação dos desenvolvedores e usuários. Os modelos de IA, ao serem implementados em cenários complexos, como recomendações personalizadas ou raciocínios avançados, muitas vezes ultrapassam os limites de suas capacidades. Para resolver isso, os engenheiros responsáveis por estes modelos devem avaliar rigorosamente as aplicações da IA, questionando sua adequação para cada problema, reconhecendo seus limites e implementando processos para mitigar erros antes de aplicá-los em larga escala. Essa abordagem seria essencial para evitar a dependência excessiva de sistemas falíveis em questões críticas.

Por fim, o artigo ressalta que, apesar da sua aparência convincente, a IA deve ser tratada como uma ferramenta imperfeita, comparável a um banco com pernas instáveis. Seu uso requer responsabilidade e transparência por parte de seus criadores, que devem se esforçar para garantir que a tecnologia seja aplicada com segurança e clareza. Isso inclui o desenvolvimento de práticas rigorosas de avaliação e uma comunicação honesta sobre suas limitações. Essa abordagem, argumenta o autor, é essencial para evitar falhas persistentes que comprometam a confiança dos usuários e a eficácia dos sistemas.

Conteúdos extras para você

Isso é tudo por hoje, pessoal!

Me conta: o que você achou do conteúdo de hoje?

Faça Login ou Inscrever-se para participar de pesquisas.

Não perca nada!

Para mais notícias sobre IA, fique atento aos próximos conteúdos!

Caso tenha interesse, possuo alguns conteúdos já publicados em meu site. Dê uma olhada:

Confira mais conteúdos!

Reply

or to participate.