Category: GitHub

Robôs de IA mentem para ler as páginas na web e irritam desenvolvedores

Robôs de IA mentem para ler as páginas na web e irritam desenvolvedores

Big techs e empresas de IA desconsideram restrições e empregam diversas táticas para contornar bloqueios (ilustração: Vitor Pádua/Tecnoblog)

Resumo

Robôs de IA sobrecarregam servidores de projetos open-source, gerando tráfego semelhante a ataques DDoS e levando a bloqueios de IPs.
Empresas como a Amazon contornam restrições usando IPs residenciais e mudando agentes.
Read The Docs relata que bloqueios de robôs de IA reduziram o tráfego em 75%, economizando US$ 1.500 mensais no gasto com largura de banda.

Diversos desenvolvedores estão relatando o impacto dos robôs de IA em projetos de código aberto. Esses robôs estão sobrecarregando e desestabilizando os servidores de sites gits, nos quais desenvolvedores publicam códigos open-source e contribuem para projetos. Em alguns casos, devs estão bloqueando o acesso de alguns países aos seus servidores.

Xe Iaso, um dos desenvolvedores que publicou um relato sobre a situação, conta que os crawlers de IA (robôs que varrem a internet por dados para treinamento) da Amazon chegaram a derrubar seu servidor — praticamente como um ataque DDoS. Iaso explica ainda que a big tech desenvolve robôs mentirosos para driblar as restrições ao uso do conteúdo para treinamento de IA.

Como os robôs enganam os sites para acessar seus conteúdos?

Entre as táticas aplicadas pela Amazon para burlar os bloqueios de sites estão usar IPs residenciais como proxies e mudar o agente (escondendo que a Amazon é a autora). Em seu blog, Iaso publicou um relato frustrante sobre como a big tech é incisiva e agressiva na sua “busca por conhecimento”.

Amazon é uma das empresas que ignora restrições de sites, usando até IPs residenciais para enganar os bloqueios (ilustração: Vitor Pádua/Tecnoblog)

Para tentar solucionar a queda do seu servidor git, Iaso o protegeu com uma VPN e criou um sistema de verificação batizado de Anubis. O Anubis é praticamente um captcha, no qual quem deseja acessar o conteúdo da biblioteca precisa resolver um problema.

Um estudo da LibreNews mostra que em torno de 97% do tráfego de alguns projetos de código aberto vem de robôs de IA. A “sede” das empresas de IA por treinar seus LLMs vem sobrecarregando os servidores devido ao enorme aumento de tráfego. Isso também eleva os custos de largura de banda dos servidores.

Outro projeto afetado pelo alto volume de tráfego foi o Fedora Pagure. Uma das medidas tomadas pela equipe para se proteger do “DDoS” de crawlers de IA foi bloquear todo o tráfego vindo do Brasil. O GitLab de infraestrutura da KDE foi derrubado por um alto volume de tráfego de robôs com IPs da Alibaba.

Anubis é útil, mas também tem problemas

Devs de projetos open-source estão trabalhando em conjunto para mitigar os danos dos robôs de IA (ilustração: Vitor Pádua/Tecnoblog)

Como as empresas burlam as restrições, seja ignorando os bloqueios do robots.txt ou mudando o IP para evitar a sua detecção, o sistema Anubis criado por Iaso foi adotado por outros projetos de código-aberto. Contudo, ainda que eficiente, o sistema sofre com atrasos quando é acessado por muitos usuários — sejam eles legítimos ou não.

O alto tráfego também aumenta os custos dos projetos open-source. O Read The Docs relatou que o bloqueio de robôs de IA derrubou em 75% o tráfego nos sites, saindo de 800 GB de transferência de dados por dia para 200 GB por dia. Isso gerou uma redução de US$ 1.500 (R$ 8.601) no gasto com largura de banda.

No início do mês, uma pesquisa mostrou que as IAs, além de darem respostas erradas em 60% do tempo, também violam as restrições de sites contra crawlers.

A comunidade de projetos de código-aberto trabalha em conjunto para se proteger dos robôs. Uma das medidas colaborativas da comunidade é listar os crawlers e desenvolver códigos padrão para bloquear o acesso desses robôs.

Com informações da Ars Technica
Robôs de IA mentem para ler as páginas na web e irritam desenvolvedores

Robôs de IA mentem para ler as páginas na web e irritam desenvolvedores
Fonte: Tecnoblog

Bluesky vai permitir que usuários escolham se IAs podem acessar suas publicações

Bluesky vai permitir que usuários escolham se IAs podem acessar suas publicações

CEO do Bluesky revelou que plataforma quer ferramenta que dê aos usuários a escolhe de fornecer conteúdo para IAs (ilustração: Vitor Pádua/Tecnoblog)

Resumo

O Bluesky permitirá que usuários controlem o acesso de IAs às suas publicações.
A solução utiliza scripts para bloquear crawlers de IA, que geralmente são respeitados por buscadores.
A proposta da rede social está disponível no GitHub.

O Bluesky promete em breve liberar a opção para que os usuários escolham se IAs podem utilizar suas publicações para treinamento. A declaração foi feita por Jay Graber, CEO do microblogging, durante uma palestra no SXSW. O Bluesky não desenvolve nenhuma IA generativa — o problema são as empresas que usam publicações da rede social para treinar seus LLMs.

Como deve funcionar o sistema “anti IA” do Bluesky?

Uma das ideias é que a opção de impedir que IAs usem o conteúdo publicado pelos usuários seja similar ao bloqueio usado em sites de notícias. Segundo a CEO do Bluesky, os scripts que impedem os crawlers das IAs costumam ser respeitado pela maioria dos buscadores — ainda que a Perplexity seja ótima em violar esses bloqueios.

X, ao contrário do Bluesky, possui IA que usa conteúdos dos usuários no seu treinamento — e não há opção de negar isso (foto: Giovanni Santa Rosa/Tecnoblog)

Assim, Graber explica que essa pode ser a base para a solução que o Bluesky quer implementar. Sendo uma rede social de código aberta e descentralizada, é possível acessar a proposta da plataforma no Github.

No ano passado, foi revelado que um milhão de publicações do Bluesky estavam em um banco de dados no Hugging Face, uma espécie de plataforma Git para desenvolvimento de machine learning. Com essa proposta do Bluesky, usuários que são contra o uso de suas publicações para treinamentos de IAs poderão evitar que isso se repita.

Bluesky trouxe mais novidades para a plataforma nesta semana

Lista de novidades da nova atualização do Bluesky (imagem: divulgação)

No início dessa semana, a rede social também publicou o update 1.99. A novidade agora permite que usuários publiquem vídeos de até três minutos, aba separada para DMs de usuários desconhecidos, um novo atalho para silenciar contas e três novas traduções — lembrando que há meses a rede social já conta com tradução em português.

O Bluesky liberou o upload de vídeos em setembro do ano passado. Como não possui grandes investimentos, a chegada de novos recursos é feita de forma gradual. Por exemplo, a plataforma não permite o upload de GIFs a partir do dispositivo do usuário, mas há integração com o Tenor para publicar GIFs desta plataforma.

Com informações de TechCrunch e Android Headlines
Bluesky vai permitir que usuários escolham se IAs podem acessar suas publicações

Bluesky vai permitir que usuários escolham se IAs podem acessar suas publicações
Fonte: Tecnoblog

Microsoft coloca modelo de IA da DeepSeek no Azure e no GitHub

Microsoft coloca modelo de IA da DeepSeek no Azure e no GitHub

Microsoft anunciou integração com modelos da DeepSeek, mas investiga se empresa copiou modelos da OpenAI (ilustração: Vitor Pádua/Tecnoblog)

Resumo

A Microsoft anunciou que o modelo de IA DeepSeek R1 estará disponível nas plataformas Azure AI Foundry e GitHub.
Após o sucesso repentino do chatbot da DeepSeek, a big tech rapidamente incluiu o modelo, apesar das suspeitas de que a startup chinesa teria extraído indevidamente dados da OpenAI.
A Microsoft também planeja lançar versões “destiladas” do DeepSeek R1 para PCs com certificação Copilot+.

A Microsoft anunciou, nesta quarta-feira (29/01), que o modelo de inteligência artificial R1, da DeepSeek, estará disponível nas plataformas profissionais Azure AI Foundry e no GitHub. Além disso, a companhia prometeu que haverá versões “destiladas” da tecnologia para computadores com o selo Copilot+.

O Azure AI Foundry é uma plataforma de computação em nuvem que oferece diversos serviços de inteligência artificial, com acesso a APIs de mais de 1.800 modelos de variados tipos. Já o GitHub é uma plataforma para desenvolvedores. Nela, a Microsoft incluirá recursos adicionais e guias para integrar o DeepSeek R1 aos aplicativos criados por profissionais.

Por que esta integração é relevante?

O movimento da Microsoft chama a atenção por dois motivos. Um deles é que a empresa foi rápida para incluir o DeepSeek R1 entre os modelos disponíveis no Azure AI Foundry e no GitHub. Vale dizer que o R1 tem código aberto.

O outro é que a própria Microsoft revelou ter identificado um movimento de extração indevida de grandes volumes de dados da OpenAI. Agora, a gigante de Redmond investiga se o caso tem ligação com a DeepSeek. Vale lembrar que a Microsoft é uma das principais investidoras da OpenAI.

DeepSeek chegou ao topo das listas de apps mais baixados em janeiro de 2025 (foto: Giovanni Santa Rosa/Tecnoblog)

Nesta quarta-feira (29/01), a desenvolvedora do ChatGPT disse ter encontrado evidências de que a companhia chinesa usou técnicas de “destilação”, ou seja, treinou seus modelos a partir de perguntas e respostas de outros modelos — no caso, modelos da OpenAI.

Qual o próximo passo do DeepSeek R1 na Microsoft?

No mesmo comunicado, a Microsoft afirmou que, em breve, consumidores poderão usar versões “destiladas” do DeepSeek R1 em PCs com a certificação Copilot+, com execução local. Este “selo” identifica computadores que cumprem certos requisitos para bom desempenho em tarefas de IA, como 16 GB de RAM e NPU de 40 TOPS ou mais.

Por versões “destiladas”, entenda modelos menores derivados do R1, mais adequados para rodar com recursos limitados. A Microsoft não deu mais detalhes de como seriam estes modelos.

Com informações da Microsoft, Verge, TechCrunch e Reuters
Microsoft coloca modelo de IA da DeepSeek no Azure e no GitHub

Microsoft coloca modelo de IA da DeepSeek no Azure e no GitHub
Fonte: Tecnoblog

Winamp tem repositório de código-fonte aberto apagado sem explicação

Winamp tem repositório de código-fonte aberto apagado sem explicação

Winamp clássico (imagem: Emerson Alecrim/Tecnoblog)

No final de setembro, o código-fonte do clássico reprodutor de mídia Winamp foi aberto. Mas não da maneira convencional: a licença de uso do código não permite a distribuição de softwares derivados, por exemplo. Esse pode ter sido um dos fatores que, aparentemente, fizeram a Llama Group apagar o repositório de código do player.

O código-fonte do Winamp estava disponível no GitHub. Mas, desde a semana passada, o link para o projeto exibe um erro de página não encontrada. Até o momento, não há explicação oficial para o que teria feito o repositório sumir menos de um mês depois de ter sido criado.

Nem tão aberto assim

De acordo com o Ars Technica, há pelo menos dois fatores que podem ter levado ao sumiço do repositório. Um são as críticas que a iniciativa vinha recebendo pelo fato de o código do Winamp não ter sido aberto de forma ampla.

Normalmente, projetos de código aberto são disponibilizados com base em licenças abrangentes, como GPL e MIT. Contudo, o código-fonte do reprodutor foi liberado por meio de uma licença própria, chamada de Winamp Collaborative License (WCL).

O maior problema da WCL é que essa licença permite que o desenvolvedor use, modifique e estude o software, ou faça contribuições voluntárias para o projeto. Mas a pessoa não pode distribuir versões modificadas do player. Projetos derivados devem ser mantidos para uso pessoal, consequentemente.

A reação da comunidade foi imediata. Apesar da proibição, mais de 2.600 forks (projetos derivados) do Winamp foram criados em um visível movimento de protesto contra as restrições da licença WCL.

Para completar, alguns desenvolvedores destacaram que o repositório do Winamp pode ter liberado, sem autorização, o código-fonte de componentes externos ao projeto, a exemplo do software do servidor Shoutcast para transmissões de áudio.

É possível que esses dois fatores, especialmente o último, tenha feito a Llama Group (atual responsável pelo Winamp) eliminar o repositório, mas não há confirmação sobre isso. O Ars Technica e outros veículos pediram um posicionamento sobre o assunto, mas a companhia não se manifestou até o momento.

Enquanto isso, a abertura do código do Winamp fica em uma espécie de “limbo”. Ninguém sabe o que acontecerá com o projeto.

Winamp clássico e suas skins (imagem: reprodução/Winamp Skin Museum)

Winamp fez sucesso no Windows XP

O Winamp surgiu em 1997 e, anos depois, se tornou muito popular, principalmente entre usuários do Windows XP. A facilidade de uso, os recursos de reprodução e a capacidade de personalização de visual oferecida pelas “skins” contribuíram para o sucesso do player.

Com a popularização do streaming, o Winamp foi sendo deixado de lado. O reprodutor chegou a ser relançado em 2018 e vinha sendo atualizado desde então, mas sem o sucesso de antes. Apesar disso, o reprodutor ainda tem fãs. Prova disso é a versão física do Winamp criada por um deles.
Winamp tem repositório de código-fonte aberto apagado sem explicação

Winamp tem repositório de código-fonte aberto apagado sem explicação
Fonte: Tecnoblog

IA do GitHub alerta e corrige vulnerabilidades em códigos

IA do GitHub alerta e corrige vulnerabilidades em códigos

GitHub vai utilizar inteligência artificial para corrigir erros em códigos (Imagem: Divulgação/GitHub)

O GitHub anunciou nesta semana o lançamento da AI Autofix, ferramenta que utiliza inteligência artificial para detectar bugs e possíveis vulnerabilidades em códigos. O recurso foi desenvolvido pela Sentry, empresa de tecnologia que desenvolve soluções de segurança e correção de código. A AI Autofix servirá como um complemento ao GitHub Copilot, outra ferramenta de IA que auxilia desenvolvedores.

O GitHub já havia apresentado uma prévia da AI Autofix em novembro de 2023, acompanhando um período no qual a Microsoft, sua proprietária, apresentava novos recursos do Copilot. O Copilot é a linha da big tech para serviços ligados a sua IA generativa. A AI Autofix está disponível para os clientes do GitHub Advance Security — ou GHAS, um serviço comprado à parte para os clientes do plano GitHub Enterprise.

AI Autofix ainda está em beta, mas já pode ser útil

Apesar do lançamento para todos os usuários do GHAS, a AI Autofix ainda está em beta. Pierre Tempel, gerente de produto do GitHub, afirma que a ferramenta é capaz de reconhecer mais de 90% de alertas para JavaScript, TypeScript, Java e Python. Mesmo em beta, a AI Autofix já pode facilitar o trabalho dos desenvolvedores.

AI Autofix do GitHub notificará se encontrar uma falha ou bug em código (Imagem: Divulgação/GitHub)

Ao detectar um bug ou vulnerabilidade, como mostra a imagem, a AI Autofix enviará uma notificação. Na janela que abrir, haverá uma mensagem explicando a causa do erro ou da falha de segurança. Então, a AI Autofix passará uma sugestão de correção — o usuário poderá aceitar ou não essa dica da inteligência artificial.

Assim como o GitHub Copilot, essa nova ferramenta economiza tempo para os desenvolvedores. Eles não precisam ir até a linha e editar o código, basta autorizar que a AI Autofix aplique a sugestão. Para quem não conhece, o GitHub Copilot sugere o restante do código conforme o dev vai escrevendo — similar ao Gmail, Word e teclado de smartphones com suas funções de auto-completar palavras ou orações.

E claro, a grande vantagem da AI Autofix é de diminuir a probabilidade de desenvolvedores lançarem sistemas com falhas de segurança. O GitHub afirma ainda que essa ferramenta recebeu um incremento da tecnologia do Copilot.

Com informações: TechCrunch e The Hacker News
IA do GitHub alerta e corrige vulnerabilidades em códigos

IA do GitHub alerta e corrige vulnerabilidades em códigos
Fonte: Tecnoblog

GitHub Copilot X é um chatbot com GPT-4 para ajudar desenvolvedores

GitHub Copilot X é um chatbot com GPT-4 para ajudar desenvolvedores

Um dos usos mais interessantes para a inteligência artificial é escrever código. Com instruções simples, ela é capaz de gerar várias linhas de comando. Para quem trabalha nessa área, vai ficar mais fácil usar esse tipo de recurso. O GitHub anunciou nesta quarta-feira (22) a nova versão do seu Copilot. Chamado Copilot X, ele usa o GPT-4 da OpenAI como base e ficou mais parecido com o ChatGPT.

GitHub Copilot X (Imagem: Divulgação/GitHub)

O Copilot foi apresentado em junho de 2021 e oficializado em junho de 2022. A ferramenta usava IA para sugerir códigos, funções complexas e testes unitários completos. As recomendações aparecem em tempo real.

A nova versão parece mais completa. O Copilot X, segundo o GitHub, é inspirado no ChatGPT: ele tem uma interface de chat que se integra com o VS Code e o Visual Studio.

Além de interagir desta forma, a inteligência artificial reconhece o código escrito e mensagens de erro. Assim, o desenvolvedor pode pedir uma análise profunda, com explicações do que cada bloco de código deve fazer. Ele até sugere correções de bugs.

GitHub Copilot X sugerindo correção de bug no chat (Imagem: Divulgação/GitHub)

Outro recurso adicionado é o de reconhecimento de voz. Com ele, os programadores poderão falar instruções em linguagem natural. A inteligência artificial, então, se encarrega de criar o código.

O novo Copilot usa o GPT-4, da OpenAI, como base. Vale lembrar que o GitHub foi comprado pela Microsoft em 2018, por US$ 7,5 bilhões.

A mesma Microsoft investiu outros bilhões de dólares na OpenAI, e vem colocando tecnologias do tipo em seus produtos, como o Bing e o Microsoft 365.

IA em documentação e pull requests

O Copilot vai além de sugerir códigos e correções, e o GitHub está preparando novas funcionalidades, que ainda serão testadas.

A ferramenta pretende criar descrições para pull requests, como são chamadas as solicitações para incluir alterações feitas em um projeto inicial.

Ainda nesse campo, a inteligência artificial vai identificar se um pull request não foi testado o suficiente e sugerir como fazer isso. As recomendações podem ser aceitas, editadas ou recusadas.

O GitHub criou ainda o Copilot for Docs. A ferramenta, ainda em fase experimental, pode gerar respostas para perguntas sobre a documentação do projeto.

Ele traz informações sobre linguagem, frameworks e tecnologias que estão sendo usadas. Por enquanto, ela vai funcionar com documentações para React, Azure Docs e MDN.

Com informações: GitHub
GitHub Copilot X é um chatbot com GPT-4 para ajudar desenvolvedores

GitHub Copilot X é um chatbot com GPT-4 para ajudar desenvolvedores
Fonte: Tecnoblog