Category: Amazon Web Services (AWS)

57% do conteúdo na web foi criado por robôs, mostra estudo

57% do conteúdo na web foi criado por robôs, mostra estudo

Pesquisa mostra que material gerado por IA vem crescendo na internet (Imagem: Vitor Pádua / Tecnoblog)

Um estudo divulgado pela AWS nesta semana indica que 57% do conteúdo textual da internet já é gerado por IAs. A pesquisa mostra que a maioria do que é publicado na rede é tradução criada com Machine Translation, inteligências artificiais focadas em traduzir textos. Contudo, isso não é só ruim para os usuários e criadores, mas também prejudica o treinamento de IAs generativas.

Como os LLMs dependem de conteúdo humano e especializado para entregar uma informação mais precisa, a replicação de textos utilizando IAs e apenas com traduções impacta no desempenho das IAs generativas.

O estudo da AWS destaca que as traduções são falhas porque vêm de textos mal escritos. Consequentemente, esse material traduzido entregará informações erradas ou de má-qualidade para os usuários. Além disso, ainda há a questão de que o LLM “reciclará” conteúdos para o seu treinamento — é IA treinando IA, quase um esquema de pirâmide.

Inteligência artificial é usada para criar textos, que depois são usados para treinar as IAs, que aí são usadas para gerar mais textos e o ciclo não para (Imagem: Vitor Pádua / Tecnoblog)

Qualidade das respostas cai a cada prompt

A pesquisa mostra que a qualidade e precisão das respostas geradas pelo LLMs cai com o tempo. Se você acha que a IA do Google sugerir passar cola na pizza é ruim, espere mais alguns anos.

Para quem usa o ChatGPT, Gemini, Copilot ou outra IA para tarefas mais simples, essa queda de qualidade pode passar despercebida. Apesar disso, no fim de 2023 e início de 2024 tivemos o caso da “preguiça” do ChatGPT. Na Comunidade do Tecnoblog, alguns leitores já reclamaram de uma certa queda de qualidade das IAs generativas.

O estudo da AWS aponta uma solução para isso: o uso de tecnologias de detecção de material gerado por Machine Translation (MT). Ao contrário dos tradutores básicos, que praticamente traduzem palavra por palavra, as MTs usam IAs para avaliar o contexto do texto.

Com informações: Windows Central
57% do conteúdo na web foi criado por robôs, mostra estudo

57% do conteúdo na web foi criado por robôs, mostra estudo
Fonte: Tecnoblog

Amazon promete investigar se Perplexity AI está burlando bloqueio de sites

Amazon promete investigar se Perplexity AI está burlando bloqueio de sites

Chatbot da Perplexity estaria lendo matérias mesmo sem autorização das editoras (Imagem: Vitor Pádua / Tecnoblog)

A Amazon iniciou uma investigação para saber se a Perplexity AI está usando seus servidores para coletar conteúdo da web sem autorização. Há algumas semanas, Wired e Forbes acusaram a empresa de inteligência artificial de violar direitos autorais e plagiar matérias.

Segundo a Wired, um programa hospedado em um servidor da Amazon Web Services ignorou as instruções do Robots Exclusion Protocol e acessou textos publicados pela editora Condé Nast, da qual faz parte. A reportagem ainda afirma que The Guardian, Forbes e The New York Times detectaram atividades parecidas.

O Robots Exclusion Protocol é um padrão que contém uma série de instruções para permitir ou proibir o acesso automatizado às páginas. Elas devem ser armazenadas em um arquivo robots.txt no domínio do site. A própria Perplexity AI traz, em sua documentação, instruções de como usar este protocolo para rejeitar o robô da startup.

Apesar de usado desde os anos 1990 e respeitado por grandes empresas, o protocolo não bloqueia os robôs, apenas acrescenta uma sinalização para que eles leiam ou ignorem o conteúdo. Mesmo assim, a Amazon declarou à Wired que usuários de seus servidores são obrigados a seguir o que manda o arquivo robots.txt — a regra faz parte dos termos de serviço da empresa.

Atividade foi detectada em robô armazenado na Amazon Web Services (Imagem: Tony Webster / Flickr)

Sara Platnick, porta-voz da Perplexity, disse à Wired que a startup já respondeu às questões da AWS e negou que os robôs estejam desrespeitando os protocolos. Mesmo assim, ela afirma que, se o usuário especificar um endereço da web ao chatbot, o robô não levará em conta as instruções do arquivo robots.txt.

Aravind Srinivas, CEO da Perplexity, negou que a empresa ignore o protocolo de exclusão de robôs. O executivo alega que a empresa usa crawlers de terceiros além de seu próprio, e que o bot identificado pela Wired era um deles.

Perplexity AI vem sendo acusada de plágio

Nas últimas semanas, Wired e Forbes declararam que a Perplexity AI vem desrespeitando direitos autorais e deixando de dar créditos às publicações. Além do acesso indevido que a Wired identificou, a revista diz que o chatbot da startup praticamente copia suas reportagens e ainda gera resumos imprecisos do conteúdo.

A Forbes também trouxe reclamações similares. Uma matéria exclusiva foi praticamente replicada, com “frases estranhamente similares” e “trechos inteiramente roubados”, sem resumir o conteúdo. Para piorar, a Perplexity listou como fontes apenas sites que repercutiram a reportagem, sem colocar um link diretamente para a Forbes.

Com informações: Engadget, Wired
Amazon promete investigar se Perplexity AI está burlando bloqueio de sites

Amazon promete investigar se Perplexity AI está burlando bloqueio de sites
Fonte: Tecnoblog