Category: Stable Diffusion

Midjourney bane contas ligadas ao Stable Diffusion após caso de botnet

Midjourney bane contas ligadas ao Stable Diffusion após caso de botnet

Midjourney acusa rival do ramo de IA generativa de imagens de data scraping (Imagem: Vitor Pádua / Tecnoblog)

A Midjourney, empresa criadora de uma IA generativa de imagem, acusa a sua concorrente Stability AI de organizar uma operação de data scraping (raspagem de dados) em seu serviço. Segundo a Midjourney, a sua rival, desenvolvedora do Stable Diffusion, utilizou uma botnet para coletar dados de prompts e imagens geradas pela sua IA. A ação de data scraping, ocorrida no dia 6 de março, causou uma queda dos serviços por quase 24 horas.

Uma investigação interna da Midjourney aponta que o ataqueda botnet foi realizada por duas contas ligadas a funcionários da Stability AI. Como consequência dessa investigação, todos os perfis dos empregados da concorrente foram banidos por tempo indeterminado do Midjourney. A empresa também atualizou sua política de uso, incluindo que funcionários de concorrentes serão banidos em casos de “automação agressiva” ou causar queda do serviço.

Stability AI se defende das acusações

Midjourney apontou o dedo para a Stability AI, que se pronunciou sobre o caso (Imagem: Vitor Pádua & Midjourney/Tecnoblog)

No X/Twitter, Emad Mostaque, CEO da Stability AI, se defendeu da acusação dizendo que a empresa não ordenou nenhuma ação contra a Midjourney. Mostaque ainda informou que a sua companhia abriu uma investigação interna sobre o caso. O CEO da Stability aproveitou a situação para destacar que o modelo SD3, usado pelo Stable Diffusion, é o melhor do mercado — em outras palavras, disse que não teria por que raspar dados de um serviço pior.

David Holz, fundador do Midjourney, respondeu a Mostaque no X/Twitter, comunicando que enviara informações para ajudá-lo na investigação interna.

O suposto ataque de botnet ao Midjourney ocorreu no dia 2 de março, derrubando a IA por quase 24 horas. Já no dia 6, a empresa publicou uma nota em seu Discord informando que a causa da queda era um ataque originário de contas pagas. Nessa nota, a Midjourney já acusava funcionários da Stability AI.

Com informações: The Verge
Midjourney bane contas ligadas ao Stable Diffusion após caso de botnet

Midjourney bane contas ligadas ao Stable Diffusion após caso de botnet
Fonte: Tecnoblog

OpenAI e outras empresas podem ter que revelar uso de material com copyright

OpenAI e outras empresas podem ter que revelar uso de material com copyright

A inteligência artificial é um assunto em alta, e seus aspectos positivos e negativos ainda estão sob avaliação. A União Europeia, por exemplo, agora está interessada na questão dos direitos autorais. O bloco discute obrigar as empresas a revelar se materiais protegidos por copyright foram usados para treinar robôs como o ChatGPT.

Bandeiras da União Europeia (Imagem: Thijs ter Haar/Wikimedia Commons)

Esta exigência foi adicionada ao Regulamento da Inteligência Artificial nas duas últimas semanas, disse uma fonte interna à Reuters. Alguns membros do Parlamento Europeu queriam proibir o uso de material com copyright, mas uma proposta mais branda, exigindo apenas transparência, venceu as discussões.

Dessa forma, empresas que desenvolvem ferramentas geradoras de conteúdo, como o ChatGPT, o Dall-E, o Midjourney e muitas outras, precisarão revelar qualquer uso de material protegido por direitos autorais para treinar seus sistemas.

O Regulamento da Inteligência Artificial (ou AI Act, em inglês) vem sendo discutido há dois anos, antes mesmo do lançamento do ChatGPT pela OpenAI e de todo o destaque sobre o tema que veio desde então.

O Parlamento Europeu já tinha um rascunho da lei, e seus membros concordaram em avançar com a matéria para a fase de discussões.

As inteligências artificiais generativas dependem de treinamento com grandes quantidades de dados. Assim, elas entendem diversas formas de escrever, acumulam informações, aprendem como desenhar em vários estilos, e assim por diante.

Processos contra empresas podem aumentar

Empresas como a OpenAI se recusam a abrir detalhes sobre os dados usados para treinar seu software. Caso a legislação europeia seja aprovada, elas precisarão revelar de onde foi retirado o conteúdo.

Isso pode ter consequências negativas para as companhias: os processos por violação de direitos autorais devem se multiplicar.

Imagem gerada pelo Stable Diffusion tem marca d’água da Getty Images (Imagem: Reprodução/The Verge)

A questão do copyright já é uma realidade no cenário da inteligência artificial, principalmente entre artistas e fotógrafos. A empresa de bancos de imagens Getty Images está processando a Stability AI, por exemplo.

O Stable Diffusion, modelo desenvolvido pela Stability AI, foi “pego” criando imagens com a marca d’água da Getty. Isso indica que as fotos da empresa foram usadas indevidamente para treinar a inteligência artificial.

Além da briga entre as duas empresas, três artistas moveram uma ação coletiva contra a Stability AI, a Midjourney e a DeviantArt.

Eles alegam que as desenvolvedoras violaram os direitos de milhões de artistas ao usar 5 bilhões de imagens raspadas da internet sem o consentimento dos artistas.

Deixando as imagens um pouco de lado, a Microsoft e sua subsidiária GitHub foram acionadas na Justiça dos EUA por causa da ferramenta Copilot.

O Copilot foi treinado usando códigos abertos. A licença desses códigos, porém, exige que o autor esteja listado em trabalhos derivados.

Mesmo assim, o Copilot cria longos scripts a partir de trabalhos protegidos por essas licenças sem dar nenhum crédito, o que seria uma violação da lei de direitos autorais.

Com informações: Reuters, The Verge
OpenAI e outras empresas podem ter que revelar uso de material com copyright

OpenAI e outras empresas podem ter que revelar uso de material com copyright
Fonte: Tecnoblog

StableLM é um concorrente de código aberto para o ChatGPT

StableLM é um concorrente de código aberto para o ChatGPT

A Stability AI ficou famosa nos últimos meses com o Stable Diffusion, modelo de geração de imagens com inteligência artificial. Agora, ela vai partir para o campo da escrita. A empresa anunciou uma alternativa ao ChatGPT chamada StableLM, com código aberto.

Demonstração do StableLM (Imagem: Giovanni Santa Rosa/Tecnoblog)

O StableLM gera texto prevendo qual o próximo token, como é chamado o fragmento de palavra. A sequência começa com uma informação fornecida por um ser humano.

O funcionamento é bem parecido com o GPT-4, modelo grande de linguagem (LLM, na sigla em inglês) que serve de base para o ChatGPT.

“Modelos de linguagem formarão a espinha dorsal da nossa economia digital, e queremos que todo mundo possa opinar nesses projetos”, diz a Stability AI no blog post anunciando a novidade. “Modelos como o StableLM demonstram nosso compromisso com tecnologias de inteligência artificial transparentes, acessíveis e solidárias.”

StableLM promete ser mais eficiente

Por enquanto, o StableLM está em fase alpha. Ele foi disponibilizado no GitHub, nos tamanhos de 3 bilhões e 7 bilhões de parâmetros. A Stability AI promete que os modelos de 15 bilhões e 65 bilhões de parâmetros serão liberados em breve.

Os parâmetros são variáveis que um modelo usa para aprender a partir dos dados de treinamento. Números menores significam que os modelos podem ser mais eficientes, podendo rodar localmente em notebooks ou smartphones.

Por outro lado, eles precisam de projetos mais elaborados para conseguir entregar bons resultados usando menos recursos.

O StableLM é mais um dos modelos grandes de linguagem a prometer desempenho próximo ao do GPT-3, da OpenAI, com número menor de parâmetros — o GPT-3 usa 175 bilhões.

Outros são o LLaMA, da Meta; o Alpaca, de Stanford; o Dolly 2.0; e o Cerebras-GPT.

Os modelos foram disponibilizados sob a licença Creative Commons BY-SA-4.0. Isso significa que projetos derivados devem dar créditos ao autor original e ser compartilhados usando a mesma licença.

Por enquanto, é possível testar uma versão do modelo de 7 bilhões de parâmetros já customizada para chatbots no Hugging Face.

Com informações: Stability AI, Ars Technica
StableLM é um concorrente de código aberto para o ChatGPT

StableLM é um concorrente de código aberto para o ChatGPT
Fonte: Tecnoblog