Category: Inteligência Artificial

Dall-E 3 será integrado ao ChatGPT e promete criar imagens melhores

Dall-E 3 será integrado ao ChatGPT e promete criar imagens melhores

A OpenAI anunciou nesta quarta-feira (20) o Dall-E 3, nova versão do seu modelo de inteligência artificial para criação de imagens. Como era de se esperar, a promessa é de que as artes geradas terão uma qualidade superior. Outra novidade é que vai dar para usar a ferramenta diretamente do ChatGPT. A previsão é que ele chegue em outubro.

Uma das ilustrações apresentadas pela OpenAI (Imagem: Divulgação/OpenAI)

Entre as melhorias na qualidade das imagens, a OpenAI promete que o Dall-E 3 será capaz de fazer mãos e textos melhores, dois pontos fracos das ferramentas do tipo disponibilizadas até aqui. Também será possível pedir ajustes em uma imagem já criada.

A empresa diz que os resultados serão mais fiéis ao que os usuários solicitarem. Para ilustrar, ela mostrou um desenho de um simpático abacate cortado ao meio, sem caroço, no divã, dizendo se sentir vazio por dentro.

Desenhos complexos e com textos devem ficar melhores no Dall-E 3 (Imagem: Divulgação/OpenAI)

Dall-E 3 será integrado ao ChatGPT

O Dall-E 3 também será integrado ao ChatGPT. Assim, os usuários não precisarão de duas ferramentas diferentes para gerar textos e imagens — vai dar para pedir tudo diretamente ao chatbot.

A nova versão da inteligência artificial geradora de imagens deve chegar em outubro para assinantes do ChatGPT Plus, plano pago que custa US$ 20 mensais, e também para os usuários corporativos.

OpenAI coloca regras para evitar acusações de plágio

Outra mudança está nas proteções. O Dall-E 3 deve rejeitar pedidos para criar uma imagem ao estilo de um artista vivo — você deve conseguir solicitar um quadro do Michael Jordan no estilo do Van Gogh, mas não do Romero Britto, por exemplo.

Além disso, artistas poderão impedir que todas as suas obras ou algumas delas não sejam usadas para treinar modelos de inteligência artificial da OpenAI.

Essas novidades parecem vir para evitar problemas relacionados a direitos autorais, como acusações de plágio, que surgiram desde que ferramentas do tipo foram liberadas para o público.

A Stability AI, concorrente da OpenAI, foi processada pela Getty Images, por exemplo. As criações do Stable Diffusion muitas vezes vinham com marcas d’água do banco de imagens. Para a Getty, isso é um indício de violação de direitos autorais.

Com informações: OpenAI, Axios, TechCrunch
Dall-E 3 será integrado ao ChatGPT e promete criar imagens melhores

Dall-E 3 será integrado ao ChatGPT e promete criar imagens melhores
Fonte: Tecnoblog

Google Bard ganha integração com Gmail, Docs, Maps e YouTube

Google Bard ganha integração com Gmail, Docs, Maps e YouTube

A ferramenta de inteligência artificial Google Bard, mantida pelo gigante da internet, ganha nesta terça-feira (19) sua maior expansão em seis meses. O Google anunciou o funcionamento da plataforma com “extensões”, como são chamados os sistemas para interligar a IA a outros produtos digitais da empresa. Será possível buscar conteúdo em mensagens do Gmail, em arquivos armazenados no Docs (ou Workspace, como é chamado atualmente), no Maps e até mesmo em vídeos do YouTube.

Google anunciou chegada do Bard ao Brasil em 13.07.2023 (Imagem: Divulgação/Google e Vitor Pádua/Tecnoblog)

De acordo com o Google, a ferramenta de IA também ganha integração com informações de hotéis e de voos armazenadas no mecanismo de busca.

As novidades estão disponíveis no Brasil, mas só funcionam em inglês. Outros idiomas serão acrescentados “em breve”, de acordo com a companhia, que não mencionou prazos.

Extensões no Google Bard

A integração do Bard com outros aplicativos é chamada de “extensão”. A empresa explica que cada plataforma pode trazer dados interessantes para a elaboração de uma resposta mais completa.

A companhia divulgou a seguinte explanação numa nota enviada a jornalistas: “A gente vive a vida circulando entre diferentes apps e janelas. Com as extensões, porém, o Bard passa a ter uma porção de ‘ajudantes’ que trazem apenas as informações necessárias de cada um desses aplicativos. Assim, em vez de passar horas pesquisando voos e fazendo planos para o dia 12 de junho, basta pedir que o Bard pesquise voos no Dia dos Namorados, floriculturas perto do aeroporto e até escreva um poema para surpreender aquela pessoa especial. Tudo isso numa única conversa.”

Demonstração de pergunta ao Bard sobre emails que tratam de uma viagem ao Grand Canyon (Imagem: Divulgação/Google)

Eu participei de uma roda de conversa na qual executivos da empresa responderam dúvidas de repórteres. Nela estava presente Patrick Kane, diretor de gerenciamento de produtos do Google. Ao perguntar sobre a privacidade dos dados pessoais dos usuários, Kane disse que “qualquer interação com o Google Workspace não é revisada por humanos, não será usada em formatos de publicidade no futuro, e nem para treinar o Bard”.

Autoria do conteúdo

O principal responsável pela ferramenta digital também disse que o Google tem o objetivo de “amplificar os mecanismos para que as pessoas chequem as informações” apresentadas pelo Bard. Diante do feedback dos usuários, a plataforma passa a exibir um ícone de “G” que rapidamente diz o nível de confiança de cada trecho do texto gerado pela inteligência artificial.

Interface do Google Bard informa origem de trechos de conteúdo (Imagem: Divulgação/Google)

Na prática, o Google Bard exibe de forma mais explícita a fonte da informação. As demonstrações feitas pela empresa de internet continham citações com fundo verde, por exemplo. Ao clicar naquela frase, o sistema mostrou o site responsável pela informação. Já trechos com fundo laranja não tinham uma fonte identificada, o que pode ser um indício de alucinação da máquina.

O Google não deu detalhes sobre como irá remunerar os produtores do conteúdo que é reprocessado e exibida pela inteligência artificial.

Veja exemplos de comandos para o Bard

O Google divulgou a seguinte lista de comandos que passam a funcionar com o Bard a partir da atualização de hoje. Não custa lembrar que os prompts devem estar em inglês. Ainda que o Bard funcione em mais de 40 idiomas, o update de agora só vale para esta língua.

Pedidos em separado

ExtensãoDescriçãoExemplo de pedidoYouTubeDescubra e aprenda com vídeos do YouTube, por meio de conversas com o BardMostre um modelo de como escrever um discurso de padrinho de casamento, e me dê exemplos de vídeos de YouTube que possam ajudar.MapasAproveite informações baseadas em localização, e concretize seus planosOnde posso levar meu filho de três anos para escolher abóboras de Halloween, e me dê ideias de artes inspiradas no outono que a gente possa fazer em casa.VoosAcesse informações sobre voos, em tempo real, e planeje viagens sob medidaMostre voos para Austin, no Texas, e me dê ideias de passeios para fazer lá. Que tal incluir também Houston?HotéisEncontre hotéis com base em critérios importantes para você, da mesma maneira que você pede dicas para um amigoEncontre hotéis para uma viagem de quatro dias a São Francisco, no Ano Novo.GmailEncontre, resuma e obtenha respostas nos seus e-mails, de forma rápida e simplesFaça um resumo das últimas entrevistas que marquei para visitar e conhecer escolas, e coloque as informações numa tabela, com data e horário.DocsEncontre, resuma e obtenha respostas nos seus documentos, de forma rápida e simplesEncontre o arquivo enviado por Ashley sobre o projeto de limpeza da praça do bairro, e faça um resumo em cinco pontos da proposta de revitalização da praçaDriveEncontre, resuma e obtenha respostas nos seus arquivos PDF, de forma rápida e simplesEncontre no meu Drive o mais recente contrato de aluguel e verifique o valor do depósito caução que eu já realizeFonte: Google

Pedidos combinados

ExtensãoExemplo de pedido combinadoDocs e MapasQuais são os lugares listados no meu arquivo Costa Rica 2024 // Mostre todos esses lugares num mapaGmail, Voos, Hotéis, Mapas e YouTubeQuais são as datas propostas pelo Erik no e-mail sobre a caminhada que vamos fazer na viagem ao Grand Canyon? // Mostre voos para Phoenix nas datas propostas,e mostre hotéis próximos à entrada do Parque Nacional Grand Canyon // Crie um itinerário para a caminhada no Grand Canyon, de ponta a ponta, e inclua uma sugestão de lista de bagagemVoos e MapasEncontre voos sem escala para Chicago no feriado de Ação de Graças. Mostre os melhores lugares para comprar flores assim que eu sair do aeroporto. E me dê alguns conselhos para meu primeiro encontro com os pais da minha namorada, porque eu estou MUITO nervoso!YouTube e LensEsta é a cadeirinha de bebê que comprei para o carro. Me mostre o vídeo com o tutorial de instalação da cadeirinha.YouTube e MapasEncontre hotéis em Paris para uma semana em novembro, e vídeos sobre programas legais para fazer com crianças quando eu estiver lá.Fonte: Google

Bard no Brasil

Considerado um rival do ChatGPT e do Bing Chat, o Bard chegou ao Brasil em julho deste ano, depois de meses de espera. Basta acessar bard.google.com para utilizar a ferramenta. Ela é de graça. O gigante da internet sempre repete que se trata de um “experimento”.
Google Bard ganha integração com Gmail, Docs, Maps e YouTube

Google Bard ganha integração com Gmail, Docs, Maps e YouTube
Fonte: Tecnoblog

Ilha no Caribe deve faturar mais de US$ 25 milhões com domínio usado por IA

Ilha no Caribe deve faturar mais de US$ 25 milhões com domínio usado por IA

Você sabe onde fica Anguila? Eu jamais saberia apontar no mapa. Esta pequena ilha caribenha de 15 mil habitantes deve ganhar uma bela grana nos próximos anos. Ela detém a um tesouro improvável: seu domínio de internet, o .ai, muito usado por empresas de inteligência artificial.

Vista aérea de Anguila (Imagem: Roy Googin/Wikimedia Commons)

Desde os anos 1990, Anguila recebeu o domínio .ai para representar os endereços de sites do país. É igual o .br no Brasil.

Em inglês, inteligencia artificial é “artificial intelligence”, e a sigla AI é muito usada. Logo, as empresas do setor se interessaram. Como este campo está em alta, a tendência é que este número cresça.

Stability.ai, X.ai e Character.ai são alguns exemplos de empresas que se aproveitaram do .ai no nome e no domínio.

Mesmo gigantes como Google e Meta têm os endereços Google.ai e Facebook.ai para as páginas de iniciativas neste campo. A Microsoft.ai, por exemplo, usa a URL para mostrar os serviços de IA da Azure.

Segundo Vince Cate, engenheiro de software que trabalha como um dos administradores do domínio .ai, são 287.432 sites registrados. O número dobrou no último ano.

O país aproveitou o boom da inteligência artificial para subir o preço em meados de abril: de US$ 120 para US$ 140 por dois anos de registro.

Cate estima que os direitos do .ai vão render entre US$ 25 milhões e US$ 30 milhões para Anguila em 2023, contra US$ 6,9 milhões em 2022. Essa cifra é bem relevante: o produto interno bruto (PIB) do país é de cerca de US$ 300 milhões anuais, e as receitas recorrentes no orçamento estão estimadas em US$ 107 milhões.

Domínios de Tuvalu e Montserrat também despertam interesse

Anguila não está sozinha entre os países minúsculos com domínios que interessam empresas de outros lugares.

Um exemplo é Tuvalu. O pequeno país da região da Polinésia, com 11 mil habitantes, é o detentor do .tv, usado por emissoras de todo o mundo. Assim como acontece em Anguila, o registo é uma das principais fontes de receita do governo.

Outro caso é Antígua e Barbuda. O país caribenho detém o domínio .ag. Pode não parecer muito interessante, mas ele é bastante usado por empresas alemãs, por causa do termo “Aktiengesellschaft”. Ele equivalente a uma “sociedade anônima” aqui no Brasil — ou seja, o .ag é para eles o que o .sa seria para nós.

Já Montserrat tem o domínio .ms. A principal empresa a usá-lo é a Microsoft, como encurtador de URLs em vários serviços.

Com informações: Bloomberg
Ilha no Caribe deve faturar mais de US$ 25 milhões com domínio usado por IA

Ilha no Caribe deve faturar mais de US$ 25 milhões com domínio usado por IA
Fonte: Tecnoblog

Google revela preço da inteligência artificial Duet, novo recurso do Workspace

Google revela preço da inteligência artificial Duet, novo recurso do Workspace

O Google anunciou nesta terça-feira (29) o preço do Duet, sua inteligência artificial para auxiliar no uso do Workspace. Assim como o seu rival Windows Copilot, o plano mais barato da IA do Google custará US$ 30 (R$ 145,61 em conversão direta) por mês para cada usuário. O Duet já está disponível para ser “contratado”.

Google Duet é a IA do Google para auxiliar o usuário nos produtos do Workspace (Imagem: Vitor Pádua / Tecnoblog)

Como revelado pelo veículo CNBC, o Google revelara o preço da inteligência artificial para potenciais clientes já em maio, mesmo mês em que o Duet foi apresentado no evento Google I/O. A empresa ainda não publicou os preços dos outros planos, sendo que o valor de US$ 30 é válido para a assinatura voltada à grandes empresas.

Até esse anúncio do Google, a inteligência artificial estava apenas em fase de testes. Através do Duet, o usuário poderá pedir resumos de textos, geração de imagens para apresentações de slides e outros recursos para aumentar a eficiência no uso dos seus aplicativos do Workspace — como Docs, Sheets e Apresentações.

Google Duet rivaliza com Microsoft Copilot até no preço

Windows Copilot será integrado com o Windows 11 e programas do Microsoft 365 (Imagem: Divulgação/Microsoft)

O preço anunciado pelo Google nesta terça é mais um ponto de rivalidade do Duet contra o Microsoft Copilot. Os dois serviços prometem as mesmas facilidades e ganhos de produtividade. O Copilot e o Duet são as versões “tunadas” do Clippy, aquele clips de papel que te ajudava (ou não) nos programas do Microsoft Office — que hoje se chama Microsoft 365.

A diferença é que o Copilot também será integrado ao Windows 11, enquanto o Google não se pronunciou sobre planos de levar o Duet ao ChromeOS. Mas seja você um usuário do Microsoft 365 ou do Google Workspace, as duas inteligências artificiais devem agregar — ainda que não cumpram as grandes promessas das duas empresas em um primeiro momento.

Quem quer economizar e não liga para integração com seus programas de “escritório”, o ChatGPT Plus custa US$ 20 (R$ 97,01) e usa o mesmo GPT-4 da Microsoft.

Com informações: CNBC e The Verge (1 e 2)
Google revela preço da inteligência artificial Duet, novo recurso do Workspace

Google revela preço da inteligência artificial Duet, novo recurso do Workspace
Fonte: Tecnoblog

Amazon, CNN, New York Times e mais sites bloqueiam robô do ChatGPT

Amazon, CNN, New York Times e mais sites bloqueiam robô do ChatGPT

O ChatGPT é capaz de responder inúmeras perguntas com uma precisão razoável, já que foi treinado com grandes quantidades de texto, como livros, artigos e também sites. Estes últimos, no entanto, parecem bem preocupados. Levantamentos mostram que mais de 15 entre os 100 sites mais acessados bloquearam o GPTBot, robô da OpenAI responsável por coletar conteúdo. Nessa lista, estão Amazon, New York Times, CNN e outros.

ChatGPT, da OpenAI (Imagem: Vitor Pádua / Tecnoblog)

Os dados são de uma análise da Originality.ai, empresa especializada em conferir se um conteúdo foi gerado por inteligência artificial ou plagiado.

Entre os 100 sites mais acessados da internet, pelo menos 15 já bloquearam o robô. Entre os 1000 mais acessados, mais de 70 tomaram esta mesma medida.

Entre os mais de 1000 sites que estão bloqueando o GPTBot, estão nomes famosos, como:

Amazon

The New York Times

CNN

Wikihow

Shutterstock

Quora

Bloomberg

Scribd

Reuters

Ikea

Airbnb

Coursera

ChatGPT e outras IAs são acusadas de violar copyright

Bloquear o robô da OpenAI é uma forma de impedir o uso de conteúdo protegido por direitos autorais.

“Propriedade intelectual é a força vital dos nossos negócios, e precisamos proteger os direitos autorais do nosso conteúdo”, declarou uma porta-voz da agência de notícias Reuters à reportagem do jornal The Guardian.

Já o New York Times atualizou os termos de serviço para incluir um item que proíbe a raspagem do conteúdo para treinamento e desenvolvimento de inteligências artificiais.

Este é um tema em debate desde que o ChatGPT e outras ferramentas de inteligência artificial generativa foram lançadas.

O banco de imagens Getty Images, por exemplo, processou os criadores do Stable Diffusion por treinar a IA com fotografias protegidas por copyright. Algumas das criações da ferramenta mostram até mesmo a marca d’água da Getty.

Escritores tomaram caminho parecido e processaram a OpenAI, enquanto uma ação coletiva foi movida contra Microsoft, GitHub e OpenAI por desrespeitar licenças de atribuição de códigos abertos usados no treinamento das ferramentas.

Sites também bloqueiam crawler de arquivo público

O GPTBot é o “crawler” da OpenAI. Este nome é dado a robôs que “rastejam” pela web indexando e coletando informações. Google e Bing, por exemplo, têm os seus, que catalogam as páginas da internet para mostrar resultados de buscas.

A ideia da OpenAI é coletar informações para treinar o modelo de linguagem em larga escala que faz o ChatGPT funcionar.

O GPTBot foi anunciado no começo de agosto de 2023. A OpenAI também disponibilizou informações sobre como os sites poderiam impedir que ele coletasse conteúdo: basta remover a permissão no arquivo robots.txt ou bloquear o IP.

Alguns (mas não todos) sites da lista também bloquearam o CCBot, crawler da organização sem fins lucrativos Common Crawl, cujo objetivo é criar arquivos públicos, para qualquer um acessar.

Parte dos dados usados no treinamento do ChatGPT — e também dos modelos do Google e de outras empresas — vem da Common Crawl.

Com informações: Business Insider, The Guardian, Search Engine Land
Amazon, CNN, New York Times e mais sites bloqueiam robô do ChatGPT

Amazon, CNN, New York Times e mais sites bloqueiam robô do ChatGPT
Fonte: Tecnoblog

Google vai resumir textos e reportagens usando inteligência artificial

Google vai resumir textos e reportagens usando inteligência artificial

A inteligência artificial terá mais uma utilidade em breve: resumir textos da internet. O Google anunciou que seu app de buscas e o navegador Chrome vão contar com um recurso para obter as informações principais de uma página da web, sem que o usuário precise ler tudo.

Google (Imagem: Vitor Pádua / Tecnoblog)

A novidade faz parte da Search Generative Experience (SGE), conjunto de ferramentas que usam IA generativa para acrescentar recursos à busca. Esta tecnologia é da mesma “família” que Bard, ChatGPT e outros.

Chamado “SGE while browsing” (ou “SGE durante a navegação”, em tradução livre), o recurso estará disponível para o app do Google para Android e iOS. Ele também deve chegar ao Chrome nos próximos dias, segundo a empresa.

O Google diz que a ferramenta foi desenhada para “ajudar pessoas a aproveitar mais profundamente conteúdos longos de publicações e criadores, facilitando achar o que você precisa enquanto navega na internet”.

O “SGE while browsing” usa inteligência artificial para criar uma lista de principais assuntos que um texto cobre. Ao clicar em um dos itens, você vai até a parte do artigo que trata daquele tópico.

Outra função é listar perguntas a que aquele artigo responde, também dando a opção de pular para a parte que interessa ao usuário.

No exemplo do Google, em um artigo sobre a Rota 66, a ferramenta traz as perguntas “Em que ano a Rota 66 começou?” e “Qual o comprimento da Rota 66?”.

Publicações terão controle sobre ferramenta

Em seu post para apresentar a novidade, o Google explica que o “SGE while browsing” não resume artigos que estão protegidos por paywall — ou seja, não vai dar para saber o que diz uma reportagem se o jornal ou revista disponibiliza o texto apenas para assinantes.

A decisão de marcar um conteúdo como gratuito ou protegido por paywall caberá aos desenvolvedores e editores.

SGE foi apresentado na Google I/O

Por se tratar de uma ferramenta experimental, o resumo de páginas precisa do Search Labs ativado.

O SGE também é capaz de resumir resultados da busca — assim, você não precisa rolar a página, nem procurar em qual site entrar.

As novidades da busca com inteligência artificial foram apresentadas pela empresa na Google I/O, em maio de 2023. Por enquanto, elas não estão disponíveis no Brasil — apenas o Bard chegou por aqui, em julho de 2023.

Com informações: Google, The Verge
Google vai resumir textos e reportagens usando inteligência artificial

Google vai resumir textos e reportagens usando inteligência artificial
Fonte: Tecnoblog

Robô LuzIA para WhatsApp passa de 2 milhões de usuários no Brasil

Robô LuzIA para WhatsApp passa de 2 milhões de usuários no Brasil

A inteligência artificial LuzIA foi lançada em julho no Brasil e já alcançou uma marca expressiva: mais de 2 milhões de usuários. Tal número coloca o país como o que mais interage com o chatbot no WhatsApp e no Telegram. Até o momento, mais de 200 mil áudios já foram transcritos por ela, e mais de 42 milhões de perguntas foram respondidas.

LuzIA no WhatsApp (Imagem: Reprodução/LuzIA)

Segundo os dados coletados pela plataforma, entre 19 de julho e 6 de agosto, mais de 42 milhões de perguntas foram enviadas por brasileiros à LuzIA. Além disso, ela gerou mais de 700 mil imagens.

Um dos recursos mais interessantes da IA é transcrever áudios. Todo mundo já deve ter passado pela situação de receber uma mensagem de voz quando não tinha como ouvir.

Até 6 de agosto, mais de 200 mil áudios foram encaminhados para a LuzIA. Segundo a empresa, isso dá quase 7 milhões de segundos ou 80 dias ininterruptos de mensagens de voz.

“Nós já estávamos otimistas com o anúncio para o Brasil porque sabemos o quanto o WhatsApp é popular por aqui, mas superou nossas expectativas”, diz Alvaro Higes, criador e CEO da LuzIA.

São Paulo lidera em número de usuários da LuzIA

A empresa criadora da LuzIA também divulgou os DDDs que mais entram em contato com a assistente, o que dá uma ideia da distribuição geográfica dos usuários.

11 (Região Metropolitana de São Paulo): 260 mil usuários

21 (Região Metropolitana do Rio de Janeiro): 130 mil usuários

31 (Região Metropolitana de Belo Horizonte): 75 mil usuários

19 (Região de Campinas): 57 mil usuários

51 (Região Metropolitana de Porto Alegre): 52 mil usuários

LuzIA não tem cadastro e funciona pelo WhatsApp ou Telegram

A LuzIA é uma ferramenta que usa inteligência artificial para responder a perguntas, transcrever áudios e gerar imagens. Ela tem como base GPT-3.5 e Whisper, da OpenAI, e Stable Diffusion, da Stability AI. Criada na Espanha, ela está disponível em mais de 40 países.

Seu grande diferencial é funcionar por aplicativos de mensagem. Basta salvar o contato do chatbot e fazer as solicitações por WhatsApp ou Telegram. As respostas vêm por lá mesmo, sem a necessidade de acessar um site ou instalar um app.

Além disso, como algumas operadoras oferecem WhatsApp ilimitado, dá para usar a LuzIA sem gastar dados da franquia.

Para acessar a inteligência artificial, basta enviar uma mensagem para (11) 97255-3036 via WhatsApp ou Telegram, ou acessar o site da IA e escolher a plataforma desejada. Não existe cadastro, e os dados são tratados de forma anônima.
Robô LuzIA para WhatsApp passa de 2 milhões de usuários no Brasil

Robô LuzIA para WhatsApp passa de 2 milhões de usuários no Brasil
Fonte: Tecnoblog

YouTube começa testes de descrições de vídeos criadas por IA

YouTube começa testes de descrições de vídeos criadas por IA

O Google está testando um recurso para criação de descrição de vídeos no YouTube que será feita por inteligência artificial. A novidade foi revelada pela empresa na última segunda-feira (31) através da página de suporte da plataforma de vídeos. O recurso será mostrado na página de busca e na página de exibição de vídeos.

YouTube inicia testes de descrições de vídeos feitas por IA (Imagem: Vitor Pádua/Tecnoblog)

Como explica o Google em seu site, os testes estão disponíveis para um número limitado de vídeos e de espectadores. A descrição feita por IA, por enquanto, funcionará apenas com produções na língua inglesa.

Google não divulgou sobre identificação de descrição feita por IA

A publicação do Google na página de suporte do YouTube não traz detalhes visuais do recurso — mostrando como será a identificação do sumário feito por inteligência artificial. Todavia, a empresa informou que essa descrição automática será mostrada na página de exibição do vídeo e durante a busca.

Por estar disponível somente para conteúdos na língua inglesa, é especulado que apenas contas baseadas em países cuja língua oficial seja inglês estejam participando do teste. O Tecnoblog tentou testar o recurso usando uma VPN e acessando os principais canais de língua inglesa, mas não conseguimos visualizar nenhuma indicação do teste.

Página de buscas será um dos lugares em que a descrição por IA será mostrada (Imagem: Reprodução/Tecnoblog)

É natural que ao criar um recurso em que a descrição será feita por IA, o Google adicione uma etiqueta ou alguma identificação para informar ao usuário que o sumário do vídeo não foi feito por um humano.

No site, o Google pede que as contas participantes passem feedback sobre o recurso caso “esbarrem” com o texto feito pela IA. A empresa afirma que esse recurso não substituirá a descrição feita pelo criador — que pode anunciar alguma publicidade no sumário.

Com informações: Android Police e The Verge
YouTube começa testes de descrições de vídeos criadas por IA

YouTube começa testes de descrições de vídeos criadas por IA
Fonte: Tecnoblog

IA do Google ensina tarefas para robô sem precisar de instruções básicas

IA do Google ensina tarefas para robô sem precisar de instruções básicas

A inteligência artificial vai muito além do ChatGPT, e o Google deu uma prova disso nesta sexta-feira (28). A empresa apresentou seu modelo de aprendizagem Robotic Transformer 2 (ou RT-2). Graças a ele, robôs conseguem executar tarefas complexas, sem que seja necessário ensiná-los os movimentos básicos envolvidos.

Braço robótico usado pelo Google para demonstrar o RT-2 (Imagem: Divulgação/Google)

Segundo a DeepMind, divisão de robótica do Google, com o RT-2, um usuário poderia dar o comando “jogue o lixo fora” a um robô, mesmo que ele não tenha sido treinado para essa tarefa específica.

A máquina conseguiria identificar o que é lixo — seja um pacote de batatinha vazio ou uma casca de banana — e o que é jogar fora.

Pode parecer bobo, mas não é. Um desafio do trabalho com robôs é a necessidade de ensinar movimentos básicos, como pegar um objeto, girá-lo, mover o braço, e assim por diante.

O RT-2, por outro lado, passou por um treinamento com uma grande quantidade de dados da web. Isso permite a ele ser capaz de fazer abstrações — entender que diferentes tipos de objeto podem ser lixo, por exemplo.

Os pesquisadores afirmam que, em testes realizados com um braço robótico em um cenário de cozinha, o modelo foi capaz de entender que objeto poderia ser improvisado como martelo (uma pedra) e escolher qual era a bebida mais apropriada para uma pessoa cansada (uma lata de energético).

Algumas tarefas possíveis com o RT-2 (Imagem: Divulgação/Google)

Nem tudo é perfeito, porém. A reportagem do jornal The New York Times viu uma demonstração ao vivo do robô e ele errou o sabor de refrigerantes e a cor de algumas frutas.

RT-2 se beneficiou da mesma tecnologia do Bard e ChatGPT

Eu abri este texto falando que a inteligência artificial é muito mais que o ChatGPT, mas existe uma relação entre ele e o modelo usado nos robôs.

O ChatGPT, o Bard e outros chatbots capazes de entender linguagem natural e responder perguntas complexas usam como base uma tecnologia chamada modelo de linguagem de larga escala, ou LLM, na sigla em inglês.

As pesquisas com LLMs foram determinantes para desenvolver o RT-2 e torná-lo capaz de entender instruções que não foram predeterminadas. O modelo é capaz até mesmo de obedecer comandos em outras línguas além de inglês — assim como os chatbots.

Para Ken Goldberg, professor de robótica da Universidade da Califórnia em Berkeley, o uso dos modelos de linguagem nas máquinas foi suficiente para dar a elas alguma capacidade de raciocínio e improviso. “Isso é muito animador”, avaliou o pesquisador em entrevista ao NYT.

Com informações: TechCrunch, The Verge, The New York Times
IA do Google ensina tarefas para robô sem precisar de instruções básicas

IA do Google ensina tarefas para robô sem precisar de instruções básicas
Fonte: Tecnoblog

E se faltar conteúdo humano para treinar a inteligência artificial?

E se faltar conteúdo humano para treinar a inteligência artificial?

No dia 18 de julho, pesquisadores da Universidade de Stanford divulgaram um artigo sobre o desempenho do ChatGPT. Numa avaliação de como a ferramenta se saía em certas categorias de prompts, a conclusão foi que o chatbot havia piorado, mesmo após a atualização do modelo GPT 3.5 para o GPT-4.

O ChatGPT pode ser usado para tudo? (Imagem: Vitor Pádua / Tecnoblog)

A descoberta surpreende. Afinal, a lógica é que uma inteligência artificial está sempre aprendendo, e, portanto, se aprimorando. Não há como saber ao certo o que provocou a piora, mas o ponto do estudo é demonstrar a necessidade de permanecer atento ao desenvolvimento dos grandes modelos de linguagem (large language models, ou LLMs). Não dá para supor que estarão sempre evoluindo.

Os achados dos pesquisadores ajudam a ilustrar os possíveis problemas do uso indiscriminado de ferramentas como o ChatGPT. Parece haver um descompasso entre a adoção dos LLMs e o entendimento de como eles funcionam. Mesmo com alucinações e vieses, a IA é muitas vezes é percebida como mágica, o que gera riscos para seus usuários.

Não confie demais

Já enfatizamos aqui no Tecnoblog que o ChatGPT mente que nem sente. Não custa lembrar: modelos de linguagem desse tipo trabalham com previsão de palavras, sendo muitíssimo competentes em calcular a probabilidade do próximo item numa frase. Você apresenta uma pergunta, e, com isso, um contexto; a ferramenta prevê as melhores palavras para responder o que você pediu.

Ou seja: o ChatGPT chuta, e é excelente nisso. Mesmo quando acerta, isso se deve a sua capacidade de elencar as palavras mais prováveis num determinado contexto. É para isso que serve todo o material de treinamento do modelo: torná-lo capaz de prever melhor.

É justamente por ser um mecanismo de previsão que há constantes equívocos em suas respostas. Ele não está consultando um banco de dados com todo o conhecimento existente, e sim tentando acertar o próximo termo. Nem sempre consegue. Daí surgem as chamadas alucinações, fatos e fontes totalmente inventados porque seria provável, naquele contexto, dizer algo daquela natureza.

Em teste, ChatGPT criou lei sobre o uso de celulares nas escolas catarinenses (Imagem: Reprodução/Tecnoblog)

Diante disso, fica claro por que é tão problemático tratar LLMs como gurus. Você já deve ter visto, no Twitter, perfis ensinando a ganhar dinheiro como ChatGPT. Alguns pedem ideias de negócio à ferramenta; outros, dicas de investimento. Outros ensinam como pedir ao ChatGPT criar o seu treino na academia, dispensando o trabalho de um personal trainer.

O problema, obviamente, é que a ferramenta não foi feita para isso, e as chances de você receber uma informação ou “dica” errada são grandes. Pode ser que um dia tenhamos inteligências artificiais capacitadas para esses fins, mas esse dia não é hoje. O ChatGPT nem sabe do que está falando.

Mesmo com toda a atenção, alguma coisa passa

Isto não impede, é claro, que experimentos sejam feitos com os textos gerados pela ferramenta. Vários veículos jornalísticos ao redor do mundo já anunciaram o uso de inteligência artificial na criação de notícias, por exemplo, apesar dos riscos.

O caso do site CNET foi bastante comentado no início do ano, com textos gerados por IA contendo erros de cálculo; mais recentemente, o Gizmodo também virou notícia por apresentar conteúdo equivocado num texto que listava os filmes de Star Wars em ordem cronológica (a lista, criada por IA, estava errada).

O uso de LLMs no contexto do jornalismo é motivo de disputas. Por mais que o discurso de muitos executivos aponte para o uso da ferramenta como um auxílio para jornalistas, muitos profissionais da área acreditam que se trata de um convite para uma lógica de produtividade baseada em quantidade, não qualidade.

Falando em quantidade, o número de sites com desinformação gerada inteiramente por IA já está na casa das centenas, de acordo com levantamento da organização Newsguard. O objetivo parece ser gerar textos que obtenham um bom ranqueamento no Google. Resultado: mais cliques, e, portanto, mas renda com anúncios.

(Imagem: Unsplash / Jonathan Kemper)

Atores mal-intencionados certamente verão em ferramentas como o ChatGPT um atalho para criar mais e mais conteúdo problemático. Mas o ponto é que, mesmo sem uma intenção escusa por parte do usuário, textos gerados por LLMs frequentemente contém erros factuais e informações inventadas.

E, como discutimos no Tecnocast 297, mesmo os profissionais mais atentos deixarão passar algo. É inevitável.

O jeito é a IA treinar a IA?

Mas há um fato: criar conteúdo via ChatGPT é muito barato. Assim, é muito provável que vejamos mais e mais conteúdo nascido de ferramentas de LLM, e não de seres humanos, se espalhando pela internet.

Isso poderia gerar dinâmicas curiosas. Afinal, inteligências artificiais são treinadas com material encontrado na internet. Num mundo em que uma parcela significativa dos textos na web foram criados por inteligência artificial, os modelos de linguagem acabariam sendo alimentados por material que eles próprios originaram.

Alguns pesquisadores apontam que este fenômeno causaria o chamado colapso de modelo (model collapse). Ao usar conteúdo autogerados para aprender mais, estes modelos passariam a produzir material menos útil para os usuários. Ou seja: o uso indiscriminado das ferramentas de IA pode prejudicar até mesmo os próprios modelos.

Uma forma de evitar o colapso é garantir que os dados com os quais os modelos são alimentados foram 100% criados por humanos. Isso envolveria pagar por acesso a livros, artigos e notícias, de modo a obter material de alta qualidade e de origem comprovada.

Inteligência artificial (Imagem: Pixabay/Geralt)

Porém, há um obstáculo: dinheiro. Conteúdo gerado por seres humanos é caro, e as empresas certamente prefeririam economizar. Por isso, já se fala de treinamento com dados sintéticos. É quando uma IA cria material especificamente para treinamento de LLMs. Já há, inclusive, startups vendendo esta tecnologia como serviço, como aponta esta reportagem do Finantial Times.

Como podemos ver, há muita coisa em jogo no desenvolvimento dos modelos de linguagem. Por enquanto, o melhor é prosseguir com cautela. Ou seja: nada de pedir para o ChatGPT fazer a sua série na academia.
E se faltar conteúdo humano para treinar a inteligência artificial?

E se faltar conteúdo humano para treinar a inteligência artificial?
Fonte: Tecnoblog