Category: Gemini

Gemini: IA do Google passa a enxergar e conversar sobre o mundo

Gemini: IA do Google passa a enxergar e conversar sobre o mundo

Gemini Live estreia recurso visual nos celulares Galaxy S25, Pixel 9 e no Gemini Advanced (imagem: divulgação)

O Google liberou a funcionalidade de usar a câmera do celular com o Gemini Live. Anunciado no ano passado, o recurso da big tech que permite que usuários conversem com o Gemini enquanto exibem algum elemento do ambiente. Com essa ferramenta, é possível pedir informações sobre objetos, roupas e até ajuda na decoração da casa.

Para quais celulares está disponível o Gemini Live?

O Gemini Live foi liberado para os celulares Galaxy S25, Pixel 9 (não vendido oficialmente no Brasil) e assinantes do Gemini Advanced — serviço de assinatura da IA que fornece recursos extras.

Em seu site, a Samsung diz que o Gemini Live será lançado “primeiro nos celulares da série Galaxy S25”, indicando que outros dispositivos da marca ganharão a ferramenta no futuro.

Usuário pode pedir ao Gemini Live para identificar uma planta (foto: Thássius Veloso/Tecnoblog)

Se você já tem um modelo da linha Galaxy S25 e o celular está atualizado, você pode ativar o Gemini Live pressionando e segurando o botão lateral.

Quais as funcionalidades do Gemini Live?

Com o Gemini Live, o usuário pode apontar a câmera do celular para algum elemento e conversar com a IA. Por exemplo, é possível filmar a sua sala e pedir para o Gemini sugestões sobre como redecorar o espaço, seja trocando um móvel de lugar ou itens que combinem com a decoração.

O Google também mostra em seu site algumas outras sugestões, como filmar objetos na casa que estão com defeitos (uma cadeira rangendo, por exemplo) e receber o possível diagnóstico do problema, dicas de roupas para vestir em uma determinada ocasião, auxílio com cálculos e perguntar qual o material de uma roupa.

No momento, a funcionalidade de pedir informações sobre estabelecimentos não está disponível. Esse recurso foi mostrado pelo Google para o Android XR. Porém, dadas as suas semelhanças com o Gemini Live, é provável que ele estreie na IA no futuro.

Assim, usuários poderão apontar a câmera para a fachada de um restaurante, ver a tradução do cardápio (se tiver na parte externa) e ouvir o sumário das análises do local.
Gemini: IA do Google passa a enxergar e conversar sobre o mundo

Gemini: IA do Google passa a enxergar e conversar sobre o mundo
Fonte: Tecnoblog

Estudo mostra que maioria dos textões do LinkedIn foi escrita por IA

Estudo mostra que maioria dos textões do LinkedIn foi escrita por IA

Talvez o autor daquele post de “o que aprendi com tal coisa” no LinkedIn não aprendeu nada (Imagem: Vitor Pádua / Tecnoblog)

Uma pesquisa realizada com milhares de textos em inglês no LinkedIn mostra que a maioria foi escrita por inteligência artificial. O estudo avaliou 8.795 postagens com mais de 100 palavras publicadas entre janeiro de 2018 e outubro de 2024. 54% deles são provavelmente gerados por IA, a tecnologia do momento.

A pesquisa foi realizada pela startup Originality AI, que desenvolve ferramentas de detecção de conteúdo criado por IAs, e divulgada pela revista Wired. O próprio LinkedIn, que é de propriedade da Microsoft, fornece no seu plano Premium uma ferramenta de inteligência artificial para aprimorar publicações, perfil e mensagens diretas.

O que levou ao aumento de textos de IA no LinkedIn?

Popularização do ChatGPT coincide com crescimento de textos gerados por IA (Imagem: Vitor Pádua / Tecnoblog)

Segundo John Gillham, CEO da Orginality AI, o salto de publicações de textos gerados por IA ocorreu no início de 2023, quando o ChatGPT começou a se popularizar. A IA generativa da OpenAI foi lançada no fim de 2022. O crescimento de textos supostamente gerados por IA foi de 189%.

No momento, a tecnologia não é capaz de garantir com precisão se um texto é ou não criado por inteligência artificial (e é provável que essa tecnologia nunca surja). Por isso os textos são apontados como “provavelmente gerados por IA”.

Em resposta ao caso, o LinkedIn disse que não analisa se os textos foram escritos ou editados por IA. Porém, a plataforma afirma que tem ferramentas para detectar textos de baixa qualidade e duplicados, que podem indicar que foram feitos por inteligência artificiais. Nesses casos, a rede social corta o alcance da publicação.

Usuários do LinkedIn que usam IA nos textos (seja para a criação ou edição) foram ouvidos pelo Wired. Em resposta ao veículo, os usuários dizem preferir as IAs generalistas (como o ChatGPT e Claude) às ferramentas dedicadas para textos e conteúdo profissional.

“O que aprendi com jornalismo de tecnologia”

Contas de memes no Instagram usam textos de IA para enganar algoritmo e ter mais alcance (Imagem: Reprodução/Instagram)

Trabalhando com jornalismo de tecnologia desde 2021, pude acompanhar o crescimento das IAs generativas. E, não querendo ser engenheiro de obra-pronta, o resultado do estudo não me surpreende. IAs generativas são ótimas para gerar lero-lero e viralizar no LinkedIn — no Instagram e no Google também.

O ChatGPT, Copilot, Gemini e até o Galaxy AI permitem que os usuários gerem textos do zero ou peçam melhorias no que foi produzido. Com a popularização dessas ferramentas começaram a surgir sites criados para gerar receita com o Google Ads. Os criadores usam as IAs para produzirem textos com SEO otimizado e ficar entre os primeiros resultados do Google.

No Instagram, você provavelmente já viu alguma página de meme com uma legenda sobre algum carro ou explicando alguma coisa. Essa é a estratégia usada pelas páginas para que o algoritmo entenda que o conteúdo é educativo e amplie o alcance do post.

Com informações: Wired
Estudo mostra que maioria dos textões do LinkedIn foi escrita por IA

Estudo mostra que maioria dos textões do LinkedIn foi escrita por IA
Fonte: Tecnoblog

Google usará usar energia nuclear para desenvolvimento de IA

Google usará usar energia nuclear para desenvolvimento de IA

Google, assim como a Microsoft, também usará energia nuclear nas operações de inteligência artificial (Imagem: Vitor Pádua / Tecnoblog)

O Google anunciou nesta segunda-feira (14) que utilizará energia nuclear para as suas operações de inteligência artificial. A big tech firmou um contrato com a Kairos Power, uma empresa que desenvolve reatores modulares pequenos (SMR em inglês) resfriados com fluoreto de sódio. O primeiro reator da Kairos Power para o Google deve iniciar as operações em 2030.

O anúncio da big tech segue os passos da Microsoft, que em setembro divulgou um acordo para utilizar exclusivamente a energia gerada na usina de Three Mile Island. Assim como a empresa de Bill Gates, o Google utilizará a energia para a sua operação de inteligência artificial. No comunicado, a big tech do buscador não explicou se será terá exclusividade na compra da energia da usina da Kairos.

500 MW de energia gerada na primeira usina

Segundo o Google, em comunicado publicado em seu site, a usina da Kairos será capaz de gerar 500 MWh de energia por mês. Porém, essa capacidade só deve ser atingida em 2035, quando a Kairos terá uma maior quantidade de reatores fabricados.

No comunicado, a big tech destaca a importância desse acordo para o desenvolvimento das inteligências artificiais. O Google relata que o sistema energético precisa de novas fontes energéticas para suportar a evolução dessa tecnologia.

O alto consumo não está só no treinamento da IA, mas também no uso para tarefas simples do consumidor, como a criação e um email, já que o processamento é realizado nos data centers das empresas.

Maquete 3D de usina nuclear da Kairos Power, que fornecerá energia para o Google (Imagem: Divulgação/Kairos)

Como o Google e a Microsoft operam nos EUA, a busca por energias limpas e renováveis para o desenvolvimento de IA está ligada à redução da emissão de carbono. Os EUA têm como principal fonte de energia os combustíveis fósseis.

Essas duas big techs tem plano de zerar a emissão de carbono (ou empatar a emissão e sequestro de carbono) nos próximos anos. Além desse investimento em energia nuclear, o Google também investe no desenvolvimento de energia geotérmica.

Com informações: The Verge
Google usará usar energia nuclear para desenvolvimento de IA

Google usará usar energia nuclear para desenvolvimento de IA
Fonte: Tecnoblog

Snapdragon 7+ Gen 3 ganha recursos de IA e foto de chips mais caros

Snapdragon 7+ Gen 3 ganha recursos de IA e foto de chips mais caros

Snapdragon 7+ Gen 3 é mais avançado que 7 Gen 3, mas ainda não chega ao nível dos aparelhos flagship (Imagem: Divulgação / Qualcomm)

A Qualcomm anunciou o system-on-chip Snapdragon 7+ Gen 3, voltado para smartphones avançados ou premium, logo abaixo do topo de linha. A empresa promete que ele será capaz de rodar modelos compactos de inteligência artificial no dispositivo, sem depender da nuvem. Além disso, o desempenho teve um salto de até 45% em relação à geração anterior, e as câmeras ganharam recursos antes restritos aos modelos mais caros.

O portfólio dos chips Snapdragon da Qualcomm está organizado em números: 8 para aparelhos de topo de linha, 7 para aparelhos premium, 6 para intermediários e 4 para a linha de entrada. Dentro de cada linha, há algumas variações: “+” significa um chip mais potente, e “S”, um produto mais acessível.

Snapdragon 7+ Gen 3 recebeu recursos de chips de topo de linha de gerações passadas (Imagem: Divulgação / Qualcomm)

Vamos ver na prática. O Snapdragon 8S Gen 3, lançado nesta semana, deve ficar para aparelhos mais caros, mas ainda abaixo do topo de linha, o Snapdragon 8 Gen 3. Já o Snapdragon 7+ Gen 3 anunciado hoje é para smartphones premium, com aperfeiçoamentos em relação ao Snapdragon 7 Gen 3 do ano passado.

Segundo a Qualcomm, OnePlus, Realme e Sharp já preparam seus primeiros smartphones com Snapdragon 7+ Gen 3. Eles devem chegar nos próximos meses.

Potência para rodar Gemini Nano, do Google

A Qualcomm embarcou na onda da inteligência artificial generativa e promete que o Snapdragon 7+ Gen 3 vai conseguir rodar modelos como Llama 2 (da Meta) e Gemini Nano (do Google). A empresa menciona assistentes de voz e ferramentas de geração de imagem como usos possíveis para o chip.

Em termos de desempenho, a empresa afirma que a CPU é 15% melhor e que a GPU é 45% melhor que ao Snapdragon 7+ Gen 2, da geração passada. Já a eficiência de energia melhorou 5%.

Ainda sobre a CPU, ela mantém o “esquema” 1-4-3, com um núcleo prime (2,8 GHz), quatro de performance (2,6 GHz) e três de eficiência (1,9 GHz). A frequência do núcleo prime foi reduzida, enquanto os demais tiveram um aumento.

Na GPU, temos novidades para aprimorar efeitos visuais de games, como o Game Post Processing Accelerator e a Adreno Frame Motion Engine 2. Para fechar, suporte a armazenamento UFS 4.0 e RAM LP-DDR5x, mais rápidas que as compatíveis com a geração anterior.

Novo chip tem melhorias em imagem, desempenho e conectividade (Imagem: Divulgação / Qualcomm)

Snapdragon 7+ Gen 3 traz Wi-Fi 7 e IA para fotos

O Snapdragon 7+ Gen 3 também traz outros recursos que antes estavam restritos a linhas mais caras de chips. Um deles é a segmentação semântica. Com ela, o processador de imagem da câmera consegue entender o que é cada parte da imagem, usando IA.

Pense em uma selfie com uma paisagem ao fundo, por exemplo. Com a segmentação semântica, o smartphone consegue distinguir o rosto, o céu e a natureza, aplicando o processamento de imagem mais adequado a cada uma dessas áreas.

Outro recurso novo nesta categoria de chips da Qualcomm é o Snapdragon Low Light Vision (LLV), que pretende melhorar a captura de imagens com pouca luz.

Em som, a novidade é o rastreio de cabeça para áudio espacial, e em conectividade, o Snapdragon 7+ Gen 3 ganhou suporte a Wi-Fi 7 e Bluetooth 5.4.
Snapdragon 7+ Gen 3 ganha recursos de IA e foto de chips mais caros

Snapdragon 7+ Gen 3 ganha recursos de IA e foto de chips mais caros
Fonte: Tecnoblog

Google prepara Gemini para funcionar com fones de ouvido

Google prepara Gemini para funcionar com fones de ouvido

Gemini chegou à web e aos smartphones (Imagem: Divulgação/Google)

O chatbot Gemini deverá funcionar também em fones de ouvido. O código da versão beta do app do Google traz uma mensagem que diz que a empresa está trabalhando para levar sua inteligência artificial para este tipo de dispositivo — indo além da web, do Android e do iOS. A inteligência artificial poderá substituir o Assistente, que atualmente é compatível com vários fones.

As informações foram encontradas pelo site 9to5Google em uma análise do código da versão 15.6 do app do Google, ainda em fase de testes. Ele tem uma mensagem de erro que diz (em tradução livre):

O aplicativo móvel do Gemini está trabalhando para expandir a disponibilidade e torná-lo acessível em seus fones de ouvido.

Pixel Buds Pro ainda usam o Google Assistente (imagem: divulgação/Google)

Substituição do Assistente pode começar nos fones

Vários fones de ouvido têm botões ou gestos para ativar o Google Assistente. Mesmo com a chegada do Gemini, na semana passada, eles continuam usando o software antigo. Isso é esperado: o próprio Google enfatizou que seu novo chatbot de IA ficará disponível apenas na web e nos smartphones (Android e iOS). Outros aparelhos, como smart displays, alto-falantes e TVs, continuam com o Assistente.

Como observa o 9to5Google, os fones de ouvido são uma escolha mais segura para expandir o Gemini. Eles funcionam conectados a smartphones, que contam com o aplicativo completo. É diferente de um smart display, por exemplo, que demandaria uma implementação mais independente.

Por outro lado, o Gemini terá que tomar um rumo um pouco diferente. Os chatbots com IA generativa lançados até agora tendem a dar respostas longas, articulando vários trechos de textos. Uma resposta em áudio teria que ser mais resumida — imagino que pouca gente teria paciência para um robô “tagarela” na orelha.

Gemini terá aba no aplicativo do Google para iPhone (Imagem: Divulgação/Google)

O aplicativo do Google também traz outros textos a serem usados em mensagens de erro do Gemini (em tradução livre):

“Muitos pedidos em um período curto. Tente novamente mais tarde.”

“O app mobile do Gemini está recebendo mais tráfego que o usual e está temporariamente indisponível. Tente novamente mais tarde.”

O Gemini é o novo nome do Bard, robô conversacional com IA generativa. Apresentado na última quinta-feira (8), ele usa o modelo de linguagem de larga escala (LLM, na sigla em inglês) também chamado Gemini, lançado pelo Google em dezembro de 2023.

Com informações: 9to5Google
Google prepara Gemini para funcionar com fones de ouvido

Google prepara Gemini para funcionar com fones de ouvido
Fonte: Tecnoblog

Google adota o nome Gemini para concorrer com ChatGPT e Copilot

Google adota o nome Gemini para concorrer com ChatGPT e Copilot

Chatbot Gemini ganha aplicativo próprio e substitui Google Assistente (Imagem: Vitor Pádua/Tecnoblog)

O Google anunciou o fim do Bard e a adoção do nome Gemini para as ferramentas de inteligência artificial da empresa. A partir desta quinta-feira (08), os consumidores perceberão a transição, considerada uma das mais importantes da história do Google pela vice-presidente Sissie Hsiao.

Em resumo, o Google revelou o seguinte:

O Bard passa a se chamar Gemini e ganha um app dedicado a ele no Android

O serviço Google One estreia um plano com inteligência artificial generativa de alta capacidade, o Google One AI Premium, com preço fixado em R$ 96,99/mês no Brasil

O Google Assistente passa a ser alimentado pelo modelo do Gemini

O Duet AI se torna Gemini nos aplicativos do Google Workspace e do Google Cloud (incluindo o Gmail e Google o Docs)

O que é Gemini?

O Google anunciou em dezembro de 2023 o lançamento do Gemini, um novo modelo de linguagem considerado poderoso por ser multimodal. Ou seja, ele consegue entender interações em texto, áudio ou imagem. De modo simplificado, seria o equivalente ao GPT-4, o mais avançado LLM da rival OpenAI.

O Gemini se divide em três versões distintas: a Nano, a tradicional e a Advanced (antiga Ultra). Cada qual tem suas próprias características, como maior velocidade de processamento ou maior capacidade de encarar atividades complexas. Depois de dois meses, a empresa decidiu levar o Gemini a diversos produtos e plataformas que já estão disponíveis para os usuários.

IA generativa do Gemini no Gmail (Imagem: Divulgação/Google)

O CEO Sundar Pichai explicou num comunicado que o então Gemini Ultra passa a se chamar Gemini Advanced. O modelo está mais ágil em atividades que exijam “raciocinar, seguir instruções, codificação e colaboração criativa”. Por enquanto, ele funciona somente em inglês, mas pode ser acessado em 150 territórios, inclusive o Brasil. Ainda não se sabe quando começará a falar português. Os próximos idiomas do Gemini Advanced serão japonês e coreano.

Aliás, a pronúncia de Gemini em inglês é jeh-muh-nai. Os adeptos da astrologia provavelmente já sacaram que tem a ver com o signo de Gêmeos naquele idioma.

O novo aplicativo do Gemini

Eu participei de uma entrevista coletiva nesta quarta-feira (07), na qual executivos do Google explicaram as variadas mudanças e adaptações para a chegada do modelo de linguagem Gemini. Os usuários de Android irão contar com um aplicativo dedicado à IA, nos mesmos modelos do que a Microsoft fez ao anunciar o app do Copilot.

Nele, será possível interagir por meio de texto, voz ou imagem, conforme mencionei acima. Todo o processamento ocorre na nuvem. Somente o smartphone Pixel 8 Pro, do próprio Google, conta com uma IA embarcada diretamente no aparelho.

Os recursos do Gemini no mobile estarão disponíveis em celulares com no mínimo Android 12 e memória RAM de 4 GB.

Usuários de iPhone (iOS) poderão acionar o Gemini por meio do aplicativo oficial do Google. Não será necessário instalar nada novo.

A equipe do Google me explicou que o app oficial é muito popular entre os adeptos do ambiente Apple. “Conforme tivermos retorno dos usuários e o que funciona melhor para ele, nós poderemos melhorar a experiência com o passar do tempo”, diz o Google ao Tecnoblog.

É necessário um iPhone com iOS 16 ou posterior para acessar as funções do novo modelo de linguagem.

Gemini terá aba no aplicativo do Google para iPhone (Imagem: Divulgação/Google)

Novo site do Gemini

Interface do site do Gemini (Imagem: Reprodução/Tecnoblog)

Print do site do Gemini

O Gemini será acessado no computador pelo endereço gemini.google.com. Com essa mudança, a página em bard.google.com sai de cena. Num teste inicial, notei que o sistema está rápido em escrever as respostas. Ele traz o botão do Google, que checa as informações dispostas na resposta e informa os links para conteúdos que embasam as afirmações.

A página informa que as conversas são processadas por seres humanos com o objetivo de aprimorar a tecnologia do Gemini. O Google recomenda que os usuários não insiram dados confidenciais.
Google adota o nome Gemini para concorrer com ChatGPT e Copilot

Google adota o nome Gemini para concorrer com ChatGPT e Copilot
Fonte: Tecnoblog

Google pode trocar nome do Bard para Gemini

Google pode trocar nome do Bard para Gemini

Gemini é o nome dos modelos de IA do Google e pode ser aproveitado no assistente (Imagem: Divulgação/Google)

O chatbot Bard, do Google, pode ter um novo nome: Gemini. Segundo o registro de mudanças do software, a troca pode acontecer já na próxima quarta-feira (7). Além disso, uma versão paga do serviço parece estar a caminho, a exemplo do que a OpenAI faz com o ChatGPT Plus, bem como um app dedicado para Android.

As mudanças apareceram no changelog, nome dado ao registro e alterações feitas a um app nas atualizações. No documento, consta uma atualização programada para o dia 7 de fevereiro.

O texto diz que o Google vai mudar o nome do Bard para Gemini para refletir o compromisso de permitir que todo mundo possa ter acesso direto à inteligência artificial da empresa. Além disso, haverá um app dedicado para Android e uma versão paga chamada Gemini Advanced estará disponível, usando o modelo Gemini Ultra.

Google added a new changelog for Bard, and — oh boy — it’s a big one!The availability in Canada is awesome! That said I don’t really understand the limitations with the app. That’s disappointing as someone who lives in Europe.Oh by the way… https://t.co/xM2snHVYJ9 is real. pic.twitter.com/QKgKrRjmM4— Dylan Roussel (@evowizz) February 3, 2024

Além do novo nome, Gemini terá app para Android

Sobre o app, a empresa diz que o Gemini terá um aplicativo separado no Android e estará no aplicativo do Google no iOS. Ele vai aceitar texto, voz e imagens como entrada.

É interessante observar que o texto menciona voz entre as formas de entrada. O changelog diz que o aplicativo é um passo na direção de criar o assistente de IA mais útil do mundo. Pode representar também um passo da transição do Google Assistente atual para um novo, com habilidades mais amplas.

Assistente com Bard, anunciado na Google I/O de 2023, pode ter outro nome (Imagem: Reprodução/Google)

O aplicativo será lançado inicialmente apenas nos EUA e em inglês, para dispositivos selecionados. Posteriormente, ele será lançado quase globalmente, com suporte a inglês, coreano e japonês. O “quase” fica por conta de Reino Unido, União Europeia e Espaço Econômico Europeu, que ainda não receberão o app, provavelmente por questões regulatórias.

Versão paga só vai entender inglês

Sobre a assinatura Gemini Advanced, o Google diz que o serviço usará o Gemini Ultra 1.0. Quando apresentou os modelos Gemini, o Ultra foi colocado como o mais avançado dos três. Segundo a empresa, ele terá capacidade para executar tarefas mais complexas, como gerar código, raciocinar, entender instruções mais sutis e colaborar de forma criativa.

O Google também promete que os assinantes terão acesso a recursos novos e exclusivos nos próximos meses, como análises profundas de documentos e dados, geração de código aprimorada, capacidades multi-modais e mais.

O Gemini Advanced será lançado em 150 países e territórios, mas estará disponível e otimizado apenas em inglês.

Google segue passos de Microsoft e OpenAI

A mudança de nome do Bard e a chegada de uma opção paga repetem movimentos feitos por Microsoft e OpenAI. A Microsoft colocou recursos e inteligência artificial em muitos de seus serviços ao longo de 2023, mas só em novembro decidiu unificá-los sob o nome Copilot.

Já a OpenAI oferece o ChatGPT Plus desde fevereiro de 2023, com acesso ao GPT-4 (a versão gratuita usa o GPT-3.5) e acesso prioritário nos momentos de grande demanda. A assinatura mensal é de US$ 20.

Com informações: Android Authority
Google pode trocar nome do Bard para Gemini

Google pode trocar nome do Bard para Gemini
Fonte: Tecnoblog