Category: Microsoft Copilot

Microsoft Copilot ganha comandos de voz e vai entender o que está na tela

Microsoft Copilot ganha comandos de voz e vai entender o que está na tela

Assistente da (Imagem: Reprodução/Microsoft)

A Microsoft apresentou uma série de novidades para sua ferramenta de inteligência artificial generativa Copilot. Os recursos vão de um redesign no aplicativo (para iOS, Android, web e Windows) até novas capacidades de raciocínio e atalhos com base no que está na tela.

Algumas das atualizações apresentadas serão exclusivas dos Copilot+ PCs, nome dado aos computadores com poder de processamento suficiente para rodar recursos de IA localmente, com desempenho satisfatório, sem depender da nuvem. Por fim, os recursos de IA do Microsoft 365 serão liberados também para assinantes dos planos pessoais da ferramenta.

Tela inicial do Copilot terá sugestões (Imagem: Divulgação / Microsoft)

“Acreditamos que o Copilot pode ir além de dar respostas básicas ou gerar conteúdo, para dar apoio a você em suas tarefas”, diz Yusuf Mehdi, vice-presidente executivo da Microsoft.

Copilot Voice e Copilot Daily

O Copilot Voice é uma das principais novidades anunciadas pela Microsoft. Ele lembra o assistente de voz do ChatGPT, com capacidade para lidar com linguagem natural e dar respostas rápidas. Também é possível interromper o assistente, caso o que ele esteja falando não seja o que você precisa no momento, e fazer um novo pedido. O Copilot oferece quatro opções de voz.

Em um dos exemplos, o usuário pede ajuda ao Copilot para dar um presente a um amigo que não bebe vinho. O assistente sugere um azeite de boa qualidade, uma caixa de chás artesanais ou uma cesta de snacks gourmet.

A voz soa natural e informal, e é capaz até de argumentar por que azeite é um bom presente. Acho que o Copilot não foi ao mercado recentemente para ver quanto o azeite está custando, mas este é outro assunto.

O Copilot Voice estará disponível inicialmente apenas em inglês, na Austrália, Canadá, Nova Zelândia, Reino Unido e Estados Unidos. A Microsoft promete expandir o suporte para mais regiões e idiomas em breve.

Copilot Voice terá interface minimalista (Imagem: Divulgação / Microsoft)

Outra novidade envolvendo voz é o Copilot Daily, que dá as informações básicas para o dia, como se fosse um programa de rádio. Uma voz digital, parecida com a de um locutor, dá notícias importantes para o usuário, previsão do tempo, curiosidades e dicas. Tem até uma música suave de fundo.

O Copilot Daily será liberado inicialmente para Estados Unidos e Reino Unido, devendo chegar em breve a outros países.

Think Deeper

Outro novo recurso é o Think Deeper (“pense melhor”, em tradução livre). Seguindo os passos da OpenAI e seu modelo o1, o Think Deeper promete lidar melhor com pedidos que envolvem raciocínio e informações complexas, como os que envolvem matemática e código.

O exemplo da Microsoft é planejar uma reunião de família. O Copilot pede detalhes sobre todo mundo — como idade, ocupação, o que gosta de fazer — e dá uma sugestão de local, transporte, cardápio e atividades para todos.

Think Deeper promete ser capaz de lidar com grande quantidade de informações (Imagem: Divulgação / Microsoft)

E o lançamento? O Think Deeper será disponibilizado inicialmente para um número limitado de assinantes do Copilot Pro na Austrália, Canadá, Nova Zelândia, Reino Unido e Estados Unidos.

Copilot Vision

A Microsoft apresentou ainda o Copilot Vision. Ele está em fase de testes e não será lançado nesta leva de atualizações. Segundo Mehdi, o recurso poderá ver e ouvir o que a navegação do usuário. Quando solicitado, o assistente usará as informações de texto e imagens da página para responder a perguntas e dar ajuda.

Em uma demonstração, o usuário navega pelo site de cinema e TV Rotten Tomatoes. Ele pede ao Copilot sugestões de filmes e série, além de mais informações sobre títulos específicos.

O recurso lembra o Recall, já que ambos acompanham as atividades do usuário no computador. Provavelmente por isso, Mehdi diz que o Copilot Vision só funciona quando ativado, notificações avisam quando a ferramenta está funcionando e nenhuma conversa é armazenada após o fim da sessão. Anteriormente, a repercussão negativa do Recall obrigou a Microsoft a realizar uma série de mudanças.

O Copilot Vision chegará primeiro para um número limitado de assinantes do Copilot Pro nos EUA, por meio do Copilot Labs.

Copilot+ PC terá recursos exclusivos

Algumas novidades apresentadas pela Microsoft são exclusivas dos Copilot+ PC, nome dado às máquinas certificadas para rodar recursos de inteligência artificial localmente, sem depender da nuvem.

Um destes recursos se chama Click to Do (”clique para fazer”, em tradução livre). Ao usar o atalho, ele cria atalhos com base no que está na tela, como pesquisar, saber mais, editar ou comprar. A ferramenta funciona em páginas, documentos, imagens e vídeos.

Em um exemplo, o usuário pausa um vídeo e usa o Click to Do para procurar imagens similares a um objeto presente na filmagem. Isso lembra, de certa forma, o Circule para Pesquisar, do Google, presente em seus próprios smartphones da linha Pixel e nos aparelhos da Samsung, mas com possibilidades bem mais amplas.

Click to Do “entende” o que está na tela e sugere ações com IA (Imagem: Divulgação / Microsoft)

Os computadores com o selo Copilot+ PC também terão uma busca aprimorada para o Windows. A Microsoft promete que o sistema vai encontrar qualquer coisa que o usuário pedir, seja um arquivo ou uma configuração, mesmo que ele não saiba o nome exato.

No exemplo dado pela empresa, o usuário digita “adicionar fones” na caixa de busca do app Configurações. Mesmo sem haver uma opção com este nome, ele sugere os itens “Configurações de Bluetooth e outros dispositivos” e “Aparelhos auditivos”.

O mesmo funciona com busca de fotos no File Explorer: se você digitar “churrasco”, verá fotos de churrasco, mesmo que não esteja escrito “churrasco” na imagem ou no nome de arquivo.

Explorador de Arquivos vai entender o que usuário está procurando (Imagem: Divulgação / Microsoft)

Os aplicativos Fotos e Paint ganharam novidades nos Copilot+ PCs. O Fotos terá ferramentas aumentar a resolução das imagens — a IA ajuda a deixar a dar mais nitidez e detalhes.

Já o Paint poderá gerar objetos em áreas determinadas da imagem, usando apenas pedidos simples — você pode mostrar em que parte da praia quer um farol, por exemplo, e o app adiciona o que foi solicitado.
Microsoft Copilot ganha comandos de voz e vai entender o que está na tela

Microsoft Copilot ganha comandos de voz e vai entender o que está na tela
Fonte: Tecnoblog

Asus revela miniPC que traz botão Copilot no próprio gabinete

Asus revela miniPC que traz botão Copilot no próprio gabinete

NUC 14 Pro AI com botão Copilot no gabinete (imagem: divulgação/Asus)

NUC 14 Pro AI é o nome do miniPC que a Asus anunciou na esteira da IFA 2024, evento de tecnologia que acontece na Alemanha. Como o nome sugere, a novidade traz recursos de inteligência artificial (IA) e leva o conceito tão a sério que incorpora até um botão Copilot na parte frontal.

A ideia é questionável, afinal, o Copilot do Windows 11 pode ser acionado pelo próprio teclado. É de se presumir que o usuário que quiser fazer uso regular da tecnologia comprará um teclado que já tenha uma tecla dedicada, a exemplo do que já ocorre em alguns notebooks atuais.

Além disso, me pergunto se não existe o risco de o usuário confundir o botão com a tecla de liga/desliga que também foi posicionada na parte frontal do NUC 14 Pro AI.

MiniPC Asus NUC 14 Pro AI (imagem: divulgação/Asus)

Com processador Intel para notebook

O que faz o NUC 14 Pro AI realmente interessante é o seu hardware. Para começar, ele pode ser equipado com um chip da recém-anunciada linha Intel Core Ultra 200V, cujos modelos contam com NPU em capacidade entre 40 e 48 TOPS, o que os torna aptos a equipar PCs de categoria Copilot+.

Os chips Core Ultra 200V foram desenvolvidos para notebooks, mas, como vemos aqui, nada impede o seu uso em outras plataformas. Uma das vantagens de sua adoção no NUC 14 Pro AI é que, além de recursos para IA, o miniPC provavelmente será mais econômico no consumo de energia.

Por outro lado, o chip deverá vir soldado à placa-mãe do equipamento, o que dificultará ou impedirá a sua substituição.

A Asus ainda não divulgou todas as especificações do NUC 14 Pro AI, mas indicou que ele suporta memórias LPDDR5X. A memória RAM deve ter, no máximo, 32 GB de tamanho, pois essa é a capacidade suportada pelos chips Core Ultra 200V.

O material de divulgação também revela que o Asus NUC 14 Pro AI suporta SSD M.2 2280, Bluetooth 5.4 e Wi-Fi 7. O equipamento traz ainda portas USB-C com Thunderbolt 4, HDMI, Ethernet, USB 3.2 Gen 1 e USB 3.2 Gen 2. Tudo isso em um equipamento que mede 130 x 130 x 34 mm.

MiniPC Asus NUC 14 Pro AI (imagem: divulgação/Asus)

Disponibilidade e preço

Ainda não há informações sobre preços e data de lançamento, mas o Verge aponta que o miniPC deve ser lançado até o fim do ano. Uma coisa é certa: ele será mais barato que os notebooks Copilot+ que tem preço inicial na cada dos US$ 1.000 nos Estados Unidos.

Falando nisso, vale destacar que os recursos do Copilot+ serão liberados para PCs com chip Intel ou AMD compatível a partir de novembro.
Asus revela miniPC que traz botão Copilot no próprio gabinete

Asus revela miniPC que traz botão Copilot no próprio gabinete
Fonte: Tecnoblog

Microsoft anuncia IA que cria avatar hiper-realista em videochamadas

Microsoft anuncia IA que cria avatar hiper-realista em videochamadas

Dentes do avatar crescem e mudam de tamanho no decorrer do vídeo (Imagem: Reprodução/Tecnoblog)

A Microsoft revelou nessa quinta-feira (18) a VASA-1, IA generativa capaz de criar avatares hiper-realistas para videochamadas. Basicamente, a VASA-1 cria um deepfake do usuário e dispensa o uso de webcam durante reuniões. Para criar o avatar, o framework precisa de apenas uma imagem e um áudio de 1 minuto ou mais do usuário.

A VASA -1, como mostra a Microsoft no anúncio do framework, permite que o usuário escolha vários presets para o vídeo que será exibido na videochamada. É possível, por exemplo, escolher a quantidade de zoom, a posição do rosto e emoções. A Microsoft informou que não há previsão do lançamento da VASA-1.

Avatares para videochamadas sem webcam

VASA-1 pode acabar com uso de webcams nas videochamadas (Imagem: Divulgação/Microsoft)

O VASA-1 tem como principal função permitir a participação de videochamadas sem webcams. Porém, todo mundo que já participou de uma reunião online pode pensar que ela tem uma outra aplicação: exibir um deepfake do nosso rosto para aqueles dias que não estamos bem para abrir a câmera — seja por um dia de calor, estar embaixo das cobertas em um dia frio ou apenas por se sentir acabado.

Segundo a Microsoft, nos primeiros testes com o framework foi possível gerar vídeos de 45 fps em aplicações offline. Já em transmissões, o fps cai para 40 e a latência fica em 170 ms — testes realizados em um desktop com uma GPU RTX 4090. Os vídeos têm 512 x 512 pixels de tamanho.

Por mais que não haja previsão de lançamento do framework, é natural imaginar que ele deve estrear primeiro no Microsoft Teams — caso seja lançado um dia. Contudo, a Microsoft pode lucrar fornecendo a API do VASA-1 para outras empresas.

Nova ferramenta, problemas de sempre

Microsoft anunciou a VASA-1, IA que cria avatares hiperrealista para videochamadas (Imagem: Vitor Pádua/Tecnoblog)

O anúncio da Microsoft traz dezenas de vídeos mostrando o uso do VASA-1 — e todas as pessoas na demonstração são imagens criadas por IA. Assistindo aos vídeos com mais atenção, você percebe os erros comuns das IAs de vídeos e deepfakes. Um dos exemplos conta com os dentes da personagem crescendo de tamanho durante alguns trechos.

No vídeo sobre o uso de diferentes emoções, podemos notar que a orelha direita do homem (esquerda de quem vê) está muito estranha e chega a mexer em alguns momentos — até com um pedaço da parte interna surgindo.

Com informações: MSPowerUser e XDA-Developers
Microsoft anuncia IA que cria avatar hiper-realista em videochamadas

Microsoft anuncia IA que cria avatar hiper-realista em videochamadas
Fonte: Tecnoblog