Category: Matthew Prince

Cloudflare revela motivo do pior apagão em seis anos

Cloudflare revela motivo do pior apagão em seis anos

Rede da Cloudflare ao redor do mundo (imagem: divulgação)

Resumo

A Cloudflare enfrentou um apagão de cinco horas devido a uma atualização incorreta no sistema anti-bot, afetando plataformas como ChatGPT e X.
O CEO Matthew Prince assumiu a responsabilidade e anunciou medidas técnicas, incluindo validação rigorosa de arquivos e botões de emergência globais.
A falha começou com uma consulta mal configurada no ClickHouse, causando duplicação de dados e erros HTTP 5xx.

A Cloudflare enfrentou sua pior interrupção desde 2019 na terça-feira (18/11), deixando fora do ar plataformas globais como ChatGPT, X e até o site do Tecnoblog por cerca de cinco horas. A falha foi causada por uma atualização incorreta no sistema anti-bot, que gerou sobrecarga em servidores críticos após duplicação acidental de dados de configuração.

Num comunicado oficial, seu CEO assumiu a responsabilidade pelo incidente, inicialmente confundido com um ataque DDoS, e anunciou quatro medidas técnicas para evitar novas quedas. Entre elas, estão mecanismos de desligamento emergencial e revisão rigorosa de arquivos internos, parte de esforços para fortalecer a infraestrutura da empresa.

Problema começou em sistema anti-bot

O CEO Matthew Prince explicou que a falha ocorreu durante atualização de segurança no ClickHouse, sistema de análise de dados usado internamente. Uma consulta mal configurada passou a listar colunas duplicadas após mudança de permissões. Isso fez o arquivo de configuração pesar duas vezes seu tamanho normal.

Clientes que não usavam a função anti-bot permaneceram online.

Gráfico do volume de erros HTTP 5xx na rede da Cloudflare em 18/11 (imagem: divulgação)

O sistema de proxy central entrou em colapso ao carregar o arquivo corrompido, gerando erros HTTP 5xx. Serviços como Workers KV e Cloudflare Access também foram afetados indiretamente. Inicialmente, a equipe suspeitou que fosse um ataque DDoS de grande escala.

Falha afetou serviços globais por horas

A partir das 8h28, cerca de 20% dos sites que usam a rede da Cloudflare começaram a apresentar falhas. Até a página que dá o status da operação da Cloudflare ficou offline, indicando falsamente suspeitas de ataque. A equipe identificou o real problema às 11h24.

“Dada a importância da Cloudflare no ecossistema da internet, qualquer interrupção em qualquer um dos nossos sistemas é inaceitável. O fato de ter havido um período em que nossa rede não conseguiu rotear tráfego é profundamente doloroso para cada membro da nossa equipe. Sabemos que falhamos com vocês hoje.”

– Matthew Prince, CEO da Cloudflare

A recuperação exigiu a substituição manual do arquivo defeituoso e a reinicialização dos servidores. O tráfego normalizou gradualmente até as 14h06.

“Em nome de toda a equipe da Cloudflare, gostaria de pedir desculpas pelos transtornos que causamos à Internet hoje.”

– Matheus Prince, CEO da Cloudflare

Empresa lista medidas para o futuro

A Cloudflare detalhou quatro medidas técnicas para evitar a repetição do problema. Em resumo, são elas:

Validação rigorosa de arquivos internos: Tratar configurações geradas pela própria Cloudflare como se fossem dados externos, com verificações automáticas de tamanho e formato antes de serem aplicados;

Botões de emergência globais: Criar mecanismos para desligar rapidamente funções problemáticas em toda a rede, como “freios de emergência” digitais;

Controle de relatórios de erro: Limitar automaticamente o volume de logs e registros detalhados de falhas (core dumps) para evitar que congestionem servidores durante crises;

Testes de cenários extremos: Simular falhas em módulos essenciais (como o proxy que roteia tráfego) para identificar gargalos e adicionar redundâncias, garantindo que um erro não derrube todo o sistema.

A companhia também reconheceu atrasos na recuperação de seu próprio dashboard interno durante a crise, prometendo melhorar a escalabilidade de sistemas críticos para equipes de resposta rápida. As medidas começam a ser implementadas imediatamente, com prioridade para os botões de emergência e a validação de arquivos.

Com informações de The Verge
Cloudflare revela motivo do pior apagão em seis anos

Cloudflare revela motivo do pior apagão em seis anos
Fonte: Tecnoblog

CEO da Cloudflare adverte: a web como conhecemos está morrendo

CEO da Cloudflare adverte: a web como conhecemos está morrendo

Matthew Prince, CEO da Cloudflare (imagem: Flickr/World Economic Forum)

Resumo

Matthew Prince, CEO da Cloudflare, afirmou que a inteligência artificial tem enfraquecido o modelo de negócios da web ao reduzir o tráfego enviado a sites.
Ele apontou o avanço das buscas do tipo “zero clique”, nas quais o usuário obtém respostas sem acessar links, impulsionado pela IA generativa.
A Cloudflare está no centro dessa transformação, com seus serviços sendo usados por cerca de 80% das empresas de IA e presentes em 20% a 30% dos sites da web.

Matthew Prince é cofundador e CEO da Cloudflare, companhia que fornece serviços de otimização e segurança para milhões de sites em todo o mundo. É com base nessa posição que o executivo alertou em uma entrevista recente: a inteligência artificial está destruindo o modelo de negócio de grande parte dessas páginas.

Prince se refere principalmente ao crescimento do chamado “zero clique”. Esse comportamento ocorre quando o usuário encontra o que precisa ao fazer uma busca na web sem ter que clicar em nenhum link nos resultados.

Se os links não são clicados, os sites relacionados a eles não são acessados. Logo, essas páginas deixam de gerar receita com publicidade online ou com vendas, por exemplo.

A principal causa para esse fenômeno é a IA generativa. Serviços como ChatGPT e Google Gemini permitem que o usuário obtenha a informação da qual precisa na mesma tela de interação com essas ferramentas, sem que a pessoa tenha que acessar páginas externar para isso.

Não é que esses serviços não disponibilizem links complementares às respostas dadas. O problema é que a taxa de cliques nesses endereços é consideravelmente mais baixa em relação aos resultados das buscas convencionais. “Hoje, 75% das buscas são respondidas sem que você saia do Google”, complementou Prince.

O executivo também observou que, há cerca de dez anos, o Google levava um visitante para cada duas páginas que tinham dados coletados pelo buscador. Atualmente, essa proporção está em um acesso para cada seis páginas.

75% das buscas são respondidas sem que você saia do Google, diz Prince (imagem: Nathana Rebouças/Unsplash)

O que pode acontecer com a web?

O principal problema é que, sem uma quantidade razoável de acessos, a permanência dos sites afetados na web pode se tornar inviável. Além disso, muitos produtores de conteúdo poderão se sentir desmotivados a seguir com essa atividade por saberem que suas páginas servirão de base de dados para serviços de IA sem que nenhuma contrapartida seja oferecida.

O modelo de negócios da web não poderá sobreviver a menos que ocorra alguma mudança, pois cada vez mais as respostas às perguntas que você faz não o levarão à fonte original, mas a alguma derivação dessa fonte.

E, se os criadores de conteúdo não conseguem extrair valor daquilo que estão fazendo, eles deixarão de criar conteúdo original.

Matthew Prince, CEO da Cloudflare

O executivo também contou que 80% das empresas de IA usam a Cloudflare e que os serviços da companhia estão presentes em 20% a 30% dos sites na web. “Então, estamos no meio disso. E acho que parte do que estamos pensando é sobre isso [como lidar com o problema]”.

Com informações de Council on Foreign Relations e TechSpot
CEO da Cloudflare adverte: a web como conhecemos está morrendo

CEO da Cloudflare adverte: a web como conhecemos está morrendo
Fonte: Tecnoblog