Vazamento de documentos do Google revela bastidores e contradições de como são definidas as respostas do buscador
Como o Google faz exatamente para definir qual site aparece primeiro em um resultado na busca é um segredo guardado há um quarto de século. Documentos internos da empresa vazados na semana passada, no entanto, jogaram luz sobre o que determina como os links aparecem em uma pesquisa — e mostram que a empresa faz aquilo que dizia não fazer.
O compilado de 2,5 mil documentos internos, que foram tornados públicos por dois profissionais de SEO (sigla para a otimização de mecanismos de buscas) dão detalhes dos dados coletados pelo Google para definir o ranqueamento de informações na busca. São mais de 14 mil fatores levados em consideração.
O material fornece pistas de como opera um dos algoritmos mais poderosos da internet, o que influencia o tráfego de audiência para fontes de informações e também a taxa de cliques que chega para as empresas — e que potencialmente é revertida em lucro e em vendas.
São ferramentas que determinam a vida ou a morte de sites. E influenciam a vida de bilhões de pessoas que procuram informações no Google.
Segundo Rand Fishkin, especialista em marketing digital responsável por publicar as informações do vazamento, os dados apontam contradições no que, durante anos, o Google publicamente apontava como fatores que determinavam o resultado das buscas.
‘JANELA INCOMPLETA’
Um desses fatores é o uso de dados de navegação do Chrome para determinar o ranqueamento de sites. O Google sempre negou que usava esses dados para afinar a classificação de páginas no buscador. O vazamento, porém, mostrou que isso não é verdade.
A taxa de cliques (CTR, pela sigla em inglês) dos sites também pesa na ordem de exibição dos links, o que o Google negava.
— O que chama a atenção é que o Google sempre afirmou categoricamente que não utilizava dados do Chrome. Nós desconfiávamos porque frequentemente testamos os algoritmos — afirma Rosana Amaral, professora no curso de SEO da Escola Britânica de Artes Criativas e Tecnologia (EBAC).
Ela ressalta ainda que o mecanismo também privilegia sites grandes em detrimentos de sites pequenos.
O Google confirmou a autenticidade dos documentos vazados, mas ressaltou que era preciso ter cautela para não fazer “suposições imprecisas sobre a Busca com br em informações fora de contexto, desatualizadas ou incompletas.”
Carlos Affonso, diretor do Instituto de Tecnologia e Sociedade (ITS), faz um paralelo com a fórmula secreta de um produto: os documentos trazem elementos dela, mas não revelam toda sua composição, nem o processo de produção:
— É importante não comprar a ideia de que a “verdade foi revelada”, mas agora temos mais pistas. Abre uma janela, ainda incompleta, para entendermos como os sites são ranqueados. Se esses elementos forem verdadeiros, é importante a gente entender como eles podem favorecer determinados tipos de sites. E aí a principal preocupação é a desinformação.
Uma das preocupações das companhias é que, ao revelar as “fórmulas” dos algoritmos, explica Affonso, sites de desinformação usem isso para tirar vantagem desses mecanismos.
Isso é ainda mais preocupante depois que o Google passou a usar inteligência artificial (IA) nas buscas, oferecendo aos usuários um resumo do tema pesquisado e deixando os links em segundo plano. Sem os cliques que esse links na busca proporcionam, os sites não conseguem recursos e podem deixar de existir, o que levaria a um “deserto de informações” na internet, sem dados de fontes originais.
QUEBRA DE CONFIANÇA
As revelações rapidamente repercutiram entre empresas de marketing digital que dependem do algoritmo do Google para ajudar sites a aparecerem melhor na busca.
O CEO da iPullRank e veterano da indústria de marketing digital Michael King, um dos primeiros a analisar o material, disse à mídia americana que o vazamento traz a lição de que “o Google nos diz uma coisa e faz outra.”
Para Leonardo Foletto, pesquisador da Escola de Comunicação e Mídia (ECMI) da FGV, o vazamento levanta um debate sobre a transparência dos mecanismos e algoritmos do principal buscador da internet:
— Essas revelações são importantes porque, ao contradizer o Google, elas também nos trazem questionamentos sobre a credibilidade do que a empresa decide revelar. Talvez existam elementos que não estão claros sobre como funcionam os mecanismos de busca.
Para Rogério Salgado, fundador e diretor da Agência Explorer, as revelações marcam uma “quebra de confiança” em relação às diretrizes que a empresa apresenta ao mercado e as práticas que realmente adota.
Não está claro o quanto essas informações expostas são usadas pela empresa para definir a ordem em que os sites aparecem no Google. O material foi identificado primeiro por um usuário do Github, plataforma voltada para programadores de código. Não se sabe também, no entanto, se eles foram realmente expostos intencionalmente ou por acidente.
VOZES DE CRIANÇAS
Em meios aos debates sobre as novas informações das buscas, o Google também confirmou a autenticidade de outro vazamento, revelado pelo site especializado em tecnologia 404 Media. Os documentos, de 2,7 mil páginas, revelaram milhares de incidentes relacionados à privacidade dos usuários entre 2013 e 2018, incluindo um episódio em que endereços residenciais de usuários do Waze foram tornados públicos, e outro em que a empresa armazenou e transcreveu placa de carros em fotos do Google Street View.
Os documentos também mostram que a companhia acidentalmente gravou vozes de mil crianças no YouTube Kids. Segundo o banco de dados, um filtro que deveria interromper gravações de áudio de crianças “não foi aplicado corretamente”.
Os relatórios mostram que os incidentes foram reportados pelos funcionários do Google e depois corrigidos. Mas a empresa não divulgou isso na época.
Para Pedro Martins, coordenador da Data Privacy Brasil, as revelações abrem margem para questionamentos sobre o tratamento de dados dentro do Google:
— As informações podem gerar questionamentos sobre a legalidade das práticas da empresa, independentemente do erro. Ficou claro que foram erros que a empresa não queria cometer e que ela tentou resolver. Mas para além do erro, pode haver o questionamento se a prática é lícita, como transcrever informações do Street View.
Em nota, o Google afirmou que os relatórios obtidos pela 404 têm mais de seis anos e mostram como os funcionários da empresa rapidamente sinalizaram e consertaram os problemas.
O Globo
Escreva sua opinião
O seu endereço de e-mail não será publicado.