Como funciona uma busca no Google? O processo por trás de cada pesquisa

Como funciona uma busca no Google: o processo por trás de cada pesquisa

Entenda como o Google vasculha a internet, documenta as informações e rankeia os resultados de buscas.

Você já parou para se perguntar como o Google recolhe e organiza resultados para qualquer dúvida em uma fração de segundos?

Desde as primeiras vezes que me atentei sobre buscas no Google, o número de respostas e o tempo até ter a lista final me surpreenderam.

Olhe por exemplo o resultado da busca pela palavra-chave Marketing Digital:

Busca marketing digital

Impressionante, não? Aproximadamente 1,7 bilhões de resultados em menos de meio segundo!

Como uma ferramenta pode passar por tantas páginas na Web, entender quais delas apresentam respostas para o termo que eu digitei, e ainda ordenar os resultados para me entregar os que vão atender melhor minha dúvida?

A missão me parece digna do Papai Noel. Visitar diversos endereços, fazer entregas em todos sem deixar passar nenhum, e ainda passar despercebido pelas crianças?

Papai Noel Google

Mas, diferentemente do Natal, fazer uma pesquisa no Google não tem nada de mágica.

Neste artigo, você vai entender como funciona uma busca no Google e como você pode chegar ao topo das pesquisas. Vamos lá?

Como o Google vasculha a internet?

Como o Google procura as respostas para sua pesquisa?

Quando você faz uma pesquisa, o Google não procura as respostas direto nos sites de destino, mas sim na lista de páginas indexadas por ele.

Ao invés de vasculhar cada página da Web toda vez que alguém faz uma busca — e são aproximadamente 3.5 bilhões de buscas diárias em todo o mundo —, o Google usa um programa de computador desenvolvido por eles, chamado GoogleBot, para vasculhar a internet e construir um índice de páginas.

O GoogleBot, também conhecido como crawler, spider ou bot, começa vasculhando um número pequeno de páginas (normalmente por páginas com autoridade de domínio alta), e vai seguindo os links que encontra nessas páginas para chegar até outras páginas, e assim por diante. Explicamos melhor o funcionamento do GoogleBot nesse post.

Em pouco tempo, o GoogleBot vasculha basicamente todas as páginas que consegue encontrar e registra todas as informações que consegue sobre cada uma delas em seu índice. É nesse índice que o Google procura as respostas para suas pesquisas!

No começo, cada vez que o Google vasculhava a internet levava em torno de 1 mês. Hoje a internet é mapeada várias vezes em um único dia, apresentando conteúdos que foram recentemente postados e aumentando o caráter imediatista do buscador.

Cada vez que vasculha a web, o Bot procura por sites novos, alterações em sites existentes e sites/links inativos.

É importante estar atento a isso, e damos dicas de como indexar uma página no Google nesse post.

Por estar em seu próprio sistema, o índice é uma forma muito mais rápida de vasculhar a internet, e garante que em uma fração de segundo você obtenha um volume gigante de respostas.

Mas como as informações de cada site são registradas no índice?

Como o Google documenta as informações da internet?

Ao vasculhar a internet, o GoogleBot registra todos os dados que pode de uma página.

Ele registra todas as palavras que encontra e onde elas estão na página. O mesmo vale para links, imagens, conteúdos embedados, qual o domínio, quais os dados de publicação e todos os outros elementos que compõem a página.

O Google usa uma forma de armazenamento conhecida como Lista Invertida. Nela, os termos e elementos mapeados são registrados de acordo com sua presença e posição em uma página ou documento.

Isso ajuda a diminuir o tempo de processamento de uma busca, por permitir uma localização mais fácil de cada termo de uma palavra-chave no índice.

São mapeados também os dados de uso, registrando quantas pessoas acessam a página, por quanto tempo, de onde elas vem e qual o trajeto delas lá dentro — ou a saída.

O índice é um banco de dados gigante (de fazer inveja no do Papai Noel), com todas as informações sobre as páginas que o GoogleBot vasculhou.

Como você pode imaginar, isso gera um volume enorme de informações. Para armazená-las, a empresa possui cerca de 16 centros de dados, espalhados por 3 continentes, a maioria nos EUA.

Banco de dados do Google

O Google investe muito dinheiro em formas de ter bancos de dados mais seguros e eficientes, e estamos falando de tecnologia de ponta. Se quiser entender um pouco melhor, eles explicam bastante no vídeo abaixo.

Mas um banco de dados por si só não responde nenhuma pergunta. A terceira etapa deste artigo vai te mostrar como o Google transforma as informações que ele acumula de cada página em uma resposta quando você digita sua pesquisa. Siga conosco!

Como o Google rankeia os resultados?

Voltamos alguns anos no tempo, até o dia que eu (ou pelo menos uma versão mais jovem) busquei entender melhor o que é marketing digital.

Como qualquer pessoa, recorri ao nosso amigo Google, que encontrou as 1,7 bilhões de possíveis respostas para minha pesquisa. Minha reação foi mais ou menos esta:

via GIPHY

Mas, por que ele selecionou essas respostas em primeiro lugar? E como ele decide qual, dentre todas essas possibilidades, têm a maior chance de responder o que eu quero descobrir?

Para definir e rankear os resultados, o Google começa por caminhos bem óbvios, mas ganha complexidade ao longo do processo. Fique comigo!

Como o Google seleciona as respostas possíveis?

O processo começa com a ferramenta definindo quais documentos no índice contém as palavras “marketing” ou “digital”. Isso as coloca entre as possíveis respostas para minha busca.

Ao fazer isso, o Google chegou às 1,7 bilhões de respostas, mas ainda não sabe como rankear essas opções.

Para avaliar qual a ordem de resultados têm mais chance de corresponder aos meus objetivos de busca, são avaliados mais de 200 fatores de rankeamento.

É a interseção entre todos eles, gerada pelo algoritmo do Google, que define quais resultados você verá primeiro.

Esse é o objeto de estudo dos profissionais de SEO. Entender os mecanismos de busca, e garantir que sites tenham os elementos necessários para aparecer no topo das pesquisas.

Eu sei, a vida é muita curta para ler um artigo com 200 intertítulos, mas se você é daquelas pessoas que gostam de ouvir a história completa, temos um artigo falando de todos os principais fatores de rankeamento.

É importante ressaltar que o Google não divulga sua fórmula secreta, então ninguém sabe a verdade absoluta e inquestionável sobre quais os fatores e qual o peso de cada um.

Fórmula secreta

Mas nós sabemos o suficiente para passar alguns fatores que influenciam diretamente nos resultados de pesquisas, e como você pode trabalhar esses fatores em suas páginas.

Obs: a lista não está em ordem de relevância.

Fatores de rankeamento no Google

Se você pulou direto para este intertítulo (sem julgamentos), já aviso que vou falar de alguns poucos fatores responsáveis pelo rankeamento, mas você pode acessar nosso post com os 200 principais aqui, ou ir direto para como chegar ao 1º lugar na página de resultados.

A ferramenta de busca está sempre buscando o resultado que entregue mais valor para quem fez a busca, por isso avalia coisas como:

Correspondência de palavras-chave

Vamos supor que em vez de 1,7 bilhões, o Google tivesse encontrado apenas 10 páginas onde os termos “marketing” ou “digital” aparecem:

Marketing aparece nas páginas A, C, I, R e S.

Digital aparece nas páginas C, D, R, S e X.

Se meu objetivo é encontrar uma página que me dê respostas sobre Marketing digital, um resultado que contenha ambos os termos (como os resultados C, R e S do exemplo) ganha força na corrida para o topo da página de resultados, ou serp.

Outro fator importante de mencionar a respeito da procura por correspondência de palavras-chave é a ordem com que elas aparecem.

Mais uma vez usando o exemplo acima: se, dos resultados C, R e S, apenas o R e o S contém os termos ‘marketing’ e ‘digital’ seguidos e nessa ordem, como em ‘marketing digital’, é mais plausível que sejam resultados melhores para minha busca, não?

A quantidade de vezes e a posição na página em que os termos aparecem também são levados em consideração.

Se dos dois resultados em que os termos ‘marketing digital’ aparecem seguidos e na ordem certa, um deles conta com a palavra-chave logo no título principal, além de no meio do texto, e o outro possui o termo apenas no fim da página, no meio de um parágrafo, é mais provável que o primeiro trate do assunto da minha pesquisa.

O Google está cada vez melhor em entender que um conteúdo não precisa repetir a palavra-chave ‘marketing digital’ 439 vezes para possuir as informações mais relevantes sobre o tema.

Mas, ainda assim, é importante que o buscador saiba do que se trata um conteúdo, principalmente usando os intertítulos (h1, h2, h3..)

Autoridade de Domínio

Um dos fatores mais decisivos para o posicionamento de um resultado é a autoridade do domínio onde a página está inserida. Esta página que você está agora, por exemplo, está dentro do domínio rockcontent.com.

A capacidade deste post de rankear bem para uma pesquisa como “Como funciona uma busca no Google” depende diretamente da autoridade deste domínio, mesmo que contenha a palavra-chave exata em seu título.

Esse fator de rankeamento diz ao Google o quando este domínio é forte, funcionando como um voto de confiança digital para um site.

Por exemplo: você já se perguntou por que tantas buscas no Google tem a Wikipédia no topo das respostas?

Eu tive essa dúvida, e percebi que a principal razão é sua autoridade de domínio altíssima.

Como o site tem muito conteúdo completo e recebe links de vários outros sites — sendo alguns muito importantes — o Google entende que é um domínio forte e confiável, e seus resultados recebem mais atenção e carinho no momento do rankeamento.

Este gráfico mostra o impacto claro da autoridade de domínio no rankeamento de resultados de busca:

domínio impacta no rankeamento

É claro que a história é mais complexa, por isso eu escrevi um post sobre a razão da Wikipédia performar tão bem em buscas eos porquês de uma autoridade de domínio ser alta ou não.

Mas tem um fator que é levado muito a sério pela ferramenta de busca, e muitas vezes é deixado de lado: a intenção de busca.

Intenção de busca

Eu ia começar usando o exemplo da busca sobre ‘marketing digital’, mas você já deve estar cansado, certo?

Então vamos descontrair com uma distração universal: filhotes fofinhos.

busca por filhote

Aparentemente, olhar fotos de filhotes fofinhos deixa as pessoas mais felizes e produtivas. Então, você chega no escritório, abre o navegador e pesquisa ‘filhotes fofinhos’.

Qual seria seu nível de decepção se recebesse apenas resultados em texto como resposta?

Quando você pesquisa por filhotes fofinhos, não está atrás de “5 fatos científicos sobre filhotes fofinhos”, ou “como se alimentam filhotes fofinhos”, ou ainda “filhotes fofinhos: guia completo”.

Se você pesquisa esse termo é por que quer ver imagens de filhotes fofinhos, ora!

Você pode ter a autoridade de domínio mais alta do mundo e fazer o conteúdo mais completo da história sobre o assunto.

Se ele não tiver imagens de filhotes fofinhos, você não vai ser o primeiro resultado e ponto final.

Em casos onde a intenção é conseguir mais informações sobre um tema, como a famigerada palavra-chave ‘marketing digital’, entram em campo os conteúdos que vão mais a fundo no tema.

São levados em conta fatores como:

  • tamanho do conteúdo;
  • multimídia;
  • frequência de atualização;
  • tempo de permanência da página;
  • intertítulos (e a presença das palavras-chave neles);
  • links externos que a página recebe.

É possível ver como o Google busca cada vez mais oferecer exatamente o que você busca em primeiro lugar por meio de outros exemplos:

Qual é a primeira informação que aparece ao pesquisar o termo ‘uma milha’?

busca por milha

A partir da análise de dados, a ferramenta entendeu que as buscas por esse termo normalmente são de pessoas que desejam fazer a conversão de unidades de medidas, portanto, já oferece o resultado em primeiro lugar, e em forma de ferramenta de conversão.

Já na seção de resultados normais você encontra nossa amiga Wiki.

E se você pesquisar o termo ‘restaurante’?

busca por restaurante

Antes do primeiro resultado ‘tradicional’, o Google oferece um resultado em mapa, mostrando onde estão os restaurantes mais perto de mim.

Isso por que este tipo de busca é caracterizado como uma busca local. Quem procura termos como restaurante, hotel ou lavanderia, normalmente está procurando soluções vantajosas em termos geográficos. Quanto menor a distância, melhor.

Se quiser entender como aparecer na serp para buscas locais, temos um ebook que fala tudo sobre SEO local.

SEO LocalPowered by Rock Convert

Como você pode ter o primeiro lugar em uma página de busca

Poderia abordar aqui os diversos aspectos de um conteúdo campeão e que te levam para o primeiro lugar na serp, mas isso já foi feito — e com muita qualidade.

O André Mousinho, especialista em SEO da Rock Content, fez um artigo sobre como rankear em primeiro para qualquer palavra-chave.

No artigo, ele conta como colocou o Blog da Rock em primeiro para as palavras-chave mais relevantes de nosso mercado, e dá todas as dicas de como você pode fazer o mesmo!

Recomendo ler com atenção, por que é conteúdo de primeira (do jeitinho que o Google gosta).

Espero que este conteúdo te ajude a entender melhor como funciona a maior ferramenta de busca do mundo! Ficou com outras dúvidas? Deixe nos comentários o que você quer descobrir e atualizamos este artigo.


100.000 pessoas não podem estar enganadas
Deixe seu email e receba conteúdos antes de todo mundo