Do ponto de vista de um usuário, os mecanismos de pesquisa são um milagre dos dias de hoje. Você digita uma consulta em uma caixa de pesquisa e, na maioria dos casos, os resultados da Web são classificados e classificados em milissegundos.
Mecanismos de pesquisa populares como o Google começaram a responder algumas perguntas diretamente nos resultados da pesquisa, o que economiza tempo e cliques.
Mas como funcionam os mecanismos de pesquisa como o Google e por que você deveria se importar?
Neste guia, você aprenderá:
Contents
O que é um mecanismo de pesquisa?
Um mecanismo de pesquisa consiste em duas coisas principais: um banco de dados de informações e algoritmos que calculam quais resultados devem ser retornados e classificados para uma determinada consulta.
No caso de mecanismos de busca na web como o Google, o banco de dados consiste em trilhões de páginas e os algoritmos analisam centenas de fatores para fornecer os resultados mais relevantes.
Como funcionam os mecanismos de pesquisa?
Os mecanismos de pesquisa funcionam com uma lista de URLs conhecidos, que depois vão para o Agendador. o Agendador decide quando rastejar cada URL. Rastreado páginas, vá para o analisador onde informações vitais são extraídas e indexado. Analisado links vão para o Agendador, que prioriza sua rastejando e re-crawling.
Quando você procura algo, os mecanismos de pesquisa retornam páginas correspondentes e algoritmos classifique-os por relevância.
Aqui está um diagrama do Google mostrando esse processo:
Um diagrama simples mostrando como os mecanismos de pesquisa funcionam pelo Google [source].
Abordaremos algoritmos de classificação em breve. Primeiro, vamos nos aprofundar nos mecanismos usados para criar e manter um índice da Web para garantir que entendemos como eles funcionam. Esses são agendamento, rastejando, análise, e indexação.
Nota.
Esse processo se aplica apenas a mecanismos de pesquisa na web como Google, Bing e DuckDuckGo. Existem outros tipos de mecanismos de pesquisa, como Amazon, YouTube e Wikipedia, que mostram apenas resultados em seus sites.
Agendamento
o Agendador avalia a importância relativa de URLs novos e conhecidos. Ele decide quando rastejar novos URLs e com que frequência rastrear novamente URLs conhecidos.
Crawling
O rastreador é um programa de computador que baixa páginas da web. Os mecanismos de pesquisa descobrem novo conteúdo rastreando regularmente páginas conhecidas, onde novos links costumam ser adicionados ao longo do tempo.
Por exemplo, toda vez que publicamos uma nova postagem no blog, ela é empurrada para o topo da página inicial do blog, onde há um link.
Quando um mecanismo de pesquisa como o Google rastrear novamente nessa página, ele baixa o conteúdo da página com os links adicionados recentemente.
o rastejante passa a página da web baixada para o analisador.
Nota.
Crawling não envolva “seguir” links de uma página para outra, como muitas pessoas acreditam.
Análise
o analisador extrai links da página, juntamente com outras informações importantes. Em seguida, envia URLs extraídos para o Agendador e extraiu dados para indexação.
Indexação
Indexação é onde analisado informação de rastejou páginas são adicionadas a um banco de dados chamado pesquisa índice.
Pense nisso como uma biblioteca digital de informações sobre trilhões de páginas da web.
O que é um algoritmo do mecanismo de pesquisa?
Descobrir e indexar conteúdo é apenas a primeira parte do quebra-cabeça. Os mecanismos de pesquisa também precisam de uma maneira de classificar os resultados correspondentes quando um usuário realiza uma pesquisa. Este é o trabalho dos algoritmos dos mecanismos de pesquisa.
Cada mecanismo de pesquisa possui algoritmos exclusivos para classificar as páginas da web. Mas como o Google é de longe o mecanismo de pesquisa mais usado (pelo menos no mundo ocidental), é sobre esse assunto que focaremos o restante deste guia.
Como o Google funciona?
O Google funciona da mesma maneira como descrito acima. isto rasteja a web e índices o conteúdo que encontra. Então, quando você procura algo, ele encontra resultados correspondentes e os classifica por algoritmo por relevância em uma fração de segundo.
O Google funciona tão bem como um mecanismo de pesquisa devido a três fatores:
Primeiro, eles rastrearão e rastrearão novamente a Web em uma escala maior do que qualquer outra pessoa. Isso lhes permitiu criar e manter o maior e mais fresco índice do planeta.
Segundo, eles investiram pesadamente em modelos de linguagem que permitem entender o verdadeiro significado por trás das consultas mais obscuras ou incorretas.
Por exemplo, eles entendem que se você procurar por “italiano restringir, “Você quis dizer” italiano restaurante. ”
Além disso, eles também entendem sinônimos.
É por isso que, quando você pesquisa por “como ganhar dinheiro online”, vê sinônimos em negrito como “ganhar” e “dinheiro” nos resultados.
Eles são tão bons nisso que alguns resultados de pesquisa nem sequer mencionam a consulta exata.
Aqui, o Google entende que “ganhar dinheiro extra on-line” significa o mesmo que “ganhar dinheiro on-line” e que é um resultado relevante para a consulta de pesquisa.
Terceiroe, o mais importante, seus algoritmos de classificação provavelmente retornam os resultados mais relevantes de todos os mecanismos de pesquisa.
Como os algoritmos de pesquisa do Google funcionam
O Google analisa centenas de fatores para encontrar e classificar conteúdo relevante. Ninguém sabe o que são todos esses itens, mas sabemos os principais.
Vamos discutir alguns deles.
Relevância tópica
O Google afirma que quando uma página da web contém as mesmas palavras-chave da consulta de pesquisa, especialmente em posições de destaque como títulos, isso é um sinal de relevância.
Mas essa idéia não é infalível, e é por isso que o Google também procura a presença de outras palavras relevantes na página.
Veja como o Google explica isso:
Pense: quando você pesquisa “cães”, provavelmente não deseja uma página com a palavra “cães” centenas de vezes. Com isso em mente, os algoritmos avaliam se uma página contém outro conteúdo relevante além da palavra-chave “cães”, como fotos de cães, vídeos ou mesmo uma lista de raças.
Para dar outro exemplo, digamos que você tenha um artigo sobre “como obter uma carteira de motorista”. Ele provavelmente deve ter subseções sobre o licenciamento de carros, motocicletas e ônibus, além de mencionar palavras e frases como estrada, dirigindo, licença, exame, segurançae licença de privilégio completo.
A presença de palavras e frases relacionadas como essas provavelmente ajuda a aumentar a confiança do Google de que sua página é sobre o que diz ser.
Para dar outro exemplo, imagine que você deseja criar uma lista dos melhores atores.
Observe qualquer um dos resultados da primeira página e você notará algo interessante: quase todos mencionam pessoas como Robert De Niro, Jack Nicholson e Meryl Streep.
Mencionar essas pessoas, ou entidades, em sua página pode ajudar a aumentar a confiança do Google de que a página é um resultado relevante para consultas como “melhores atores”.
Intenção de pesquisa
O Google sabe que as pessoas realizam pesquisas por um motivo e que entender esse motivo as ajuda a retornar melhores resultados de pesquisa e cria usuários mais satisfeitos.
Em outras palavras, eles trabalham duro para classificar o conteúdo que os usuários esperam ver.
É por isso que todos os principais resultados para “iPhone X unboxing” são vídeos …
… Enquanto os resultados para “iPhone X box” são imagens e listagens de produtos:
O Google entende que, apesar do uso de linguagem semelhante, o intenção por trás dessas pesquisas é totalmente diferente. Eles trabalham duro para fornecer resultados correspondentes ao estilo, tipo e formato do conteúdo e ângulo de conteúdo que os usuários desejam ver.
Esses são conhecidos como os 4 Cs da intenção de pesquisa.
Estilo de conteúdo
O estilo do conteúdo pode ser dividido em três grupos: vídeos, imagens e conteúdo baseado em texto.
Para a maioria das consultas, o estilo de conteúdo dominante e mais desejável nos resultados é bastante claro. Para outros, como “rosas cor de rosa”, o Google entende que a intenção é mista e mostra vários estilos de conteúdo.
Tipo de conteúdo
O tipo de conteúdo geralmente se enquadra em um dos quatro grupos: postagens no blog, produto, categoria e páginas de destino.
Por exemplo, todos os resultados de “como iniciar um blog” são postagens no blog.
Formato de conteúdo
O formato do conteúdo se aplica principalmente a postagens de blog, vídeos e páginas de destino. Para postagens de blog, estilos comuns são “como fazer”, listar postagens, tutoriais, artigos de opinião e artigos de notícias.
Todos os resultados para “dicas de blogs” são postagens na lista.
Para páginas de entrada, o formato pode ser uma calculadora ou ferramenta interativa.
Ângulo de conteúdo
O ângulo do conteúdo refere-se ao principal ponto de venda do conteúdo. Para a maioria das consultas, há um ângulo dominante nos resultados da pesquisa.
Por exemplo, a maioria dos resultados do topo do ranking de “dicas de blogs” é focada em iniciantes.
O Google não classifica listas de dicas avançadas aqui, porque não é isso que os pesquisadores querem ver.
Leitura recomendada: Intenção da pesquisa: o “fator de classificação” negligenciado para o qual você deve otimizar em 2019
Frescor
O Google sabe que a atualização dos resultados importa mais para algumas pesquisas do que para outras.
Por exemplo, uma consulta como “o que há de novo no Netflix” exige resultados super atualizados porque os usuários querem saber sobre filmes e televisão mostra que foram adicionados recentemente à plataforma de streaming de vídeo. Como resultado, o Google prioriza os resultados de pesquisa que foram publicados ou atualizados recentemente.
Para consultas como os “melhores fones de ouvido”, o frescor ainda é importante – mas não tanto. Em outras palavras, é improvável que uma lista de 2015 seja de grande utilidade, porque a tecnologia dos fones de ouvido se move rapidamente. Não é tão rápido que uma postagem publicada no mês passado não é mais útil.
O Google sabe disso e mostra resultados que foram atualizados ou publicados nos últimos meses.
Também existem consultas em que a frescura dos resultados é principalmente irrelevante, como “como amarrar uma gravata”. Nada mudou nesse processo em décadas (ou tem?), Portanto, não importa se os resultados da pesquisa são de ontem ou 1998. O Google sabe disso e não tem escrúpulos em classificar um resultado a partir de 2013 na posição 2.
Qualidade do conteúdo
O Google deseja classificar conteúdo de alta qualidade acima de conteúdo de baixa qualidade. O problema é que a qualidade do conteúdo é objetivamente complicada, então o Google olha para algo chamado E-A-T na tentativa de fazê-lo.
E-A-T de quê?
- Perícia;
- Autoridade; e:
- Confiar em
Eis como o E-A-T funciona em poucas palavras:
Digamos que você pesquise “como escrever uma música”. Com uma escolha, você quase certamente prefere ler algo de Beyonce do que eu. Por quê? Porque Beyonce é uma compositora especialista e autoridade descobrir quem você Confiar em para dar conselhos úteis sobre o assunto.
Agora, embora o E-A-T seja importante para todas as consultas, é crucial para o que o Google gosta de chamar YMYL ou seu dinheiro ou sua vida pesquisas.
Google diz YMYL consultas são aquelas que podem impactar potencialmente a felicidade futura, a saúde, a estabilidade financeira ou a segurança de uma pessoa.
Por exemplo, faça uma consulta como “dosagem segura de ibuprofeno?”
Nesse caso, retornar resultados que não demonstrem E-A-T pode ter implicações com risco de vida. Se uma página é imprecisa, ela não deve aparecer nos resultados da pesquisa, independentemente de quão “topicamente relevante” seja.
Dito isto, o conteúdo em si não é a única coisa que influencia o E-A-T. Coisas como backlinks apontando para a página também são importantes.
Pense nos backlinks como votos de outros sites. Quando alguém cria um link para uma página, está atestando esse conteúdo e recomendando-o aos leitores.
Provavelmente, é por isso que a maioria dos estudos em larga escala mostra uma clara correlação entre backlinks e classificações, incluindo nosso estudo de 920 milhões de páginas:
Resultados do nosso estudo de ~ 920 milhões de páginas da web.
Dito isto, é importante observar que nem todos os backlinks são criados iguais. o relevância e autoridade do site de vinculação e da página da web também são importantes.
Por exemplo, digamos que você tenha um artigo sobre como iniciar um negócio. O Google dará mais importância a um backlink do guia da Small Business Administration para financiar sua empresa do que um similar de uma postagem no site de blog de seu amigo sobre o que eles fizeram no fim de semana passado.
Usabilidade
O Google quer classificar as páginas da web que fazem seus usuários felizes, e isso vai além do retorno de resultados relevantes. O conteúdo também precisa ser acessível e fácil de consumir.
Existem alguns fatores de classificação confirmados que ajudam nisso.
Velocidade da página
Ninguém gosta de esperar o carregamento das páginas, e o Google sabe disso. Por isso, eles tornaram a velocidade da página um fator de classificação para pesquisas em computadores em 2010 e, posteriormente, para pesquisas em dispositivos móveis em 2018.
Compatibilidade com dispositivos móveis
65% das pesquisas do Google ocorrem em dispositivos móveis, o que explica por que a compatibilidade com dispositivos móveis é um fator de classificação para pesquisas em dispositivos móveis a partir de 2015.
E, desde julho de 2019, a compatibilidade com dispositivos móveis também é um fator de classificação para pesquisas em computadores, graças à mudança do Google para a “indexação em dispositivos móveis”. Isso significa que o Google “usa predominantemente a versão móvel do conteúdo para indexação e classificação” em todos os dispositivos .
Personalização
O Google afirma que “informações como sua localização, histórico de pesquisas anteriores e configurações de pesquisa ajudam a [us] para adaptar seus resultados ao que é mais útil e relevante para você naquele momento. “
Por exemplo, uma pesquisa pelo “melhor restaurante mexicano” usa sua localização para retornar resultados locais – mesmo fora do “pacote de mapas”.
Isso acontece porque o Google sabe que você não vai viajar pelo mundo para almoçar.
É uma história semelhante para uma consulta como “comprar uma casa”. O Google retorna páginas com listagens locais e não nacionais, porque é provável que você não queira se mudar para outro país.
A linguagem é outro fator importante. Afinal, não faz sentido mostrar resultados em inglês para usuários espanhóis. É por isso que o Google classifica a versão em inglês do nosso SEO tutorial em países onde o idioma dominante é o inglês e a versão em espanhol em países onde o idioma dominante é o espanhol.
Leitura recomendada: Hreflang: O Guia Fácil para Iniciantes
Por que você deveria se importar com o funcionamento do Google?
Saber como o Google encontra e classifica o conteúdo melhora sua capacidade de criar páginas que aparecem nos resultados da pesquisa. Se você ficar cego sem entender o que o Google valoriza, ou mesmo como eles descobrem conteúdo, suas chances de classificação são praticamente nulas.
Fazer esforços para obter uma classificação mais alta no Google é conhecido como Otimização de Mecanismos de Pesquisa (SEO)
SEO é uma prioridade para muitas empresas porque:
- O tráfego é “livre” de SEO esforços;
- O tráfego é consistente mês após mês (desde que você possa manter as classificações);
- Ele fornece a capacidade de atingir um grande público em alguns casos.
Aqui no Ahrefs, temos investido muito em SEO por alguns anos, e agora recebemos quase 600.000 visitas do Google todos os meses.
Procurando saber mais sobre SEO? Leia nossas 7 etapas SEO tutorial ou assista ao vídeo abaixo.
Pensamentos finais
Muitas pessoas perseguem algoritmos de mecanismo de busca, procurando continuamente brechas que lhes permitam classificar com relativa facilidade. Embora isso às vezes funcione por um curto período, raramente funciona a longo prazo e pode até resultar em uma temida penalidade no Google.
A chave para classificar a longo prazo é focar na criação de conteúdo que ofereça as melhores informações para a palavra-chave de destino e a melhor experiência do usuário.
Em outras palavras, crie conteúdo principalmente para usuários, não para mecanismos de pesquisa.
Tem perguntas? Deixe-me saber nos comentários ou no Twitter.