Como o Ahrefs conta links e domínios

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br


Cada ferramenta de backlink armazenará links diferentes.

Ao construir um índice da web, as empresas precisam fazer muitas escolhas em relação ao rastreamento, análise e indexação de dados. Embora haja muita sobreposição entre os índices, também haverá algumas diferenças dependendo das decisões de cada empresa.

Em nome da transparência, queremos que as pessoas saibam mais sobre o índice de links do Ahrefs.

Os links levam os usuários de uma página da web para outra quando clicados. Existem muitas maneiras de criá-los, sendo o método mais comum o clássico HTML <a> elemento com um atributo href.

<a href="https://ahrefs.com/blog/how-ahrefs-counts-links/url">link text</a>

No entanto, é possível criar links com outros elementos, incluindo:

  • Onclick
  • Botão
  • Clicando
  • Opção / valor
  • E mais…

Em um mundo ideal, qualquer coisa que funcione como um link seria armazenado. Infelizmente, não vivemos em um mundo ideal. Nem o Ahrefs nem o Google armazenam todos os tipos de links porque não é um processo eficiente carregar cada página e clicar em cada link. Isso é exatamente o que você teria que fazer se quiser encontrar todos os links que funcionam para os usuários.

Em vez disso, os rastreadores normalmente buscam páginas, possivelmente as renderizam e, em seguida, extraem e armazenam vários tipos de links. Todos os rastreadores funcionam de forma diferente, então vamos falar sobre como fazemos as coisas aqui no Ahrefs.

Links que armazenamos

Aqui estão os tipos de links que armazenamos em nosso índice.

links externos

Links de um site para outro criado usando o clássico HTML <a> elemento com um atributo href.

Links internos

Links de uma página em um site para outra página no mesmo site. Existem 22,21 trilhões de backlinks internos em nosso índice. Isso é muito mais extenso do que nossa contagem de links externos ao vivo. Nós somos os únicos SEO ferramenta onde você pode acessar esses dados sem um rastreamento de site personalizado. Usamos os dados do link interno no URL Avaliação (UR), semelhante à forma como o Google o usaria no cálculo do PageRank.

Se você quiser ver quando foi o primeiro e último rastreamento de um URL, você pode verificar o relatório “Melhor por links” no Site Explorer. Existem guias para links externos e internos.

melhor por relatório de links

Links que podemos armazenar

Aqui estão todos os links que armazenamos em algumas circunstâncias.

Links inseridos com JavaScript

Como o Google renderiza todas as páginas, eles podem contar links que são inseridos com JavaScript, mas não estão no HTML código. Renderizar em escala consome muito mais recursos do que apenas baixar o HTML de páginas. No Ahrefs, processamos cerca de 80 milhões de páginas por dia. É por isso que teremos alguns desses links inseridos por JavaScript, mas não todos. Atualmente somos os únicos SEO ferramenta que é renderizada durante nosso rastreamento regular da web, portanto, temos alguns dados de link que outras ferramentas não têm.

Leia Também  O que são sitelinks? Como influenciá-los

No entanto, só contamos links inseridos com JavaScript se eles estiverem no formato de um HTML <a> elemento com um atributo href. Você verá esses links marcados no relatório de backlinks como “JS,” como isso:

link js

Links de páginas com URL parametros

Os parâmetros são adições a um URL como? tag = alguma coisa. Você pode ver alguns desses URLs em nosso índice, mas geralmente são parâmetros que mostram conteúdos diferentes. Em muitos casos, as páginas com parâmetros podem mostrar o mesmo conteúdo. Temos muitos sistemas implementados para consolidar URLs em versões canônicas e proteção adicional para caminhos de rastreamento infinitos. Outras ferramentas podem não tomar as mesmas decisões ou ter as mesmas proteções em vigor. Como resultado, eles podem contar essencialmente o mesmo link muitas vezes.

Links que tentamos não armazenar

Aqui estão os links que fazemos o possível para não armazenar.

Links de páginas com URL parametros

Conforme mencionado acima, existem tipos de parâmetros bons e ruins. Tentamos não armazenar aqueles que estão duplicados.

Links de páginas em caminhos de rastreamento infinitos

Esses caminhos criam um número infinito de URLs possíveis. Os parâmetros são uma maneira pela qual eles podem se formar, mas também o são os filtros, o conteúdo dinâmico e os caminhos relativos quebrados para links. Conforme mencionado antes, temos muitas proteções em vigor para links nesses tipos de página, de modo que eles têm menos probabilidade de aparecer em nossos relatórios. O respeito à canonização e a maneira como priorizamos o rastreamento de páginas são apenas duas dessas proteções. Cada índice terá que lidar com esses espaços infinitos, mas há potencial para essas páginas aumentarem a contagem de links.

Links que não armazenamos

Aqui estão todos os links que nunca armazenamos.

Links em PDFs ou outros documentos

O Google converte muitos formatos de documentos em HTML e os indexa como fariam com qualquer outra página. Isso significa que eles contam links nesses documentos. Eu não acredito que nenhum SEO A ferramenta atualmente indexa esses links, mas provavelmente deveríamos. Acho que um dia o faremos, mas também estou preocupado que o esforço e os recursos necessários para isso não valham a pena. De acordo com o analista de tendências do Google para webmasters, John Mueller, links em PDFs não têm nenhum efeito prático na pesquisa na web.

Links em iframes

Iframes permitem que outra página seja exibida dentro de uma página. Por isso, o Ahrefs não conta links em iframes. No entanto, eles são mostrados aos usuários, portanto, outras ferramentas podem contá-los, mesmo que o conteúdo tecnicamente pertença a uma página diferente. O Google pode ou não contar esses links.

Links de páginas não indexadas

Tiramos esses links. Há mensagens contraditórias de representantes do Google sobre se eles usam isso nos cálculos de links ou não. Ferramentas diferentes podem tomar decisões diferentes.

Mesmos links de vários IPs

Um fato engraçado sobre a web é que os sites podem exibir a mesma página em vários IP endereços. Se for esse o caso, um índice de link pode contar o mesmo link várias vezes. Nós não fazemos isso. Nós associamos os links às páginas em que eles estão.

Leia Também  Hamlet Batista sobre o dimensionamento de SEO através da tecnologia e como automatizar seu SEO

Vários links para a mesma página de uma única página

Atualmente, registramos apenas uma versão de um link em uma página. Se você criar um link para uma página do menu e novamente para o conteúdo do corpo, contaremos apenas com um desses links. Podemos mudar isso no futuro para fornecer aos usuários mais dados, mas este é o estado atual. O Google contará todas as versões de links para passar no PageRank, mas só pode usar o texto âncora de uma versão.

Outros itens relacionados ao link que afetam o índice

Entender como contamos links é uma coisa, mas muitas outras coisas podem afetar o que é ou não contado.

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br

Número de links por página

Não acredito que tenhamos um limite para o número de links que contamos por página, mas temos um limite de tamanho de página que pode afetar o número de links que vemos. O Google não recomenda mais do que alguns milhares de links por página.

Redirecionado ou canonizado

No Ahrefs, confiamos em todos os redirecionamentos e tags canônicas e consolidamos links onde os sites nos dizem para fazer. Para o Google, isso é mais complicado, pois eles têm muitos sinais de canonização que determinam qual página é a líder em um cluster canônico. Mantemos as coisas simples porque é impossível saber como o Google vê cada situação e confundiria nossos usuários se tratássemos os canônicos e os redirecionamentos de maneira diferente a cada vez.

Esses links são marcados em nossos relatórios com “301”, “302” ou “Canônico”, como:

Quais domínios são indexados?

No Ahrefs, temos o Domínios de referência relatório que mostra todos os domínios vinculados a um site ou página da web.

Mas como exatamente contamos os domínios?

Você pensaria que esta seria uma pergunta fácil de responder. É apenas domain.com, certo? Infelizmente, as coisas são um pouco mais complexas, pois existem muitas maneiras de contar domínios. Uma opção é tratar cada domínio registrado como um domínio – o que parece ser a forma como o Google os agrega no Google Search Console. Outra é tratar cada subdomínio como um domínio diferente. Você também pode agregar algumas seções de um site e não outras (o que o Google faz), passar por cada seção em uma pilha de tecnologia diferente, etc. Existem muitas opções.

No Ahrefs, temos aproximadamente 175 milhões de domínios após a verificação. O processo de verificação inclui a remoção de domínios de spam e a divisão de alguns subdomínios onde determinamos que diferentes usuários controlam as diferentes áreas. Usamos uma lista personalizada para isso, mas há uma lista pública semelhante em https://publicsuffix.org/list/.

domínios ahrefs

É importante observar que diferentes definições de domínio podem resultar em grandes variações de domínios de referência. Aqui estão alguns exemplos de coisas que outros, não os Ahrefs, podem contar como domínios separados:

  • Subdomínios de versões móveis (m.domain.com, mobile.domain.com, etc.)
  • Subdomínios de país / idioma (en.domain.com, fr.domain.com, de.domain.com, jp.domain.com, etc). Pode haver exceções a isso em nosso índice, como wikipedia.org, mas esta não é uma prática padrão.
  • Subdomínios aleatórios (support.domain.com, images.domain.com, etc.)
Leia Também  O caso antitruste do Google torna o mecanismo de busca da Apple mais provável?

Outra decisão que os provedores de ferramentas de backlink devem tomar é se devem contar algumas subpastas como domínios diferentes. Por exemplo, acho que a maioria dos índices de links contaria blogs diferentes em plataformas bem conhecidas (por exemplo, user1.blogspot.com, user2.blogspot.com) como domínios diferentes porque diferentes usuários os controlam. Mas por que não fazer o mesmo para sites como medium.com/user1 ou github.com/user1? No Ahrefs, não fazemos isso atualmente, mas há uma chance de que possamos no futuro, onde sabemos que diferentes pessoas controlam cada subpasta em um site.

A questão aqui é que existem muitas maneiras de contar domínios. Isso é óbvio quando você olha para os números variáveis ​​de empresas que contam sites na Internet. De acordo com a Verisign, existem 370,7 milhões de domínios registrados em 3º T 2020 em todos os TLDs. De acordo com a Netcraft, existem 1.229.948.224 sites em 263.787.870 domínios exclusivos com 193,8 milhões de sites ativos em novembro de 2020. De acordo com o Internet Live Stats, existem cerca de 1,8 bilhões de sites com menos de 200 milhões ativos atualmente. Cada empresa tem claramente uma metodologia diferente para contar domínios.

Para recapitular, o que fazemos no Ahrefs é pegar todos os sites que conhecemos e remover muitos domínios inativos e de spam e, em seguida, adicionar alguns para subdomínios em sites como blogspot.com. É assim que chegamos à nossa contagem total de domínios de ~ 175 milhões. Outros índices podem fazer isso de maneira diferente e apresentar contagens diferentes.

Por que não podemos ver todos os links

Como encontramos backlinks ao rastrear a web, só podemos fazer isso em sites que podemos rastrear. Se os proprietários do site bloquearem o AhrefsBot em seu arquivo robots.txt, não poderemos rastrear o site. Por exemplo, se você receber um backlink de website.com e website.com bloqueia o AhrefsBot, não podemos rastrear o site e seu backlink não aparecerá no Ahrefs. IP bloqueios, bloqueios de agente de usuário de servidores (diferente de robots.txt), tempos limite de servidor, proteção de bot e muitas outras coisas também podem afetar nossa capacidade de rastrear alguns sites. Rastrear a web em grande escala não é fácil.

Temos vários índices de links

Cada ferramenta deve tomar decisões sobre armazenamento e recuperação de dados. No Ahrefs, dividimos nossos dados em vários índices.

  • Viver – os links que vemos que ainda estão ativos na web. Isso representa melhor o estado atual da web e é o que muitos de nossos usuários acharão mais útil.
  • Recente – links que vimos ativos na web nos últimos 3-4 meses.
  • Histórico – todos os links que já vimos. Essa vai ser a lista mais abrangente, mas com muitos links que não existem mais.

Você pode alternar entre os índices em nosso backlink e relatórios de domínio de referência.

índices ahrefs

Outros índices podem escolher mostrar todos os dados que já viram e, embora isso signifique que eles possam mostrar muitos links, muitos desses links podem não existir mais.

Pensamentos finais

Queríamos que vocês, nossos usuários, tivessem mais informações sobre nosso índice para que possam tomar decisões informadas. Também queremos que você nos informe se acha que devemos mudar as coisas e por quê.

Se você estiver comparando índices de links ou tiver dúvidas sobre nossos dados, sinta-se à vontade para entrar em contato conosco se tiver perguntas ou esclarecimentos.



cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *