Rastreado – atualmente não indexado: um guia de status de cobertura

Rastreado - atualmente não indexado: um guia de status de cobertura
cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br


O relatório de cobertura de índice do Google é absolutamente fantástico, pois fornece aos SEOs informações mais claras sobre as decisões de rastreamento e indexação do Google. Desde o seu lançamento, o usamos quase diariamente na Go Fish Digital para diagnosticar problemas técnicos em escala para nossos clientes.

No relatório, existem muitos “status” diferentes que fornecem aos webmasters informações sobre como o Google está lidando com o conteúdo do site. Embora muitos dos status forneçam algum contexto sobre as decisões de rastreamento e indexação do Google, um permanece incerto: “Rastreado – atualmente não indexado”.

Desde que foi relatado o status “Rastreado – atualmente não indexado”, ouvimos vários proprietários de sites perguntando sobre seu significado. Um dos benefícios de trabalhar em uma agência é poder obter muitos dados e, como vimos essa mensagem em várias contas, começamos a entender as tendências dos URLs relatados.

Definição do Google

Vamos começar com a definição oficial. De acordo com a documentação oficial do Google, esse status significa: “A página foi rastreada pelo Google, mas não indexada. Pode ou não ser indexado no futuro; não é necessário reenviar este URL para rastreamento. “

Então, essencialmente o que sabemos é que:

  1. O Google pode acessar a página
  2. O Google levou um tempo para rastrear a página
  3. Após o rastreamento, o Google decidiu não incluí-lo no índice

A chave para entender esse status é pensar nas razões pelas quais o Google “conscientemente” decidirá contra a indexação. Sabemos que o Google não está tendo problemas para encontrar a página, mas, por algum motivo, acha que os usuários não se beneficiariam dela.

Isso pode ser bastante frustrante, pois você pode não saber por que seu conteúdo não está sendo indexado. A seguir, detalharei alguns dos motivos mais comuns que nossa equipe explicou para explicar por que esse status misterioso pode estar afetando seu site.

1. Falsos positivos

Prioridade: baixa

Nossa primeira etapa é sempre executar algumas verificações pontuais de URLs sinalizados na seção “Rastreado – atualmente não indexado” para indexação. Não é incomum encontrar URLs que estão sendo denunciados como excluídos, mas acabam por estar no índice do Google.

Por exemplo, aqui está um URL que está sendo sinalizado no relatório do nosso site: https://gofishdigital.com/meetup/

No entanto, ao usar um operador de pesquisa no site, podemos ver que o URL está realmente incluído no índice do Google. Você pode fazer isso anexando o texto “site:” antes do URL.

Rastreado - atualmente não indexado: um guia de status de cobertura 1

Se você estiver vendo URLs relatados com esse status, recomendo começar usando o operador de pesquisa do site para determinar se o URL está indexado ou não. Às vezes, esses resultados são falsos positivos.

Solução: Não faça nada! Voce é bom.

2. URLs do feed RSS

Prioridade: baixa

Este é um dos exemplos mais comuns que vemos. Se seu site utiliza um feed RSS, você pode encontrar URLs exibidos no relatório “Rastreado – atualmente não indexado” do Google. Muitas vezes esses URLs terão a string “/ feed /” anexada ao final. Eles podem aparecer no relatório assim:

Rastreado - atualmente não indexado: um guia de status de cobertura 2

O Google encontra esses URLs de feeds RSS vinculados a partir da página principal. Eles costumam ser vinculados ao uso de um elemento “rel = alternate”. Plugins do WordPress como o Yoast podem gerar automaticamente esses URLs.

Solução: Não faça nada! Voce é bom.

É provável que o Google opte seletivamente por não indexar esses URLs e por boas razões. Se você navegar para um URL de feed RSS, verá um documento XML como o abaixo:

Rastreado - atualmente não indexado: um guia de status de cobertura 3

Embora este documento XML seja útil para feeds RSS, não é necessário que o Google o inclua no índice. Isso proporcionaria uma experiência muito ruim, pois o conteúdo não se destina aos usuários.

3. URLs paginados

Prioridade: baixa

Outro motivo extremamente comum para a exclusão “Rastreado – atualmente não indexado” é a paginação. Frequentemente, vemos um bom número de URLs paginados neste relatório. Aqui podemos ver alguns URLs paginados aparecendo em um site de comércio eletrônico muito grande:

Leia Também  Um guia de SEO para marcação de esquema de evento
Rastreado - atualmente não indexado: um guia de status de cobertura 4

Solução: Não faça nada! Voce é bom.

O Google precisará rastrear URLs paginados para obter um rastreamento completo do site. Esse é o caminho para o conteúdo, como páginas de categorias mais profundas ou páginas de descrição de produtos. No entanto, embora o Google use a paginação como um caminho para acessar o conteúdo, ele não precisa necessariamente indexar os URLs paginados.

Se houver algo, verifique se você não faz nada para impactar o rastreamento da paginação individual. Verifique se toda a sua paginação contém uma tag canônica auto-referencial e está livre de tags “nofollow”. Essa paginação funciona como uma avenida para o Google rastrear outras páginas-chave no seu site, então você definitivamente deseja que o Google continue rastreando-a.

4. Produtos expirados

Prioridade: Média

Ao verificar pontualmente as páginas individuais listadas no relatório, um problema comum que vemos nos clientes são os URLs que contêm texto que indica produtos “expirados” ou “fora de estoque”. Especialmente em sites de comércio eletrônico, parece que o Google verifica a disponibilidade de um produto específico. Se determinar que um produto não está disponível, ele continua a excluir esse produto do índice.

Isso faz sentido da perspectiva do UX, pois o Google pode não querer incluir conteúdo no índice que os usuários não podem comprar.

No entanto, se esses produtos estiverem realmente disponíveis no seu site, isso poderá resultar em muitas oportunidades de SEO perdidas. Ao excluir as páginas do índice, seu conteúdo não tem a chance de ser classificado.

Além disso, o Google não verifica apenas o conteúdo visível na página. Houve casos em que não encontramos nenhuma indicação no conteúdo visível de que o produto não esteja disponível. No entanto, ao verificar os dados estruturados, podemos ver que a propriedade “disponibilidade” está definida como “OutOfStock”.

Rastreado - atualmente não indexado: um guia de status de cobertura 5

Parece que o Google está pegando pistas do conteúdo visível e dos dados estruturados sobre a disponibilidade de um determinado produto. Portanto, é importante que você verifique o conteúdo e o esquema.

Solução: verifique a disponibilidade do seu inventário.

Se você encontrar produtos realmente disponíveis listados neste relatório, verifique todos os seus produtos que podem estar incorretamente listados como indisponíveis. Realize um rastreamento do seu site e use uma ferramenta de extração personalizada como o Screaming Frog’s para coletar dados das páginas dos seus produtos.

Por exemplo, se você deseja ver em escala todos os seus URLs com o esquema definido como “OutOfStock”, é possível definir o “Regex” para: “disponibilidade”: “

Isso: “class =” redactor-autoparser-object “> http://schema.org/OutOfStock” deve raspar automaticamente todos os URLs com esta propriedade:

Rastreado - atualmente não indexado: um guia de status de cobertura 6

Você pode exportar essa lista e fazer referência cruzada com dados de inventário usando o Excel ou ferramentas de inteligência de negócios. Isso deve permitir rapidamente encontrar discrepâncias entre os dados estruturados em seu site e os produtos realmente disponíveis. O mesmo processo pode ser repetido para encontrar instâncias em que o conteúdo visível indica que os produtos expiraram.

5. 301 redirecionamentos

Prioridade: Média

Um exemplo interessante que vimos aparecer sob esse status são os URLs de destino das páginas redirecionadas. Frequentemente, veremos que o Google está rastreando o URL de destino, mas não o incluindo no índice. No entanto, ao analisar o SERP, descobrimos que o Google está indexando um URL de redirecionamento. Como o URL de redirecionamento é o indexado, o URL de destino é lançado no relatório “Rastreado – atualmente não indexado”.

Rastreado - atualmente não indexado: um guia de status de cobertura 7

O problema aqui é que o Google ainda não está reconhecendo o redirecionamento. Como resultado, ele vê o URL de destino como uma “duplicata” porque ainda está indexando o URL de redirecionamento.

Solução: Crie um sitemap.xml temporário.

Se isso ocorrer em um grande número de URLs, vale a pena tomar medidas para enviar sinais de consolidação mais fortes ao Google. Esse problema pode indicar que o Google não está reconhecendo seus redirecionamentos em tempo hábil, levando a sinais de conteúdo não consolidados.

Uma opção pode ser a configuração de um “mapa do site temporário”. Este é um mapa do site que você pode criar para acelerar o rastreamento desses URLs redirecionados. Essa é uma estratégia que John Mueller recomendou anteriormente.

Para criar um, você precisará fazer engenharia reversa de redirecionamentos que você criou no passado:

  1. Exporte todos os URLs do relatório “Rastreado – atualmente não indexado”.
  2. Faça a correspondência entre eles no Excel e os redirecionamentos que foram configurados anteriormente.
  3. Encontre todos os redirecionamentos que possuem um URL de destino no bloco “Rastreado – atualmente não indexado”.
  4. Crie um sitemap.xml estático desses URLs com o Screaming Frog.
  5. Faça o upload do mapa do site e monitore o relatório “Rastreado – atualmente não indexado” no Search Console.

O objetivo aqui é que o Google rastreie os URLs no sitemap.xml temporário com mais frequência do que seria. Isso levará a uma consolidação mais rápida desses redirecionamentos.

Leia Também  Como otimizar os snippets em destaque do Google em 2020
cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br

6. Conteúdo fino

Prioridade: Média

Às vezes, vemos URLs incluídos neste relatório com conteúdo extremamente baixo. Essas páginas podem ter todos os elementos técnicos configurados corretamente e podem até estar adequadamente vinculados internamente; no entanto, quando o Google executa esses URLs, há muito pouco conteúdo real na página. Abaixo está um exemplo de uma página de categoria de produto em que há muito pouco texto exclusivo:

Rastreado - atualmente não indexado: um guia de status de cobertura 8
Esta página de listagem de produtos foi sinalizada como “Rastreado – atualmente não indexado”. Isso pode ser devido ao conteúdo muito fino da página.

É provável que esta página seja muito fina para o Google achar útil ou há tão pouco conteúdo que o Google considera uma duplicata de outra página. O resultado é o Google removendo o conteúdo do índice.

Rastreado - atualmente não indexado: um guia de status de cobertura 9

Aqui está outro exemplo: o Google conseguiu rastrear uma página de componente de depoimento no site Go Fish Digital (mostrado acima). Embora esse conteúdo seja exclusivo do nosso site, o Google provavelmente não acredita que o depoimento de uma única frase deva permanecer sozinho como uma página indexável.

Mais uma vez, o Google tomou a decisão executiva de excluir a página do índice devido à falta de qualidade.

Solução: adicione mais conteúdo ou ajuste os sinais de indexação.

Os próximos passos dependerão da importância de indexar essas páginas.

Se você acredita que a página deve definitivamente ser incluída no índice, considere adicionar conteúdo adicional. Isso ajudará o Google a ver a página como uma experiência melhor para os usuários.

Se a indexação for desnecessária para o conteúdo que você está encontrando, a questão maior é se você deve ou não tomar as etapas adicionais para sinalizar fortemente que esse conteúdo não deveria ser indexado. O relatório “Rastreado – atualmente não indexado” indica que o conteúdo está qualificado para aparecer no índice do Google, mas o Google está optando por não incluí-lo.

Também pode haver outras páginas de baixa qualidade às quais o Google não está aplicando essa lógica. Você pode executar uma pesquisa geral do “site:” para encontrar conteúdo indexado que atenda aos mesmos critérios dos exemplos acima. Se você perceber que um grande número dessas páginas está aparecendo no índice, convém considerar iniciativas mais fortes para garantir que essas páginas sejam removidas do índice, como uma tag “noindex”, erro 404 ou removê-las do seu estrutura de ligação interna completamente.

7. Conteúdo duplicado

Prioridade: Alta

Ao avaliar essa exclusão em um grande número de clientes, essa é a maior prioridade que vimos. Se o Google vir seu conteúdo como duplicado, ele poderá rastrear o conteúdo, mas optar por não incluí-lo no índice. Essa é uma das maneiras pelas quais o Google evita a duplicação de SERP. Ao remover o conteúdo duplicado do índice, o Google garante que os usuários tenham uma variedade maior de páginas exclusivas para interagir. Às vezes, o relatório rotula esses URLs com o status “Duplicar” (“Duplicar, o Google escolheu canônico diferente do usuário”). No entanto, esse nem sempre é o caso.

Esse é um problema de alta prioridade, especialmente em muitos sites de comércio eletrônico. As páginas principais, como as páginas de descrição do produto, geralmente incluem as mesmas ou similares descrições de produtos, como muitos outros resultados na Web. Se o Google as reconhecer como muito semelhantes a outras páginas interna ou externamente, poderá excluí-las do índice por completo.

Solução: adicione elementos exclusivos ao conteúdo duplicado.

Se você acha que essa situação se aplica ao seu site, veja como você faz o teste:

  1. Pegue um trecho do potencial texto duplicado e cole-o no Google.
  2. No URL da SERP, anexe a seguinte string ao final: “& num = 100”. Isso mostrará os 100 melhores resultados.
  3. Use a função “Localizar” do seu navegador para ver se o seu resultado aparece nos 100 principais resultados. Caso contrário, seu resultado pode estar sendo filtrado para fora do índice.
  4. Volte para o URL SERP e anexe a seguinte string ao final: “& filter = 0”. Isso deve mostrar o resultado não filtrado do Google (obrigado, Patrick Stox, pela dica).
  5. Use a função “Localizar” para procurar seu URL. Se você vir a página agora aparecendo, é uma boa indicação de que seu conteúdo está sendo filtrado para fora do índice.
  6. Repita esse processo para alguns URLs com potencial conteúdo duplicado ou muito semelhante que você está visualizando no relatório “Rastreado – atualmente não indexado”.
Rastreado - atualmente não indexado: um guia de status de cobertura 10

Se você vê consistentemente seus URLs sendo filtrados para fora do índice, precisará tomar medidas para tornar seu conteúdo mais exclusivo.

Embora não exista um padrão único para isso, aqui estão algumas opções:

  1. Reescreva o conteúdo para ser mais exclusivo em páginas de alta prioridade.
  2. Use propriedades dinâmicas para injetar automaticamente conteúdo exclusivo na página.
  3. Remova grandes quantidades de conteúdo desnecessário. As páginas com texto mais modelo do que o texto exclusivo podem estar sendo lidas como duplicadas.
  4. Se o seu site depende de conteúdo gerado pelo usuário, informe aos colaboradores que todo o conteúdo fornecido deve ser exclusivo. Isso pode ajudar a impedir instâncias em que os colaboradores usam o mesmo conteúdo em várias páginas ou domínios.
Leia Também  Como lidar com páginas de produtos temporariamente fora de estoque

8. Conteúdo voltado para o público

Prioridade: Alta

Em alguns casos, os rastreadores do Google obtêm acesso ao conteúdo ao qual não deveriam ter acesso. Se o Google estiver encontrando ambientes de desenvolvimento, ele poderá incluir esses URLs neste relatório. Até vimos exemplos do Google rastreando o subdomínio de um cliente específico configurado para tickets do JIRA. Isso causou um rastreamento explosivo do site, focado em URLs que nunca deveriam ser considerados para indexação.

O problema aqui é que o rastreamento do site pelo Google não é focado e está gastando tempo rastreando (e potencialmente indexando) URLs que não são direcionados aos usuários. Isso pode ter implicações enormes no orçamento de rastreamento de um site.

Solução: ajuste suas iniciativas de rastreamento e indexação.

Essa solução dependerá totalmente da situação e do que o Google poderá acessar. Normalmente, a primeira coisa que você deseja fazer é determinar como o Google pode descobrir esses URLs particulares, principalmente se for por meio de sua estrutura de links internos.

Inicie um rastreamento a partir da página inicial do seu subdomínio primário e veja se algum subdomínio indesejável pode ser acessado pelo Screaming Frog por meio de um rastreamento padrão. Nesse caso, é seguro dizer que o Googlebot pode estar encontrando exatamente os mesmos caminhos. Você deseja remover todos os links internos para este conteúdo para cortar o acesso do Google.

A próxima etapa é verificar o status de indexação dos URLs que devem ser excluídos. O Google mantém suficientemente todos eles fora do índice ou alguns foram pegos no índice? Se o Google não estiver indexando uma grande quantidade desse conteúdo, considere ajustar seu arquivo robots.txt para bloquear o rastreamento imediatamente. Caso contrário, as tags “noindex”, as canônicas e as páginas protegidas por senha estão na mesa.

Estudo de caso: duplicado conteúdo gerado pelo usuário

Para um exemplo do mundo real, essa é uma instância em que diagnosticamos o problema no site do cliente. Esse cliente é semelhante a um site de comércio eletrônico, pois grande parte do conteúdo é composto de páginas de descrição do produto. No entanto, essas páginas de descrição do produto são todo o conteúdo gerado pelo usuário.

Essencialmente, é permitido a terceiros criar listagens neste site. No entanto, os terceiros frequentemente adicionavam descrições muito curtas às suas páginas, resultando em conteúdo restrito. O problema que ocorre com frequência é que essas páginas de descrição do produto geradas pelo usuário foram capturadas no relatório “Rastreado – atualmente não indexado”. Isso resultou na perda da oportunidade de SEO, pois as páginas capazes de gerar tráfego orgânico foram completamente excluídas do índice.

Ao seguir o processo acima, descobrimos que as páginas de descrição do produto do cliente eram muito pequenas em termos de conteúdo exclusivo. As páginas que estavam sendo excluídas pareciam ter apenas um parágrafo ou menos de texto exclusivo. Além disso, a maior parte do conteúdo da página era de texto de modelo existente em todos esses tipos de página. Como havia muito pouco conteúdo exclusivo na página, o conteúdo do modelo pode ter causado o Google a visualizar essas páginas como duplicadas. O resultado foi que o Google excluiu essas páginas do índice, citando o status “Rastreado – atualmente não indexado”.

Para solucionar esses problemas, trabalhamos com o cliente para determinar qual conteúdo de modelo não precisava existir em cada página de descrição do produto. Conseguimos remover o conteúdo de modelo desnecessário de milhares de URLs. Isso resultou em uma diminuição significativa nas páginas “Rastreadas – atualmente não indexadas”, quando o Google começou a ver cada página como mais exclusiva.

Rastreado - atualmente não indexado: um guia de status de cobertura 11

Conclusão

Felizmente, isso ajuda os profissionais de marketing de busca a entender melhor o misterioso status “Rastreado – atualmente não indexado” no relatório de cobertura do índice. Obviamente, existem muitos outros motivos pelos quais o Google escolheria categorizar URLs como este, mas esses são os casos mais comuns que vimos com nossos clientes até o momento.

No geral, o relatório Cobertura de índice é uma das ferramentas mais poderosas no Search Console. Eu incentivaria altamente os profissionais de marketing de busca a se familiarizarem com os dados e os relatórios, pois encontramos rotineiramente um comportamento subótimo de rastreamento e indexação, especialmente em sites maiores. Se você já viu outros exemplos de URLs no relatório “Rastreado – atualmente não indexado”, informe-me nos comentários!

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *