7 Tipos de conteúdo duplicado, e como ficar seguro com cada um.

Conteúdo duplicado é um assunto muito importante no mundo SEO. Quando ouvimos sobre isso, é principalmente no contexto das penalidades do Google que pensamos; mas esse efeito colateral potencial de duplicação de conteúdo não é apenas ampliado em importância (o Google quase nunca penaliza sites por conteúdo duplicado em si), mas também é a consequência mais grave do problema. Os 3 problemas de SEO muito mais prováveis que podem ser causados por conteúdo duplicado são os seguintes:

Google quase nunca penaliza sites por conteúdo duplicado, penalidades são direta consequência do conteúdo duplicado.

Orçamento de crawl budget (rastreamento desperdiçado).

Se a duplicação de conteúdo aparecer internamente em seu site, é garantido que você envie algum do seu  “crawl budget” (também conhecido como o número de mecanismos de pesquisa de páginas rastreados por unidade de tempo) para o lixo. Isso significa que as páginas importantes do seu site serão rastreadas com menos frequência.

Diluição de Link juice.

Para duplicação de conteúdo externo e interno, a diluição de link Juice é uma das maiores desvantagens do SEO. Com o tempo, os dois URLs podem criar backlinks apontando para eles, e, a menos que um deles tenha um link canônico (ou um redirecionado 301) apontando para a peça original, os links valiosos que ajudariam a classificação original da página serão distribuídos entre os dois URLs.

Apenas uma das páginas classificadas por palavras-chave alvo.

Quando a Google encontra instâncias de conteúdo duplicado, normalmente mostra apenas um deles em resposta a consultas de pesquisa – e não há garantia de que a página será a que você deseja classificar.

Mas todos esses cenários são evitáveis se você souber onde o conteúdo duplicado pode se esconder, como detectá-lo e como lidar com ele. Neste artigo, vamos descrever os 7 tipos de duplicação de conteúdo – e como lidar com cada um deles.

conteudo seo-duplicado

1. Conteúdo copiado

O conteúdo copiado é basicamente um conteúdo não original em um site que foi copiado de outro site sem permissão. Como eu disse anteriormente, o Google pode nem sempre ser capaz de distinguir entre o original e a cópia, por isso, muitas vezes, a tarefa do proprietário do site é ficar atento aos raspadores e saber o que fazer se o conteúdo deles for roubado.

Infelizmente, isso nem sempre é fácil ou direto. Mas aqui está um pequeno truque que eu pessoalmente uso.

Se você acompanhar como seu conteúdo é compartilhado e vinculado on-line (e se você tiver um blog, você realmente deveria) por meio de um aplicativo de monitoramento de mídia social / como o Awario, você pode acertar dois coelhos com uma cajadada só. Na sua ferramenta de monitoramento, você normalmente usa o URL e o título da postagem como palavras-chave no seu alerta. Para pesquisar também por versões copiadas do seu conteúdo, tudo o que você precisa fazer é adicionar outra palavra-chave – um extrato da sua postagem. Idealmente, deve ser bem longo, por exemplo, uma frase ou duas. Cercar a peça com aspas duplas para ter certeza de que você está procurando uma correspondência exata.

Com essa configuração, o Awario procurará as duas menções ao artigo original (como compartilhamentos, links e outras) e as versões copiadas do conteúdo encontrado em outros sites.

Se você encontrar cópias do seu conteúdo, é recomendável entrar em contato com o webmaster solicitando que ele remova a peça (ou coloque um link canônico no original, caso seja no seu site).

2. Conteúdo Compartilhado

Conteúdo compartilhado é conteúdo republicado em um site diferente com a permissão do autor da peça original. Embora seja uma maneira legítima de colocar seu conteúdo na frente de um novo público, é importante definir diretrizes para os editores com os quais você trabalha para garantir que a distribuição não se transforme em um problema de SEO.

Idealmente, o editor deve usar a tag canônica no artigo para indicar que seu site é a fonte original do conteúdo. Outra opção é usar uma tag noindex no conteúdo distribuído. É sempre melhor verificar isso manualmente cada vez que uma parte de seu conteúdo for publicada em outro site.

3. Páginas HTTP e HTTPS

Um dos problemas de duplicação interna mais comuns são URLs HTTP e HTTPS idênticas em um site. Esses problemas surgem quando a mudança para HTTPS não é implementada com a atenção total que o processo exige. Os dois cenários mais comuns quando isso acontece são:

  • Parte do seu site é HTTPS e usa URLs relativos.

Geralmente, é justo usar uma única página ou diretório seguro (pense em páginas de login e carrinhos de compras) em um site HTTP. No entanto, é importante ter em mente que essas páginas podem ter links internos apontando para URLs relativos em vez de URLs absolutas:

URL absoluto: https://intuitivaweb.agency/blog/

URL relativo: / blog /

URLs relativos não contêm informações de protocolo; em vez disso, eles usam o mesmo protocolo que a página pai em que são encontrados. Se um bot de pesquisa encontrar um link interno como este e decidir segui-lo, ele acessará um URL HTTPS. Poderia, então, continuar o rastreamento seguindo mais links internos relativos e até mesmo rastrear todo o site no formato seguro e, assim, indexar duas versões completamente idênticas das páginas do seu site. Nesse cenário, você desejaria usar URLs absolutos em vez de URLs relativos em links internos. Se já houver páginas HTTP e HTTPS duplicadas em seu site, redirecionar permanentemente as páginas seguras para as versões HTTP corretas é a melhor solução.

  • Você mudou todo o site para HTTPS, mas a versão HTTP ainda está acessível.

Isso pode acontecer se houver backlinks de outros sites que apontam para páginas HTTP ou porque alguns dos links internos em seu site ainda contém o protocolo antigo e as páginas não seguras não redirecionam os visitantes para os seguros. Para evitar a diluição de link Juice e o desperdício de seu Crawl Budget, use o redirecionamento 301 em todas as suas páginas HTTP e verifique se todos os links internos em seu site estão especificados por meio de URLs relativos.

Você pode verificar rapidamente se o seu site tem um problema de duplicação HTTP / HTTPS no WebSite Auditor do SEO PowerSuite. Tudo o que você precisa fazer é criar um projeto para o seu site; Quando o rastreamento do aplicativo terminar, clique em Problemas com versões de site HTTP / HTTPS na auditoria do seu site para ver onde você está.

4. Páginas WWW e não WWW

Uma das causas mais antigas de conteúdo duplicado é quando as versões WWW e não WWW do site são acessíveis. Como com o HTTPS, esse problema é comumente corrigido pela implementação de redirecionamentos 301. Uma opção ainda melhor seria especificar seu domínio preferido no Google Search Console.

Para verificar se há casos de duplicação em seu site, consulte as versões www e não-www fixas (em Redirecionamentos) em seu projeto WebSite Auditor.

5. Parâmetros de URL gerados dinamicamente

Os parâmetros gerados dinamicamente são frequentemente usados para armazenar determinadas informações sobre os usuários (como IDs de sessão) ou para exibir uma versão ligeiramente diferente da mesma página (como uma com ajustes de classificação ou filtragem feitos). Isso resulta em URLs com esta aparência:

URL 1: https://intuitivaweb.agency//rank-tracker.html?newuser=true

URL 2: https://intuitivaweb.agency/rank-tracker.html?order=desc

Embora essas páginas normalmente contenham o mesmo conteúdo (ou muito semelhante), ambos são páginas diferentes para a Google rastrear. Geralmente, os parâmetros dinâmicos criam não duas, mas dezenas de versões diferentes da URL, o que pode resultar em enormes quantidades de Crawl Budget gasto em vão.

6. Conteúdo semelhante

Quando as pessoas falam sobre duplicação de conteúdo, elas geralmente implicam conteúdo completamente idêntico. No entanto, partes de conteúdo muito semelhante também se enquadram na definição do Google de conteúdo duplicado:

“Se você tiver muitas páginas semelhantes, considere expandir cada página ou consolidar as páginas em uma. Por exemplo, se você tiver um site de viagens com páginas separadas para duas cidades, mas as mesmas informações nas duas páginas, poderá mesclar páginas em uma página sobre ambas as cidades ou pode expandir cada página para conter conteúdo exclusivo sobre cada cidade. “

Tais problemas podem ocorrer com frequência em sites de comércio eletrônico, com descrições de produtos similares que diferem apenas em algumas especificações. Para resolver isso, tente tornar suas páginas de produtos diversas em todas as áreas, além da descrição: as resenhas de usuários são uma ótima maneira de conseguir isso. Nos blogs, problemas de conteúdo semelhantes podem surgir quando você pega um conteúdo antigo, adiciona algumas atualizações e o refaz em uma nova postagem. Nesse cenário, usar um link canônico (ou um redirecionamento 301) no artigo antigo é a melhor solução.

7. Páginas para impressão

Se as páginas do seu site tiverem versões para impressão acessíveis por meio de URLs separados, será fácil para o Google localizar e rastrear essas informações por meio de links internos. Obviamente, o conteúdo da própria página e sua versão para impressão será idêntico, o que desperdiçará seu crawl budget novamente.

Se você oferecer páginas para impressão aos visitantes de seu site, é melhor fechá-las  para os bots de mecanismos de pesquisa por meio de uma tag noindex. Se todos eles estiverem armazenados em um único diretório, como https://intuitivaweb.agency/blog/print, poderá adicionar uma regra de noindex ao diretório inteiro no seu robots.txt.

Concluindo

O conteúdo duplicado pode ser um problema para os SEOs, pois dilui o link juice de suas páginas (também conhecido como Link power) e drena o crawl budget, impedindo que novas páginas sejam rastreadas e indexadas. Lembre-se de que suas melhores ferramentas para combater o problema são tags canônicas, redirecionamentos 301 e robots.txt e incorporar verificações de conteúdo duplicadas na rotina de auditoria do site para melhorar a indexação e as classificações.

Quais são as instâncias de conteúdo duplicado que você viu em seu próprio site e quais técnicas você usa para evitar duplicações?

Tem problemas de conteúdo duplicado e não consegue resolver?

Marque uma consultoria gratuita e sem compromisso com um nosso especialista SEO certificado Seocertification.org

Que tal marcar uma conversa conosco?

Gostou do artigo? Compartilhe com os seus amigos em sua mídia social favorita!

(Atualizado: novembro 6, 2018)