Elemento de link canônico - Canonical link element
Um elemento de link canônico é um elemento HTML que ajuda os webmasters a evitar problemas de conteúdo duplicado na otimização de mecanismos de pesquisa , especificando a versão " canônica " ou "preferencial" de uma página da web. Ele é descrito no RFC 6596, que entrou no ar em abril de 2012.
Propósito
Um grande problema para os mecanismos de pesquisa é determinar a fonte original dos documentos que estão disponíveis em vários URLs. A duplicação de conteúdo pode acontecer de várias maneiras, incluindo:
- Duplicação devido a parâmetros GET
- Duplicação com vários URLs devido ao CMS
- Duplicação devido à acessibilidade em diferentes hosts / protocolos
- Duplicação devido a versões impressas de sites
Problemas de conteúdo duplicado ocorrem quando o mesmo conteúdo pode ser acessado em vários URLs . Por exemplo, http://www.example.com/page.html seria considerado pelos mecanismos de pesquisa como uma página totalmente diferente de http://www.example.com/page.html?parameter=1 , embora ambos URLs podem fazer referência ao mesmo conteúdo.
Em fevereiro de 2009, Google , Yahoo e Microsoft anunciaram suporte para o canonical
elemento link, que pode ser inserido na <head>
seção de uma página da web, para permitir que os webmasters evitem esses problemas. O elemento de link canônico ajuda os webmasters a deixar claro para os mecanismos de pesquisa qual página deve ser creditada como a original.
Como os mecanismos de pesquisa funcionam rel=canonical
Os mecanismos de pesquisa tentam utilizar definições de links canônicos como um filtro de saída para seus resultados de pesquisa. Se vários URLs contiverem o mesmo conteúdo no conjunto de resultados, as definições de URL do link canônico provavelmente serão incorporadas para determinar a fonte original do conteúdo. "Por exemplo, quando o Google encontra instâncias de conteúdo idênticas, ele decide mostrar uma delas. A escolha do recurso a ser exibido nos resultados da pesquisa dependerá da consulta de pesquisa."
De acordo com o Google, o canonical
elemento de link não é considerado uma diretiva, mas uma dica de que o algoritmo de classificação "respeitará fortemente".
Embora o elemento de link canônico tenha seus benefícios, Matt Cutts , então chefe da equipe de spam do Google , disse que o mecanismo de busca prefere o uso de redirecionamentos 301 . Cutts disse que a preferência por redirecionamentos é porque os spiders do Google podem escolher ignorar um elemento de link canônico se considerarem mais benéfico fazê-lo.
Implementação
Etiqueta semântica
O elemento de link canônico pode ser usado no HTML semântico<head>
ou enviado com o cabeçalho HTTP de um documento. Para documentos não HTML, o cabeçalho HTTP é uma maneira alternativa de definir um URL canônico.
Pelo padrão HTML 5, o elemento HTML deve estar dentro da seção do documento.
<link rel="canonical" href="http://example.com/">
<head>
Auto-hiperlink
Alguns sites, como o Stack Overflow, têm hiperlinks na página que levam a uma URL limpa deles mesmos. Os benefícios de usabilidade estão facilitando a cópia do URL ou título de destino do hiperlink se o navegador ou uma extensão do navegador oferecer uma opção de menu de contexto "Copiar texto do link" para hiperlinks, a capacidade de o URL original ser recuperado de uma página salva se não for armazenado pelo navegador em um comentário dentro do arquivo, bem como a capacidade de duplicar a página aberta em uma nova guia ao lado da atualmente aberta se o navegador não tiver esse recurso.
Exemplos
HTML
Abaixo está um exemplo de código HTML que usa rel = canonical dentro da <head>
tag. O código pode ser usado em uma página https://example.com/page.php?parameter=1
para informar aos mecanismos de pesquisa que https://example.com/page.php
é a versão preferida da página da web.
<!DOCTYPE html>
<html>
<head>
<link rel="canonical" href="https://example.com/page.php">
</head>
<body>
...
</body>
</html>
HTTP
HTTP/1.1 200 OK
Content-Type: application/pdf
Link: <https://example.com/page.php>; rel="canonical"
Content-Length: 4223
...