Una url canónica es la URL de la página que Google considera más representativa de un conjunto de páginas duplicadas de un sitio web. Por ejemplo, si tienes varias URLs que dirigen a la misma página o páginas con contenido igual o similar. En estos casos Google elegirá una URL como canónica.

Cuando el robot de Google indexa los sitios, intenta determinar cuál es el contenido principal de cada página. Si detecta que en un mismo sitio hay varias páginas con contenido similar, marca como canónica la página que considera más completa y útil. Será esta la que se rastreará con mayor frecuencia ya que las versiones duplicadas no se rastrearán tan a menudo para reducir la carga de rastreo de Google de tu sitio.

Para elegir las páginas canónicas, Google tiene en cuenta si la página se publica mediante HTTP o HTTPS, la calidad, si la url está en un sitemap y si incluye la etiqueta rel= canonical.

Si no indicas explícitamente qué URL es la canónica, Google la seleccionará por ti. Puedes ver cuál es la página que Google considera canónica con la herramienta de inspección de URLs. Ten en cuenta que aunque selecciones una página canónica específicamente, Google puede elegir otra distinta a la tuya por rendimiento o contenido.

¿Cómo indicar la página canónica?

Para elegir la URL canónica de un conjunto de URLs duplicadas o páginas idénticas o similares deberás:

Utilizar la etiqueta de enlace rel=”canonical”

Puedes indicar que una página es un duplicado añadiendo una etiqueta <link> a la sección head de la página HTML.

Si tienes varias URLs que dirigen al mismo contenido, pero quieres que la canónica sea la siguiente: https://example.com/hat/blue-hat, deberás:

  • Incluir en todas las páginas duplicadas un elemento de enlace rel=”canonical” a la sección <head> de las páginas duplicadas. Este, debe dirigir a la página canónica:

          <link rel=”canonical” href=”https://example.com/hat/blue-hat”>

  • Si la página canónica tiene una variante para móviles, añade a la página un enlace rel=”alternate” que lleve a la versión para móvil: <link rel=”alternate” media=”only screen and /max-width: 640px)” href=”https://example.com/hat/blue-hat”>
  • Incluye en la página los atributos hreflang pertinentes para el idioma u otros tipos de redirecciones que consideres oportuno. Utilizando rutas absolutas y no relativas en los elementos de enlace rel=”canonical”.

Utiliza el encabezado HTTP rel=”canonical”

Puedes configurar tu servidor, indicando la URL canónica de documentos compatibles con la Búsqueda, incluidos documentos que no sean HTML, como archivos PDF, mediante encabezados HTTP rel =”canonical” y no etiquetas HTML.

Ejemplo: si das acceso a un archivo PDF desde varias URLs, puedes devolver un encabezado HTTP rel=”canonical” cuando se soliciten las URLs duplicadas para indicar al robot de Google cuál es la URL canónica de ese archivo:

Link: <http://www.example.com/downloads/sizes.pdf>; rel="canonical"

Utiliza un sitemap

Elige las URLs canónicas de todas las páginas de tu sitio y envíalas en un sitemap. Todas las páginas que figuran en los sitemaps se sugieren como canónicas, si hay páginas duplicadas, el robot de Google decidirá cuáles son preferentes, en función de la similitud del contenido.

Utiliza redirecciones 301 para las URLs retiradas

Utiliza este método cuando quieras deshacerte de las páginas duplicadas que tengas y asegurarte de que la transición a las nuevas URLs se realice sin problemas antes de retirar las antiguas.

Selecciona una de las URLs como canónica y utiliza redirecciones 301 para enviar el tráfico de las otras URLs a la canónica. Las redirecciones 301 configuradas en el servidor son la mejor forma de asegurarte de que se redirija a los usuarios a los buscadores a la página correcta. Con el código 301, se indica que una página se ha trasladado de forma permanente a otra ubicación.

Conclusión

Si tienes páginas en las que se puede acceder mediante varias URLs o páginas diferentes con contenido igual o similar, Google elegirá la URL como canónica que es la que rastreará y considerará que las otras son duplicadas, si no lo indicas explícitamente. Para indicar a Google la URL canónica, puedes utilizar la etiqueta de enlace rel=”canonical”, el encabezado HTTP rel=”canonical”,  sitemap o las redirecciones 301 para las URLs retiradas.


Photo by John Schnobrich on Unsplash

Referencias:
· Consolidate duplicate URLs