Asiste al evento de SEO más avanzado del año

Códigos de Respuesta desde el Servidor en el SEO

Listado de los códigos de respuesta más útiles para el posicionamiento web

Autor:
Carlos Sánchez
Temática:
Servidores
Fecha de publicación:
2022-12-19

Última revisión:
2024-02-09

Los códigos de respuesta del servidor son una parte importante de la interacción entre una página web y un navegador.

Cada vez que un usuario a través de un navegador solicita una página web y realiza su petición http, el servidor envía un código de respuesta junto con la página solicitada. Estos códigos de respuesta indican el estado de la solicitud y proporcionan información adicional sobre la solicitud.

La gestión de servidores ayudan muchísimo en el posicionamiento web, y forzar o generar los códigos de respuesta necesarios según la página es una parte necesaria que cualquier SEO técnico debe saber.

Listado de códigos de respuesta para el SEO

Cabe decir que Google en su documentación no recoge todos los códigos de Estado posibles, como el status code meme 418 (de soy una tetera), por lo que no podemos esperar que se comporte de una forma 100% predecible, aunque la tendencia es a que lo tome igual que su familia (el primer número) de códigos de respuesta.

Aquí hay una lista de algunos de los códigos de respuesta más comunes que puede encontrar en una página web:

1xx (Información):

Los códigos de respuesta de esta categoría, informan de que la petición ha sido recibida y que se continua en el proceso. No afectan necesariamente ni al rastreo ni a la indexación.

2xx (Éxito):

Los códigos de respuesta de esta categoría una vez rastreados, pueden ser tenidos en cuenta para la indexación (leer en específico cada uno para saber más). Para que un contenido sea indexable, a la fuerza tiene que ser un código de respuesta de categoría 2XX.

Más códigos de respuesta HTTP 2XX

3xx (Redirección):

Los códigos de respuesta de esta categoría provocan que se realice una solicitud a otro documento distinto. Es decir lo que se conoce como una redirección. Es posible que un código 3XX apunte a otra dirección que arroje otro código 3XX, a esto se le conoce como cadena de redirecciones. Oficialmente Google no sigue más de 10 saltos de redirecciones (5 en el caso del robots.txt). Aunque no es recomendable tener ninguna cadena de redirecciones, evitarlas en la medida de lo posible y que no sean más de 3.

Oficialmente según la documentación de Google, Googlebot trata los códigos de respuesta 3XX de la misma forma (aunque se pueden ver diferencias entre el 301 y 302, adjunto hilo de twitter). Se recomienda utilizar los códigos de respuesta correspondientes.

Problemas del 304

Según Gary Illyes puede ocurrir este proceso:

Esto no quiere decir que vaya a ocurrir, pero que es una posibilidad que se debe tener en cuenta y es un paso extra de auditoría si realmente la decisión de la empresa es utilizar este tipo de implementación por optimización. Ya que detectar y depurar este tipo de fallos suele ser bastante engorroso.

Un arreglo para este tipo de situaciones sería que si el tamaño de la página que se sirve son 0bytes con un código de respuesta, se emita un código de respuesta 500. Como en el ejemplo de este código.

Advertencia: Este código en apache no es perfecto y necesita un pulido, tiene ciertos fallos, es solo una ejemplificación.

RewriteEngine On
RewriteCond %{REQUEST_FILENAME} -f
RewriteCond %{DOCUMENT_ROOT}%{REQUEST_URI} !-s
RewriteRule ^ - [R=500,L]

4xx (Errores del cliente):

Los códigos de respuesta 4xx se refieren a errores de cliente. Estos errores indican que la solicitud del cliente no puede ser procesada debido a un problema con la solicitud.

Deben evitarse todos los enlaces que lleven a documentos que arrojen un código de respuesta 4XX en la medida de lo posible. Las URLs que estaban indexadas y arrojan uno de estos códigos de respuesta desaparecen del listado y a su vez no se pueden indexar páginas con estos códigos de respuesta.

Algunos ejemplos comunes de códigos de respuesta 4xx incluyen:

Frecuencia de rastreo en Google con 4xx contradiciendose
Podemos observar como Google se contradice en dos líneas seguidas en cuanto
a los efectos que producen los códigos de respuesta 4XX. En mi experiencia y comprobando los logs
Google tiende a bajar la frecuencia de rastreo, aunque no es el sistema más efectivo.

Estos códigos de respuesta pueden afectar negativamente el SEO de un sitio web de varias maneras. Por ejemplo, si un motor de búsqueda encuentra muchas páginas con códigos de respuesta 4xx en un sitio web, puede interpretarlo como una señal de que el sitio no es de confianza o que no está actualizado. Esto puede llevar a una disminución en el ranking del sitio en los resultados de búsqueda. Además, si un usuario intenta acceder a una página con un código de respuesta 4xx y se encuentra con un mensaje de error, es posible que decida abandonar el sitio y no volver a visitarlo, lo que también puede afectar negativamente el tráfico y el SEO del sitio. Por lo tanto, es importante asegurarse de que todas las páginas de un sitio web estén funcionando correctamente y de que los códigos de respuesta sean los adecuados para evitar problemas de SEO.

A excepción del 429, los errores 4XX no se deben utilizar para tareas como mantenimiento o limitar la frecuencia de rastreo. Es decir, si esa URL se pretende indexar posteriormente, se debe utilizar un 5XX.

5xx (Errores del Servidor):

Los códigos de respuesta 5xx se utilizan para indicar que ha habido un error en el servidor mientras se procesaba la solicitud del cliente. Estos códigos incluyen:

Estos códigos de error del servidor (incluyendo el 429) nos pueden servir para solicitar a Google que ralentice el rastreo. Ya que si bien es verdad que a lo largo del tiempo retirará esas URL del índice de búsqueda, no es un efecto inmediato y podemos realizar tareas de mantenimiento sin perder posicionamiento si es una tarea a corto plazo. Por ejemplo de cara a una migración, para minimizar el impacto de los posibles errores.

Códigos de error 5xx y el robots.txt

En cuanto al robots.txt tiene una característica peculiar, en el caso de que tenga un código de respuesta 5XX, según Google Developers y su documentación utilizará la última copia almacenada en caché en caso de haberla, si no la hay, no habrá restricción de rastreo. Sin embargo, en Gary Illyes afirma rotundamente que puede acabar con una desindexación en la página. Entramos en una gran contradicción. En cualquiera de los casos, lo ideal es que el robots.txt no arroje este tipo de error.

contradicción google robots.txt
contradicción documentación de google robots.txt error

Cómo utilizar los Response CODES de HTTP a nuestro favor

Es importante asegurarse de que su sitio web esté devolviendo los códigos de respuesta adecuados para garantizar que los motores de búsqueda puedan indexar y rastrear su sitio de manera efectiva. Si tiene problemas para determinar qué códigos de respuesta está devolviendo su sitio, puede utilizar herramientas como Google Search Console, la consola de Chrome o Screaming Frog para ayudarlo a identificar y solucionar cualquier problema. Es importante ser conscientes de que podemos forzar y generar nosotros mismos esos códigos de respuesta en cualquier URL de una página sobre la que tengamos control.

Bibliografía

Si te gusta este artículo, me ayudarías un montón compartiendo mi contenido:
No se te da mal el SEO Técnico

Te falta mi máster. Accede a una formación avanzada que te permitirá aplicar e implementar SEO en cualquier tipo de WEB

¡Accede al Máster de SEO Técnico!
Tal vez te interesen otros artículos:
Artículos de SEO

Si te ha gustado esta publicación, siempre me lo puedes agradecer dándome like en esta publicación de LinkedIn sobre este mismo artículo.

Usamos cookies para asegurar que te damos la mejor experiencia en nuestra web. Aquí tienes nuestra política de privacidad.