Un artículo con un código de respuesta 200 que habla sobre 404
Aun a riesgo de hacer un artículo que sea considerado soft 404 por usar las palabras mágicas (404), creo que es información útil para el lector y quiero contribuir a la comunidad SEO.
Ya que realmente, hasta las páginas que no existen en tu web requieren de cierta optimización, y es que realmente, una página que arroja un 404, pese a que la puedas personalizar y leer, es oficialmente una página que no existe.
Forma parte del conjunto de códigos de respuesta 4xx los cuales son considerados "errores del cliente" (ahora matizaremos en qué consiste eso). Salvo el código 429 Google considera a todos de la misma forma. (En otro post ya hablaré sobre el 429 y cómo puede salvarte de ataques DOS y DDOS y por qué Google lo considera un 5XX).
Todos los errores
4xx
, salvo429
, se tratan del mismo modo: el robot de Google indica a los sistemas de indexación que no existe el contenido. — Google Developers
Por lo que sí, de cara a Google el 410 (páginas que existían y ya no) sería lo mismo que un 404. Siento si caíste en el mito de que desindexaba antes, oficialmente, según la documentación y pruebas que he realizado yo, funciona de la misma forma a nivel técnico. No obstante, no todo es técnico, es posible que a nivel de UX tenga sentido hacer las diferencias y sea mejor para el usuario.
Los 404 a nivel técnico deben existir, porque en tu web no existen todas las posibilidades infinitas de URLs y por tanto de páginas no existentes. Si no existen, se deben indicar que no deben existir.
Así que sí, por si te lo preguntas, los 404 son nuestros amigos y no es cuestión de redireccionar todos los 404 que nos encontremos. Tampoco es una buena práctica redireccionar todos los 404 y que no existan.
Si se supone que deben ser 404, entonces no hay nada que hacer. Los 404 en páginas que no existen están bien. Es técnicamente correcto que devuelvan un 404. Que sean señalados no significa que estés haciendo algo mal, si los 404 son intencionales. —John Mu
Un 404 nunca se indexará si el código de respuesta es correcto, debemos asegurarnos que el código de respuesta de un 404 es efectivamente un 404, lo cual podemos comprobarlo con la DEVTOOLs o con extensiones de chrome como redirectpath o perseo.
Es totalmente irrelevante si tenemos en ese 404 personalizado metas index o canonicals, ya que son señales que ningún motor de búsqueda tendrá en cuenta desde el momento en el que ve el código de respuesta. Pero no nos relajemos, que si es importante personalizarlo y veremos por qué.
En la medida de lo posible, lo que hay que evitar es cualquier tipo de enlazado hacia una página 404, y se pueden redireccionar cuando haya enlaces externos a nuestra página. Lo cual se puede comprobar rápidamente con ahrefs y si tienes un bolsillo más ajustado, con la Bing Webmaster.
Es posible que nos encontremos que la página existe por motivos que no terminamos de controlar, como páginas que te genera el CMS, o incluso un virus seo, o bloques de páginas heredadas de proyectos antiguos.
Podemos hacer que aunque "existan" esas páginas porque se generan de forma automática, el servidor las anule y hagamos que se arroje un 404.
Resulta que también tenemos que ayudar al usuario lo máximo posible, y para eso debemos darle unos códigos de respuesta que no sólo informen al usuario de lo que ha ocurrido, sino que además, pueda saber como actuar una vez que ha sucedido. No todo el mundo tiene la rapidez mental de volver atrás y si además ha venido de otra URL, el usuario ya ha salido de nuestra web. Es decir, debe ser una página funcional.
Aunque tenemos que tener en cuenta un aspecto curioso. Además de la usabilidad, también nos sirven para el posicionamiento.
¿Quién dijo que una página no indexable no nos puede ayudar con nuestro posicionamiento?
Pues si que ayuda, y tanto es así que Google recomienda tener un 404 bien hecho y personalizado para mejorar la experiencia del usuario. Lo dicen hasta en sus guidelines oficiales, sección 9.2.
Esa guía es una guía para los revisores de Google donde deben evaluar el UX de una página, y este es uno de los apartados, en el que bien implementado el 404 personalizado, se puede obtener un buen punto.
¿Qué parámetros tienen en cuenta los revisores para evaluar los 404?
@elseotecnico Respuesta a @marketingconirene ♬ sonido original - Carlos Sánchez
MJ Cachón hizo un test para comprobar la eficacia de la desindexación y en sus pruebas sobre una web (sería interesante verlo en una muestra mas amplia e incluso actual) en sus conclusiones sí que un 410 desindexó antes que un 404.
Te falta mi máster. Accede a una formación avanzada que te permitirá aplicar e implementar SEO en cualquier tipo de WEB
¡Accede al Máster de SEO Técnico!