#11 Nuevos motivos que impiden que se indexen páginas en el sitio https://...
Y otras formas de que le de un infarto a un nichero
No tienes idea de la cantidad de veces que he visto a gente preguntar por los problemas de indexación que aparecen en Google Search Console. Y muchos se agobian mucho con este tema, aun cuando realmente no es algo tan complicado de entender.
Y de eso vengo a hablarte en el email de esta semana: de los problemas de indexación, como interpretarlos y como tener tu web en orden sin que te de un infarto cada vez que recibes un email con mismo asunto que este.
¿Cómo funciona la indexación en Google?
El proceso completo de indexación de google pasa por las fases que he puesto en la imagen de arriba. Voy a hablar brevemente de cada parte:
Rastreo. Google sabe que tu URL existe, pero no está indexada. Para que Google rastree tu web puedes usar la inspección de URLs en GSC o enviar un sitemap. Cuando haces esto, Google pone las solicitudes en cola y entran en la fase “Descubierta, sin rastrear”. Una vez se rastrea, pasa a “Rastreada, sin indexar”.
Indexación. Cuando Google rastrea nuestra URL y la indexa, para a la fase de “Indexada”. Y esto significa que ya aparecerá en futuras consultas.
Posicionamiento. El momento en el que está indexada, la URL puede empezar a generar impresiones y se irá posicionando. Si la URL no se posiciona bien, puede desindexarse de nuevo, ya que Google tiene un presupuesto limitado para el crawling.
Crawling y los problemas de indexación
El crawling es el proceso que tiene que realizarse para procesar el contenido de cada URL que hay en google, analizar el tema del que trata y asignarle una posición en google.
Teniendo en cuenta que hay cientos de miles de millones de URLs en google, este proceso requiere de una capacidad de cómputo brutal. Por eso digo que el presupuesto del crawling es limitado.
Ahora bien, si es limitado, Google tiene que darle prioridad a unas webs u otras, ya que es prácticamente imposible tener todo el contenido existente indexado a la vez.
Aunque no se sabe realmente como funciona el crawling de Google, es evidente que Google le da preferencia de crawleo a webs grandes, establecidas y con autoridad. Por eso hay webs con autoridad que no tienen ni que forzar el rastreo, porque sus contenidos se indexan muy rápido.
Esto último ocurre por ejemplo con los medios que aparecen en Discover, que normalmente lo hacen recién publicados.
Por el contrario, las webs nuevas suelen tardar mucho en crawlearse y, por consiguiente, indexarse, ya que no tienen nada de tráfico ni de autoridad, entonces Google las pone “a la cola”.
Y ahora que sabes todo esto, vayamos a analizar los errores de indexación que suelen tener las páginas web y a entender cada uno.
Para acelerar la indexación de tus sitios web…
Tienes un descuento en Indexed Pro: 20% de descuento en los planes Growth y Ninja anuales, usando el código "MACA20". Para usarlo, debes introducir el código en el checkout de Stripe, justo antes de pagar. Yo la estoy probando y me da unos resultados muy buenos en webs con muchas URLs, me las indexa completamente en cuestión de días.
Los errores de indexación de Google
La verdad es que hay muchísimos errores de indexación diferentes. Algunos probablemente ni si quiera los haya visto nunca, así que no me voy a centrar en hablar de todos, si no en los más habituales.
Y si se da el caso de que tienes un problema de indexación que no está en la lista, puedes ponerlo en comentarios y buscamos información al respecto!
Un problema de indexación puede ser de dos tipos:
Sitio web. Quiere decir que el problema es ajeno a Google y debes comprobar por ti mismo si tienes que solucionar algo con tu página web.
Google. Quiere decir que el problema está en manos de Google y tu sólo tienes que esperar a que ellos hagan sus cosas con el problema.
Esta información la ves en la sección de páginas en GSC, y en la interrogación de Fuente te explica esto mismo:
Pero lo más importante es que entiendas que un problema de indexación lo que quiere decir es que Google había conocido una URL a la que actualmente no puede acceder.
Y esto no tiene porque ser malo ni un error en tu web. En serio, tienes que entender esto. Un problema de indexación sólo es Google diciéndote: oye, aquí antes había una URL y ahora no soy capaz de llegar a ella POR ESTE MOTIVO.
Lee los dos últimos párrafos las veces necesarias hasta que entiendas que un problema de indexación no quiere decir que haya algo malo en tu web.
Y a continuación te explico los diferentes motivos que generan problemas de indexación y lo que significa cada uno.
Descubierta: actualmente sin indexar
Como te decía antes esto quiere decir que Google ha recibido información de que la URL existe. Puede ser porque hayas usado una app de indexación, la opción de inspeccionar URL o hayas incluido un sitemap.
En este caso, simplemente debes esperar a que Google la rastree y luego la indexe. Para acelerar este proceso, lo mejor que puedes hacer es un buen interlinking en tu web.
Rastreada: actualmente sin indexar
Este es similar al caso anterior, pero la URL ya está rastreada, más cerca de la indexación. Lo que debes hacer sigue siendo lo mismo que en el caso anterior: esperar a que Google la indexe, sin más.
Error de redirección
El error de redirección ocurre cuando se genera una redirección que está dando problemas. Pueden ser:
Se genera un bucle en la redirección. Por ejemplo, la url dominio/url1 redirecciona a dominio/url2 y esta misma vuelve a redireccionar a la url1. Esto genera un bucle que pasados unos segundos genera un error. Para solucionarlo, debes eliminar una de las dos redirecciones.
La redirección es demasiado larga. Es decir, si dominio/url1 redirige a dominio/url2 y este a su vez redirige a dominio/url3 y así consecutivamente durante unas cuantas redirecciones, el navegador da un error por redirección muy larga, y la URL final no es accesible. Para solucionarlo, debes acortar esta cadena de redirecciones, preferiblemente a una sola redirección.
Hay una URL incorrecta en la redirección. Esto puede ocurrir si hay redirecciones entre diferentes URLs y una de ellas desaparece o nunca existió, por ejemplo. Para solucionarlo, debes eliminar o corregir la URL incorrecta en la redirección.
Si tienes un error de redirección en tu web lo que debes hacer es ver cual es la URL que da ese error y arreglarlo. Para ello, desde la sección Páginas de GSC, vas al error de redirección y pulsas en el. Abajo, salen las URLs afectadas.
Si tienes un plugin de SEO (como Rank Math) que haga redirecciones automáticas, puede que en algún momento te ocurra esto, ya que al renombrar (la URL) o borrar entradas, suele hacer automáticamente redirecciones.
De ser así, debes revisar que la URL del informe de errores sigue teniendo ese problema y solucionarlo. Para solucionarlo hay que mirar cada caso concreto.
Hay una cosa en la que debes fijarte y es la fecha del último rastreo. Porque si es una fecha muy antigua, puede que el problema fuera algo puntual y ya no exista. En cualquier caso debes comprobarlo, ver de donde surge el error e intentar solucionarlo.
Página con redirección
Este problema de indexación ocurre cuando estamos haciendo redirecciones en nuestra web. Y el problema que te está diciendo Google es que la página de origen de la redirección (es decir, la que está redirigiendo a otra) no se va a indexar precisamente a causa de la redirección.
Y esto tiene todo el sentido del mundo, realmente. ¿Por qué iba Google a querer indexar una URL que nunca es accesible? De hecho, lo más lógico es pensar que a ti, como dueño de la web, tampoco te importa mucho que esa URL se indexe.
Cuando se hacen redirecciones lo ideal es usar redirecciones 301 (por defecto son las que usa Rank Math) ya que son permanentes y eso implica que a la larga la URL inicial va a desaparecer y la que va a ocupar su lugar es la nueva URL, a la que se redirige.
Excluida por una etiqueta “noindex”
Este problema de indexación es… bastante explícito por sí mismo, no? Básicamente a la URL o URLs afectadas se les ha asignado una etiqueta no index, que fuerza la no indexación.
Por lo tanto, Google ha conocido esa URL (probablemente por enlazado interno) pero como tiene una etiqueta no index, no es capaz de indexarla. Y esto por lo general no supone un problema real, pero siempre hay que comprobar las URLs afectadas, claro.
Por lo general, las webs que tienen URLs con etiquetas no index es porque nosotros mismos hemos especificado que no queremos que se indexen esas URLs.
Como siempre, lo que hay que hacer es comprobar cuáles son las URLs afectadas y si son URLs que no queremos que se indexen pues seguimos con nuestra vida. Si realmente son URLs que deberían indexarse, lo más probable es que el plugin de SEO que estemos usando haya puesto la etiqueta de no index y haya que cambiarlo manualmente.
No se ha encontrado (404)
El error 404 es uno muy conocido y significa que Google tenía una URL conocida (no necesariamente ya indexada) que de repente deja de ser accesible y no la encuentra. Así que, da error 404.
Esto ocurre cuando borramos una URL y no hacemos una redirección (manual o usando un plugin que lo haga automáticamente). Lo normal es redireccionar a una URL similar (en caso de que se haya eliminado por canibalización) o una redirección directa a la home, aunque dependiendo del caso puede haber otras opciones.
Así que lo de siempre: miramos cual es la URL afectada y generamos una redirección 301 a la nueva URL. Y tu dirás: pero entonces me saldrá un error de redirección. A lo que yo te digo: ¿de verdad es un error?
Como te decía hace unos cuantos párrafos, los “errores” de indexación son URLs que Google sabía que existían y ahora acceder a ellos no es posible. Eso no quiere decir que haya ningún problema en tu sitio.
Hay más errores de indexación, pero he decidido poner los más habituales y los que veo que generan inquietudes en mucha gente del sector! Si hay alguno que te salga y quieres que lo explique en la newsletter, pónmelo en comentarios!!
Recomendaciones de la semana
Bruno Ramos aclara que no se pueden poner anuncios debajo de los encabezados y Adsense puede penalizarte por eso.
Hridoy Rehman, habla sobre las oportunidades que hay en webs de afiliación y que este tipo de webs no están muertas.
Ian nos lista una serie de webs que han subido mucho con los últimos updates de Google.
Esta semana os pregunté por twitter por los themes de wordpress que usáis (además de Asap y Generate Press que son los que ya uso) y recibí muchas respuestas interesantes y muchas recomendaciones.
Para la semana que viene dejo que elijáis el tema entre los siguientes. Las tres opciones son:
Cómo hacer un buen análisis de la competencia que os permita saber si podréis posicionaros por encima de lo que ya hay en Google
Analiza al usuario objetivo de tu web para saber cómo darle el contenido. Crea un perfil, y haz el artículo en base a ese perfil.
Canibalizaciones. Como identificarlas y como solucionarlas. Cuando preocuparse y cuando no.
Aquí los votos (en navegador):
Además, te recuerdo que si hay algo de lo que quieras que hable en la newsletter, puedes responderme a cualquiera de los emails que mando o poner un comentario aquí, en substack!
Descuento de Indexed Pro: 20% de descuento en los planes Growth y Ninja anuales, usando el código "MACA20". Para usarlo, debes introducir el código en el checkout de Stripe, justo antes de pagar. Yo la estoy probando y me da unos resultados muy buenos en webs programáticas con muchas URLs, me las indexa completamente en cuestión de días.
PD: En los mails hablo de mi experiencia personal y no tiene que ser la mejor forma de hacer las cosas ni mucho menos la única.
PD2: El email puede contener enlaces de afiliación. Como el contenido es gratuito, es la forma que tengo de rentabilizar el tiempo que uso creando el contenido!
Muchas gracias por leer, nos vemos la semana que viene en tu buzón de entrada! (o en spam 🥲)
Saludos,
Macarena
Gracias Macarena,
es verdad que cada vez que recibo un correo de GSC con problemas de indexación empiezo a sudar. Me fastidia también mucho el tema de la indexación de URLs con / o no al final.
En cuanto a los temas que propones, todos me parecen estupendos. Si tuviera que elegir uno me decantaría por el análisis de la competencia. El motivo es que da igual lo bien que hagas tu página, si la cagas en esto, porque habrá gente a la que nunca podrás superar, y el coste de oportunidad es muy grande.
Hola, he leído que Google dice que no hay presupuesto de indexación, hace poco.