Las señales de clasificación orgánicas que Google incluye

El SEO tradicional o SEO básico solo trata algunos de los siguientes puntos sin profundizar en ellos. Sin embargo, el SEO avanzado llega a niveles de compresión e investigación más profundos de los motores de búsqueda.

A continuación expongo un listado de señales de clasificación orgánicas que el motor de búsqueda Google, ha patentado.

Las posibles señales de clasificación han sido muy debatidas en SEO durante los últimos años, y aunque probablemente nunca sabremos al 100% cuales son todas ellas, al menos si podemos corroborar algunas.

Hay una diferencia importante entre las señales de clasificación que Google incluye y las que solo considera.

A veces veo que se confunden los dos términos, y conlleva a “suponer” señales de clasificación falsas o no contrastadas.

Conozco bien el tema, y he leido cientos de artículos hablando sobre si google incluye unas señales de clasificación u otras.

La diferencia entre esos artículos y este, radica en que las señales de este listado están documentadas y publicadas por el propio Google.

Cuales son las señales de clasificación de búsqueda orgánica

 Las señales de clasificación orgánicas son aquellas que incluyen nichos específicos, dejando fuera los resultados de noticias, búsquedas locales, vídeos o búsquedas por imágenes.
 
 Este tipo de resultados es muy probable que trabajen con señales de clasificación diferentes para los motores de búsqueda.
 
 También es posible ver una combinación de resultados de búsqueda orgánicos con otros no orgánicos debido a la búsqueda universal de Google.
 
Por ejemplo, cuando se realiza una búsqueda de algunos términos genéricos en Google, podemos obtener una mezcla de resultados de diferentes tipos, como son:
  • páginas web
  • noticias
  • imágenes
  • videos
  • listas de libros
  • otros.

Esto significa que puede existir diferentes tipos de señales de clasificación que se están utilizando para cualquier consulta.

A continuación voy a exponer un listado de señales de clasificación orgánicas que se incluyen en patentes de google .

1. Edad del dominio y tasa de vinculación

documento google 1

Esta patente de Google especifica como el motor de búsqueda utiliza un primer rastreo de la página web o a través del enlace que fue descubierta, como el nacimiento de ese sitio web.

Aquí hay que añadir sobre los dominios y su antiguedad lo siguiente.

En un primer momento, google declaró que podrían considerar la renovación de un dominio como señal de clasificación, cuando el dominio se adquiere por 5 o 10 años con el objetivo de evitar los spammers.

Sin embargo, no tiene validez esta afirmación porque existen millones de páginas webs que se renuevan año a año y no son spammers.

La patente también habla sobre los enlaces y su respuesta para clasificar una página web. Debemos tener en cuenta:

  1. La fecha en la que el motor de búsqueda indexa la página (documento).
  2. La fecha en la que se detecta el primer enlace (backlink) a esa página.
  3. La cantidad de enlaces que recibe esa página.
  4. La tasa promedio de enlaces que recibe esa página calculada en un determinado tiempo.

2. Uso de palabras clave dentro de una página

En este documento de Google, nos explican como Google encuentra las palabras que contienen esos términos de búsqueda utilizados por los usuarios como una parte importante para los resultados orgánicos.
 

Aún debemos seguir implementando las palabras clave específicas en una página dentro de sus diferentes meta etiquetas.

Si embargo, no es tan necesario incluir un número de veces o porcentaje de veces esa palabra clave.

Lo que debemos hacer es implementar las palabras clave que utilizan los usuarios para encontrar esa página junto a términos contextuales que den valor al contenido.

3. Las frases relacionadas dentro de una página o documento 

En esta patente, Google afirma que las páginas con más frases relacionadas en ellas tienen una clasificación más alta que las páginas con menos frases relacionadas.

Google puede ver las consultas para las que una página está optimizada, y buscar las palabras con la clasificación más alta para esos términos de consulta, y ver qué frases completas significativas ocurren con mayor frecuencia (o co-ocurren) en esas páginas de alta clasificación.

Esta patente dice entre otras muchas cosas:

Los documentos que contienen las frases más relacionadas con las frases de consulta Q tendrán los vectores de bits de frases relacionadas de mayor valor, y estos documentos serán los documentos de mayor clasificación en los resultados de búsqueda.

Puedes utilizar alguna de estas frases relacionadas como textos de anclaje para ayudar a clasificar otras páginas.

Pero también dice sobre las duplicidades de documentos para una misma consulta:

Por ejemplo, un artículo de noticias producido por una agencia de noticias (Press release) , puede ser replicado en una docena o más de sitios web de periódicos individuales.

La inclusión de todos estos documentos duplicados en respuesta a una consulta de búsqueda solo carga al usuario con información redundante y no responde de manera útil a la consulta.

Por lo tanto, el sistema de presentación 130 proporciona una capacidad adicional 704 para identificar documentos que probablemente sean duplicados o casi duplicados entre sí, y solo incluyen uno de estos en los resultados de búsqueda.

Esto deja claro que la creación de contenido sobre un mismo tema ya creado, si es redundante o no hay una gran diferencia, google no lo mostrará.

¿Qué opinas ahora sobre los envíos de notas de prensa masivos?

4. Palabras clave en encabezados, listas y títulos

Google define las palabras clave en títulos y listas como “proximidad semántica a la página“.

Para fines de SEO puede ser de interés conocer qué relación hay entre un encabezado de página con la keyword y su relevancia de cara a los motores de búsqueda.

Esta patente de Google muestra  como el motor de búsqueda está tratando de ubicar y entender las estructuras visuales en una página que podría ser semánticamente significativa, como una lista de elementos asociados con un encabezado.

Esta patente también nos declara sobre las palabras clave en los encabezados:

Una técnica básica para clasificar los resultados del motor de búsqueda se basa en el grado en que la consulta de búsqueda coincide con los resultados.

Por ejemplo, los documentos que contienen todos los términos de la consulta de búsqueda o que contienen varias apariciones de los términos en la consulta de búsqueda pueden considerarse más relevantes que otros documentos y, por lo tanto, el motor de búsqueda puede clasificarlos más ampliamente.

También se pueden considerar otros factores, como la proximidad de los términos (también conocida como distancia entre los términos) en el documento.

La proximidad de los términos en este contexto se puede medir simplemente contando el número de palabras en el documento que aparecen entre los términos de búsqueda.

En documentos como las páginas web, sin embargo, que puede contener información de formato complejo, la “proximidad” de los términos en el archivo HTML subyacente puede no correlacionarse con la “cercanía” de los términos cuando se visualiza visualmente el documento.

En consecuencia, el rendimiento de los motores de búsqueda que clasifican los documentos según la proximidad de los términos de búsqueda en los documentos subyacentes puede verse afectado.

Para encabezados y títulos, un término (palabra clave) en el título de un documento puede considerarse cercano a cualquier otro término en el documento, independientemente del recuento de palabras entre los términos.

De manera similar, un término (palabra clave) que aparece en un encabezado (H2, H3) puede considerarse muy cercano a otros términos que están debajo del encabezado en la estructura de árbol.

Es probable que Google use la distancia entre diferentes palabras dentro de una página como una señal de clasificación y de como de relevante podría ser esa página para esas palabras clave si aparecieran dentro de una consulta.

Y este concepto de cercanía semántica dentro de estructuras como encabezados y listas puede ayudar a dar luz a la optimización de la web.

La agrupación de palabras clave según la intención de usuario puede tener sentido.

5. Velocidad de la página 

Google ha anunciado en varias ocasiones que utiliza Page Speed como señal de clasificación.

Su esfuerzo último al integrar lighthouse es otra prueba más.

En esta patente sobre Page Speed, Google menciona cosas como:

Dados dos recursos que son de relevancia similar a una consulta de búsqueda, un usuario típico puede preferir visitar el recurso que tiene el menor tiempo de carga. 

El tiempo de carga de un recurso puede depender de la cantidad de contenido incluido en el recurso un recurso que incluye múltiples videos incrustados puede tener un tiempo de carga más prolongado que un recurso que no incluye imágenes o videos incrustados.

Además, un recurso alojado por un servidor web en Francia puede cargar más rápido en un dispositivo de usuario en Francia que en un dispositivo de usuario en los Estados Unidos.

Mejorar la velocidad de carga es algo que no debemos pasar por alto. Esto incluirá compresión de archivos, minificar CSS, mejoras en el servidor, implantar themes optimizados para SEO y más.

6. Tiempo de visualización de una página 

Esta patente de Google nos dice que una web puede clasificar las páginas más alto si se ven durante más tiempo que otras páginas web.

tiempos de visualizacion en google

Un sistema que utiliza los tiempos de visualización para clasificar los resultados de búsqueda también puede proporcionar a los proveedores de contenido un mayor uso del sitio y la participación de los usuarios al promocionar el contenido que tiene tiempos de observación más prolongados.

Y añade:

En general, “tiempo de visualización” se refiere al tiempo total que un usuario pasa viendo un video.

Sin embargo, los tiempos de visualización también pueden calcularse y utilizarse para clasificar otros tipos de contenido según la cantidad de tiempo que un usuario pasa viendo el contenido, por ejemplo, la cantidad de tiempo que pasa viendo un video, viendo una página web en particular o escuchando una archivo de audio (podcast ).

Introducir archivos de vídeo o audio dentro del cuerpo del contenido de una página web es algo que ya deberías estar haciendo.

7. Los términos de contexto dentro de  una página 

Esta patente de google, nos habla sobre los diferentes significados que puede tener una misma palabra y como google puede interpretarlo.

Un motor de búsqueda debe ser capaz de saber cuando una consulta realizada a través de una palabra tiene un significado u otro.

Este aprendizaje automático lo adquiere Google a través de los gráficos de conocimiento (Knowledge Graph)

Debes asegurarte de que el motor de búsqueda entiende el contexto de las palabras clave introducidas en el contenido para que lo archive dentro del grupo de entidades correcto para poder ofrecerlo a los usuarios correctos.

Un motor de búsqueda puede responder a la consulta de un usuario:

  • dando contextos, tanto macro como micro-contextos basados ​​solo en la consulta.
  • con otras consultas del mismo usuario.
  • con la consulta asociada con otra información.
  • con los resultados de la consulta de ese usuario.
  • con otras entradas proporcionadas sobre el usuario para dar contexto.

8. Señal de calidad de los textos según el modelo de idioma Ngram

En esta patente de google, el buscador puede interpretar señales de calidad de las páginas webs según los modelos de lenguaje creados a partir de esas páginas cuando mira los ngrams en las páginas de un sitio.

puntajes de calidad ngrams

Qué son los ngram

Los modelos n -gram ahora se usan ampliamente en probabilidad , teoría de la comunicación , lingüística computacional (por ejemplo, procesamiento estadístico del lenguaje natural ), biología computacional (por ejemplo, análisis de secuencia biológica ) ycompresión de datos .

El Visor de Ngram se basó inicialmente en la edición de 2009 de Google Books Ngram Corpus.

Al final se trata de determinar la calidad del contenido de una página web.

Por ejemplo, si una una web nueva es capaz de crear un contenido que sea del mismo nivel de calidad que otra que ya esta bien posicionada, la primera puede obtener un puntaje de calidad mayor que otras webs nuevas.

Un ejemplo de escribir con un alto grado contextual y de sintaxis lo podemos encontrar cuando cuando hablamos de “posicionamiento web”.

Los “usuarios de calle” utilizan la palabra o frase “posicionamiento web” para encontrar contenido relacionado con este sector, sin embargo, dentro de un documento que trate sobre – posicionamiento web, un experto en redacción de SEO puede incluir términos como “ranking orgánico de motores de búsqueda”, o incluso “optimización de una página web para motores de búsqueda.

Escribir contenido de alta calidad sigue siendo prioritario para obtener buenos puntos por parte del buscador, y esto requiere también de una buena base linguística.

He escrito un artículo recientemente sobre la optimización de textos usando la PNL SEO que te puede ayudar en este sentido.

Tal vez te interese conocer algunas herramientas de IA para optimizar contenidos.

9. Contenido gibberish perjudica la clasificación

Google ha estado realizando análisis de ngram en muchos libros y documentos durante años, y es capaz de saber si el contenido que se crea a través del lenguaje es de calidad o son galimatías.

A través de este aprendizaje el buscador es capaz de detectar contenido de baja calidad e impedir que ese sitio web clasifique alto.

Esta patente de google, ofrece información sobre el contenido gibberish.

gibberish de google

10. Resultados de páginas de autoridad

En esta patente, podemos encontrar información relevante sobre la clasificación de páginas con autoridad para ciertos tipos de consultas en los que es posible que no existan páginas web con la suficiente autoridad o confiabilidad por parte del buscador.

El sistema puede incluir un resultado de búsqueda autorizado (página web con autoridad), por ejemplo, cuando los puntajes de un primer conjunto de resultados de búsqueda inicial son bajos o cuando la consulta en sí indica que el usuario busca recursos de un sitio autorizado.

Podemos ver ejemplos rápidamente sobre la inclusión de páginas de autoridad cuando realizamos una consulta local, como [negocio local ] en [ciudad] “o similares.

Aquí encontraremos como google siempre incluye una página de autoridaden los resultados, como páginas amarillas u otra similar, debido a que en muchos casos las páginas de ese sector no tienen autoridad online.

Para solventar este problema conviene trabajar el E-A-T (experiencia, autoridad y confiabilidad de los contenidos según las pautas de calidad de google).

11. Penalización por actividad sospechosa para aumentar las clasificaciones 

Esta patente de google, nos habla sobre la posible penalización a páginas webs que puedan incurrir en acciones sospechosas con el fin de engañar al buscador.

La World Wide Web (“web”) contiene una gran cantidad de información que cambia constantemente.

Las técnicas de spam que modifican el rango, como el spam de índice y enlace, incluyen un conjunto de técnicas mediante las cuales los proveedores de información intentan engañar a un motor de búsqueda para que clasifique su información (o la información de sus clientes) en o cerca de la parte superior de la lista de resultados de búsqueda.

Algunas de las técnicas utilizadas por los spammers que modifican el rango incluyen el relleno de palabras clave, el texto invisible, el texto minúsculo, los redireccionamientos de páginas, el relleno de etiquetas META y la manipulación basada en enlaces.

También explica más en profundidad el tema de los enlaces:

La manipulación basada en enlaces puede incluir la creación o manipulación de un primer documento o un conjunto de primeros documentos para incluir un enlace o una serie de enlaces a un segundo documento en un intento de aumentar el rango del segundo documento.

Algunos motores de búsqueda existentes determinan el rango de un documento en función del número o la calidad de los enlaces que apuntan al documento.

Una granja de enlaces es un ejemplo de una técnica de manipulación basada en enlaces.

Ya sabes que intentar subir el ranking solo a base de enlaces, conlleva un riesgo.

12. Puntajes de popularidad para páginas de eventos 

A todos nos suenan páginas como Meetup, ¿verdad?

¿Es posible que este tipo de páginas posicionen más alto si incluyen eventos muy populares o relevantes para la audiencia?

Esta patente de google, trata sobre esta señal de clasificación para páginas de eventos.

señal de clasificacion de eventos

Un motor de búsqueda puede identificar los eventos más populares para un tipo de consulta y colocarlos en una posición alta para satisfacer la búsqueda de los usuarios .

13. El PageRank de un enlace se basa en la probabilidad de que alguien haga clic en él

En esta patente, podemos comprobar como se establece un “rango de peso” a la probabilidad de clic que puede recibir un enlace, el texto de anclaje y las palabras que hay antes y después de un enlace.

Por ejemplo, la unidad de generación de modelos 410 puede generar una regla que indique que un enlace ubicado debajo del encabezado “Más historias destacadas” en el sitio web cnn.com tiene una alta probabilidad de ser seleccionado.

Además,  la unidad de generación de modelos 410 puede generar una regla que indica que un enlace asociado con una URL de destino que contiene la palabra “domainpark” tiene una baja probabilidad de ser seleccionado.

Se pueden generar pesos para los enlaces basados ​​en el modelo (acto 540). El peso de un enlace puede ser una función de las reglas aplicables a los datos de características asociados con el enlace.

El peso de un enlace puede reflejar la probabilidad de que el enlace sea seleccionado. 

Los datos de comportamiento del usuario están asociados con un subconjunto o clase de usuarios. En este caso, los pesos asignados a los enlaces pueden adaptarse a la clase de usuario.

Como vemos en esta patente, google puede asignar una puntuacióna cada uno de los enlaces que hay dentro de una misma página.

Según donde se encuentre el enlace y la probabilidad de que el usuario haga clic en él, incluido el texto de anclaje y frase, determinará una puntuación positiva o negativa.

Tal vez colocar enlaces en pies de página no sea de gran valor ni para el usuario ni para google.

14. El CTR y la señal de clasificación

Se ha escrito mucho en SEO sobre el CTR y si es una señal de clasificación más o menos fuerte.

Todavía hay mucha confusión al respecto, ya que esta patente declara que “los usuarios que realizan búsquedas son a menudo los mejores jueces de relevancia, por lo que si seleccionan un resultado de búsqueda particular, es probable que sea relevante, o al menos más relevante que las alternativas.” 

Algún estudio realizado declara que se necesitan más de 100 clics (probáblemente 500) para marcar la diferencia.

Sin embargo, el propio Gary Illies declaró en Twitter que “los clics son demasiado ruidosos” como para tenerlos en cuenta en las clasificaciones.

Aunque la polémica está servida, creo que la suma del número de clics y el tiempo de estancia o navegación por la página de los usuarios, puede ser relevante para obtener una mejor clasificación.

15. Niveles de calidad del sitio web

Si hay un mayor número de consultas de referenciaque consultas asociadas, el nivel de calidad de un sitio web es mayor.

Y un número de consultas asociadas menor que el número de referencia , puede ocasionar un ranking más bajo.

Las consultas de referencia son aquellas que suelen incluir el nombre de la marca, empresa o persona.

Esto es lo que explica esta patente.

Si google te otorga una puntuación baja de calidad, el ranking que obtendrás será más bajo.

Esta especificación describe cómo un sistema puede determinar una puntuación para un sitio, por ejemplo, un sitio web, como lo ve un motor de búsqueda, que representa una medida de calidad para el sitio.

La puntuación de calidad del sitio para un sitio en particular puede determinarse calculando una proporción de un numerador que representa el interés del usuario en el sitio como se refleja en las consultas de los usuarios dirigidas al sitio y un denominador que representa el interés del usuario en los recursos encontrados en el sitio como respuestas a consultas de todo tipo (genéricas).

La puntuación de calidad del sitio para un sitio se puede usar como una señal para clasificar los recursos, o para clasificar los resultados de búsqueda que identifican los recursos.

La idea sobre obtener una puntuación de alta calidad y que eso se muestre en los resultados de búsqueda orgánicos pasa por responder preguntas y resolver cuestiones de tu sector.

A mayor interés de tu público por el contenido publicado, mayor númerod e búsquedas particulares (de marca) y mayor puntuación te otorgará google.

calidad del sitio web

16. Nombres de personas iguales

Todos hemos visto algún caso en el que cuando realizas una consulta sobre una persona aparecen otras muy similares y puede llegar a confundir a los buscadores.

¿Como trata google esta desambiguación de personas?

Esta patente habla sobre este aspecto que se produce mucho en la web.

 Los diferentes contextos del nombre de una persona generalmente se refieren a diferentes personas con el mismo nombre y / o se refieren a aspectos disjuntos de la misma persona.

Se utilizan grupos para generar los clústeres a partir de las listas de términos de contexto. Los datos se almacenan en los datos de contexto de nombre .

El agrupamiento de recursos de acuerdo con un nombre no ambiguo facilita la extracción de datos y otras técnicas de procesamiento de datos que pueden satisfacer las necesidades informativas de los usuarios.

Esto significa que un motor de búsqueda puede desambiguar personas con un mismo nombre agrupándolos en diferentes grupos, siendo la clave aquí – el contexto.

desambiguacion de nombres google

Si vas a escribir sobre una persona o nombrarla dentro de un documento web de la cual existen varias, deberás introducir etiquetas (o texto alrededor) que informe al motor de búsqueda de quien estás hablando.

Para esto puede ser de gran ayuda el marcado de datos estructurados y algún plugin avanzado como el que nombro en este podcast:

17. Eficacia y afinidad a través de las redes sociales, y aplicaciones

Esta patente de Google analiza diferentes señales de clasificación de motores de búsqueda que son un poco diferentes, como puede ser las redes sociales o las aplicaciones (APPs).

Google puede detectar si utilizamos una aplicación de forma contínua para buscar una canción, un lugar, etc, incluso si estamos conectados a través de una red social con ellos.

Por lo que si realizamos una consulta sobre ese tema o buscando una canción nueva por ejemplo, nos devolverá resultados de esa red social o aplicación.

A esto le llaman afinidad.

La patente también nos menciona que:

Por ejemplo, cuando dos páginas web proporcionan acceso a canciones del mismo álbum pero una de las páginas web proporciona detalles adicionales sobre la escritura del álbum o sobre cómo se formó el grupo musical que escribió el álbum, la página web con detalles adicionales puede ser clasificado más altoque la página web con menos detalles.

¿Puede esto tener algo que ver con el SEO social?

18. Citas y opiniones

Esta patente de google indica que pueden identificar quien dijo qué a través de diversos métodos como palabras donde se menciona “ha dicho”, “dijo”, dos puntos o comillas.

Se proporcionan sistemas y métodos para generar un orden de clasificación de las comillas identificadas, donde el orden de clasificación se basa en las puntuaciones de cotización.

Además, se proporcionan sistemas y métodos para transmitir información a fin de mostrar las citas seleccionadas en un dispositivo de visualización.

Es de interés conocer que uno de los primeros procesos descritos en la patente es el que se centra en la identificación y almacenamiento de citas e información asociada con las citas en una base de datos.

Las entidades objeto pueden incluir, por ejemplo, un autor, una persona, un lugar, un tema, un elemento o cosa, y / o un evento, etc. asociado con la consulta.

Por ejemplo, la consulta “opiniones sobre Mandela” puede incluir la entidad sujeto “Mandela”, que es una persona.

La patente también muestra cómo se podrían aplicar estas diferentes formas de calificar la relevancia para un tema según las opiniones:

Las puntuaciones de relevancia para la entidad en cuestión “rompiendo mal” pueden basarse en los elementos de contenido publicados desde el momento del lanzamiento del primer episodio del programa de televisión “Breaking Bad” hasta un año después del lanzamiento del último episodio.

De nuevo aquí, utilizar el marcado de datos puede ser una buena idea.

Este artículo sobre las señales de clasificación orgánicas aún no esta terminado. Lo actualizaré en breve.

Creo que hay mucha información respaldada por las propias patentes de google, aunque también es cierto que el propio motor de búsqueda ha indicado que no tiene por qué seguir los pasos de una patente.

Aún así considero que seguir la investigación de estos documentos puede ayudar a saber más  sobre SEO .

Te animo a suscribirte al blog para estar al dia de SEO avanzado y a dejar un comentario sobre alguna de las señales que más haya resonado contigo.

 

Seguro que a tus seguidores les gustará:
  • 11
  •  
  •  
  •  
  •  
    11
    Shares
Categorías Google

2 comentarios en “Las señales de clasificación orgánicas que Google incluye”

  1. Menudo artículo te has currado Ginés, mi enhorabuena!

    Llevo ya bastante tiempo en el mundillo pero si algo me gusta del SEO es que no dejas nunca de aprender.

    En especial me quedo con el punto de “las frases relacionadas” que, aunque aún funcionan los textos spineados deja mucho que pensar para un futuro no tan lejano.

    Y también el punto del pagerank de un enlace me ha llamado la atención porque muchos se pensarán que importa más al cantidad sin importar dónde estén colocados pero tiene muchísima lógica que su colocación (e incluso el anchor) influya bastante (puesto que influye en la probabilidad de hacer clic en él).

    Un saludo y gracias por este SEO repaso

Deja un comentario