Palabras clave LSI ¿verdadero o falso?

Las palabras clave siempre ha sido un punto de interés por cualquier usuario que desea comenzar a mejorar el SEO de su web, sin embargo, difiero en este sentido, pero no es el momento de afrontarlo.

Desde hace aproximadamente 1 año más o menos, algunos SEOs internacionales comenzaron a hablar de «palabras clave LSI» , como una nueva forma de poner palabras clave en una web, y como estas palabras clave podrían mejorar el posicionamiento orgánico de una página.

Pero como veremos a continuación, no hay una base robusta detrás del término palabras clave LSI.

# Como agrupar palabras clave según la intención de usuario

También se crearon herramientas basadas en este nuevo sistema de palabras clave, pero sin demasiado trabajo que sostenga lo que es el LSI y si Google lo utiliza o no.

herramient LSI

El problema de estas herramientas que dicen que utilizan LSI, es que para ofrecer estos términos LSI es necesario tener acceso a la base de datos «dinámica» de Google, lo cual es bastante complicado que les dejen, ¿no crees?

Comencemos por el principio…

La verdad o no de las palabras clave LSI y si deberían ser aplicadas

Qué significa LSI

Las siglas LSI significan en inglés Latent Semantic Indexing, y supuestamente se refiere a términos conceptualmente relacionados que los motores de búsqueda utilizan para comprender mejor el contenido de una página web.

Por qué podría ser importante la implementación del LSI

Google ha evolucionado rápido y ya dejó de utilizar la «frecuencia de repetición» de un mismo término de consulta, conocido como «palabra clave» como indicador de valor para clasificar un documento web.

Esta frecuencia de repetición de una misma palabra clave a lo largo de una página web, se suele medir en %.

Aunque este método está en desuso por Google desde hace años, por desgracia aún hay mucha gente en el mundo SEO que lo utiliza, al igual que hay todavía hay herramientas de SEO que también lo utilizan como indicador de valor.

La prueba de que el repetir una palabra clave a lo largo de una página está obsoleto es la siguiente:

comienzo grafico de conocimiento

Este documento fue publicado oficialmente por Amit Singhal jefe de búsqueda de Google hasta entonces, el 16 de mayo de 2012 .

La búsqueda de sinónimos y palabras clave semánticas

Es cierto, que a Google le gustan los sinónimos y los términos semánticos, pero eso no significa que utilicen algo llamado «indexación de palabras clave semánticas«

Es muy posible que el motor de búsqueda busque términos relacionados semanticamente dentro de un documento web, para otorgar un puntaje mayor o menor a la calidad del contenido.

Un ejemplo de como Google puede estar usando la semántica, son las patentes que hablan sobre «la indexación basada en frases«.

Patentes como esta, tratan de descubrir el contenido duplicado, el spam a través del relleno de palabras clave o detectar posibles hackeos de honeypots.

El objetivo de esta patente es identificar clases de consultas basadas en frases, pero sigue siendo algo que está lejos de lo que se ha denominado LSI.

La indexación basada en LSI está apoyada en la semántica, pero se inventó para la recopilación de datos empresariales e indexar bases de datos pequeñas por el año 1990 antes de la Web.

Lo más cercano al LSI que he encontrado publicado, es algún pequeño ejemplo o mención en alguna patente sobre indexación semántica latente y una patente de 1988 que se refiere a la » Recuperación de información computacional mediante estructura semántica latente», que no es LSI.

La patente empieza así:

Una consulta de usuario se recupera en el nuevo dominio estadístico y luego se procesa en el sistema informático para extraer el significado subyacente para responder a la consulta.

Tal vez es más acertado utilizar términos como «vectores de contexto» o «frases que co-ocurren» entre si dentro de un documento web para referirnos a la semántica.

Hay algunos otros documentos publicados que pertenecen a Google y que tratan la semántica, los términos relacionados entre sí, o la agrupación de palabras que co-ocurren en un documento web.

terminos coocurren

El propio Backlinko ha escrito como es habitual en él un mega post hablando del LSI, pero creo que no se ha mirado muy bien las patentes o la historia que hay detrás del LSI.

Backlinko LSI

Es fácil confundirse aquí pensando que las palabras clave LSI es algo así como «los sinónimos de los sinónimos».

# Las clases de consultas y la intención de usuario

De dónde viene la indexación semántica latente (LSI)

Susan Dumais una investigadora de Microsoft ha sido una de las co-autoras de la tecnología Indización semántica latente, teniendo varias investigaciones publicadas sobre el tema.

Susan Dumais Microsoft

También trabajó en en el equipo que llevó a cabo la investigación «Indexing by Latent Semantic Analysis».

Sin embargo, hay un detalle a tener en cuenta, todas estas investigaciones se hicieron antes de ser publicada la World Wide Web en agosto de 1991, por tanto, aún pone más en duda la tecnología LSI que se indica en SEO actualmente.

Para entender mejor este tema de las palabras clave del cual no soy un gran fanático, me gustaría exponer «como funciona la búsqueda de Google» a través de una increible ponencia que hizo el ingeniero de Google Paul Haahr durante el evento SMX West 2016  .

Para explicar cómo funciona la búsqueda en Google, existen dos partes de un motor de búsqueda:

  • Antes de la consulta
  • Procesamiento de consultas.

#1. Proceso que realiza Google antes de la consulta

  • Rastrear la web
  • Analizar las páginas de rastreo.
  • Extraer enlaces (la versión clásica de búsqueda)
  • Renderizar contenidos (Javascript, CSS ).
  • Anotar la semántica

1.2. Construir un índice

  • Vincular el índice
  • Para cada palabra clave, aparece una lista de páginas
  • La lista se divide en millones de páginas
  • Estas páginas se llaman «fragmentos»
  • 1000s de fragmentos para el índice web.
  • Más metadatos por documento.

#2. Cuando alguien realiza una consulta

Comprensión y expansión de consultas.

  • ¿El nombre de consulta utiliza las entidades?
  • ¿Hay sinónimos útiles?
  • El contexto importa
  • Recuperación y puntuación
    • Enviar la consulta a todos los fragmentos.
    • Cada fragmento
      • Encuentra páginas coincidentes
      • Calcula una puntuación para la consulta + página
      • Devuelve las primeras páginas por puntuación.
    • Combinar todas las páginas superiores.
    • Ordenar por puntuación
  • Ajuste posterior a la recuperación
    • Hosting clustering (cuántas páginas son del mismo dominio), enlaces de sitio
    • ¿Hay demasiado contenido duplicado?
    • Degradaciones de spam, acciones manuales, etc 

Como vemos Google se ha preocupado bastante en los últimos años de trabajar sobre la semántica, pero de una forma algo diferente a lo que se ha denominado en el mundo SEO «LSI«.

# El futuro de la indexación de Google

Conclusión

Es una buena idea usar palabras clave relacionadas semánticamente y palabras clave que muestren el contexto correcto haciendo que aparezcan en las páginas que usen el mismo significado que ellas (intención de usuario).

Si te topas con alguien que dice usar keywords LSI cuando realiza una investigación de palabras clave, realmente deberías cuestionar sus conocimientos de SEO.

«LSI» es la abreviatura de «Indización semántica latente«, que contiene la palabra «Semántica», pero tiene un significado muy específico y no significa usar «palabras clave relacionadas semánticamente» que sería más correcto.

 

Para llevar

Posíblemente y viendo las últimas patentes y esfuerzos que realiza el buscador procesos como word2Vec (utilizado para Rankbrain) es mucho más moderno, más escalable y potente que el LSI.

A tus seguidores les gustará:
  •  
  •  
  •  
  •  
  •  
Categorías Google

2 comentarios en “Palabras clave LSI ¿verdadero o falso?”

  1. Interesante tu punto de vista y me ha gustado la forma en que explicas el funcionamiento de la indexación.

    Realmente, entiendo que sí se está realizando algún tipo de indexación por palabras sinónimas o conceptos, cuando me he encontrado que algunos de los competidores que tengo en algunas keywords con bastante volúmen de búsqueda ni siquiera tienen la keyword en el texto. Obvio, son webs con cierta autoridad. Y de algún modo, Google entiende de qué están hablando, aunque no usen dicho término literal.

    También me ha resultado curioso, ver que por ejemplo una de mis webs rankea a menudo por keywords + Alemania, aunque no se mencione Alemania en el artículo concreto (Sí que está en la descripción de la web eso sí).

    • Hola Taisa,
      No es necesario utilizar la palabra clave literal en muchos de los casos ya que el motor de búsqueda está preparado para entender el «contexto» de frases y párrafos.
      Luego hay que tener en cuenta que nos enfocamos demasiado en las «palabras» y poco en el sentido completo de las «frases», la relación contextual entre los párrafos y el sentido completo de la página en si.
      Recuerdo algún estudio realizado por Ahrefs hace un par de años en el cual ya demostraron que no era necesario tener la palabra clave exacta en el título o en la url para posicionar primero por ella.

Deja un comentario