Skip to main content
Google

Qué son las entidades, su relación con el SEO actual y por qué son importantes

Por marzo 18, 2019abril 5th, 2021Un comentario
entidades y SEO

El SEO moderno requiere de conocimientos avanzados sobre motores de búsqueda, y al ser el algoritmo de Google el que más nos afecta a todos, debemos comprender cómo funciona por dentro si deseamos obtener el mayor éxito posible de sus resultados orgánicos.

Hoy vamos a saber los principios de las entidades para un motor de búsqueda, ya que pienso que son muy, muy importantes para conseguir un buen posicionamiento orgánico en la actualidad.

3 Razones por las que debemos comprender las entidades en el SEO

#1. El SEO es cada vez más dificil.

Atrás quedaron los términos de búsqueda simples o keywords (como veremos más adelante), por un una optimización de las páginas web más compleja.

entidades seo es dificil

#2. La competencia por las mejores ubicaciones en SERPs ha reducido el ROI a lo largo de los años .

Las modificaciones en el diseño de las SERPs del “gran G” han traido cambios también en el CTR.

Y por otro lado, los anuncios de PPC siguen subiendo, por lo que una estrategia en Adwords o en Facebook Ads es cada vez más costosa según indica este estudio de tendencias de Internet del 2018.

entidades reportaje 1

#3. Lo que el usuario ve de un vistazo sin hacer scroll es muy reducido.

Según el tipo de búsqueda del usuario, este se encontrará con modelo de resultados adaptados a esa consulta, pero se deja mucho contenido sin ver si no se desplaza hacia abajo.

entidades Pc y movil

La solución a esta nueva situación pasa por: ser más eficientes en la optimización de contenidos.

Otro dato que indica que Google apuesta por una mayor personalización en las búsquedas orgánicas, parece que coincide con la última actualización importante del motor de búsqueda el 12 de marzo del 2019.

Comencemos por el principio…

¿Cuando comenzó google a usar entidades en vez de palabras clave?

El 16 de mayo de 2012 Amit  Singhal  jefe del equipo de búsqueda principal de Google hasta 2016, anunció públicamente el Knowledge Graph: cosas no cadenas.

Esto significaba un gran cambio en como el motor de búsqueda comenzaría a clasificar de una forma diferente las páginas web.

A partir de ese momento y a través del Knowledge Graph, clasificarían:

  • cosas = entidades.

Por tanto, dejaban de clasificar:

  • cadenas = palabras clave

El Knowledge Graph le permite buscar cosas, personas o lugares que Google conoce (hitos, celebridades, ciudades, equipos deportivos, edificios, características geográficas, películas, objetos celestes, obras de arte y más) y obtener instantáneamente información relevante para su consulta.

Este es un primer paso crítico hacia la construcción de la próxima generación de búsqueda, que aprovecha la inteligencia colectiva de la web y entiende el mundo un poco más como lo hace la gente.

Y este lanzamiento fué en año 2012!

Esta es una buena razón que expongo algunas veces cuando intento explicar qué es el SEO tradicional y qué es el SEO moderno.

A partir de ese momento se comenzó a hablar de “entidades” en el mundo SEO internacional y en base a una nueva forma de optimizar los contenidos que habían dentro de una página web.

Una excelente presentación de Mary Meeker sobre las tendencias y el futuro de Internet nos arrojan más conocimiento sobre la evolución de los motores de búsqueda y nos pueden dar pistas hacia donde se dirige el gran “G”.

Un ejemplo de la presentación de las tendencias de Internet en 2018, he extraido algunas ideas para exponerlas aquí y conseguir una mejor explicación del Internet de las cosas.

Recopilación de datos + compartir + optimización = omnipresencia

La evolución del gasto de tiempo de los usuarios en Internet conlleva a comprender donde se genera más contenido para ofrecer una mayor satisfacción del cliente.

entidades data customer

Los motores de búsqueda aún no pueden hacer lo que casi cualquier humano puede:

diferenciar entre una estrella , una marca de cerveza y una cantante de pop .

entidades estrella

Esto se debe a que la indexación web se ha basado en las palabras que se encuentran en las páginas web, no en lo que significan.

Desde el principio, los motores de búsqueda han emparejado esencialmente cadenas de texto, dice Shashi Thakur, un líder técnico para el equipo de búsqueda de Google.

“Cuando intentas unir cadenas, no tienes una idea de lo que significan esas cadenas. Debemos tener una conexión con el conocimiento del mundo real de las cosas y sus propiedades y conexiones con otras cosas “.

Así que, toca posicionar entidades!

Qué son las entidades en SEO

Según el diccionario de tecnología, en bases de datos, una entidad es la representación de un objeto semántico o concepto del mundo real que se describe en una base de datos.

Ejemplos de nombres de entidades: alumno, empleado, artículo, noticia, etc. Las entidades se describen en la estructura de la base de datos empleando un modelo de datos.

Cada entidad está constituida por uno o más atributos.

Por ejemplo, la entidad “Alumno” podría tener los atributos: nombre, apellido, año de nacimiento, etc.

El Knowledge Graph te permite buscar y encontrar entidades como:

  • cosas
  • personas
  • lugares
  • hitos
  • celebridades
  • ciudades
  • equipos deportivos
  • edificios
  • características geográficas
  • películas
  • obras de arte

Y además, obtener inmediatamente información relevante (para el usuario) para cada consulta realizada.

Para que esto ocurra de forma inmediata hay que manejar millones de datos por segundo y hay que ordenar todos esos datos.

Esta es la base de las entidades y por esta razón tienen una gran relación con el SEO.

La extracción de datos en entidades

Las entidades deben ser comprendidas por una máquina ( y transformarlas a números y vectores ) y cada entidad estará asociada a una categoría y etiqueta o atributo.

Cuando Google rastrea la Web para recopilar información sobre objetos o cualquier tipo de entidad, también recopila datos sobre esas entidades.

Estos hechos están separados en diferentes categorías o atributos asociados con esas entidades.

Por ejemplo, un libro puede tener atributos como un autor, un editor, un año publicado, un sitio web , un género y alguno más.

De esta manera se organiza el contenido en grandes bases de datos, y utilizando una herramienta para ello como puede ser:

word2vec

La herramienta word2vec es un vector de palabras que toma un cuerpo de texto como entrada (palabras o frases) y produce los vectores de palabras como salida.

El archivo vector de palabras resultante se utiliza en el  procesamiento de lenguaje natural ( PNL ) y aprendizaje automático ( ML ).

word2vec se utiliza para aumentar la comprensión del lenguaje y se basa en dos algoritmos secundarios:

  1. Skip Grams
  2. Continuous Bag of Words, que es lo que significa ‘CBOW’.

Este sistema de entrenamiento contínuo es capaz de puntuar la calidad de las palabras y frases dentro de un documento web.

Básicamente pueden comprender el texto y las palabras comprobando “la cercanía” entre ellas.

A mayor cantidad de datos que tenga, mejor entrenado estará para determinar y agrupar palabras.

entidades sentimiento

Para manejar miles de millones de datos RDF se utilizan “triples” (o entidades).

De forma básica un triple RDF contiene tres componentes:

  • El sujeto
  • El predicado
  • El objeto

Un triple RDF se escribe convencionalmente en el orden:

sujeto – predicado – objeto.

El predicado también se conoce como la propiedad del triple.

entidades rtf

Cómo contrasta Google la información que se publica diariamente en Internet

El motor de búsqueda necesita contrastar el contenido que se genera cada segundo con algunas fuentes “creibles y relevantes”, y para ello utiliza las bases de datos reputadas que existen como:

  • Freebase: comprada por Google en el 2010 y luego migraron los datos a wikidata.
  • Wikipedia: otra enorme base de datos con más de 48 millones de artículos en 300 idiomas.
  • Central Intelligence Agency – CIA.
  • El motor gráfico Pregel de Google
  • Otros sitios web de relevancia.

Microsoft también utiliza entidades

El otro gran buscador “Bing” también ha seguido los mismos pasos que Google.

En abril del 2012 los investigadores del equipo de Procesamiento de Lenguaje Natural de Microsoft Research describieron el proceso de creación de “Objetos Activos“, como un conjunto de acciones dinámicas que podrían asignarse como propiedades a ciertos tipos de entidades.

Por ejemplo, dada una consulta para una linterna específica, nuestro objetivo es presentar acciones como leer reseñas, ver videos de demostración y encontrar el mejor precio en línea.

Todo este proceso, aunque parezca algo complicado, lo único que intenta hacer es:

comprender el significado del texto que hay dentro de un documento web

Y lo mejor de todo es que este método se puede escalar x1.000 millones de veces, lo cual es más poderoso que contar palabras clave.

Por qué son importantes las entidades para el SEO

Las entidades están directamente relacionadas con el marketing de contenidos y con el blogging.

Estamos en un momento en el que el marketing de contenidos está un punto muy alto dentro de la  estrategia de posicionamiento web de una empresa.

Los artículos de blog aun traen mucho tráfico, tanto como que es capaz de que algunas empresas ganen varios millones de dólares anuales gracias a ese tráfico desde buscadores.

Actualmente se estima que hay más de 1.000 millones de blogs, por lo que ser más eficientes con los contenidos es lo que necesitamos.

estudio blogging

Estudio 2019 sobre blogging

Las empresas se han dado cuenta del gran potencial que tiene el marketing de contenidos para atraer usuarios al negocio, obtener mayor visibilidad, llegar a su target, convertir lectores en clientes y obtener mayor relevancia como marca en Internet.

Fuchsia OS el sistema operativo de Google y las entidades

Google Chrome, y esta fuente de personalización, a veces llamada “Artículos para ti” o “Sugerencias de Chrome” está basada casi en su totalidad en entidades y, según NiemanLab y TechCrunch, el tráfico de esta fuente aumentó 2.100% en 2017.

Esto habla del increíble poder e influencia que Google tiene sobre el comportamiento de navegación de un usuario y, en consecuencia, el tráfico de editores de noticias.

Una vez que un usuario ha elegido Chrome como su navegador, se coloca en un lugar destacado dentro de la experiencia móvil de un usuario, personalizado con el inmenso conocimiento que Google tiene sobre el comportamiento y los intereses de navegación de uno y con frecuencia impulsado por la velocidad de AMP.

Consejos finales

#1. Utiliza la API del lenguaje natural de Google para comprobar cuantas entidades encuentra el rastreador en tus textos.

#2. Clasifica tu marca (entidad ) en vez de palabras clave simples (cadenas).

#3. Utiliza el marcado de datos estructurados para hacer que el buscador comprenda mejor la relación del contenido dentro de una página.

#4. Usa un lenguaje sencillo fácil de entender por un usuario y por una máquina. Las listas, las tablas o los títulos son cosas que estructuran el contenido y eso a google le gusta.

#5. El autor del contenido puede ser muy importante. Esto está basado en las políticas de calidad de Google (EAT).

#6. Investiga qué aparece para los tipos de consultas para los que creas contenido ( Intención de usuario ).

#7. Utiliza la etiqueta itemprop para tu marca.  Podemos dar más información al motor de búsqueda dentro , como las propiedades de un elemento con itemprop : actores , clasificación , genero .

#8. Optimiza el contenido para todo el viaje del usuario. Cada consulta que trae una visita, tiene un por qué y un futuro. Ofrece ese contenido relacionado con el tema para completar el viaje y cerrar el círculo.

#9. Las señales de usuario siguen siendo muy valiosas. No dejes de mirar todo lo relacionado con el tiempo de los usuarios, tasas de clics, páginas visitadas, el CTR, etc, todo esto es importante para google.

Para ir terminando, dejo un pantallazo de una diapositiva de la presentación que hizo Mike Arnesen ( Founder & CEO at UpBuild)  en el SMX Advanced 2018 sobre el tipo de lenguaje que prefiere un buscador.

entidades json

Con este repaso a lo que son las entidades, creo que es suficiente para comprender lo importante que son para el motor de búsqueda y por qué debemos comprender su funcionamiento de cara al SEO de nuestra web.

Hay algunas patentes de google publicadas sobre las entidades como esta, que explican parte del método que utilizan para las clasificaciones orgánicas.

Te puede interesar:

Acerca del autor

SEO Mánager en ginesmayol.com . Ayudo a empresas y marcas a posicionarse en Google. Presidente de la Asociación de MKT Digital de la Región de Murcia. Creo estrategias de Adquisición de tráfico para empresas y marcas nuevas. Hago deporte a diario y me gusta todo lo relacionado con el medio ambiente y el estilo de vida sencillo y saludable.

Únete a la discusión Un comentario

  • Ariadna dice:

    Hola,
    al parecer esto del posicionamiento orgánico es cada vez más complicado y entender a google se esta convirtiendo en una odisea para los que comenzamos un negocio online.
    Espero entender algo de aquí y poder ponerlo en práctica en mi tienda online.
    Un excelente post y gracias por compartir estos conocimientos.

Deja una respuesta