fbpx

Cómo clasifica Google las imágenes: Factores de clasificación de imágenes

Hace solo unos pocos días lanzamos una nueva web de moda, y una de las mayores preocupaciones que teníamos era de mantener el buen ranking que tienen algunas de sus imágenes en la búsqueda de imágenes.

google imagenes mujer

 

Esto no es algo fácil de hacer.

El propio John Muller ha confirmado en más de una ocasión.

Las imágenes de Google no se actualizan con la misma frecuencia como lo puede hacer el motor de la búsqueda central porque  entienden que las imágenes que aparecen en una web no se cambian o modifican con la misma frecuencia que un texto.

Aunque mi opinión personal es esta vez si avanzamos hacia Internet más visual y multimedia, esto debería reconsiderarse.

Estas son las señales de clasificación orgánicas que Google incluye

PageRank para la búsqueda de imágenes de productos

Google y Microsoft tienen factores de clasificación de imñagenes muy similares y  proyectos relacionados con la búsqueda de imágenes y su comprensión en activo actualmente.

Vamos a verlo para conocer la primera mano como los principales motores de búsqueda para clasificar los kilómetros de imágenes que pueden subirse a Internet.

El SEO tradicional hablaba de utilizar urls amigables para los archivos de imagen y de rellenar los meta títulos ALT de estas para que los motores de búsqueda entendieran mejor que hay en esa imagen y obtener así una buena clasificación de las imágenes.

Sin embargo, hay algunos otros factores que se desconocen a la hora de clasificar imágenes en los motores de búsqueda.

Hoy vamos a profundizar en cómo los principales motores de búsqueda utilizan su IA para detectar y comprender que objetos, personas o cosas hay dentro de una imagen.

Imágenes de Google

El motor de búsqueda ya comenzó el proceso de entendimiento de imágenes en el 2008 , como podemos observar en esta patente realizada en el  Instituto de Tecnología de Georgia.

grafico imagenes google

 

Aquí podemos ver una representación del algoritmo de imágenes para elegir las diez mejores imágenes seleccionadas de los 1000 resultados de búsqueda de ” Pinturas de Monet “.

Hay una parte del estudio dedicado a la detección y eliminación de imágenes irrelevantes.

En esta patente hay algunos conceptos interesantes para la clasificación de documentos como imágenes que podemos sacar, como estos:

Los resultados del experimento anterior muestran que podemos
disminuir el número de imágenes irrelevantes en los resultados
de la búsqueda.

Sin embargo, la satisfacción del usuario no es puramente una
función de relevancia ; Por ejemplo, muchos otros factores
como la diversidad de las imágenes, pueden ser relevantes.

Asumiendo que los usuarios usualmente hacen clic en las imágenes que
están interesados.

Una forma efectiva de medir la calidad de la búsqueda
es analizar el número total de “clics” que recibe cada imagen.

Google está trabajando en varios proyectos relacionados con las imágenes a través de la IA (Inteligencia Artificial), como uno de los más recientes,  AutoML Vision .

La  visión de la nube de la API  permite que los desarrolladores comprendan el contenido de una imagen mediante el encapsulado de potentes modelos de aprendizaje automático en una API REST fácil de usar.

Esta API clasifica las imágenes rápidamente en millas de categorías (por ejemplo, “barco de vela”), detecta los objetos y las comunicaciones en las imágenes y es capaz de leer las palabras impresas que contienen.

De este modo, puede crear meta datos en su catálogo de imágenes, modificar el contenido de habilitación o habilitar nuevas situaciones de marketing mediante el análisis de opinión en imágenes.

 Incluso si no has subtitulado ninguna de tus fotos, Google puede resaltar las que tienen el objeto o la acción que estás buscando.

Ejemplo de cómo google puede rastrear una imagen utilizando IA

He realizado una prueba para determinar cómo funciona este sistema de IA utilizando una imagen que aparece en un artículo anterior mio.

google imagenes api

Este sistema de reconocimiento de imágenes es capaz de rastrear un archivo de imagen y traducir lo que hay dentro y a partir de aquí agruparlo dentro de una de sus principales categorías de entidades.

La API Cloud Vision utiliza la tecnología de la búsqueda de imágenes de Google para encontrar entidades pertenecientes a una temática determinada como:

  • personas famosas
  • logotipos
  • noticias

Esta API es compatible con millones de entidades, así que también puedes tener la certeza de que las imágenes más recientes y relevantes siempre están disponibles.

Otro proyecto con imágenes en el que trabaja Google utilizando IA, es Move Mirror.

 

Move Mirror, es un experimento de inteligencia artificial que te permite explorar imágenes de una manera nueva y divertida, simplemente moviéndote.

Para detectar el movimiento y traducirlo utilizan PoseNet , un modelo que puede detectar figuras humanas en imágenes y vídeos al identificar dónde están las articulaciones clave del cuerpo.

Como vemos Google está avanzando mucho en la detección de imágenes (incluso en la detección de objetos dentro de los vídeos) utilizando IA.

Imágenes en Microsoft

Microsoft también cuenta con proyectos alrededor del reconocimiento de imágenes y utiliza patentes como esta al igual que google para progresar en su algoritmo de búsqueda.

Las búsquedas de contenido de imágenes son cada vez más populares entre los usuarios a medida que los servicios de búsqueda de imágenes están cada vez más disponibles.

La patente habla de varias posibilidades que se pueden dar, y la posible solución.

Recopilación y uso del número de sitios web que contienen una imagen idéntica como factor de rastrillado. 

Un factor de clasificación puede basarse en el número de sitios web que contienen una imagen idéntica.

Con este factor de clasificación, la invención puede determinar que las imágenes que aparecen en las páginas web de más de un sitio web pueden ser más relevantes que las imágenes que aparecen en un solo sitio web.

Como tal, el ranking de una imagen se puede actualizar dependiendo de la cantidad de sitios web en los que se encuentra la imagen.

Recopilación y uso del número de sitios web que contienen una imagen similar como factor de clasificación. 

Otro factor de clasificación puede basarse en el número de sitios web que contienen imágenes similares.

Por ejemplo, una imagen en un sitio web que es similar a las imágenes en otros sitios web puede recibir una clasificación más alta dependiendo de la mayor cantidad de otros sitios web que incluyan estas imágenes similares.

Cuanto mayor sea el número de sitios web que contienen imágenes similares a una primera imagen identificada, mayor será la clasificaciónde la imagen identificada.

Recopilación y uso del tamaño de las imágenes como factor de clasificación 

Otro factor de clasificación se puede basar en el tamaño de las imágenes….Los usuarios tienen más probabilidades de hacer clic en las imágenes con el mayor número de píxeles.

Las imágenes con un mayor número de píxeles pueden clasificarse más altas que las imágenes con un número menor de píxeles.

Pero, también puede ocurrir lo contrario.

Recopilación y uso de relaciones de enlace entre imágenes como factor de clasificación 

 Cuanto mayor sea el número de relaciones de enlace que tenga una imagen, mayor será la clasificación por encima de otras imágenes.

Por ejemplo, supongamos que una imagen en miniatura de un objeto que tiene texto cercano,  está vinculada a una imagen más grande en la que la imagen más grande que se muestra en una página web que no tiene texto.

Cada imagen podría afectar, y posiblemente elevar, la clasificación de cada una de ellas.

Esto ocurre mucho en CMS como wordpress que genera automáticamente varias copias de una imagen subida para que se adapten a los diferentes tipos de pantallas.

Recopilación y uso de la frecuencia de una imagen dentro de un sitio web como factor de clasificación 

Otra opción de clasificación puede basarse en el número de veces que se usa una imagen dentro de un sitio web.

Cuidado con este punto ya que puede beneficiar y también empeorar la clasificación de una imagen.

Vamos a responder algunas dudas sobre las imágenes utilizando esta patente de Microsoft.

#1. ¿Puedo utilizar una misma imagen para más de una página de mi sitio web?

Si el sitio web contiene una misma imagen en más de una página dentro de todo el sitio web, la clasificación puede ser más baja.

#2. ¿Puedo utilizar una misma imagen varias veces en una misma página?

Si una misma imagen se muestra una pluralidad de veces en una misma página dentro de un sitio web, la imagen puede obtener una clasificación más baja que otras imágenes que no se muestran más de una vez en un sitio web.

Detección de niveles de funciones de la imagen como factor de clasificación 

Este punto está relacionado con el cumplimiento de un mínimo de calidad de las imágenes que se publican dentro de un sitio web.

una imagen puede tener un rango inferior si no cumple o si no supera un nivel de umbral

Ponderación del texto por su distancia desde una imagen como factor de clasificación

Otro factor de clasificación de imágenes es el texto que se encuentra alrededor de la imagen y su distancia contextual en relación a la búsqueda de la imagen.

el texto que está más cerca de la imagen está asociado más fuertemente que el texto que está más alejado de la consulta.

La distancia que el texto dentro de una consulta de búsqueda ( palabra clave o término de búsqueda ) tiene de una imagen,  puede basarse en diferentes elementos de distancia.

La siguiente es una fórmula es un ejemplo para calcular la distancia de una imagen al texto dentro de una consulta de búsqueda que se encuentra en la misma página web que la imagen:

Distancia = (1 * numwords) + (10 * numfullstops) + (5 * numTDs) – (10 * numTRs)

Uso de la detección de rostro y nombre como factor de clasificación

Otro factor de clasificación puede basarse en si una imagen incluye la cara de una persona en ella.

Si por ejemplo la consulta de búsqueda recibida por el buscador es una solicitud de una imagen de una persona a través del detector de nombre, entonces

 las imágenes que incluyen caras de personas pueden ser clasificadas más altas que las imágenes que no contienen caras de personas.

algoritmo de imagenes

Conclusión

Hemos visto como los principales motores de búsqueda utilizan similares factores de clasificación que se pueden usar para comprender el funcionamiento de sus algoritmos y clasificar imágenes más alto.

Algunos puntos a considerar como importantes pueden ser:

  • Número de sitios web que utilizan esa imagen.
  • Coincidencia del texto o correlación de este con esa imagen en distintos sitios web.
  • Número de sitios web que contienen una imagen similar.
  • Tamaño de la imagen.
  • Vinculación de diferentes versiones de una misma imagen.
  • Frecuencia de una misma imágen dentro de varias páginas de un mismo sitio web.
  • La calidad de la imagen medida en pixeles, aspecto, gradiante, importa.
  • Número total de imágenes dentro de una página.
  • Distancia del texto que hay alrededor de la imagen. Más cerca puede ser más relevante.
  • Para búsquedas con nombre, las imágenes con caras pueden clasificar más alto.
  • Si la imagen encaja con lo que trata la página.

Estos son los puntos más importantes que hemos podido extraer de esta patente de Microsoft y que dan algunas pistas interesantes para la búsqueda por imágenes.

Como he comentado arriba, hay que prestar atención a todos los detalles alrededor de la imagen si deseamos que esta se muestre en los primeros puestos del ranking.

Te puede gustar aprender:

Seguro que a tus seguidores les gustará:
  • 35
  •  
  •  
  •  
  •  
    35
    Shares
Categorías Google

2 comentarios en “Cómo clasifica Google las imágenes: Factores de clasificación de imágenes”

  1. Muy buen articulo Gines!, creo que esto va a dar tela que cortar. Nosotros que nos dedicamos al diseño web, el tema de los tamaños de las imágenes como también los pixeles y calidades lo tenemos un poco complicado, ya que como usted nombra el CMS WordPress crea distintos tamaños, y no solo eso, como usted también sabe, trabajamos las imágenes para no superar los 100kb (como mucho).
    Muchas gracias por compartir tan buena información.
    Un saludo

    • Hola Nikana,
      podemos extraer de esta patente que las imágenes pixeladas pueden tener un peor ranking, pero no habla de cantidad de pixeles ni del peso de la imagen en si.
      Un dato interesante es comprobar como si buscamos una blusa de fiesta, vemos como un 90% de imagenes son de “mujeres con blusa”, cuando podrían ser solo de “blusas” como objeto.
      Esto significa que el motor de búsqueda ha aprendido de los clics de los usuarios y sabe que cuando una persona utiliza esos términos, realmente quiere ver personas utilizando ese producto.
      Una apreciación interesante para todo aquel que gestione una tienda online.

Deja un comentario