Google Vision, el reconocimiento de imágenes a tu alcance

Google Vision, el reconocimiento de imágenes a tu alcance

Hoy en día, la mayoría de las grandes empresas tecnológicas están apostando por la inteligencia artificial como elemento clave de las mismas, ya sea como complemento a sus productos o como base para generar nuevos servicios en un futuro nada lejano.

Y si nos referimos a empresas tecnológicas, no podemos dejar de hablar del rey por excelencia de internet, Google. En post anteriores, ya hemos hablado de diferentes herramientas o aplicaciones de inteligencia artificial en Google, como el traductor DeepL, su nuevo sistema operativo Android 9 o su famoso altavoz Google Home.

Sin embargo, hoy nos vamos a centrar en una herramienta que es clave para cualquier desarrollador que quiera experimentar con la inteligencia artificial de Google. Estamos hablando del sistema de reconocimiento de imágenes, Google Vision

¿Qué es Google Vision?

Google Vision es una API que permite a los desarrolladores comprender el contenido de una imagen mediante el uso de potentes modelos de aprendizaje automático (machine learning).

Esta API clasifica las imágenes rápidamente en miles de categorías (por ejemplo, «coche»), detecta objetos y caras determinadas dentro de dichas imágenes y es capaz de leer las palabras impresas que contengan. De este modo, es posible crear metadatos en tu catálogo de imágenes, moderar el contenido ofensivo u optimizar nuevas campañas de marketing mediante el análisis de opinión en imágenes.

Además, para aquellos desarrolladores que aún no tengan demasiada experiencia con el machine learning, existe la versión beta de AutoML Vision. Con esta herramienta, una vez subidas y etiquetadas las imágenes, se crea un modelo que puede escalarse según sea necesario para adaptarse a necesidades específicas.

Funciones de Google Vision

Gracias a Google Vision es posible extraer información tan valiosa de las imágenes como esta:

Detección de etiquetas: detecta amplios conjuntos de categorías en una imagen, desde medios de transporte hasta animales.
Detección web: busca imágenes similares en Internet.
Reconocimiento óptico de caracteres (OCR): detecta y extrae texto de una imagen. Esta función es compatible con un gran número de idiomas y con la identificación automática de idiomas.
Reconocimiento de escritura a manoBETA.
Detección de logotipos.
Localizador de objetosBETA: no solo identifica un objeto en una imagen, sino que podrás identificar en qué parte de la imagen se encuentra dicho objeto y cuántos objetos de ese tipo hay en la imagen.
Detección de puntos de referencia: detecta estructuras artificiales y naturales muy famosas dentro de una imagen.
Detección de caras: detecta varias caras en una imagen, además de sus atributos faciales clave, como el estado emocional o las prendas que lleva en la cabeza. No admite el reconocimiento facial.
Moderación de contenido: detecta contenido explícito, como el dirigido a adultos o el de carácter violento.
Búsqueda de productosBETA: reconoce los productos de un determinado catálogo en fotos web y móviles.
Atributos de imagen: detecta los atributos generales de la imagen, como el color dominante, y ofrece sugerencias de recorte pertinentes.

Detección de caras, objetos, logotipos, caracteres... y hasta productos. ¡Todo esto es posible gracias al reconocimiento de imágenes de #GoogleVision! 👁 #InteligenciaArtificial Clic para tuitear

Precio Google Vision

Los precios de la API Google Vision van en función del número de imágenes a procesar. Hasta 1000 unidades al mes, se puede disfrutar de la herramienta de manera gratuita, incluyendo todas las funcionalidades. A partir de ahí, cada servicio tiene una tarifa diferente, que se va aumentando en función del rango de número de imágenes: entre 1000 y 5 millones y entre 5 millones y 20 millones.

Para usar el modelo AutoML Vision, el precio depende de las horas de preparación y predicción. En principio, cada mes se obtiene una hora de preparación gratuita, mientras que las siguientes tienen un precio de 20$. Para la predicción, es gratuita hasta 1000 imágenes. Entre 1001 y 5 millones cuesta 3$ cada 1000 imágenes.

Y para terminar…

Como ya habéis visto, Google Vision se trata de una herramienta muy potente con un montón de aplicaciones. De momento, alg