Google Vision, el reconocimiento de imágenes a tu alcance

Google Vision, el reconocimiento de imágenes a tu alcance

Hoy en día, la mayoría de las grandes empresas tecnológicas están apostando por la inteligencia artificial como elemento clave de las mismas, ya sea como complemento a sus productos o como base para generar nuevos servicios en un futuro nada lejano.

Y si nos referimos a empresas tecnológicas, no podemos dejar de hablar del rey por excelencia de internet, Google. En post anteriores, ya hemos hablado de diferentes herramientas o aplicaciones de inteligencia artificial en Google, como el traductor DeepL, su nuevo sistema operativo Android 9 o su famoso altavoz Google Home.

Sin embargo, hoy nos vamos a centrar en una herramienta que es clave para cualquier desarrollador que quiera experimentar con la inteligencia artificial de Google. Estamos hablando del sistema de reconocimiento de imágenes, Google Vision

¿Qué es Google Vision?

Google Vision es una API que permite a los desarrolladores comprender el contenido de una imagen mediante el uso de potentes modelos de aprendizaje automático (machine learning).

Esta API clasifica las imágenes rápidamente en miles de categorías (por ejemplo, “coche”), detecta objetos y caras determinadas dentro de dichas imágenes y es capaz de leer las palabras impresas que contengan. De este modo, es posible crear metadatos en tu catálogo de imágenes, moderar el contenido ofensivo u optimizar nuevas campañas de marketing mediante el análisis de opinión en imágenes.

Además, para aquellos desarrolladores que aún no tengan demasiada experiencia con el machine learning, existe la versión beta de AutoML Vision. Con esta herramienta, una vez subidas y etiquetadas las imágenes, se crea un modelo que puede escalarse según sea necesario para adaptarse a necesidades específicas.

Funciones de Google Vision

Gracias a Google Vision es posible extraer información tan valiosa de las imágenes como esta:

Detección de etiquetas: detecta amplios conjuntos de categorías en una imagen, desde medios de transporte hasta animales.
Detección web: busca imágenes similares en Internet.
Reconocimiento óptico de caracteres (OCR): detecta y extrae texto de una imagen. Esta función es compatible con un gran número de idiomas y con la identificación automática de idiomas.
Reconocimiento de escritura a manoBETA.
Detección de logotipos.
Localizador de objetosBETA: no solo identifica un objeto en una imagen, sino que podrás identificar en qué parte de la imagen se encuentra dicho objeto y cuántos objetos de ese tipo hay en la imagen.
Detección de puntos de referencia: detecta estructuras artificiales y naturales muy famosas dentro de una imagen.
Detección de caras: detecta varias caras en una imagen, además de sus atributos faciales clave, como el estado emocional o las prendas que lleva en la cabeza. No admite el reconocimiento facial.
Moderación de contenido: detecta contenido explícito, como el dirigido a adultos o el de carácter violento.
Búsqueda de productosBETA: reconoce los productos de un determinado catálogo en fotos web y móviles.
Atributos de imagen: detecta los atributos generales de la imagen, como el color dominante, y ofrece sugerencias de recorte pertinentes.

Detección de caras, objetos, logotipos, caracteres... y hasta productos. ¡Todo esto es posible gracias al reconocimiento de imágenes de #GoogleVision! 👁 #InteligenciaArtificial Clic para tuitear

Precio Google Vision

Los precios de la API Google Vision van en función del número de imágenes a procesar. Hasta 1000 unidades al mes, se puede disfrutar de la herramienta de manera gratuita, incluyendo todas las funcionalidades. A partir de ahí, cada servicio tiene una tarifa diferente, que se va aumentando en función del rango de número de imágenes: entre 1000 y 5 millones y entre 5 millones y 20 millones.

Para usar el modelo AutoML Vision, el precio depende de las horas de preparación y predicción. En principio, cada mes se obtiene una hora de preparación gratuita, mientras que las siguientes tienen un precio de 20$. Para la predicción, es gratuita hasta 1000 imágenes. Entre 1001 y 5 millones cuesta 3$ cada 1000 imágenes.

Y para terminar…

Como ya habéis visto, Google Vision se trata de una herramienta muy potente con un montón de aplicaciones. De momento, algunas de estas funciones aún están en modo beta, pero los desarrolladores que lo deseen ya pueden ir haciendo pruebas de esta API.

Es interesante mencionar que si Google ha podido crear una inteligencia artificial tan precisa, ha sido gracias a nosotros. Como lo oyes. Para llevar esto a cabo, han sido necesarias millones y millones de imágenes, que no son otras que las que los usuarios hemos subido a la nube de Google Photos. Pero bueno, seguro que ya lo sabrías porque, como todo el mundo, te leíste los términos y condiciones de uso de la aplicación. ¿O no?

Bromas aparte, lo que es cierto es que ahora más que nunca, gracias a Google Vision y la inteligencia artificial, las imágenes valdrán más que mil palabras.

Y no te olvides que antes de salir… ¡dale a compartir!

 

Google Vision, el reconocimiento de imágenes a tu alcance
Valora este artículo.

Graduado en ADE. Formándome en Marketing Digital.  Me gusta estar al tanto de lo último en tecnología y de la actualidad económica. Futbolero empedernido. También paso el rato viendo pelis y series.  Acompáñanos en esta nueva aventura de la Inteligencia Artificial.

Deja un comentario

¿A qué esperas?

¡Suscríbete y estarás al día de todas las novedades sobre IA!

Acepto la política de privacidad
    

Este sitio web utiliza cookies para que usted tenga la mejor experiencia de usuario. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies y la aceptación de nuestra política de cookies, pinche el enlace para mayor información.plugin cookies

ACEPTAR
Aviso de cookies