Khipus Group, LLC - Computer Vision

Muy seguramente algunas películas donde están involucrados robots super avanzados que pierden el control y tratan de exterminar a la humanidad.  No te culpo. Eso es lo que ha provocado Hollywood con s

 · 3 min read

¿Qué se te viene a la mente cuando escuchas el termino de Inteligencia Artificial? 

Muy seguramente algunas películas donde están involucrados robots super avanzados que pierden el control y tratan de exterminar a la humanidad. 

No te culpo. Eso es lo que ha provocado Hollywood con sus películas por varias décadas, y seguramente continuará haciéndolo por que es un material que vende. 


Sin embargo, te puedo decir que estamos muy lejos de lo que esas películas o series proyectan, con mucha confianza te puedo decir que tanto si eres un joven o un adulto mayor es improbable que lleguemos a ver a un verdadero “Terminator” antes de morir. 

Hay varios pilares sobre los que se basa la Inteligencia Artificial y uno de ellos es la Visión Computacional (Computer Vision). En pocas palabras la Visión Computacional es:  


 “La capacidad de interpretar el mundo a través de video, imágenes y cámaras” 


 Y esto es lo que la Visión Computacional es capaz de hacer: 


  1. Analizar imágenes. 
  2. Clasificar imágenes. 
  3. Detectar objetos en imágenes. 
  4. Detección y análisis de rostro en imágenes. 
  5. Lectura de texto en imágenes. 

 

Las máquinas al carecer ojos biológicos, le pueden dar una interpretación al mundo con la Visión Computacional. 


Analizar Imágenes



Si tuvieras que describir esa imagen dirías algo como:  


“Una chica abrazando a un perro con camisa” 


Eso es obvio por que nosotros sabemos darle una interpretación, sin embargo, para que una máquina le de la misma interpretación necesita apoyarse de Visión Computacional. 

Y eso es prácticamente es lo que hace el Análisis de Imágenes, tu le entregas esa imagen y te dará una descripción de lo que esta tiene: 

“Una chica abrazando a un perro con camisa” 


 Clasificar Imágenes 



Prácticamente hablamos de identificar lo que existe en una imagen y vincularlo con una clase. 


Imagina que tienes una aplicación de una granja para identificar los huevos de gallina que se pueden comercializar. Algunos desafortunadamente tendrán defectos y no podrán salir al mercado. Con la Visión Computacional puedes entrenar un modelo con un almacén de imágenes donde le enseñes al modelo cuales son los huevos que tienen defectos respecto de los que no. Tendrías entonces una clase de huevo que no se puede consumir. 


 Detectar objetos en imágenes



Si me preguntas que animales de juguete observo en esa imagen, con mucha facilidad te diría que hay una jirafa del lado derecho, un gorila en el centro y un elefante a la izquierda. 


Ese tipo de respuestas son las que ofrece la detección de objetos con Visión Computacional. 


Detección y Análisis e Rostro en Imágenes



En la imagen de arriba vemos a nueve rostros, cinco de ellos son hombres y cuatro son mujeres. Algunos son mayores de edad, otros son más jóvenes, pero todos están sonriendo. La Visión Computacional es capaz de saber esto, el estado de animo no es un misterio aquí y se puede leer. 


Lectura de texto en imágenes 



Tal vez en países con políticas extremas de castigo como Singapur es raro ver este tipo de contaminación visual. Lamentablemente en latinoamerica siempre puedes encontrar paredes rayadas en la calle como la imagen de arriba. 

Y aunque es muy entendible para nosotros leerlo, ese tipo de letra no es reconocible para una computadora (un poco de Comic Sans, otro de Times New Roman y un poquito más de resentimiento). 


La Visión Computacional es capaz de interpretar este tipo de texto que no viene de un formato digital si no que viene de una forma más humana y transformarlo a una versión digital. 


Como te puedes dar cuenta, la Visión Computacional ayuda a darle una interpretación al mundo exterior.  


¿Aplicaciones? Piensa en algún proceso que necesite supervisión de cámaras, de seguro puedes resolver o mejorar algo. ¿Ya conoces PhotoMath? Bueno te dejo este link para que veas un ejemplo real Visión Computacional en acción aterrizada en un producto: 


https://youtu.be/TZDVRdDfbN4 




Victor E. Moreno

My name is Víctor Moreno and I'm specialist in Cloud Computing, I have around 10 years of experience working in software development with Microsoft .Net and more technologies. I was MVP (Most Valuable Professional) in Microsoft Azure three years.