Nebulova Blog

Data Science

Qué es Computer Vision

El término Computer Vision (Visión Artificial en español) es un subcampo de machine learning que enseña a los ordenadores a ‘ver’ y entender el contenido de las imágenes digitales.

Puede parecer una tarea muy simple ya que hasta un niño de tres años sabe diferenciar objetos tanto en imágenes como en videos. Sin embargo, a nivel biológico y computacional las cosas se complican bastante.

En este artículo, intentaremos responder a las siguientes preguntas:

  1. ¿Por qué necesitamos el Computer Vision?
  2. ¿Cuáles son los casos de uso reales?
  3. ¿Cómo empezar con el Computer Vision?

Por qué Computer Vision

A día de hoy, prácticamente todo lo que nos rodea genera contenido digital. Desde los pequeños sensores instalados en las puertas de los supermercados hasta los mas sofisticados smartphones y, muchos de esos dispositivos toman imágenes y graban videos.

Cabe esperar que, analizar dicho contenido digital puede proporcionar mucha información útil tanto en el sector comercial como académico. Una forma de hacerlo es que dicho análisis lo lleven a cabo los humanos, lo cual supone una inversión elevada. Sin embargo, existe una alternativa inteligente que consiste en sacarle partido al machine learning (ML) y deep learning (DL). La tarea consiste en aplicar ML y DL a las imágenes digitales y videos, con el fin de clasificar (reconocer) los objetos que aparecen en ellas.

Casos de uso

Es un hecho que las aplicaciones de CV al mundo real son innumerables. Además, las grandes empresas como Amazon, Google, Microsoft y Facebook están invirtiendo millones de euros en esta tecnología. Realizando una búsqueda en internet, llegamos a la conclusión de que muchos de los siguientes sectores están echando mano de la tecnología CV:

  • Automoción
  • Retail y Seguridad
  • Salud
  • Banca

Veamos uno por uno los casos de uso reales que se están llevando a cabo utilizando visión artificial.

Automoción

¿Quién no conoce Tesla? Esta empresa de automoción sabe el significado real de la aplicación de Computer Vision. En comunicación con la tecnología de IA, todos los modelos Tesla llevan instaladas decenas de cámaras. Utilizando la visibilidad 360, su sistema AutoPilot tiene la capacidad de conducir el vehículo sin la supervisión humana.

Retail y Seguridad

En el año 2018 Amazon inauguró el supermercado conocido como Amazon Go donde los clientes no tienen que pasar por caja, y por lo tanto no tienen que hacer colas innecesarias. En este video explicativo, podemos ver que esto lo consiguen instalando cientos de cámaras en el recinto del supermercado en combinación con la tecnología de Computer Vision.

Además, una empresa de seguridad StopLift en Massachusetts ha desarrollado una solución basada en Computer vision. Dicha solución, denominada ScanItAll, detecta tanto anomolías por parte de los clientes como los errores de los propios cajeros en los supermercados.

Salud

Microsoft pone a disposición un software llamado InnerEye, que es capaz de visualizar e identificar tumores u otras anomalías en las radiografías (rayos X). Los radiólogos pueden subir una radiografía tridimensional, y el software colorea las zonas que presentan anomalías, con el fin de prestar mayor atención a dicha zona.

Banca

Este sector también está sacándole partido a la tecnología de CV. Existen sistemas como Mitek Systems que realizan un reconocimiento de imágenes con el fin de clasificar documentos, extraer información e identificar a los individuos. Esto facilita trámites como no tener que acudir a una sucursal para abrir una nueva cuenta bancaria. El usuario se identifica utilizando la cámara de su teléfono móvil, sube la documentación necesaria, y se ahorra las largas colas que se solían hacer en los bancos.

Cómo empezar con Computer Vision

Como hemos mencionado anteriormente, CV es un subcampo de machine y deep learning. Lo primero que tenemos que hacer es aprender un lenguaje de programación como Python o C++, seguido de una introducción a machine learning y deep learning. A continuación os recomendamos algunos libros para empezar el camino hacia Computer Vision:

  1. Computer Vision: Algorithms and Applications
  2. Computer Vision: Models, Learning, and Inference
  3. Programming Computer Vision with Python

Si no te apetece recorrer este camino por tu cuenta, en Nebulova te ofrecemos masters y cursos avanzados que te convertirán en un auténtico experto de Computer Vision gracias a nuestros expertos activos tanto en la investigación como en el sector comercial.