¿Puede una computadora aprender por sí misma el sentido común?

En un pasado no muy lejano, sugerir que una computadora podría demostrar "sentido común" se consideraría un oxímoron. Pero las supercomputadoras como Watson de IBM pueden presagiar nuevos roles para las computadoras.

Actualmente, los investigadores de la Universidad Carnegie Mellon están ejecutando un programa informático las 24 horas del día, los 7 días de la semana, en un esfuerzo por capturar datos y aprender el sentido común a una escala masiva.

El programa se llama Never Ending Image Learner (NEIL) ya que el software busca imágenes en la Web, hace todo lo posible para comprenderlas por sí solo y, a medida que construye una base de datos visual en crecimiento, reúne el sentido común a gran escala.

NEIL aprovecha los avances recientes en visión por computadora que permiten a los programas de computadora identificar y etiquetar objetos en imágenes, caracterizar escenas y reconocer atributos, como colores, iluminación y materiales, todo con un mínimo de supervisión humana.

A su vez, los datos que genera mejorarán aún más la capacidad de las computadoras para comprender el mundo visual.

NEIL tiene avances significativos sobre los dispositivos robóticos anteriores, ya que puede hacer asociaciones entre cosas para obtener información de sentido común. Información que la gente conoce casi de forma intuitiva: que los coches a menudo se encuentran en las carreteras, que los edificios tienden a ser verticales y que los patos se parecen a los gansos.

Según las referencias del texto, podría parecer que el color asociado con las ovejas es negro, pero la gente, y ahora NEIL, saben que las ovejas suelen ser blancas.

"Las imágenes son la mejor manera de aprender las propiedades visuales", dijo Abhinav Gupta, Ph.D., profesor asistente de investigación en el Instituto de Robótica Carnegie Mellon.

“Las imágenes también incluyen mucha información de sentido común sobre el mundo. Las personas aprenden esto por sí mismas y, con NEIL, esperamos que las computadoras también lo hagan ".

Un grupo de computadoras ha estado ejecutando el programa NEIL desde finales de julio y ya ha analizado tres millones de imágenes, identificando 1.500 tipos de objetos en medio millón de imágenes y 1.200 tipos de escenas en cientos de miles de imágenes.

Ha conectado los puntos para aprender 2500 asociaciones de miles de instancias.

Una motivación para el proyecto NEIL es crear la base de conocimientos estructurada visualmente más grande del mundo, donde los objetos, escenas, acciones, atributos y relaciones contextuales se etiquetan y catalogan.

“Lo que hemos aprendido en los últimos 5 a 10 años de investigación en visión por computadora es que cuantos más datos tenga, mejor será la visión por computadora”, dijo Gupta.

Algunos proyectos, como ImageNet y Visipedia, han intentado compilar estos datos estructurados con ayuda humana.

Pero la escala de Internet es tan vasta - solo Facebook tiene más de 200 mil millones de imágenes - que la única esperanza para analizarlo todo es enseñar a las computadoras a hacerlo en gran parte por sí mismas.

La gente también le dice a NEIL qué categorías de objetos, escenas, etc., buscar y analizar. Pero a veces, lo que descubre NEIL puede sorprender incluso a los investigadores.

Se puede anticipar, por ejemplo, que una búsqueda de "manzana" podría devolver imágenes de frutas y computadoras portátiles. Pero Gupta y su equipo, todos marineros de agua dulce, no tenían idea de que una búsqueda de F-18 identificaría no solo imágenes de un avión de combate, sino también catamaranes de clase F18.

A medida que avanza su búsqueda, NEIL desarrolla subcategorías de objetos: los triciclos pueden ser para niños, para adultos y pueden ser motorizados, o los autos vienen en una variedad de marcas y modelos.

Y comienza a notar asociaciones: que las cebras tienden a encontrarse en las sabanas, por ejemplo, y que los pisos de negociación de acciones suelen estar abarrotados.

Antes de que NEIL pueda convertirse en un nombre familiar, será necesario reducir la escala, ya que NEIL es computacionalmente intensivo, con el programa ejecutándose en dos grupos de computadoras que incluyen 200 núcleos de procesamiento.

Fuente: Universidad Carnegie Mellon

!-- GDPR -->