Tres expertos en IA de Practia comparten sus experiencias con redes neuronales de machine learning y los retos y las oportunidades que estas generan.
Entre 2018 y 2019, las organizaciones que han empleado inteligencia artificial (IA) han crecido del 4% al 14%, según la Encuesta de la Agenda CIO 2019 que Gartner realiza en el mundo. Un incremento interesante pero moderado en función de las expectativas que genera a nivel global la aplicación de IA: 9 de cada 10 responsables de TI espera utilizar este tipo de tecnologías en los próximos tres años.
Desde IDC, por su parte, sostienen que la IA se encuentra aún en estado embrionario, ya que necesita procesar grandes cantidades de datos para generar modelos nuevos de aprendizaje y así tomar decisiones espontaneas en tiempo real. La consultora de mercado advierte que no será hasta 2022 cuando estas tecnologías inteligentes comiencen a integrar la visión y la voz como parte afectiva que puede dar inicio a la «inteligencia artificial emotiva». Añaden en su análisis que el desarrollo de los algoritmos de IA facilitará la integración en prácticamente cualquier dispositivo de la nueva era digital, de tal modo que para el citado año, el 25% de los dispositivos y sistemas endpoint correrá algoritmos de IA. Advierten que para 2024 las interfaces de usuario y automatización de procesos con IA reemplazarán un tercio de las aplicaciones actuales basadas en pantalla.
Estos números resultan promisorios. Aún así, los expertos en ciencias de datos estudian con mucha atención las propiedades emergentes de este tipo de sistemas, habilidades inesperadas que surgen del entrenamiento intensivo de las aplicaciones de machine learning y que abren nuevos horizontes hacia beneficios exponencialmente significativos.
Experiencias reveladoras
Para analizar el fenómeno de las propiedades emergentes de la IA reunimos a tres especialistas de Practia para que compartan sus visiones: Denise Bendersky, Data Scientist; Juan Echagüe, director de Investigación y Desarrollo (I+D); y Daniel Yankelevich, socio fundador y director de Aceleración Digital de Negocios (ADN); respectivamente.
- ¿Cómo se explican las propiedades emergentes de IA o machine learning?
JE: Hablamos de propiedades emergentes porque cuando arrancamos no tenemos suficiente información de los mecanismos y estos empiezan a producir cosas que no esperábamos. No existe conocimiento experto que permita predecir las propiedades emergentes pero tampoco se trata de una situación aleatoria: al mirar retrospectivamente se nota que hay una lógica, pero que solo se puede interpretar, precisamente, analizándola hacia atrás. Esa es la característica de los comportamientos emergentes. En ambientes industriales o de banca se tratan de evitar, mientras que, por el contrario, estamos interesados en generarlos en rubros como marketing o retail.
DB: Entre los modelos de machine learning existe un tipo de algoritmo basado en redes descriptivas o generativas. Es posible entrenar una red neuronal para que describa el contenido de una foto o que genere cosas que no existen. Durante el entrenamiento, analiza grandes cantidades de datos, observa patrones y trata de representarlos matemáticamente. En ciertos casos, aparecen estas propiedades intrínsecas que no se le había enseñado ni formaban parte del objetivo del algoritmo: habilidades no esperadas.
- ¿Qué experiencias han desarrollado en este ámbito?
DY: En 2017 se conoció una noticia sobre unos programas de IA de Facebook que habían inventado un lenguaje propio y que por ese motivo debieron desconectarlos. Facebook publicó todos los datos con los que realizó esa prueba, por lo que nosotros, en laboratorio, la replicamos con algunos cambios y mejoras. Se trataba de dos agentes que interactuaban para obtener la mayor cantidad de puntos posible en una negociación. A este tipo de sistemas no les importa si hablan bien o mal -de hecho, no tienen reglas gramaticales-, por lo que, si una deformación de lenguaje les da resultado en la negociación, la van a seguir utilizando. Es normal que eso pase. De modo que, desde nuestra visión, esa no era la noticia. Sí sucedió que los agentes empezaron a desarrollar una estrategia en la negociación que incluía mentir. En una mesa había pelotas, libros y sombreros. Cada uno de esos elementos representaba un puntaje distinto para cada agente, que tenían que arreglar cómo se los repartían. Luego de varios entrenamientos, un agente pidió una pelota, que para él tenía valor cero. ¿Por qué tomó semejante decisión? Porque luego, en el transcurso de esa negociación, la ofreció a cambio de otra cosa que sí le sumaba. Eso fue lo sorprendente: el desarrollo de una estrategia que se basó en «mentir» para negociar mejor después. Eso es una propiedad emergente, una estrategia que nadie le enseñó y la aprende solo.
DB: En la programación tradicional uno escribe reglas en un programa, si le quiero enseñar las palabras, le pongo un diccionario y si necesito que genere palabras va a utilizar las que existen. En el aprendizaje automático, en cambio, no hay reglas, sino datos y un algoritmo, un modelo, que puede identificar patrones en esos datos. Es decir, aprende las reglas a partir de los datos. Hoy, en las organizaciones, tenemos grandes volúmenes de datos lo que nos permite utilizar este tipo de modelos. Una red neuronal responde a este formato de aprendizaje a partir de los datos y trata de imitar el funcionamiento del cerebro porque los humanos somos muy buenos para resolver ciertas tareas que las máquinas no. Estas redes tienen «neuronas» que se interconectan y se organizan por capas. En nuestro experimento, pusimos en funcionamiento una con el objetivo de generar contenido con el estilo literario de Borges. Empezamos, como muchos de los proyectos de I+D, con una idea. Esto implicó conseguir un corpus de textos de Borges y entrenar la red. Este modelo predice carácter a carácter y no palabra por palabra. Obviamente, el algoritmo iba a inventar términos, era lo esperable. Sin embargo, encontramos además que, si bien creaba palabras, respetaba los signos de puntuación y las reglas de la acentuación. En conclusión: propiedades emergentes, habilidades que no estaban explícitas en el algoritmo.
DY: Una situación similar se dio con una red neuronal que jugaba al Atari Breakout y tenía como objetivo maximizar su score. El agente no sabía nada, ni qué es una pelota, ni un ladrillo. Empezó a jugar y después de cuatro horas de entrenamiento no solo ya tenía mejor desempeño que cualquier humano, sino que había aprendido a hacer los túneles al costado para sumar muchos más puntos: había desarrollado una estrategia.
- ¿Cómo pueden aprovechar las organizaciones estas propiedades?
JE: Las organizaciones siempre tienen mecanismos de defensa, mayormente saludables, y muchas, hoy, los usan frente a IA. Cuando pensamos en agregar IA a los procesos de decisión, el objetivo es liberar tiempo de personas, lo que debería hacer más creativas a las organizaciones. Ese movimiento es muy resistido en estos momentos y como resultado se evita que aparezcan efectos emergentes: así baja el riesgo de que «las cosas salgan mal», pero también se pierden oportunidades de descubrir cosas nuevas, y mejores formas de hacer bien las mismas cosas. Agregar IA produce propiedades emergentes en los sistemas actuales, que ya tienen la complejidad de estar conformados por personas, aspectos organizacionales y tecnología. Las encontramos repetidamente en los procesos de transformación digital, y se han vuelto uno de los temas claves en la gestión del cambio.
DY: Suelo proponer un ejercicio a los alumnos de big data que se basa en una planilla Excel de seis filas por cuatro columnas. columnas. Les digo que busquen patrones ahí, y es muy difícil para un ser humano encontrarlos en esas 24 casillas. Precisamente es para este tipo de habilidades donde pueden aprovecharse estos sistemas con un poder mucho mayor. No se trata solo de obedecer un comando sino de generar estrategias que a nosotros no se nos ocurrirían. Por ejemplo, si estoy preparando la planificación para el próximo año y estoy definiendo las cuotas de mis vendedores, el asistente podría advertirme sobre lo que cada vendedor hizo uno, dos o tres años hacia atrás, o cómo le fue con cada tipo de cliente, y que yo le pueda preguntar si tengo alguna duda y que él me explique.
DB: Para implementar este tipo de experiencias solemos empezar con un piloto: un proyecto de corta duración que requiere una pregunta de negocio bien definida y datos. Esta metodología nos lleva del plano teórico al real, en el cual puede ocurrir que los datos que se creía que estaban no están, que no alcanzan, que es necesario adquirir nuevos o robustecerlos, sumado a que en general surgen preguntas nuevas.
Apliquemos esta noción a las compras de un cliente de un supermercado. A un sistema de programación tradicional tenemos que decirle exactamente qué tipo de cosas recomendarle. En cambio, una red neuronal que se entrene para recomendarle productos, analizará tanto las características de los productos como de los clientes y puede generar propuestas acertadas, incluso de productos que nunca consumió.
- ¿Cómo se aplicará entonces la IA? ¿Caerán los temores?
DY: Hace un tiempo Kasparov organizó un torneo de ajedrez en el cual las personas podían jugar asistidos por computadoras. En algunos equipos prevaleció el humano, en otros la máquina y otros quedaron en una situación intermedia. Estos últimos fueron los que mejor funcionaron. La IA se va a aplicar en todo, la duda es cómo. Están quienes creen que va a reemplazar nuestro trabajo. Yo creo que va a ser en el formato de asistentes, en procesos de planificación, análisis de fraudes, compras y ventas, optimización de proveedores, capital humano y gestión de talento. Allí se va a dar otro nivel de emergencia de propiedades cuando estos asistentes colaboren entre sí. Por ejemplo, cuando un departamento de capital humano tenga dificultades para cubrir dos puestos y su agente IA le diga «hablé con el agente IA de compras y recomienda estos dos perfiles».
JE: Hay cosas que no estamos dispuestos a delegar en los sistemas de IA porque tenemos cierto temor a esos comportamientos emergentes. Sin embargo, hasta que aparecen, solo estamos haciendo más de lo mismo. Yo me burlaba de la generación de mis padres porque les daba temor subir a un ascensor sin ascensorista. Hasta que un día utilicé uno sin botones y sentí que no tenía el control. Para nosotros, el control está en los botones. Entonces, el mix más apropiado parece ser colocar una persona junto a un sistema de IA.
Las tres reglas esenciales de la IA
Los expertos de Practia advierten que muchas de las organizaciones actuales están lideradas por personas que no piensan en lo que les podría aportar la IA, producto de su propia formación de negocios, la cual no ha evolucionado a una velocidad equivalente a la dinámica de esta era. Daniel Yankelevich, socio fundador de Practia, ofrece tres recomendaciones para que las organizaciones puedan subirse a esta tendencia:
- Muchas veces este tipo de implementaciones no surgen desde Sistemas sino desde otra área que contrata un servicio que aplica inteligencia artificial. El CIO, por lo tanto, debe ser el agente de cambio y no «correr atrás de la pelota». Para eso es necesario que empiece a probar y tener redes neuronales funcionando, al menos para saber cómo hacerlo.
- Buscar un lugar donde experimentar con este tipo de soluciones en función del valor que da la compañía y no en función de la solución: pensar cuál es el sector de la empresa donde más valor podría agregar una toma de decisiones mejorada a partir de IA.
-
Pensar en las capacidades que se van a necesitar desarrollar a dos años y en cómo ir incorporándolas: a quién corresponde capacitar, qué herramientas van a ser obsoletas. Es cierto, pensar estos temas a largo plazo en Argentina es difícil.
Datos destacados
14% de máxima y 4% de mínima es lo que crecieron las organizaciones que han empleado IA entre 2018 y 2019. (Fuente: Gartner).
25% de los dispositivos y sistemas endpoint contendrá algoritmos de IA en apenas dos años (Fuente: IDC).
Frases destacadas
«Es posible entrenar una red neuronal para que describa el contenido de una foto o que genere cosas que no existen». Denise Bendersky, Data Scientist en Practia.
«La IA se va a aplicar en todo, la única duda es el cómo. Están quienes creen que va a reemplazar nuestro trabajo. Yo creo que va a ser en el formato de asistentes». Daniel Yankelevich, socio fundador y director de Aceleración Digital de Negocios (ADN) en Practia.
«No existe conocimiento experto que permita predecir las propiedades emergentes pero tampoco se trata de una situación aleatoria: al mirar retrospectivamente se nota que hay una lógica». Juan Echagüe, director de Investigación y Desarrollo (I+D) en Practia.