La ingeniería del software desarrolló a lo largo de los años mecanismos y estrategias para incrementar las probabilidades de éxito. Una de ellas es lo que se conoce como DevOps, que propone la creación de equipos multidisciplinarios de expertos en desarrollo e infraestructura para incrementar la eficiencia y la productividad en el proceso de desarrollo. En su versión más madura, también incorpora especialistas en seguridad de la información-
Esta misma idea se está aplicando a la creación de software específico para inteligencia artificial y el aprendizaje automático, segmento en el que recibe el nombre de MLOps (una suerte de acrónimo entre “machine learning” y “operaciones”). ¿El objetivo? Colaborar en el proceso de conversión entre el modelo matemático que define el científico de datos y un producto de software útil y funcional al negocio.
La ciencia de datos y la inteligencia artificial están en boca de todos. En este contexto, se produce un fenómeno cada vez más frecuente: las empresas se frustran porque saben que es posible obtener valor de estas nuevas tecnologías, pero fallan en el momento de la implementación o de la puesta en marcha de sus iniciativas.
De lo teórico a lo práctico
Esto empeora porque muchas veces el modelo matemático subyacente es correcto, pero no se encuentra la forma de materializarlo en la práctica. En general, esto ocurre por dos razones. Por un lado, porque es difícil poner a operar las piezas de software creadas. O porque no se atravesó un proceso de change management que ayude al negocio a adoptarla.
Históricamente se creyó que el data scientist era necesario y suficiente para resolver estos problemas. Sin embargo, como se trata de una posición que en general está ocupada por un profesional que no viene de las ciencias informáticas -y sí de la ingeniería, la física, la matemática pura, entre otros perfiles- no siempre conoce las prácticas necesarias para llegar al producto buscado.
Resurgieron así problemas históricos que la industria del software resolvió hace tiempo, como el famoso “en mi máquina compila” o que el producto funcione en contextos muy acotados.
El científico de datos seguramente entregue un excelente análisis preliminar donde se determina si el modelo predictivo es factible. Sin embargo, llegará una instancia en que se necesitará un suministro de datos para poner el modelo en funcionamiento. En esta instancia se vuelve adecuada la participación de un ingeniero de datos que se ocupe de alimentarlo.
Inanición de datos
Uno de los problemas más comunes cuando no se aplica MLOps es la inanición de datos: son insuficientes o no llegan a tiempo y producen demoras o latencias. Otro conflicto común es una falta de alineación con el negocio. Aquí se vuelve fundamental la presencia de expertos en industria que sepan hacer las preguntas adecuadas para perfeccionar el modelo.
Según el proyecto, el grado de madurez o el tipo de iniciativa, también pueden ser requeridos desde un especialista en limpieza de datos hasta un arquitecto de software. O incluso un experto en seguridad de la información. MLOps también permite entregas ágiles, rápidas, continuas y evolucionadas para facilitar progresivamente la adopción por parte del negocio.
En resumen: MLOps une lo mejor de dos mundos para garantizar que el software sea correcto desde el punto de vista matemático y útil para resolver un problema de negocios con herramientas inteligentes. ¿Encuentra tu empresa obstáculos para implementar soluciones de machine learning? Contanos tu experiencia en nuestro Linkedin y Twitter!
Este artículo se realizó con colaboración de Juan Paulini.