Hay un viejo chiste que cuenta de un oficial del Gobierno chino que está de visita en Latinoamérica y es llevado a conocer una ciudad. El oficial pregunta cuántos habitantes tiene; y cuando el intendente, orgulloso, le dice que han llegado a 100.000, repregunta: «¿Y en qué hotel se hospedan?». Las cantidades son relativas.
Según nuestra visión, la cantidad de datos no es tan relevante como la aproximación al análisis. El fundamento puede resumirse en una frase: lo diferente es el uso del método científico para cuestionar la visión de negocio basado en datos concretos. Es decir, tomar premisas de negocio que se dan por hechas y utilizar los datos para ratificarlas o refutarlas, y a partir de ahí disparar cambios. El hecho de refutar una visión establecida de negocio puede abrir nuevas fronteras y es algo que los datos ayudan a realizar. En un proyecto de Big Data ejecutado en nuestra empresa tuvimos en un momento cuatro doctores en Informática en una sala discutiendo sobre las propiedades que mostraban los datos y cuestionando los algoritmos que se estaban usando. Esto caracteriza más a un proyecto de Big Data que el hecho de usar Hadoop u otra tecnología.
MAS QUE BIG, SMART
Desde un punto de vista técnico, queda claro que Hadoop no es la solución a todos nuestros problemas. Para todos los que alguna vez trabajamos en sistemas distribuidos (mi doctorado fue en sistemas distribuidos), era obvio que no todos los problemas pueden resolverse razonablemente con el modelo map & reduce, y a veces es necesario usar otros modelos. No solo eso: a veces ni siquiera es necesario utilizar más de una computadora…
Por eso, en Practia apostamos fuertemente por los hijos de Big Data. Por Data Science, por Predictive Analytics. Creemos que entre la tecnología –que permite hoy procesar logs de operaciones, conjuntos enormes de datos de fuentes distintas, y aplicar sobre ellos numerosas reglas y algoritmos estadísticos– por un lado, y el negocio –que necesita estos datos para armar modelos con los cuales tomar decisiones– por el otro, hace falta alguien que entienda los algoritmos y pueda traducirlos al negocio, y que pueda seleccionar la mejor tecnología para un determinado problema y así ayudar a realizar las preguntas que importan.
En 2005, al cumplir diez años, nos presentábamos como traductores de tecnología: profesionales bilingües que podíamos interactuar con el mundo del negocio y el de la tecnología, generando valor en esa interpretación.
Hoy más que nunca estas capacidades son clave a la hora de armar proyectos que tal vez deberíamos llamar «de Smart Data». Posiblemente sean Big, porque la dimensión de los datos es un problema con el cual hay que lidiar y haya que buscar estrategias adecuadas a la hora de resolverlos. Pero esa no es su principal característica, sino el valor que agregan, la inteligencia que generan, el «insight» con la naturaleza del negocio, por lo que es adecuado pensar en Smart como su principal característica. Y en Smart Data, en vez de las típicas tres»V» de Big Data (variedad, volumen, velocidad), tendremos otras tres «V»: valor, valor, valor.