IBM elige a Trifacta para desarrollar una solución de « Data Preparation »

IBM dispone de una solución ETL («extraer, transformar y cargar») completa, DataStage, adquirida en 2005, pero no posee una solución de preparación de datos, algo que está más orientado a la ofimática. IBM eligió trabajar con Trifacta con el fin de desarrollar una integración entre las soluciones de los dos desarrolladores.

Después de haber trabajado varios meses en colaboración, IBM y Trifacta revelaron a finales de junio su alianza. Parece que IBM le confió a Trifacta el desarrollo de una herramienta de preparación de datos, conectada al ecosistema IBM. La « data preparation », de la que Trifacta reivindica la paternidad, es un nuevo mercado. Las « ETL » son herramientas técnicas, destinadas a equipos informáticos y a la industrialización de proyectos. Las herramientas de preparación de datos están más orientadas a los usuarios, más ágiles, pero también menos rigurosos. Tienen un lugar entre Excel y los sistemas ETL.

Como lo señala muy bien Trifacta, la diferencia entre dos proyectos de ciencia de datos no está realmente en los algoritmos. La mayoría de estos desarrollos están disponibles en open source y abiertos al público. La diferencia está más bien en los datos que alimentan a estos algoritmos. Y estos datos deben ser limpiados, preparados y referenciados.
Los usuarios avanzados se han acostumbrado a utilizar estas nuevas herramientas de preparación. ¡Pero no están libres de defectos! Más que suprimir los silos de datos, tienen tendencia a producir nuevos silos. Cada conjunto de datos (dataset), depurado y preparado, es guardado por su usuario, el cual crea de esta manera un nuevo silo, con mucha frecuencia no referenciado y no compartido...

Trifacta propone nombrar, etiquetar y compartir estos conjuntos de datos derivados. Y en el marco de su alianza con IBM, la idea es combinar estos nuevos conjuntos de datos con la herramienta de gobernanza IBM, Watson Data Catalog.

¿Cuál será el destino de esta alianza de aquí en adelante? Imposible de adivinar. Pero si IBM ve en ella una oportunidad de negocio interesante, no vacilará en adquirir a Trifacta con el fin de asegurar el dominio y el futuro de esta solución de preparación de datos.