Tecnología

¿Puede dltHub resolver el problema de la biblioteca de Python para la IA? Dig Ventures cree que sí

Créditos de la imagen: bicho amargo debajo de CC POR 2.0 licencia.

Python es el lenguaje de programación preferido en IA, sin embargo, la mayoría de las organizaciones no pueden incorporar a sus desarrolladores de Python en su infraestructura de datos heredada. Esto significa que se pierden los beneficios de la IA en la organización. Sin embargo, ha habido una falta de bibliotecas de Python de código abierto para desarrolladores diseñadas en torno a flujos de trabajo de IA.

DLT (abreviatura de herramienta de carga de datos), una startup con sede en Berlín, cree que podría tener la solución. Está construyendo exactamente esa biblioteca de Python de código abierto que, según afirma, fue diseñada para esta nueva ola de IA.

La puesta en marcha dice que su biblioteca se integrará con los flujos de trabajo existentes, incluidos los flujos de trabajo de Python donde la carga de datos no ocurría anteriormente, como un cuaderno de Google Colab, una función de AWS Lambda, un Airflow DAG o documentos asistidos por GPT-4 o áreas de desarrollo de GPT-4.

La puesta en marcha ya ha recaudado $ 1.5 millones en fondos previos a la semilla de empresas de excavación, fundada por Ross Mason, quien creó Mule Project y fundó MuleSoft (MULE:NYSE). Se unen a la ronda los fundadores de empresas y la IA de empresas como Huggingface, Instana, Miro y Matillion.

El CEO Matthaus Krzykowski me dijo por correo electrónico: “La mayoría de las aplicaciones GPT-4 que se muestran en los medios son demoware. Los usuarios que las prueban las abandonan rápidamente. Otras herramientas de IA en las que los capitalistas de riesgo han acumulado recientemente una gran cantidad de dinero (bases de datos/marcos de vectores) tienen muchos desafíos similares”.

Él dice que dlt ahora tiene una comunidad creciente de desarrolladores de Python y se está «implementando en producción en varias empresas tecnológicas en auge», incluida la empresa de entrega de software con sede en San Francisco, Harness, que cubrimos anteriormente.

En un comunicado, Alexander Butler, ingeniero de datos sénior de Harness, dijo: “Aprovechar dlt ha cambiado nuestras operaciones de datos. Ha acelerado el ritmo de nuestro equipo de DataOps: dedicamos menos tiempo a EL (extracción y carga) y más a T, al mismo tiempo que podemos personalizar profundamente nuestros extractores a medida que evolucionan los requisitos comerciales”.

Julien Chaumond, CTO/cofundador de Huggingface e inversionista ángel de dltHub agregó: “La revolución actual del aprendizaje automático ha sido posible gracias a la explosión cámbrica de herramientas Python de código abierto que se han vuelto tan accesibles que una amplia gama de profesionales pueden usarlas. Como biblioteca de Python fácil de usar, dlt es la primera herramienta que esta nueva ola de personas puede usar”.

En cuanto a los competidores potenciales, Krzykowski admite que las startups “compiten con empresas ETL como Meltano, Stitch Data, Airbyte y, en menor medida, Fivetran”.

Sin embargo, dice que «operamos en el espacio de las empresas de almacenamiento de datos como Snowflake, Databricks y Microsoft Fabric, que también quieren construir para llevar la IA a la empresa».

Federico Pareja

"Escritora típica. Practicante de comida malvada. Genio zombi. Introvertido. Lector. Erudito de Internet. Entusiasta del café incondicional".

Publicaciones relacionadas

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Botón volver arriba