Tipo de empresa | Privado |
---|---|
Industria | Tecnologías de bases de datos |
Género | DBMS multimodelo |
Fundado | Abril de 2010 Austin, TX , EE. UU. |
Fundador |
|
Sede | , Estados Unidos |
Personas clave | Chet Kapoor [1] (director ejecutivo) Davor Bonaci (director de tecnología) Ed Anuff (director de productos) Don Dixon (director financiero) Brad Gyger (director de ingresos) Jason McClelland (director de marketing) Chris Vogel (director de personal) |
Número de empleados | 800+ (junio de 2022) [2] |
Sitio web | DataStax.com |
DataStax, Inc. es una empresa de datos en tiempo real para IA con sede en Santa Clara, California . [3] Su producto Astra DB es una base de datos en la nube como servicio basada en Apache Cassandra . DataStax también ofrece DataStax Enterprise (DSE), una base de datos local construida sobre Apache Cassandra, y Astra Streaming, un servicio en la nube de mensajería y transmisión de eventos basado en Apache Pulsar. A junio de 2022, la empresa tiene aproximadamente 800 clientes distribuidos en más de 50 países. [4] [5] [2]
DataStax se construyó sobre la base de datos NoSQL de código abierto Apache Cassandra . Cassandra se desarrolló inicialmente internamente en Facebook para manejar grandes conjuntos de datos en múltiples servidores, [6] y se lanzó como un proyecto de código abierto de Apache en 2008. [7] En 2010, Jonathan Ellis y Matt Pfeil dejaron Rackspace , donde habían trabajado con Cassandra, para lanzar Riptano en Austin, Texas. [6] [8] Más tarde, Ellis y Pfeil cambiaron el nombre de la empresa a DataStax y trasladaron su sede a Santa Clara, California. [3] [9]
La empresa pasó a crear su propia versión empresarial de Cassandra, una base de datos NoSQL llamada DataStax Enterprise (DSE). [6]
En 2019, Chet Kapoor fue nombrado nuevo director ejecutivo de la empresa, reemplazando a Billy Bosworth. [10]
En mayo de 2020, DataStax lanzó Astra DB, un DBaaS para aplicaciones Cassandra. [11] En noviembre de 2020, DataStax lanzó K8ssandra, una distribución de código abierto de Cassandra en Kubernetes. [12] En diciembre de 2020, DataStax lanzó Stargate, una puerta de enlace de API de datos de código abierto. [13]
Después de adquirir el proveedor de transmisión de eventos Kesque en enero de 2021, [14] la empresa lanzó Luna Streaming, una plataforma de transmisión de datos para Apache Pulsar. [15] Luego, DataStax reconstruyó la tecnología de Kesque en Astra Streaming. [16] El servicio en la nube Astra Streaming estuvo disponible de manera general el 29 de junio de 2022. [17] Con el lanzamiento, la empresa agregó soporte a nivel de API para las herramientas de mensajería Apache Kafka, RabbitMQ y Java Message Service, además de Apache Pulsar. [18] [19] Astra Streaming puede conectarse a una plataforma de datos más grande utilizando el servicio en la nube Astra DB de DataStax. [18]
A partir de 2023, DataStax comenzó a incorporar inteligencia artificial y aprendizaje automático en su plataforma. [20] En enero de 2023, la empresa adquirió Kaskada, desarrollador de una plataforma que ayuda a las organizaciones a utilizar datos para aplicaciones de IA. [21] DataStax convirtió la tecnología Kaskada, anteriormente propiedad de la empresa, en código abierto y la integró en su servicio Luna ML, que se lanzó el 4 de mayo de 2023. [22] Con la adquisición, el exdirector ejecutivo de Kaskada, Davor Bonaci, fue nombrado director de tecnología y vicepresidente ejecutivo de DataStax. [22]
El 24 de mayo de 2023, DataStax anunció que se asociaría con ThirdAI para llevar modelos de lenguaje de gran tamaño a DSE y AstraDB, para ayudar a los desarrolladores a desarrollar aplicaciones de IA generativa. [23]
En junio de 2023, la empresa anunció el desarrollo de un traductor de esquemas basado en GPT en su servicio en la nube Astra Streaming. El traductor de esquemas GPT de Astra Streaming utiliza IA generativa para generar automáticamente asignaciones de esquemas , lo que permite la integración de datos y la interoperabilidad entre múltiples sistemas y fuentes de datos. [24]
El 18 de julio de 2023, la empresa anunció una asociación con Google para hacer que la búsqueda semántica esté disponible en su base de datos en la nube Astra DB para los desarrolladores que crean aplicaciones de IA generativa. [20]
El 13 de septiembre de 2023, DataStax lanzó el proyecto de código abierto LangStream, que funciona con Astra DB y admite bases de datos vectoriales como Milvus y Pinecone. LangStream permite a los desarrolladores trabajar mejor con fuentes de datos en tiempo real, utilizando la tecnología Apache Kafka y la IA generativa para ayudar a construir arquitecturas basadas en eventos. [25]
En noviembre de 2023, DataStax anunció RAGStack, una oferta comercial simplificada para RAG ( generación aumentada de recuperación ) basada en LangChain y la búsqueda vectorial de Astra DB. [26]
Astra DB está disponible en servicios en la nube como Microsoft Azure , Amazon Web Services y Google Cloud Platform . [27] En febrero de 2021, DataStax anunció la versión sin servidor de Astra DB, que ofrece a los desarrolladores datos de pago por uso. [28]
En marzo de 2022, DataStax introdujo nuevas capacidades de captura de datos modificados (CDC) en su servicio en la nube Astra DB. Astra DB CDC funciona con Apache Pulsar, que permite a los desarrolladores gestionar datos operativos y de transmisión en un solo lugar. [29] DataStax lidera Starlight de código abierto, que proporciona una capa de compatibilidad para diferentes protocolos sobre Apache Pulsar. [18]
El 8 de febrero de 2023, DataStax lanzó Astra Block, un servicio basado en la nube basado en la cadena de bloques Ethereum para respaldar la creación de aplicaciones Web3 , disponible como parte de Astra DB. Los desarrolladores pueden usar Astra Block para transmitir datos mejorados desde la cadena de bloques Ethereum para crear o escalar experiencias Web3 en Astra DB. [30]
Astra DB admite la tecnología LangChain de código abierto, lo que facilita a los desarrolladores la creación de aplicaciones de IA generativa. [20]
La versión 1.0 de DataStax Enterprise (DSE), lanzada en octubre de 2011, fue la primera distribución comercial de la base de datos Cassandra, diseñada para proporcionar rendimiento de aplicaciones en tiempo real y análisis pesados en la misma infraestructura física. [31] [32] Creció para incluir controles de seguridad avanzados, modelos de bases de datos gráficas, análisis operativos y capacidades de búsqueda avanzadas. [33]
En abril de 2016, la compañía anunció el lanzamiento de DataStax Enterprise Graph, agregando la funcionalidad del modelo de datos gráficos a DSE. [34]
En marzo de 2017, DataStax anunció el lanzamiento de su plataforma DSE 5.1, que incluía capacidades de búsqueda mejoradas, control de seguridad mejorado, mejoras en la gestión de datos Graph y mejoras en el rendimiento de análisis operativo. DataStax también anunció un cambio de estrategia, con un enfoque adicional en las aplicaciones de experiencia del cliente. En lugar de un nuevo conjunto de tecnologías, la empresa comenzó a ofrecer asesoramiento sobre las mejores prácticas a los usuarios de su plataforma DSE principal. [35] [33]
En abril de 2018, DataStax lanzó DSE 6, con la nueva versión enfocada en empresas que utilizan un modelo de computación en la nube híbrida, con todos los beneficios de una base de datos en la nube distribuida en cualquier nube pública o local, el doble de capacidad de respuesta y la capacidad de manejar el doble de rendimiento. [36] [37]
En diciembre de 2018, DataStax lanzó DSE 6.7, que ofrece a los clientes empresariales cinco nuevas actualizaciones de funciones clave, entre ellas: análisis mejorado, búsqueda geoespacial, protección de datos mejorada en la nube, información de rendimiento mejorada y nuevas herramientas de integración para desarrolladores con Apache Kafka Connector e imágenes Docker de producción certificadas. [38]
En abril de 2020, DataStax lanzó DSE 6.8, que ofrece a las empresas nuevas capacidades para el rendimiento de hardware y para soportar más cargas de trabajo, y actúa como operador de Kubernetes para Cassandra. [39]
DSE 7.0 se introdujo en agosto de 2023. Ofrece mejoras en las operaciones nativas de la nube y las capacidades de IA generativa, e incluye la búsqueda vectorial. [40]
En septiembre de 2014, DataStax recaudó 106 millones de dólares en una ronda de financiación de Serie E, lo que elevó la inversión total en la empresa a 190 millones de dólares . [3] El 15 de junio de 2022, la empresa anunció que había recaudado 115 millones de dólares adicionales , con una valoración de 1.600 millones de dólares . [2] [41]
En 2020, Mergermarket informó que DataStax se estaba preparando para una oferta pública inicial que podría lanzarse en 2021. [42] Sin embargo, en junio de 2022, el director ejecutivo de DataStax, Chet Kapoor, dijo que la empresa no se apresuraría a realizar una IPO. [2]