Este artículo tiene varios problemas. Ayúdenos a mejorarlo o a discutir estos problemas en la página de discusión . ( Aprenda cómo y cuándo eliminar estos mensajes )
|
Desarrollador(es) | ClickHouse, Inc. |
---|---|
Lanzamiento inicial | 15 de junio de 2016 (2016-06-15) |
Versión estable | v24.6.2.17-stable / 5 de julio de 2024 (2024-07-05) [1] |
Repositorio | github.com/ClickHouse/ClickHouse/ |
Escrito en | C++ |
Sistema operativo | Linux , FreeBSD , macOS |
Licencia | Licencia Apache 2.0 |
Sitio web | clickhouse.com |
ClickHouse es un sistema de gestión de bases de datos en columnas (DBMS) de código abierto orientado a columnas para el procesamiento analítico en línea (OLAP) que permite a los usuarios generar informes analíticos mediante consultas SQL en tiempo real. ClickHouse Inc. tiene su sede en el área de la bahía de San Francisco y su filial, ClickHouse BV, tiene su sede en Ámsterdam (Países Bajos ) .
En septiembre de 2021, en San Francisco, California, ClickHouse se constituyó para albergar la tecnología de código abierto con una inversión inicial de 50 millones de dólares de Index Ventures y Benchmark Capital con la participación de Yandex NV [2] y otros. El 28 de octubre de 2021, la empresa recibió financiación de serie B por un total de 250 millones de dólares con una valoración de 2.000 millones de dólares de Coatue Management , Altimeter Capital y otros inversores. La empresa sigue desarrollando el proyecto de código abierto y la tecnología de la nube de ingeniería.
La tecnología de ClickHouse se desarrolló por primera vez hace más de 10 años en Yandex , la empresa de tecnología más grande de Rusia. [3] En 2009, Alexey Milovidov y los desarrolladores comenzaron un proyecto experimental para comprobar la hipótesis de si era viable generar informes analíticos en tiempo real a partir de datos no agregados que también se agregan constantemente en tiempo real. Los desarrolladores dedicaron 3 años a probar esta hipótesis y, en 2012, ClickHouse se lanzó en producción por primera vez para impulsar Yandex.Metrica .
A diferencia de las estructuras de datos personalizadas que se utilizaban antes, ClickHouse se podía aplicar de forma más general como sistema de gestión de bases de datos. La potencia y la utilidad de ClickHouse ofrecían un verdadero DBMS orientado a columnas , que permitía a los sistemas generar informes a partir de petabytes de datos sin procesar con latencias inferiores a un segundo. ClickHouse fue ampliamente adoptado en Yandex, incluso para la herramienta de prueba de carga Yandex.Tank y Yandex.Market para supervisar la accesibilidad del sitio y los KPI.
En junio de 2016, el proyecto ClickHouse se lanzó como software de código abierto bajo la licencia Apache 2 para impulsar casos de uso analítico en todo el mundo. Los sistemas que en ese momento ofrecían un rendimiento de servidor de cien mil filas por segundo, ClickHouse los superó con un rendimiento de cientos de millones de filas por segundo [ cita requerida ] .
Desde que ClickHouse estuvo disponible como código abierto en 2016, su popularidad ha crecido exponencialmente, como lo demuestra su adopción por parte de empresas líderes de la industria como Uber, Comcast, eBay y Cisco. [4] ClickHouse también se implementó en el experimento LHCb del CERN para almacenar y procesar metadatos en 10 mil millones de eventos con más de 1000 atributos por evento.
Las principales características del DBMS ClickHouse son: [5]
ClickHouse tiene algunas características que pueden considerarse desventajas:
ClickHouse fue diseñado para consultas OLAP . [5] ClickHouse funciona bien cuando:
Para consultas simples, las latencias de 50 ms son típicas.
Uno de los casos más habituales de ClickHouse es el análisis de registros de servidores. Tras configurar la carga periódica de datos en ClickHouse (se recomienda insertar datos en lotes bastante grandes con más de 1000 filas), es posible analizar incidentes con consultas instantáneas o supervisar las métricas de un servicio, como las tasas de error, los tiempos de respuesta, etc.
ClickHouse también se puede utilizar como almacén de datos interno para analistas internos. ClickHouse puede almacenar datos de diferentes sistemas (como Hadoop o ciertos registros) y los analistas pueden crear paneles internos con los datos o realizar análisis en tiempo real para fines comerciales.
Según pruebas de referencia realizadas por sus desarrolladores, [6] para consultas OLAP ClickHouse es más de 100 veces más rápido que Hive (un DBMS basado en la pila de tecnología Hadoop ) o MySQL (un RDBMS común ).