메인 콘텐츠로 건너뛰기
chDB는 ClickHouse v25.8.2.1 기반의 빠른 인프로세스 SQL OLAP 엔진입니다. ClickHouse 서버에 연결하지 않고도 프로그래밍 언어 내에서 ClickHouse의 강력한 기능을 활용하려는 경우 사용할 수 있습니다.

주요 기능

  • 인프로세스 SQL OLAP 엔진 - ClickHouse 기반으로 동작하므로 ClickHouse 서버를 설치할 필요가 없습니다
  • 다양한 데이터 포맷 - Parquet, CSV, JSON, Arrow, ORC 및 70개 이상의 추가 포맷에 대한 입력 및 출력 지원
  • 최소화된 데이터 복사 - python memoryview를 통해 C++에서 Python으로의 데이터 복사를 최소화합니다
  • 풍부한 Python 생태계 통합 - Pandas, Arrow, DB API 2.0을 네이티브로 지원하며 기존 데이터 사이언스 워크플로에 자연스럽게 통합됩니다
  • 의존성 없음 - 외부 데이터베이스를 설치할 필요가 없습니다
  • DataStore API - SQL 최적화가 적용된 Pandas 호환 API로, 630개 이상의 메서드를 지원합니다

DataStore: Pandas 호환 API

NEW! DataStore는 익숙한 pandas 구문과 ClickHouse 성능을 결합한 pandas 호환 API를 제공합니다.
Hex에서 시작하기

한 줄로 마이그레이션

# import만 변경하면 기존 pandas 코드를 그대로 사용할 수 있습니다
- import pandas as pd
+ from chdb import datastore as pd

df = pd.read_csv("data.csv")
result = df[df['age'] > 25].groupby('city')['salary'].mean()

성능 하이라이트

작업pandasDataStore속도 향상
GroupBy 카운트347ms17ms19.93x
복잡한 파이프라인2,047ms380ms5.39x
Filter+Sort+Head1,537ms350ms4.40x
1,000만 행 벤치마크

DataStore 기능

  • 630개 이상의 API 메서드 - pandas DataFrame 메서드 209개, accessor 메서드 185개 이상
  • 지연 평가 - 연산이 최적화된 SQL로 컴파일됩니다
  • SQL 푸시다운 - 필터와 집계가 데이터 소스에서 수행됩니다
  • 범용 데이터 소스 - 파일, S3, 데이터베이스, 데이터 레이크에서 읽을 수 있습니다
자세히 알아보기: DataStore 문서

chDB는 어떤 언어를 지원하나요?

chDB는 다음과 같은 언어별 바인딩을 제공합니다:

시작하려면 어떻게 해야 하나요?

pandas 사용자를 위한

pandas와 유사한 사용 경험에 ClickHouse의 성능을 더해 활용하려면 DataStore API부터 시작하십시오:

DataStore API 참조

SQL API 가이드

chDB 소개 영상

chDB를 간단히 소개하는 영상을 통해 ClickHouse의 강력한 기능을 Python 환경에서 어떻게 활용할 수 있는지 알아보십시오:

성능 벤치마크

chDB는 다양한 시나리오에서 탁월한 성능을 제공합니다:

chDB 소개

라이선스

chDB는 Apache License 2.0에 따라 제공됩니다. 자세한 내용은 LICENSE를 참조하십시오.
마지막 수정일 2026년 6월 10일