MARKETS
KOSPI
KOSDAQ
S&P 500
NASDAQ
USD/KRW
BTC
NIKKEI
WTI
KOSPI
KOSDAQ
S&P 500
NASDAQ
USD/KRW
BTC
NIKKEI
WTI
Wittgenhaus

2026년 6월 12일 금요일

AI 시대, 당신을 더욱 스마트하게

AI검증

데이터브릭스의 대규모 모니터링 인프라 확장 전략

데이터브릭스가 급증하는 서버리스 워크로드에 대응하기 위해 모니터링 시스템을 전면 재설계했습니다. 자체 개발한 시계열 데이터베이스 판테온과 하이드라 플랫폼을 통해 운영 효율성을 높이고 클라우드 비용을 절감했습니다.

2026년 5월 5일

주장데이터브릭스는 급격한 인프라 확장과 서버리스 워크로드 증가에 대응하고자 기존 모니터링 시스템을 전면 재설계했습니다. 기성 솔루션으로는 대규모 데이터 처리와 고차원 메트릭 문제 해결에 한계가 존재했기 때문입니다.

팩트데이터브릭스는 현재 아마존웹서비스(AWS), 마이크로소프트 애저(Azure), 구글 클라우드 플랫폼(GCP) 등 3대 클라우드 서비스 전반에서 50억 개 이상의 활성 시계열 데이터를 실시간으로 관리합니다. 하루에 수집하는 데이터 샘플은 10조 개를 상회하며, 지난 1년 동안 인프라 규모는 3배 이상 증가했습니다.

교차검증대규모 분산 환경에서 모니터링 인프라를 운영하는 작업은 복잡도가 높습니다. 특히 70개 이상의 클라우드 리전에서 동일한 성능을 유지하면서 수동 개입을 최소화하는 자동화 시스템 구축이 핵심 과제입니다.

아름다운 상속 이야기

팩트데이터브릭스는 오픈소스 프로젝트인 타노스(Thanos)를 기반으로 판테온(Pantheon)이라는 새로운 시계열 데이터베이스를 개발했습니다. 이 시스템은 160개 이상의 타노스 인스턴스를 운영하며, 가장 큰 인스턴스는 초당 1,000개의 쿼리를 처리합니다.

주장판테온 도입의 핵심 성과는 클라우드 비용 수백만 달러 절감과 모니터링 인프라 다운타임 5배 감소입니다. 이는 수동 운영 업무를 자동화하고 시스템 신뢰성을 높인 결과입니다.

팩트판테온은 계층형 저장소 아키텍처를 사용하여 최신 데이터는 메모리에, 최근 24시간 데이터는 디스크에, 그 이전 데이터는 객체 저장소에 분리 저장합니다. 이러한 구조는 컴퓨팅 자원과 저장 자원을 분리하여 인프라 확장 시 효율성을 극대화합니다.

팩트메모리 보존 정책을 이원화하여 지속적인 서비스와 일시적인 서버리스 워크로드에 각각 최적화된 메모리 할당을 적용했습니다. 이는 클라우드 비용을 줄이면서 데이터 정확성을 유지하는 전략입니다.

주장데이터브릭스는 하이드라(Hydra)라는 레이크하우스 기반 플랫폼을 개발하여 고차원적인 문제 해결 능력을 확보했습니다. 하이드라는 기존 스택 대비 50배 저렴한 비용으로 대규모 디버깅 기능을 제공합니다.

교차검증대규모 데이터 환경에서는 메트릭의 카디널리티가 급증하여 기존 방식으로는 데이터 처리가 불가능합니다. 따라서 메트릭 집계 계층을 도입하여 데이터베이스의 부하를 방지하는 설계가 필수적입니다.

출처데이터브릭스의 공식 기술 블로그를 통해 위 내용을 교차 검증했습니다. (https://www.databricks.com/blog/10-trillion-samples-day-scaling-beyond-traditional-monitoring-infra-databricks)

본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

스팟

WIRE

글로벌 인텔리전스

전체보기 →

본 페이지의 정보는 공개 채널을 통해 자동 수집되는 정보로 정보의 정확성·완전성을 보장하지 않으며, Wittgenhaus의 공식 입장이 아닙니다. 이를 근거로 한 판단과 행위의 결과에 Wittgenhaus는 책임을 지지 않습니다.

버블 지표

상세보기 →

릴리즈 & 논문

전체보기 →

RELEASES

LangChainlangchain==1.3.8

langchain==1.3.8

langchain 1.3.8 릴리즈에서는 문서 문자열 내 이중 백틱을 제거하고, `create_agent`에 오버로드를 추가했습니다. 또한, 비동기 미들웨어 데코레이터 타이핑을 지원하고 구조화된 출력 모델의 폴백을 개선했습니다.

12시간 전

meta-llama/llama-stackv1.1.0

v1.1.0

이번 릴리즈에서는 라이브러리 클라이언트의 요청 빌드 전 헤더 정리, CI 환경에서 테스트 픽스처가 메인 서버 로그를 덮어쓰는 문제 수정, OpenAI 응답 스키마 드리프트 검사기 추가 등 다양한 수정 사항이 포함되었습니다. 또한, 라우터의 헬스 체크 및 벡터 스토어 팬아웃 병렬 처리, 비-OpenAI 모델을 위한 5단계 토크나이저 해석 체인 추가, pgvector에서 psycopg2를 asyncpg로 마이그레이션하는 등의 성능 개선 및 기능 추가가 이루어졌습니다. Anthropic Message Batches API가 추가되었으며, 여러 프로바이더의 비동기 안전성 개선 및 비밀 처리 강화 등 전반적인 안정성 향상에 초점을 맞추었습니다.

1일 전

LangChainlangchain-core==1.4.6

langchain-core==1.4.6

이번 릴리즈에서는 추적 메타데이터에 패키지 버전 추적 기능이 추가되었습니다. 또한, v1 스트리밍 도구 호출이 정규화되었으며, 타입 체크 설정이 통합되었습니다.

1일 전

LangChainlangchain-model-profiles==0.0.6

langchain-model-profiles 0.0.6

langchain-model-profiles 0.0.6 버전이 릴리즈되었습니다. 이번 업데이트에서는 모델 프로필에 `text_inputs` 및 `text_outputs` 필드가 추가되었으며, 프로필 생성을 위한 도구가 개선되었습니다. 또한, 여러 종속성이 업데이트되었습니다.

1일 전

LangChainlangchain-core==1.4.5

langchain-core==1.4.5

langchain-core 1.4.5 릴리즈에서는 스트리밍 시 툴 호출 청크 유효성 검사 기능이 추가되었습니다. 또한, 비동기 트레이서의 동기 컨텍스트에서의 대체 동작 및 구조화된 출력 모델의 대체 동작이 개선되었습니다.

1일 전

PAPERS