MARKETS
KOSPI
KOSDAQ
S&P 500
NASDAQ
USD/KRW
BTC
NIKKEI
WTI
KOSPI
KOSDAQ
S&P 500
NASDAQ
USD/KRW
BTC
NIKKEI
WTI
Wittgenhaus

2026년 6월 12일 금요일

AI 시대, 당신을 더욱 스마트하게

AI검증

데이터브릭스·버추 재단, 인공지능 기반 의료 봉사 매칭 시스템 구축

데이터브릭스와 버추 재단이 인공지능 기술을 활용해 전 세계 의료 불균형 해소에 나섭니다. 방대한 웹 데이터를 구조화해 의료진과 개발도상국 환자를 정밀하게 연결하는 플랫폼을 운영합니다.

2026년 5월 20일

주장데이터브릭스와 버추 재단은 인공지능 기술을 활용해 전 세계 의료 불균형 문제를 해결합니다. 양측은 의료진의 전문성과 개발도상국의 의료 수요를 정밀하게 매칭하는 것을 이번 협력의 핵심 목표로 삼습니다.

팩트버추 재단은 가나와 몽골을 중심으로 지금까지 5만 명 이상의 환자에게 의료 서비스를 제공했습니다. 재단은 현재 72개 저소득 및 중저소득 국가를 대상으로 의료 시설 데이터를 수집하고 관리하는 플랫폼을 운영합니다.

팩트데이터브릭스는 2024년부터 버추 재단과 협력해 방대한 웹 데이터를 구조화된 정보로 변환하는 작업을 수행합니다. 이들은 오픈소스 데이터셋인 오버추어 맵스와 웹 스크래핑 인프라인 브라이트 데이터를 주요 정보원으로 활용합니다.

팩트정보 추출 파이프라인은 오픈에이아이의 지피티 모델을 사용해 2,500만 개 이상의 웹 페이지를 처리합니다. 모델 호출 효율을 높이기 위해 의료 관련성 분류, 조직 유형 식별, 장비 및 절차 추출 등 단계별로 작업을 세분화했습니다.

교차검증대규모 언어 모델을 활용한 데이터 추출은 비용과 성능 측면에서 도전 과제를 안고 있습니다. 데이터브릭스는 아파치 스파크를 통해 작업을 병렬화하고 데이터 상태 기반 체크포인트를 설정해 불필요한 재처리를 방지합니다.

팩트데이터 통합 과정에서 발생하는 중복 문제를 해결하기 위해 스플링크라는 확률적 레코드 연결 프레임워크를 사용합니다. 전화번호나 주소 등 다양한 필드를 비교해 여러 소스에 흩어진 시설 정보를 하나의 권위 있는 기록으로 통합합니다.

팩트데이터 처리 과정에서 발생한 성능 병목 현상은 데이터브릭스의 벡터화 쿼리 엔진인 포톤을 통해 개선했습니다. 가장 느린 데이터 파티션 처리 시간을 30분에서 2분으로 단축해 약 15배의 성능 향상을 달성했습니다.

주장데이터브릭스는 의료 전문가가 자연어로 데이터를 분석할 수 있도록 랭그래프 기반의 멀티 에이전트 아키텍처를 도입했습니다. 이는 복잡한 의료 데이터를 누구나 쉽게 검색하고 분석할 수 있는 환경을 제공합니다.

교차검증인공지능 기반 시스템은 의료 현장의 효율성을 높이지만 데이터의 정확성과 최신성 유지는 지속적인 과제입니다. 시스템 신뢰도를 유지하기 위해 정기적인 데이터 업데이트와 검증 프로세스가 필요합니다.

출처데이터브릭스 공식 블로그 및 버추 재단 프로젝트 소개 영상을 통해 위 내용을 교차 검증했습니다.

본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

스팟

WIRE

버블 지표

상세보기 →

릴리즈 & 논문

전체보기 →

RELEASES

LangChainlangchain==1.3.8

langchain==1.3.8

langchain 1.3.8 릴리즈에서는 문서 문자열 내 이중 백틱을 제거하고, `create_agent`에 오버로드를 추가했습니다. 또한, 비동기 미들웨어 데코레이터 타이핑을 지원하고 구조화된 출력 모델의 폴백을 개선했습니다.

8시간 전

meta-llama/llama-stackv1.1.0

v1.1.0

이번 릴리즈에서는 라이브러리 클라이언트의 요청 빌드 전 헤더 정리, CI 환경에서 테스트 픽스처가 메인 서버 로그를 덮어쓰는 문제 수정, OpenAI 응답 스키마 드리프트 검사기 추가 등 다양한 수정 사항이 포함되었습니다. 또한, 라우터의 헬스 체크 및 벡터 스토어 팬아웃 병렬 처리, 비-OpenAI 모델을 위한 5단계 토크나이저 해석 체인 추가, pgvector에서 psycopg2를 asyncpg로 마이그레이션하는 등의 성능 개선 및 기능 추가가 이루어졌습니다. Anthropic Message Batches API가 추가되었으며, 여러 프로바이더의 비동기 안전성 개선 및 비밀 처리 강화 등 전반적인 안정성 향상에 초점을 맞추었습니다.

1일 전

LangChainlangchain-core==1.4.6

langchain-core==1.4.6

이번 릴리즈에서는 추적 메타데이터에 패키지 버전 추적 기능이 추가되었습니다. 또한, v1 스트리밍 도구 호출이 정규화되었으며, 타입 체크 설정이 통합되었습니다.

1일 전

LangChainlangchain-model-profiles==0.0.6

langchain-model-profiles 0.0.6

langchain-model-profiles 0.0.6 버전이 릴리즈되었습니다. 이번 업데이트에서는 모델 프로필에 `text_inputs` 및 `text_outputs` 필드가 추가되었으며, 프로필 생성을 위한 도구가 개선되었습니다. 또한, 여러 종속성이 업데이트되었습니다.

1일 전

LangChainlangchain-core==1.4.5

langchain-core==1.4.5

langchain-core 1.4.5 릴리즈에서는 스트리밍 시 툴 호출 청크 유효성 검사 기능이 추가되었습니다. 또한, 비동기 트레이서의 동기 컨텍스트에서의 대체 동작 및 구조화된 출력 모델의 대체 동작이 개선되었습니다.

1일 전

PAPERS