MARKETS
KOSPI
KOSDAQ
S&P 500
NASDAQ
USD/KRW
BTC
NIKKEI
WTI
KOSPI
KOSDAQ
S&P 500
NASDAQ
USD/KRW
BTC
NIKKEI
WTI
Wittgenhaus

2026년 6월 10일 수요일

AI 시대, 당신을 더욱 스마트하게

AI검증

vLLM, v0.18.1 릴리즈: 성능 및 안정성 개선

vLLM 프로젝트가 v0.18.1 패치 릴리즈를 통해 성능 최적화와 버그 수정을 완료했습니다. 이번 업데이트는 특히 SM100 MLA 프리필 백엔드 변경 및 딥젬(DeepGemm) 정확도 문제 해결에 중점을 두었습니다.

2026년 4월 6일

팩트vLLM 프로젝트가 v0.18.1 버전을 출시했습니다. 이번 릴리즈는 이전 버전인 v0.18.0에 대한 패치로, 몇 가지 중요한 이슈를 해결하는 데 초점을 맞추었습니다.

주장이번 v0.18.1 릴리즈는 vLLM의 성능과 안정성을 한 단계 끌어올릴 것으로 기대됩니다. 특히 SM100 MLA 프리필 백엔드를 TRT-LLM으로 되돌린 결정은 특정 하드웨어 환경에서의 성능 최적화를 위한 전략적인 선택으로 분석됩니다.

팩트주요 변경 사항으로는 SM100 MLA 프리필 백엔드를 TRT-LLM으로 재변경(이슈 #38562)했으며, Python 3.10 이하 버전에서 standalone_compile.FakeTensorMode의 mock.patch 해상도 실패 문제를 수정(이슈 #37158)했습니다.

팩트또한, Renormalize 라우팅을 위한 모놀리식 TRTLLM MoE 기능을 비활성화(이슈 #37605)했으며, 도커 빌드 시 누락된 FlashInfer 헤더를 사전 다운로드하도록 개선(이슈 #38391)했습니다.

팩트마지막으로, 블랙웰(Blackwell) 아키텍처에서 Qwen3.5 FP8에 대한 딥젬(DeepGemm) E8M0 정확도 저하 문제를 해결(이슈 #38083)하여 모델의 신뢰성을 높였습니다.

교차검증이번 릴리즈는 특정 하드웨어 및 소프트웨어 환경에서의 문제를 해결하는 데 집중하고 있어, 모든 사용자에게 동일한 수준의 성능 향상을 제공하지는 않을 수 있습니다. 특히 Python 버전 호환성 문제는 이전 버전 사용자에게 영향을 줄 수 있습니다.

출처프로젝트 GitHub 저장소: https://github.com/vllm-project/vLLM/releases/tag/v0.18.1

본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

스팟

WIRE

버블 지표

상세보기 →

릴리즈 & 논문

전체보기 →

RELEASES

LangChainlangchain-groq==1.1.3

langchain-groq==1.1.3

이번 릴리즈에서는 Groq 통합에 대한 Strict Mode 기능이 추가되었습니다. 또한, 모델 프로필에 새로운 필드가 추가되고, 사용량 메타데이터 토큰 추출 시 is-not-None 검사가 사용되는 등 다양한 개선 및 버그 수정이 이루어졌습니다. 일부 종속성 버전도 업데이트되었습니다.

11시간 전

LangChainlangchain==1.3.6

langchain==1.3.6

langchain 1.3.6 릴리즈에서는 요약 트리거 호환성을 유지하는 수정 사항이 포함되었습니다. 이전 버전과의 호환성을 보장하기 위한 업데이트입니다.

14시간 전

LangChainlangchain==1.3.5

langchain==1.3.5

`SummarizationMiddleware`에 AND 조건 트리거 기능이 추가되었습니다. OpenAI 관련하여 core 의존성 최소 버전이 업데이트되었고, `apply_patch` 내장 도구가 지원됩니다. 또한, pyarrow, aiohttp 등 여러 라이브러리 의존성이 업데이트되었습니다.

15시간 전

TensorRTv1.3.0rc18

v1.3.0rc18

이번 릴리즈에서는 Nemotron-H NVFP4, Qwen 이미지, Step-3.7-Flash, Cosmos3, AFMoE Trinity 등 다양한 모델 지원이 추가되었습니다. 또한, logprobs_simple_format 옵션 추가, CLI 플래그 우선순위 변경 등 API 개선이 이루어졌습니다. NIXL 및 UCX 업그레이드, DWDP 리팩토링, FlashInfer GDN 디코딩 커널 활성화, per-expert LoRA 지원 등 다양한 기능이 추가되었으며, 여러 버그 수정 및 문서 업데이트도 포함되었습니다.

15시간 전

Anthropicv0.109.1

v0.109.1

이번 릴리즈에서는 API 관련 버그 수정이 포함되었습니다. `frontier_llm`에 거부 카테고리가 추가되었습니다.

15시간 전

PAPERS