MARKETS
KOSPI
KOSDAQ
S&P 500
NASDAQ
USD/KRW
BTC
NIKKEI
WTI
KOSPI
KOSDAQ
S&P 500
NASDAQ
USD/KRW
BTC
NIKKEI
WTI
Wittgenhaus

2026년 6월 12일 금요일

AI 시대, 당신을 더욱 스마트하게

AI검증

구글 젬마 4의 멀티 토큰 예측 기술을 통한 생성 속도 3배 향상

구글이 젬마 4 모델에 멀티 토큰 예측 기술을 도입하여 텍스트 생성 속도를 기존 대비 최대 3배까지 높였습니다. 해당 기술은 보조 모델을 활용해 연산 효율을 극대화하며 개발자 누구나 자유롭게 활용할 수 있습니다.

2026년 5월 6일

주장구글은 젬마 4 모델의 텍스트 생성 속도를 기존 대비 최대 3배까지 향상하는 멀티 토큰 예측 기술을 도입했습니다. 이는 대규모 언어 모델의 고질적인 병목 현상을 해결하려는 전략적 시도입니다.

팩트기존 대규모 언어 모델은 한 번에 하나의 토큰만을 생성하는 방식을 사용합니다. 이 과정에서 매번 수십억 개의 매개변수를 메모리에서 불러와야 하므로 연산 효율이 저하됩니다.

팩트구글의 새로운 멀티 토큰 예측 기술은 보조 모델을 활용하여 여러 토큰을 동시에 제안합니다. 메인 모델은 이 제안들을 한 번에 검토하고 처리함으로써 대기 시간을 줄입니다.

교차검증보조 모델이 제안한 토큰이 정확할 경우에만 즉시 수용되는 구조입니다. 구글은 이 과정에서 텍스트의 품질이나 정확도 손실은 발생하지 않는다고 설명합니다.

팩트프로세서의 연산 코어는 데이터가 메모리에서 전달되기를 기다리는 시간이 깁니다. 이번 기술은 이러한 유휴 자원을 활용하여 연산 효율을 극대화합니다.

팩트해당 기술은 스마트폰과 개인용 컴퓨터는 물론 클라우드 환경에서도 동일하게 작동합니다. 하드웨어 제약이 있는 환경에서도 효율적인 텍스트 생성이 가능합니다.

팩트멀티 토큰 예측 드래프터는 아파치 2.0 라이선스로 허깅페이스와 캐글에 공개되었습니다. 개발자들은 누구나 자유롭게 해당 기술을 내려받아 활용할 수 있습니다.

팩트지난 4월 초 공개된 젬마 4 모델은 이미 6천만 회 이상의 다운로드를 기록했습니다. 이는 오픈 모델 시장에서 구글의 영향력이 빠르게 확대되고 있음을 보여줍니다.

주장이번 기술 도입은 온디바이스 AI 시장의 경쟁력을 강화합니다. 스마트폰과 같은 기기에서 더 빠른 응답 속도를 제공하는 것은 사용자 경험 측면에서 핵심적인 요소입니다.

출처더 디코더 및 구글 공식 블로그 자료를 교차 검증했습니다.

본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

스팟

WIRE

버블 지표

상세보기 →

릴리즈 & 논문

전체보기 →

RELEASES

LangChainlangchain==1.3.8

langchain==1.3.8

langchain 1.3.8 릴리즈에서는 문서 문자열 내 이중 백틱을 제거하고, `create_agent`에 오버로드를 추가했습니다. 또한, 비동기 미들웨어 데코레이터 타이핑을 지원하고 구조화된 출력 모델의 폴백을 개선했습니다.

16시간 전

meta-llama/llama-stackv1.1.0

v1.1.0

이번 릴리즈에서는 라이브러리 클라이언트의 요청 빌드 전 헤더 정리, CI 환경에서 테스트 픽스처가 메인 서버 로그를 덮어쓰는 문제 수정, OpenAI 응답 스키마 드리프트 검사기 추가 등 다양한 수정 사항이 포함되었습니다. 또한, 라우터의 헬스 체크 및 벡터 스토어 팬아웃 병렬 처리, 비-OpenAI 모델을 위한 5단계 토크나이저 해석 체인 추가, pgvector에서 psycopg2를 asyncpg로 마이그레이션하는 등의 성능 개선 및 기능 추가가 이루어졌습니다. Anthropic Message Batches API가 추가되었으며, 여러 프로바이더의 비동기 안전성 개선 및 비밀 처리 강화 등 전반적인 안정성 향상에 초점을 맞추었습니다.

1일 전

LangChainlangchain-core==1.4.6

langchain-core==1.4.6

이번 릴리즈에서는 추적 메타데이터에 패키지 버전 추적 기능이 추가되었습니다. 또한, v1 스트리밍 도구 호출이 정규화되었으며, 타입 체크 설정이 통합되었습니다.

1일 전

LangChainlangchain-model-profiles==0.0.6

langchain-model-profiles 0.0.6

langchain-model-profiles 0.0.6 버전이 릴리즈되었습니다. 이번 업데이트에서는 모델 프로필에 `text_inputs` 및 `text_outputs` 필드가 추가되었으며, 프로필 생성을 위한 도구가 개선되었습니다. 또한, 여러 종속성이 업데이트되었습니다.

1일 전

LangChainlangchain-core==1.4.5

langchain-core==1.4.5

langchain-core 1.4.5 릴리즈에서는 스트리밍 시 툴 호출 청크 유효성 검사 기능이 추가되었습니다. 또한, 비동기 트레이서의 동기 컨텍스트에서의 대체 동작 및 구조화된 출력 모델의 대체 동작이 개선되었습니다.

1일 전

PAPERS