AI검증

허깅페이스, 에틴 리랭커 모델 6종 출시

허깅페이스가 검색 시스템 성능 향상을 위해 에틴 리랭커 모델 6종을 공개했습니다. 긴 문맥 처리 능력과 최적화된 연산 속도를 갖춰 검색 정확도를 높입니다.

2026년 5월 19일

주장허깅페이스는 검색 시스템 성능을 극대화하기 위해 에틴 리랭커 모델 6종을 새롭게 출시했습니다. 이 모델군은 검색 결과의 정확도를 결정하는 재순위화 단계에서 최첨단 성능을 제공합니다.

팩트공개된 모델은 17M, 32M, 68M, 150M, 400M, 1B 파라미터 규모로 구성됩니다. 각 모델은 존스 홉킨스 대학의 에틴 인코더를 기반으로 하며 최대 8,192 토큰의 긴 문맥을 처리합니다.

팩트모델 학습에는 증류 기법이 적용되었으며 믹스브레드 AI의 리랭크 데이터 점수를 활용했습니다. 전체 학습 과정은 센텐스 트랜스포머 v5.5.0에 포함된 새로운 에이전트 스킬로 자동화했습니다.

주장에틴 리랭커는 모던버트 아키텍처를 채택하여 플래시 어텐션 2를 지원합니다. 이를 통해 기존 방식 대비 모델 크기와 길이에 따라 1.7배에서 8.3배까지 속도 향상을 기대합니다.

팩트모델 구조는 4단계 분류 헤드를 포함하며 실험 결과 CLS 풀링 방식이 평균 풀링보다 우수한 성능을 보였습니다. 이는 모던버트의 글로벌 어텐션 층이 충분한 정보를 전달하기 때문입니다.

팩트사용자는 센텐스 트랜스포머 라이브러리를 사용하여 단 3줄의 코드로 모델을 불러옵니다. 또한 모델 설정값을 조정하여 정밀도와 플래시 어텐션을 적용하면 처리량을 극대화합니다.

주장이번 모델들은 다양한 규모로 제공되어 사용자가 품질과 속도 사이에서 최적의 선택을 하도록 돕습니다. 긴 문맥 처리가 가능하여 방대한 문서 검색이 필요한 환경에서 유용합니다.

교차검증리랭커는 쿼리와 문서를 결합하여 처리하므로 임베딩 모델보다 정확도가 높지만 연산 비용이 많이 발생합니다. 따라서 전체 문서를 검색하기보다 임베딩 모델로 후보를 추린 뒤 리랭커로 순위를 재조정하는 방식이 권장됩니다.

교차검증리랭커 모델은 단독 사용보다 검색 시스템의 최종 단계에서 순위를 결정하는 용도로 적합합니다. 전체 코퍼스에 대해 리랭커를 실행하는 것은 비효율적이므로 반드시 검색과 재순위화 파이프라인을 구축해야 합니다.

출처허깅페이스 공식 블로그 및 관련 기술 문서를 통해 해당 내용을 교차 검증했습니다.

← 목록으로 돌아가기

본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

스팟

WIRE

글로벌 인텔리전스

전체보기 →

France 24

Pentagon says it reduced US troop brigades in Europe from four to three — The Pentagon said on Tuesday it was cutting the number of US Brigade Combat Teams stationed in Europe from four to three, returning troop levels to those seen in 2021 as Washington presses European allies to assume greater responsibility for regional defence. The move will temporarily delay the depl

5시간 전

Al Jazeera

US President Trump, family granted immunity from pending tax audits — Democratic lawmakers blast move, which follows the establishment of a controversial 'Anti-Weaponization Fund'.

5시간 전

Al Jazeera

Nigeria says joint US strikes kill 175 ISIL fighters in country’s northeast — Nigerian Army lauds joint US operation as part of ongoing military campaign to 'hunt down and kill terrorists anywhere'.

5시간 전

본 페이지의 정보는 공개 채널을 통해 자동 수집되는 정보로 정보의 정확성·완전성을 보장하지 않으며, Wittgenhaus의 공식 입장이 아닙니다. 이를 근거로 한 판단과 행위의 결과에 Wittgenhaus는 책임을 지지 않습니다.

버블 지표

상세보기 →

많이 본 콘텐츠

이코노미스트의 생성형 AI 도입 및 저널리즘 혁신 전략

마케팅16시간 전

AI 검색 결과 내 브랜드 언급 90% 부재 현상

마케팅3시간 전

"AI에서 결제하는 시대 온다"…구글 유니버설 카트 도입

마케팅9시간 전

이스라엘의 소말릴란드 승인과 홍해 안보 전략의 변화

국제22시간 전

오디세이, 4인용 AI 게임 시뮬레이터 아고라-1 공개

AI16시간 전

릴리즈 & 논문

전체보기 →

RELEASES

Anthropicv0.103.1

v0.103.1

이번 릴리즈에서는 SessionToolRunner가 소유하지 않은 도구 호출을 건너뛰는 버그가 수정되었습니다. 이는 SDK의 안정성을 향상시키는 데 기여합니다.

16시간 전

Anthropicv0.103.0

0.103.0 (20260519) Full Changelog: v0.102.0...v0.103.0(https://github.com/anthropics/anthropicsdkpython/compare/v0.102

1일 전

LangChainlangchain-tests==1.1.8

langchain-tests==1.1.8

`langchain-core` 버전 제한이 설정되었으며, 여러 라이브러리의 잠금 파일이 업데이트되었습니다. 또한, OpenAI 모델 참조가 갱신되었고 `langsmith`, `urllib3`, `langchain-core`, `types-pyyaml` 등의 의존성이 최신 버전으로 업데이트되었습니다.

1일 전

OpenAIv2.37.0

v2.37.0

이번 릴리즈에서는 API의 responses compact 메서드에 service_tier 파라미터가 추가되었습니다. 또한, Pydantic 이터레이터에 대한 조기 유효성 검사를 지원하며, 워크로드 ID 공급자를 사용할 때 불필요한 client_id가 제거되었습니다. 파일 타입 오류 메시지에 누락된 f-string 접두사가 수정되었습니다.

4일 전

LangChainlangchain==1.3.1

langchain==1.3.1

langchain 1.3.1 릴리즈에서는 Bedrock 제공자를 요약 토큰 검사에서 별칭으로 지정하는 수정 사항이 포함되었습니다.

4일 전

PAPERS

cs.AI

QSTRBench: 언어 모델의 정성적 공간 및 시간 계산 추론 능력을 평가하기 위한 새로운 벤치마크

2일 전

cs.LG

LLM 파인튜닝에서의 정렬 역학

2일 전