MARKETS
KOSPI
KOSDAQ
S&P 500
NASDAQ
USD/KRW
BTC
NIKKEI
WTI
KOSPI
KOSDAQ
S&P 500
NASDAQ
USD/KRW
BTC
NIKKEI
WTI
Wittgenhaus

2026년 6월 10일 수요일

AI 시대, 당신을 더욱 스마트하게

AI검증

곤충 생물다양성 연구용 다중 모달 데이터셋 MassID45 공개

연구진이 벌크 곤충 샘플의 자동 분류를 지원하는 다중 모달 데이터셋 MassID45를 발표했습니다. 이 데이터셋은 1만 7000개 이상의 표본 정보를 포함하며 생물다양성 모니터링의 효율성을 높일 것으로 기대됩니다.

2026년 4월 21일

주장곤충은 수백만 종에 달하며 환경 변화로 인해 심각한 개체 수 감소를 겪고 있습니다. 곤충의 다양성을 신속하게 파악하려면 DNA 바코딩과 고해상도 이미지를 결합한 자동 분류 기술 도입이 필요합니다.

주장기존 이미지 기반 분류 방식은 개별 표본 데이터에 의존하는 한계가 있습니다. 대규모 생태 조사에서는 분류되지 않은 벌크 샘플이 수집되므로 이를 처리할 새로운 데이터셋이 중요합니다.

팩트연구진은 벌크 곤충 샘플의 자동 분류기 학습을 위해 MassID45(Mixed Arthropod Sample Segmentation and Identification) 데이터셋을 발표했습니다.

팩트해당 데이터셋은 1만 7000개 이상의 표본에 분류학적 라벨을 할당했습니다. 인간 주석자가 인공지능 보조 도구를 활용해 각 절지동물 개체 주위에 분할 마스크를 생성했습니다.

팩트MassID45의 메타데이터와 벌크 이미지, 주석 및 모델은 제노도(Zenodo)에서 내려받을 수 있습니다. 원시 시퀀싱 데이터는 유럽 뉴클레오타이드 아카이브(ENA) 프로젝트 번호 PRJEB86111에서 확인 가능합니다.

팩트개별 절지동물 이미지와 DNA 바코드 서열은 생명의 바코드 데이터 시스템(BOLD) 프로젝트 ID DS-LPEPA22에서 제공합니다. 데이터셋 생성과 실험 재현을 위한 코드는 깃허브(GitHub) 저장소에 공개했습니다.

교차검증MassID45는 작은 객체 탐지와 인스턴스 분할 기술의 한계를 극복하는 데 집중합니다. 다만 실제 야생 환경의 복잡한 샘플에서 인공지능 모델이 높은 정확도를 유지할지는 추가 검증이 필요합니다.

아름다운 상속 이야기

교차검증DNA 바코딩은 높은 분류학적 해상도를 제공하지만 비용과 시간 측면에서 대규모 조사 적용에 제약이 따릅니다. 이미지 기반 자동 분류와의 결합이 이러한 한계를 보완할 수 있을지는 앞으로 지켜봐야 합니다.

주장이번 데이터셋은 생물다양성 모니터링의 속도와 정확성을 동시에 높이는 토대가 됩니다. 연구진은 향후 더 다양한 생태계 데이터를 포함해 모델의 범용성을 확장할 계획입니다.

출처본 연구는 네이처 머신 러닝(Nature - Machine Learning)의 사이언티픽 데이터(Scientific Data) 섹션에 게재되었으며, 반키(Bánki) 외(2024)의 생명 목록(Catalogue of Life)과 스토크(Stork, 2018)의 절지동물 종 수 연구를 교차 검증했습니다. 또한 바이오스캔(BIOSCAN)-1M 및 5M 데이터셋 연구를 참고했습니다.

본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

스팟

WIRE

버블 지표

상세보기 →

릴리즈 & 논문

전체보기 →

RELEASES

LangChainlangchain-groq==1.1.3

langchain-groq==1.1.3

이번 릴리즈에서는 Groq 통합에 대한 Strict Mode 기능이 추가되었습니다. 또한, 모델 프로필에 새로운 필드가 추가되고, 사용량 메타데이터 토큰 추출 시 is-not-None 검사가 사용되는 등 다양한 개선 및 버그 수정이 이루어졌습니다. 일부 종속성 버전도 업데이트되었습니다.

15시간 전

LangChainlangchain==1.3.6

langchain==1.3.6

langchain 1.3.6 릴리즈에서는 요약 트리거 호환성을 유지하는 수정 사항이 포함되었습니다. 이전 버전과의 호환성을 보장하기 위한 업데이트입니다.

18시간 전

LangChainlangchain==1.3.5

langchain==1.3.5

`SummarizationMiddleware`에 AND 조건 트리거 기능이 추가되었습니다. OpenAI 관련하여 core 의존성 최소 버전이 업데이트되었고, `apply_patch` 내장 도구가 지원됩니다. 또한, pyarrow, aiohttp 등 여러 라이브러리 의존성이 업데이트되었습니다.

19시간 전

TensorRTv1.3.0rc18

v1.3.0rc18

이번 릴리즈에서는 Nemotron-H NVFP4, Qwen 이미지, Step-3.7-Flash, Cosmos3, AFMoE Trinity 등 다양한 모델 지원이 추가되었습니다. 또한, logprobs_simple_format 옵션 추가, CLI 플래그 우선순위 변경 등 API 개선이 이루어졌습니다. NIXL 및 UCX 업그레이드, DWDP 리팩토링, FlashInfer GDN 디코딩 커널 활성화, per-expert LoRA 지원 등 다양한 기능이 추가되었으며, 여러 버그 수정 및 문서 업데이트도 포함되었습니다.

19시간 전

Anthropicv0.109.1

v0.109.1

이번 릴리즈에서는 API 관련 버그 수정이 포함되었습니다. `frontier_llm`에 거부 카테고리가 추가되었습니다.

19시간 전

PAPERS