MARKETS
KOSPI
KOSDAQ
S&P 500
NASDAQ
USD/KRW
BTC
NIKKEI
WTI
KOSPI
KOSDAQ
S&P 500
NASDAQ
USD/KRW
BTC
NIKKEI
WTI
Wittgenhaus

2026년 6월 11일 목요일

AI 시대, 당신을 더욱 스마트하게

AI검증

구글, 로봇 파일 미지원 규칙 목록 확대 및 공식화

구글이 로봇 파일(robots.txt)에서 지원하지 않는 규칙들을 공식 문서에 명확히 기재합니다. 실제 웹 데이터를 분석해 웹 관리자에게 정확한 가이드를 제공할 방침입니다.

2026년 4월 23일

주장구글은 로봇 파일 내에서 지원하지 않는 규칙을 공식 문서에 명시하여 웹 관리자에게 정확한 정보를 제공합니다. 이는 임의적인 판단을 배제하고 실제 웹 데이터를 기반으로 접근하는 체계적인 방식입니다.

팩트구글은 현재 로봇 파일에서 유저 에이전트(User-agent), 얼로우(Allow), 디스얼로우(Disallow), 사이트맵(Sitemap) 등 4가지 필드만을 공식 지원합니다. 이 외의 규칙은 검색 엔진이 무시하지만, 그동안 어떤 규칙이 가장 많이 사용되는지는 문서화되지 않았습니다.

팩트구글의 게리 일리스와 마틴 스플릿은 에이치티티피(HTTP) 아카이브 데이터를 활용해 웹사이트가 사용하는 로봇 파일 규칙을 분석했습니다. 연구팀은 상위 10개에서 15개 정도의 미지원 규칙을 식별하여 문서화할 계획입니다.

팩트연구팀은 웹페이지 테스트를 통해 수집한 에이치티티피 아카이브 데이터를 구글 빅쿼리(BigQuery)에 저장하여 분석했습니다. 초기에는 로봇 파일 데이터 수집에 문제가 있었으나, 맞춤형 자바스크립트 파서를 개발하여 이를 해결했습니다.

교차검증분석 과정에서 다수의 웹사이트가 로봇 파일 대신 에이치티엠엘(HTML) 파일을 반환하는 등 잘못된 데이터를 포함하고 있음이 확인되었습니다. 이러한 불필요한 데이터는 분석 결과의 정확도를 낮출 수 있는 요소입니다.

AI NEXT 배너

팩트분석 결과, 지원되는 주요 규칙을 제외하면 나머지 규칙의 사용 빈도는 급격히 낮아집니다. 구글은 이러한 데이터를 바탕으로 미지원 규칙 목록을 업데이트하여 개발자에게 가이드를 제공합니다.

주장구글은 로봇 파일 내 디스얼로우 규칙의 오타에 대한 허용 범위를 확대할 가능성을 시사했습니다. 이는 사용자가 실수로 입력한 오타를 검색 엔진이 유연하게 처리하여 검색 최적화 오류를 줄이려는 의도입니다.

교차검증오타 허용 범위를 넓히면 편리하지만, 웹 관리자가 로봇 파일 작성의 정확성을 확인하는 노력을 소홀히 할 위험이 있습니다. 구글은 여전히 표준화된 규칙 준수를 권장합니다.

팩트이번 연구 결과는 구글 검색 콘솔에서 이미 노출되는 인식되지 않는 태그들과 일치합니다. 구글은 앞으로 공식 문서를 업데이트하여 웹 관리자가 로봇 파일 처리 방식을 명확히 이해하도록 돕습니다.

출처서치 엔진 저널(Search Engine Journal) 보도와 구글 서치 오프 더 레코드 팟캐스트 내용을 교차 검증했습니다. 추가 데이터 분석이 필요한 사용자는 구글 빅쿼리의 공개 데이터셋을 직접 조회할 수 있습니다.

본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

스팟

WIRE

버블 지표

상세보기 →

릴리즈 & 논문

전체보기 →

RELEASES

LangChainlangchain-mistralai==1.1.5

langchain-mistralai==1.1.5

MistralAI 라이브러리 1.1.5 버전이 출시되었습니다. 이번 업데이트에서는 MistralAI 통합 테스트의 안정성이 향상되었으며, 의존성 라이브러리들이 업데이트되었습니다. 또한, 코어 라이브러리의 변경 사항이 포함되었습니다.

11시간 전

LangChainlangchain==1.3.7

langchain==1.3.7

`ProviderToolSearchMiddleware` 기능이 추가되었습니다. 또한, ruff 규칙 ARG가 추가되었고 mypy의 `warn_return_any`가 활성화되었습니다. 레거시 트리거 뷰는 2.0 버전에서 제거될 예정입니다.

15시간 전

Transformersv5.11.0

릴리즈 v5.11.0

이번 릴리즈에서는 DiffusionGemma와 DeepSeek-V3.2 모델이 추가되었습니다. 또한, `KernelConfig` API가 확장되어 n-to-1 모듈 융합 및 파라미터 변환을 지원하며, Mamba2 CUDA 커널 경로의 dtype 불일치 문제 등이 수정되었습니다. Qwen2-VL, Qwen2.5-VL, Qwen3-VL MoE 모델 패밀리의 모델 병렬 빔 탐색 버그가 수정되었고, 연속 배치 처리를 위한 텐서 병렬 지원 문서가 추가되었습니다.

16시간 전

OpenAIv2.41.1

v2.41.1

이번 릴리즈에서는 빌드 시스템 관련 변경 사항이 적용되었습니다. 예약된 릴리즈 워크플로우 트리거가 제거되었습니다.

17시간 전

LangChainlangchain-groq==1.1.3

langchain-groq==1.1.3

이번 릴리즈에서는 Groq 통합에 대한 Strict Mode 기능이 추가되었습니다. 또한, 모델 프로필에 새로운 필드가 추가되고, 사용량 메타데이터 토큰 추출 시 is-not-None 검사가 사용되는 등 다양한 개선 및 버그 수정이 이루어졌습니다. 일부 종속성 버전도 업데이트되었습니다.

1일 전

PAPERS