반응형

2019년 10월 31일부터 적용된 네이버 검색 순위 모델 소개입니다.

 

티스토리 블로그는 작년 7월쯤 있었던 대란 이후 네이버에서 검색으로 들어오는 유입이 많이 줄어들어 있었습니다.

계속 네이버 유입이 늘지 않다가 올해 11월부터 다시 네이버 유입이 조금 늘어나서 확인을 해보니 10월 31일부터 새로운 검색 랭킹 모델을 적용해서 검색 순위에 적용을 하고 있다고 합니다.

네이버의 새로운 검색 모델 내용을 정리해 봤습니다.

 

 

https://blog.naver.com/naver_search/221706818163

△ 더 많은 데이터로 학습하여 더 똑똑해진 웹사이트 검색

 

이번 네이버 검색 모델 변경에 관련된 네이버 공식 블로그의 설명입니다.

네이버 검색 노출의 순위를 결정하는 대략적인 방법을 설명해주고 있습니다.

 

참고로 검색된 결과의 노출 순위를 정하는 정확한 기준은 네이버 이외에 다른 어떠한 검색 엔진들도 명확하게 공개하지 않습니다.

명확한 기준을 공개하면 광고나 사기, 어뷰징을 목적으로 하는 악의적인 글을 기준에만 맞게 만들어서 상위 노출에 고정이 될 수 있기 때문에 절대로 공개하지 않습니다.

검색 노출은 시기 별로 기준을 계속 발전시키며 변경하는 걸 기본으로 합니다.  

 

 

※ 티스토리 방문자 변화

 

 

제 블로그에 방문자 변화 그래프입니다.

특별히 인기 있는 글이 갑자기 생기지 않았는데 11월 1일부터 눈에 뜨게 방문자가 상승을 했습니다.

10월 31일부터 새로운 검색 모델이 적용돼서 다음날부터 차이가 발생한 것으로 보입니다.

다음이나 구글에서 유입은 오차 범위의 차이로 변화가 없었는데 네이버에서 방문자가 기존 대비 30~50% 정도 증가를 했습니다.

 

다른 티스토리 블로그를 하시는 분들도 모두 그런 건 아니지만 이번 검색 순위 모델 교체 후 네이버 유입이 증가 했다는 분들이 많습니다.

 

 

이번에 변경된 네이버 검색은 랭킹 모델에 의해서 검색 노출 순위를 정하게 됩니다.

랭킹 모델은 노출 순위를 정하는 알고리즘으로 AI 학습 데이터를 사용해서 생성한다고 합니다.

 

학습 데이터는 AI가 알고리즘을 만들고 노출 순위를 결정하기 위해서 사용하는 데이터입니다.

학습 데이터는 질의-문서-적합도의 구조로 사용자가 질의한 질문에 대한 글의 적합도를 아래 기준으로 점수를 정해서 사용한다고 합니다.

웹페이지의 적합도 점수를 부여하는 기준은 네이버 웹사이트 검색 품질 가이드라인을 기준으로 한다고 합니다. 

 

△ 적합도 점수 기준입니다.

검색한 키워드에 완벽히 내용이 일치하고 질의자가 원하는 정보가 있거나 공식 정보의 경우 최고점인 5점을 받게 됩니다.

최소 3점 이상의 글이어야 일반 글로 인식되고 2점 이하는 저품질 문서로 보면 될 거 같습니다.

검색에서 상위 노출이 되기 위해서는 5점이나 4점을 받는 좋은 글을 작성해야 할 거 같습니다.

 

 

검색 랭킹 알고리즘이 학습하는 방법입니다.

태깅된 데이터는 위 학습 데이터를 사용해서 데이터베이스화 되어 있는 자료를 의미합니다.

학습한 데이터 이외에 학습하지 않은 데이터와 사용자 피드백에 위험성을 판단한 후 모든 결과를 종합해서 랭킹 모델을 구성하게 됩니다.

태깅되지 않은 데이터와 사용자 피드백은 검증이 된 게 아니라서 조작이나 거짓이 있을 수 있기 때문에 위험성이 있습니다.

 

추가 적으로 랭킹 모델 이외에 질의자의 정보 접근성 향상을 위해 스팸 문서 탐지 기술, 사진 OCR 기술, 번역 기술들을 사용해서 검색을 돕는다고 합니다.

 

 

이번 네이버 검색 순위 모델 변경으로 블로그에 네이버 유입이 늘었기 때문에 개인적으로 환영할 만한 일인 거 같습니다.

앞으로 불펌, 스팸, 어뷰징 사이트를 얼마나 차단시켜 줄지 와 글 분석 결과가 얼마나 정확할지와 다른 블로그와 네이버 블로그를 얼마나 공정하게 대할지가 중요할 거 같습니다.

반응형


AND