Skip to main content

지식 어그리게이터

김욱영

1. Introduce.

콘텐츠 기반 추천 시스템으로 대표되는 현 추천 시스템 방식은 한 계정, 한 홈페이지 안에서 너무 많은 데이터를 구축해 놓습니다. 인터넷 사용자들이 유튜브, 넷플릭스, 구글 등으로 접하는 추천 시스템을 분명히 필요로 하고 있고 있으나, 목적과 맥락에 따라 구분되지 않은 수많은 추천시스템은 많은 문제를 야기합니다. 이러한 문제는 문서작업부터 휴식에 이르기까지 방해를 받곤 합니다. 사용자 누구도 휴식에 있어 문서작업과 관련된 추천시스템을 받고자 하지 않고, 문서작업에 있어 휴식과 관련된 추천시스템을 받고자 하지 않습니다.

요약하자면, 자료 리서치 측면에서 사람들이 부족함을 느끼는 두가지 요인이 있습니다.

  1. 목적과 맥락에 맞지 않는 추천 시스템
  2. 상황별 구분할 수 없는 추천 시스템

따라서 오늘날 더 많아지는 추천 시스템에 있을 문제점을 개편하는 방안을 제시하고자 합니다. 이로서, 지식 네트워크에서 발생하는 리서치 방법을 해결하는 것을 목표로 합니다.

2. Goals.

  • 외부 자료 검색에 대한 새로운 사업 전략 제시
  • 지식 네트워크에서 자료 리서치 방식에 대한 혁신

3. State of Market Circumstances.

구글의 랭킹 추천 시스템

1) 유튜브 : 유튜브는 Video 풀에서 사용자가 원하는 후보군을(candidate generation 딥러닝모델) 추려내고, 랭킹 시스템(ranking 딥러닝 모델)을 활용하여 사용자들이 오래 시청할만한 결과값을 추출해냅니다. 이때, 유저의 시청 데이터를 이용하여 개인 맞춤형 추천을 이끕니다. 이로써 유저의 관심사에 따라 서로 다른 결과값이 나타납니다.

어그리게이터 관점에서 구글

2) 구글 : 구글은 Website라는 공급 업체와 사용자 사이를 이어주는 Aggregators로써 검색 엔진 최적화(SEO)라는 방식을 통해 사용자들에게 정보를 더 쉽게 전달해주는 역할을 합니다.(Stratechery, 2017) 구글이 가지는 SEO를 바탕으로 사용자는 퀄리티 높은 정보를 얻을 수 있습니다.

구글 고객센터에서는(부록 7.1) 사용자의 이전데이터를 바탕으로  유용한 검색 환경을 제공한다고 표시하고 있습니다. 그러나 아직까지는 개인 맞춤 검색 방식이 아닌, 모두가 같은 데이터를 검색하는 통합형 검색 형태로 확인됩니다.

3) 네이버 : 네이버는 작년 에어서치(‘21.11)를 도입하여 통합형 검색에서 개인 맞춤형 검색을 확대 중에 있습니다. 에어서치는 사용자의 이용 데이터, 사용자의 각자의 관심사에 따라 모두가 다른 검색 결과를 얻는 것으로 정의할 수 있습니다. (부록 7.2)

4) 정리 : 유튜브의 candidate generation, ranking 딥러닝 모델과 같은 추천시스템은 검색 시스템(네이버 에어서치)에도 확대되고 있습니다. 구글 또한 이전 검색을 기반으로한 리서치 방식을 도입 할 것으로 예상됩니다.

이러한 흐름을 캐치하여 이전 사용자의 경험을 학습한 새로운 지식 네트워크 서비스가 나타날 것입니다.

4. Problems of Recommendation Systems.

사람들은 주중 근무시간의 19%를 Searching and gathering information에 이용하고 있으며, 소셜 기술로 해당 생산성을 30-35% 높일 수 있습니다.(Mckinsey, 2012) 해당 상황에서 추천 시스템은 사용자가 원하는 정보를 더 쉽게 얻을 수 있고, 더 많은 정보를 얻을 수 있도록 발전하였습니다. 그러나 하나의 시스템 내에서 분리가 되지 않은 지식 네트워크는 리서치에 있어서 단절을 야기할 수 있습니다.

근무시간과 휴식시간에 공통된 시스템을 활용함에 따라, 많은 활동 데이터들이 coupling됩니다. 휴식시간에 음악 영상을 보게 된다면(혹은 검색) 해당 활동 데이터는 근무시간의 데이터에도 영향을 미쳐 생산성에 문제를 일으킵니다. 또한, 두가지 이상의 업무에 있어 구분화 되지 않은 활동 데이터는 작업에 있어 영향을 미칩니다. 시장 사이즈를 조사할 때와 기술 조사를 할 때 활동 데이터는 서로 decoupling 되어야 합니다.

따라서, 지식 네트워크 상에서 활동데이터는 상황별로 구분될 필요가 있습니다. 추천 시스템을 활용하는 Web Browser가 많을수록 해당 문제는 심화될 것입니다. 이제 제시할 사업 전략은 자료 검색 시 지식 네트워크 상에서 발생할 문제점을 해결하는 것을 목표로 합니다.

5. Solution in Knowledge Networks

1)  활동데이터의 구분 필요

유저 기록을 고려한 추천 시스템

다양한 방식의 추천 방식이 있을 수 있으나, 이 문서는 유저 기록과 목적에 영향을 받는 지식 네트워크 상에서 추천시스템을 기준으로 삼습니다. 외부 자료를 검색하는 과정에서 유저 기록과 목적의 영향을 받아 추천 지식을 제시하는 과정에서 새로운 방향을 제시하고자 합니다.

유저 기록이 추천 시스템에 영향을 미치는 방법

유저 기록 / 목적은 세부적으로 다양한 요소 (이하 factor)로 구성되어있습니다. 기존의 추천시스템은 이러한 요소를 전부 활용해왔습니다. 그러나 요소들은 모든 상황에서 동등하게 사용되지는 않습니다. 한번, factor 1가 휴식 때 듣는 음악 factor라고 생각해봅시다. 사용자가 에너지 시장 조사를 위해 문서를 만든다고 했을 때, factor 1의 활동 데이터는 효과적이지 않습니다. 그러나 사용자가 휴식을 취하자고 할 때 factor 1는 매우 중요한 요소로 작용할 것입니다.

이처럼 사용자의 의도에 따라서, 각 factor 들은 매우 중요할 수도 있고, 중요하지 않을 수도 있습니다.

이러한 문제인식을 기반으로 사용자의 문서작성 목적에 따라 각 factor의 on/off 가 결정되는 넥스트 구글, 지식 애그리게이터 아이디어를 제시하고자 합니다.

2)  지식 애그리게이터 작동과정

유저의 경험을 상황에 따라 분류하기

사용자가 검색을 통해 접속한 브라우저 기록을 특성에 따라 factor에 분류합니다. 사용자의 활동을 바탕으로 개개인마다 다른 factor들을 지니게되는 것입니다. 이러한 factor들은 새로운 문서를 작성하기 위한 리서치에 이용됩니다.

유저가 새로운 글을 작성할 떄, 검색 결과의 이전 기록을 참고하기

사용자가 새로운 문서를 작성하는 과정에서 문서의 제목과 내용, 그리고 문서가 존재하는 폴더의 타 문서들을 바탕으로 factor들을 결정됩니다.

문서의 특성에 맞추어 결정된 factor들은 리서치 과정에서의 자료 추천 시스템에 영향을 미칩니다.

3)  factor에 따른 추천시스템 변화

factor에 따른 추천 시스템 변화

기존 추천 시스템은 전체의 유저데이터 요소를 활용하여 자료를 추천하였다면, 이제는 문서 작성시 필요한 factor만을 활용하여 자료를 추천합니다. 사용자들은 더이상 불필요한 추천시스템에 노출될 필요가 없습니다. 이로써 시장조사에서 발생한 유저 기록이 기술 동향 조사에 영향을 미치지 않을 것이며, 휴식시간에 발생한 유저 기록으로 인해 업무에 영향을 받지 않을 것 입니다. 이는 문서작성을 넘어, 모든 온라인 활동의 생산성 증가를 이끌 수 있습니다.

4)  타 사용자와 factor 혼합, 스테이션

각각의 factor들의 집합인 유저 기록(user history)은 현재 계정과 웹사이트 마다 구분되어 있습니다. 유저기록들은 사용자마다 가지고 있는 고유의 특성으로 작용합니다.

사용자 개인의 유저 기록을 기반으로, 타 사용자(혹은 그룹)와 스테이션을 만들 수 있습니다. 스테이션에는 사용자들의 factor들이 혼합되어 작용합니다. 사용자가 엔터테인먼트 생태계에 대해 조사한 경험이 없어도, 스테이션 내 타 사용자가 엔터테인먼트에 굉장한 팬이라면 해당 factor가 사용자 검색에 영향을 미칩니다.

이러한 스테이션은 사용자와 타 사용자 사이의 factor들 간의 연계를 더 단단히 만듭니다. 스테이션에서의 검색 혹은 추천 시스템은 사용자가 직접 타 사용자의 계정에서 검색하는 것 만큼은 아닐지라도 서로간 협업에 있어 긍정적 경험을 심어줄 수 있습니다.

6. Future Research.

모든 데이터, 자료들은 분산화되어가고 있습니다. 그리고 시간이 지남에 따라 개인 맞춤형 정보들이 많아지고, 사람들마다 각기 다른 추천 시스템을 받는 방식으로 성장할 것입니다.

우리는 이를 유튜브에서 경험했고, 구글의 광고시스템에서 경험했습니다. 그리고 이러한 경험이 구글 검색으로 넘어가는 것도 이른 시일입니다.

시대의 흐름은 한 홈페이지 안에서 너무나 많은 데이터를 구축하게끔 만들었습니다. 그렇기에 상황별로 계정을 구분하여 다중계정을 이용하는 경우도 많습니다. 개인 맞춤형 추천 시스템이 많아짐에 따라 발생한  불편함을 유튜브 알고리즘을 통해 겪은 사람도 많을 것입니다.

그렇기에 상황에 따라서, 목적에 따라서, 맥락에 따라서 추천시스템은 달라지고 구분되어야만 합니다. 가까운 미래에는 집에서는 factor 1을 사용하고, 공부할때는 factor 2, 직장에서는 factor 3을 이용하는 등 개인 맞춤형 시스템은 시공간에 따라 구분 될 것입니다.

따라서 개인 맞춤형 시대, 불편함을 겪는 미래를 대비해야합니다. 본 문서는 현재의 문서 작성이 아니라 다가올 시대에 문서 작성을 대비하기 위해 작성되었습니다. 다가올 검색 시스템은 마치 Spotify 처럼 사용자의 취향, 관심에 따라 개인화될 것입니다. 지식 애그리게이터가 다가올 개인화 시대의 지식 SaaS가 될 수 있다고 생각합니다.

7. Appendix.

1) 구글 검색시 이전 데이터 활용

2) 네이버 개인 맞춤형 리서치, 에어서치


2022.08.24 - 비즈니스 캔버스 인턴 지원서에 작성했던 글, 인턴은 잘 안되었다.