RecSys (2) 썸네일형 리스트형 [RecSys #5-1] 추천 시스템의 숨은 영웅, Negative Sampling "이 상품을 구매했습니다", "이 영화를 시청했습니다" - 추천 시스템이 수집하는 데이터는 대부분 이런 긍정적인 행동 기록이다. 그런데 여기에 치명적인 문제가 하나 있다. 사용자가 "이 상품을 싫어한다"라고 명시적으로 말해주지 않는다는 것이다. 머신러닝 모델은 좋아하는 것과 싫어하는 것을 구분해야 학습할 수 있는데, 우리에게는 "좋아함"만 있고 "싫어함"이 없다. 이 문제를 해결하는 영리한 방법이 바로 Negative Sampling이다.Implicit Feedback의 딜레마실제 서비스 환경에서 수집되는 데이터는 대부분 Implicit Feedback(암묵적 피드백)이다. 사용자가 상품을 구매했는지, 영화를 봤는지, 링크를 클릭했는지 같은 행동 기록만 남는다. 문제는 이런 데이터에는 긍정적인 신호(Po.. [RecSys #1] 넷플릭스는 어떻게 내가 좋아할 영화를 알까? | 추천 시스템의 원리 넷플릭스를 켜면 메인 화면에 "회원님을 위한 추천" 목록이 가득하다. 유튜브는 다음에 볼 영상을 자동으로 재생하고, 쿠팡은 "이 상품은 어떠세요?"라며 끊임없이 제안한다. 이 모든 것이 바로 추천 시스템(Recommender System)의 결과물이다. 오늘은 추천 시스템이 무엇이며, 어떤 원리로 작동하는지 살펴볼 예정이다.왜 추천 시스템이 필요한가?정보 과부하 시대의 선택온라인 세상에는 선택지가 넘쳐난다. 넷플릭스에는 수만 개의 콘텐츠가 있고, 아마존에는 수억 개의 상품이 진열되어 있다. 이렇게 많은 선택 앞에서 사용자는 역설적으로 "무엇을 선택해야 할지" 막막해진다. 이것이 바로 정보 과부하(Information Overload) 문제다.아마존 창업자 제프 베조스는 이렇게 말했다."고객이 300만 명.. 이전 1 다음