-
추천시스템이란, MovieLens 데이터 분석카테고리 없음 2022. 4. 4. 19:41
추천 시스템이란?
- 사용자(User) 와 상품(Item)
- 특정 사용자가 좋아할 상품을 추천
- 비슷한 상품을 좋아할 사용자를 추천
- 사용자든 상품이든 관심 갖을만한 정보를 추천
검색 서비스 vs. 추천 서비스
- Pull information vs. Push information
- 사용자가 요구한 후 작동 vs. 사용자가 요구하기 전 작동
- 사용자 스스로 원하는 바를 알고 있다. vs 사용자 스스로 원하는 바를 정확히 알지 못한다.
User와 Item
- User와 Item 사이의 관계를 분석하고 연관관계를 찾는다.
- 해당 연관 관계를 점수화한다.
- User의 정보와 Item의 정보를 활용한다.
User Profile
- User를 분석 가능한 요소로 프로파일링
- User를 구분할 수 있는 정보를 활용 (개인 신상정보, 쿠키, 인터넷 주소, 방문 기록, 클릭 패턴 등)
- 사용자 정보를 수집하기 위한 방법 (설문조사, 평가, 웹페이지에 머무는 시간, 검색 로그 등)
- 개인별 추천 또는 사용자 그룹별 추천 가능
Item Profile
- 플랫폼마다 정의하는 아이템의 종류가 다르다
- 모든 것을 추천해주는 플랫폼은 현재 없다
- 플랫폼마다 관련 있는 아이템만 추천한다.
- 아이템 프로필에 속하는 정보(아이템 ID, 아이템 고유 정보, 아이템을 구매한 사용자 정보 등)
추천점수란
- 분석된 사용자와 아이템 정보를 바탕으로 추천점수 계산
- 사용자 또는 아이템 프로필에서 어떤 정보를 사용할지에 따라 추천알고리즘 결정
- 사용자 또는 아이템을 추천하기 위해 각각의 아이템 또는 사용자에 대한 정량화된 기준 필요
- 추천 알고리즘의 목적은 점수화하는 것이다.
추천알고리즘
이러한 추천알고리즘들을 묶어서 하나의 시스템으로 나타낸 것이 추천시스템
컨텐츠기반
- 사용자가 과거에 좋아했던 아이템을 파악하고 그 아이템과 비슷한 아이템을 추천
- 예)스파이더맨에 4.5점 평점을 부여한 유저 -> 타이타닉보다 캡틴 마블을 더 좋아할 것이다.
협업필터링
- 비슷한 성향 또는 취향을 갖는 다른 유저가 좋아한 아이템을 현재 유저에게 추천
- 간단하면서 수준 좊은 정확도를 나타낸다.
- 예) 스파이더맨에 4.5점을 준 2명의 유저 -> 유저 A가 과거에 좋아했던 캡틴 마블을 유저 B에게 추천
하이브리드
- 컨텐츠기반과 협업필터링의 장단점을 상호보완
- 협업필터링은 새로운 아이템에 대한 추천 부족
- 이에 컨텐츠기반 기법이 cold-start 문제에 도움을 줄 수 있음
MovieLens Data 분석실습
평점 데이터 속 유저와 영화 데이터 분석
https://colab.research.google.com/drive/1KDYDBjUoH1u3L6sRGdKhoqKsEVjdHkFC#scrollTo=cXlRui_ICbTE
Google Colaboratory Notebook
Run, share, and edit Python notebooks
colab.research.google.com
영화 데이터의 기본정보 분석
https://colab.research.google.com/drive/1k-yL9CgHaW7niQc46ZgDq8KifKbBOnvj#scrollTo=wKMITfeWNYBn
Google Colaboratory Notebook
Run, share, and edit Python notebooks
colab.research.google.com
참고-패스트캠퍼스, 딥러닝을 활용한 추천시스템 구현 강의