Paper: https://arxiv.org/pdf/2010.15363.pdf
PR113 Facebook group: https://www.facebook.com/groups/565858127904979
1. 추천 시스템에서 뽑아내는 score에 영향을 미칠 수 있는 요소가 몇 가지 있다
- ex. User feature, Item feature, Item popularity, etc...
- Counterfactual reasoning을 통해 popularity가 제거된 상황에서의 score를 구해보자!
- Counterfactual? Causal graph에서 결과에 영향을 미치는 일부 요인을 바꾸고 결과값 뽑는다고 간단히 생각...
2. 그러면 score에 영향을 미치는, 그리고 제거해야 하는 요소는 뭐가 있을까?
- Item popularity
- 실제 취향에 상관 없이 유명하니까 추천될 수 있음
- User conformity
- 각 user가 얼마나 인기도, 유명세에 따라가는가.... 정도로 해석하자
3. 그러면 어떻게 위 2가지 요소가 제거된 결과값을 뽑아낼 수 있을까?
- 두 요소가 실제 score에 미치는 정도를 계산해서, 원 결과에서 빼면 된다!
- User/Item module을 통해 item popularity, user comformity를 계산하도록 module 학습(eq.8)
- 개인적으로는 conformity를 왜 도입해야 하는지 설명은 좋았는데, 결국 많은 item을 소비하면 conformity가 높다는 식으로 흘러가는 것은 아쉬움
- 그래서 저 둘이 convention score에 미치는 비율을 계산해서 뺀 값으로 최종 추천(eq.9)
- 작년(2021) X. He 연구실에서 낸 causal + bias 논문의 test set 설정이 특이한데(4.1 Experiment settings - Evaluation), 믿을 수 있는 결과일까?
- 최근 나온 논문 보면 영 아닐 수 있음