본문 바로가기

PR113

[3줄 Recsys] Model-Agnostic Counterfactual Reasoning for Eliminating Popularity Bias in Recommender System(KDD'21)

 

Paper: https://arxiv.org/pdf/2010.15363.pdf

PR113 Facebook group: https://www.facebook.com/groups/565858127904979

 

1. 추천 시스템에서 뽑아내는 score에 영향을 미칠 수 있는 요소가 몇 가지 있다

  - ex. User feature, Item feature, Item popularity, etc...

  - Counterfactual reasoning을 통해 popularity가 제거된 상황에서의 score를 구해보자!

    - Counterfactual? Causal graph에서 결과에 영향을 미치는 일부 요인을 바꾸고 결과값 뽑는다고 간단히 생각...

 

2. 그러면 score에 영향을 미치는, 그리고 제거해야 하는 요소는 뭐가 있을까?

  - Item popularity

    - 실제 취향에 상관 없이 유명하니까 추천될 수 있음

  - User conformity

    - 각 user가 얼마나 인기도, 유명세에 따라가는가.... 정도로 해석하자

 

3. 그러면 어떻게 위 2가지 요소가 제거된 결과값을 뽑아낼 수 있을까?

  - 두 요소가 실제 score에 미치는 정도를 계산해서, 원 결과에서 빼면 된다!

여태 쓰던 추천 모델(Conventional Recsys) 결과에 붙여서 사용 가능

  - User/Item module을 통해 item popularity, user comformity를 계산하도록 module 학습(eq.8)

    - 개인적으로는 conformity를 왜 도입해야 하는지 설명은 좋았는데, 결국 많은 item을 소비하면 conformity가 높다는 식으로 흘러가는 것은 아쉬움

 

  - 그래서 저 둘이 convention score에 미치는 비율을 계산해서 뺀 값으로 최종 추천(eq.9)

  - 작년(2021) X. He 연구실에서 낸 causal + bias 논문의 test set 설정이 특이한데(4.1 Experiment settings - Evaluation), 믿을 수 있는 결과일까?

    - 최근 나온 논문 보면 영 아닐 수 있음