論文メモ

Self-Supervised Reinforcement Learning for Recommender Systems

概要

  • セッションベースの強化学習
  • 逐次推薦タスク、自己教師付強化学習
  • Self-Supervised Qlearning (SQN)とSelf-Supervised Actor-Critic (SAC)
    • いまいち素のActor-critisとの違いが分からない・・・
  • 既存のニューラルネットの層と簡単に結合
    • 一つが従来の自己教師付きの強化学習で利用されていた層
    • もう一つが、ユーザーエンゲージメント、購買、レコメンドなどの報酬に基づいた強化学習用の出力層