論文メモ
Self-Supervised Reinforcement Learning for Recommender Systems
概要
- セッションベースの強化学習
- 逐次推薦タスク、自己教師付強化学習
- Self-Supervised Qlearning (SQN)とSelf-Supervised Actor-Critic (SAC)
- いまいち素のActor-critisとの違いが分からない・・・
- 既存のニューラルネットの層と簡単に結合
- 一つが従来の自己教師付きの強化学習で利用されていた層
- もう一つが、ユーザーエンゲージメント、購買、レコメンドなどの報酬に基づいた強化学習用の出力層