論文メモ

A Contextual-Bandit Approach to Personalized News Article Recommendation

概要

バンディットアルゴリズムのLinUCBが最初に提案された論文。

  • ニュース記事のパーソナライズ推薦をcontextual-banditとして、モデル化
  • オフライン評価方法の提案
  • 実際のヤフーのデータセットに新しいアルゴリズムを適用し、12.5%クリック率が上昇