1.はじめに 本記事では、ダイナミックプライシングに使用可能なアルゴリズムのまとめとして、機械学習の一般的問題設定をベースとして、過去の記事も交えていろいろと紹介していきたいと思います。 ただ並べるだけではあまりに貧相な […]
タグ: 強化学習
実店舗型小売店における電子棚札及びダイナミックプライシングの事例と考察
1 はじめに 今回は、実店舗での販売における、ダイナミックプライシングと、その導入に必要不可欠な電子棚札について、事例紹介および考を行います。 2 ダイナミックプライシングの意義 2.1 原始的なダイナミックプライシング […]
強化学習(DQN)のゲームへの応用
kanou はじめに 今回は強化学習の⼿法DQN(Deep Q Network)を使ってゲームAI をつくり、強化学習がどのようなものなのかを説明したいと思います。 DQN についての詳細な説明に関しては下記のリンクを参 […]
連続時間強化学習(前編)
Miyamoto 1 はじめに 今回の記事では、[1] を基盤として連続時間の強化学習(IRL)について取り扱います。 その名の通り、時間軸を離散ではなく連続でとらえるもので、\([0, T]\) 上で定義されます。 で […]
POMDP~制限情報下での強化学習について~
Miyamoto 1 はじめに 部分観測マルコフ決定過程(partially observable Markov decision process)とは、その名の通り、状態の一部しか観測できない状況でのMDPです。 さら […]
強化学習における報酬分布の近似アルゴリズムについて
Miyamoto 1 参考論文 An Analysis of Categorical Distributional Reinforcement Learning https://arxiv.org/pdf/1802.08 […]
深層強化学習を用いた確率的最適化
Miyamoto 1 扱った論文について 論文タイトルはMachine Learning Approximation Algorithms for High-Dimensional Fully Nonlinear Par […]