強化学習アーカイブ - ダイナミックプライシングテクノロジー developers lab

ダイナミックプライシングアルゴリズムの紹介と、それらの平易な数学を用いた分類

1.はじめに本記事では、ダイナミックプライシングに使用可能なアルゴリズムのまとめとして、機械学習の一般的問題設定をベースとして、過去の記事も交えていろいろと紹介していきたいと思います。ただ並べるだけではあまりに貧相な […]

1 はじめに今回は、実店舗での販売における、ダイナミックプライシングと、その導入に必要不可欠な電子棚札について、事例紹介および考を行います。 2 ダイナミックプライシングの意義 2.1 原始的なダイナミックプライシング […]

kanou はじめに今回は強化学習の⼿法DQN(Deep Q Network)を使ってゲームAI をつくり、強化学習がどのようなものなのかを説明したいと思います。 DQN についての詳細な説明に関しては下記のリンクを参 […]

Miyamoto 1 はじめに今回の記事では、[1] を基盤として連続時間の強化学習(IRL)について取り扱います。その名の通り、時間軸を離散ではなく連続でとらえるもので、\([0, T]\) 上で定義されます。で […]

Miyamoto 1 はじめに部分観測マルコフ決定過程（partially observable Markov decision process）とは、その名の通り、状態の一部しか観測できない状況でのMDPです。さら […]

Miyamoto 1 参考論文 An Analysis of Categorical Distributional Reinforcement Learning https://arxiv.org/pdf/1802.08 […]

Miyamoto 1 扱った論文について論文タイトルはMachine Learning Approximation Algorithms for High-Dimensional Fully Nonlinear Par […]