Takahashi Section1 はじめに(背景と目的) 弊社で開発したDQN (Deep Q Network)アルゴリズムを「陣取りゲーム」を用いて検証した 。 本取り組みで用いた「陣取りゲーム」について 下図のよ […]
タグ: 深層強化学習
throough(スルー)に導入予定の深層強化学習 DDPG (Deep Deterinistic Policy Gradient)の解説
Miyamoto 1 はじめに この記事では強化学習における手法の一つであるDDPGについて紹介します。対応するワードはDQNやQテーブルなどです。これらと並列の単語として、DDPGが存在します。 Deep Deteri […]
throough(スルー)に導入している深層強化学習 DQN (Deep Q Network)の解説
Miyamoto 1 はじめに 株式会社ダイナミックプライシングテクノロジーではダイナミックプライシングツールthroough(スルー)の新技術としてDQN(Deep Q Network)を導入しています。 そのため本記 […]
深層強化学習を用いたECプラットフォームにおけるダイナミックプライシングの調査
この論文は、ICLR 2019で会議論文としてレビューされていました。 Fan Yuanxiang June 20th, 2019 イントロダクション 概要 本論文では、深層強化学習によってアリババというECサイトにおけ […]