深層強化学習アーカイブ - ダイナミックプライシングテクノロジー developers lab

陣取りゲーム

DQN (Deep Q Network)を用いた陣取りゲームAIの学習について

2020年6月11日2020年6月11日管理人コメントをする

Takahashi Section1 はじめに(背景と目的) 弊社で開発したDQN (Deep Q Network)アルゴリズムを「陣取りゲーム」を用いて検証した。本取り組みで用いた「陣取りゲーム」について下図のよ […]

続きを読む

深層強化学習 DDPG

throough(スルー)に導入予定の深層強化学習 DDPG (Deep Deterinistic Policy Gradient)の解説

2020年4月3日2020年4月3日管理人コメントをする

Miyamoto 1 はじめにこの記事では強化学習における手法の一つであるDDPGについて紹介します。対応するワードはDQNやQテーブルなどです。これらと並列の単語として、DDPGが存在します。 Deep Deteri […]

続きを読む

ダイナミックプライシングツールスルー

throough(スルー)に導入している深層強化学習 DQN (Deep Q Network)の解説

2019年12月13日2020年2月6日管理人コメントをする

Miyamoto 1 はじめに株式会社ダイナミックプライシングテクノロジーではダイナミックプライシングツールthroough（スルー）の新技術としてDQN(Deep Q Network)を導入しています。そのため本記 […]

続きを読む

深層強化学習を用いたECプラットフォームにおけるダイナミックプライシングの調査

2019年7月5日2020年1月11日管理人コメントをする

この論文は、ICLR 2019で会議論文としてレビューされていました。 Fan Yuanxiang June 20th, 2019 イントロダクション概要本論文では、深層強化学習によってアリババというECサイトにおけ […]

続きを読む