Miyamoto 1 はじめに この記事では強化学習における手法の一つであるDDPGについて紹介します。対応するワードはDQNやQテーブルなどです。これらと並列の単語として、DDPGが存在します。 Deep Deteri […]
投稿者: 管理人
中心極限定理とその応用
Miyamoto 1 はじめに 中心極限定理とは、確率論・統計学において非常に基礎的な概念であり、ほぼ全ての入門書に載っていると言っても過言ではないでしょう。 応用範囲も非常に広く、確率に関するたいていの分野で出てきます […]
Amazonセラーセントラルで使える価格の自動設定機能について
Nakamura Amazonの価格自動設定ツール Amazonに価格の自動設定ツールがあるのは、ご存知でしょうか。 場所は、Amazonセラーセントラル画面にて 「価格」>「価格の自動設定」です。 ※表示されていない場 […]
POMDP~制限情報下での強化学習について~
Miyamoto 1 はじめに 部分観測マルコフ決定過程(partially observable Markov decision process)とは、その名の通り、状態の一部しか観測できない状況でのMDPです。 さら […]
Laravelでvendor以下を汚さずユーザー登録をいい感じにする
Shogo Murakami 社内システム的なものを作る場合、Laravel標準のユーザー登録はよろしくない動作をしてしまうのでそこをいい感じに修正します。 Laravel標準の動作 URLを知っていれば誰でもユーザー登 […]
旅行業界・航空業界でのダイナミックプライシングに関する論文調査
Koudai Satake 本記事について 比較的最近の論文で、旅行業界・航空業界でダイナミックプライシングを導入したという論文が出ていましたので、それについて解説します。 論文名: Dynamic Pricing fo […]
強化学習を用いた食品ロス削減について
Miyamoto 1 はじめに 世界におけるダイナミックプライシングの事例として、イスラエル企業が行っている、食品ロスを改善するためのダイナミックプライシングについて紹介し、最後に弊社が導入中の事業についてお話します。 […]
量子アルゴリズム入門のための基礎解説
Miyamoto 1 はじめに 中山茂氏「量子アルゴリズム」を参考に、入門概説を行います。近年、世間を賑わせている量子コンピューターについて、簡単な解説を行います。 私の専門は量子論ではなく確率論なので、包括的な説明では […]
小売業・スーパーに関するダイナミックプライシング活用事例(食品ロス・フードロス対応)
Adachi Haruka 1.食品ロスの現状 ここ数年、食品ロスが話題に取り上げられています。食品ロスとは、売れ残りや食べ残しなど、本来食べられるのに捨てられてしまう食品のことを指します。 政府統計によると、1年で出荷 […]
throough(スルー)に導入している深層強化学習 DQN (Deep Q Network)の解説
Miyamoto 1 はじめに 株式会社ダイナミックプライシングテクノロジーではダイナミックプライシングツールthroough(スルー)の新技術としてDQN(Deep Q Network)を導入しています。 そのため本記 […]