レイアウト最適化における強化学習 - Shinichi0713/RL-study GitHub Wiki
Chip Placement with Deep Reinforcement Learning
アブスト:
チップ配置を学習ベースの手法で実現する。
主流の手法とは異なり、過去の経験の利用や、時間とともに改善することができる。
教師あり学習における、配置の質を教師データとした表現学習に基づき、問題設定した。
転移学習可能なポリシーと価値関数ネットワークとしてはエンコーダを応用した。
PPAを最小化することを目的として、人を超えるパフォーマンスを発揮する手法を提案する。
機械学習においてデータから有用な特徴を自動的に学習する手法 表現学習(Representation Learning)とは、機械学習においてデータから有用な特徴を自動的に学習する手法です。 具体的には、高次元データ(画像、音声、自然言語など)を低次元の特徴表現に変換し、予測タスクを解決するために利用します。従来は人間が特徴量を設計していましたが、表現学習ではコンピュータが自動で特徴を学習し、タスクを実行できるようになります。表現学習には、教師あり学習と教師なし学習の2つのアプローチがあります。
論文
Reimagining space layout design through deep reinforcement learning