[論文閱讀]Neural Architecture Search with Reinforcement Learning－Liocean

Paper Information

B. Zoph and Q. V. Le. Neural architecture search with reinforcement learning. In Proceedings of the International Conference on Learning Representations (ICLR), 2017

Introduction

深度學習的網路架構往往需要靠人為當作是參數來調整,這不僅耗時也耗力.而這篇論文提出如何"學"出

網路架構.

Contribution

以往網路架構仰賴於權重參數的調整來找到最佳解,但往往浪費大量的時間以後才發現根本train不起來,

是model結構本身的問題,而調整結構後又來從頭train過一遍.而auto ml 讓調整結構變成training的一部分,

這不僅節省研究時間,也讓更精準的演算法取代人為的架構設計,使得設計出的架構可能表現更好.

Summarization

訓練方法分下列幾個步驟：

1. Controller負責生成候選的網路架構，稱作child network

2. 訓練這個child network，必將訓練好的準確率回傳給controller

3. Controller再繼續優化其他child network，如此反覆進行直到找到最佳的準確率

螢幕快照 2018-06-09 下午1.05.08

下圖為controller如何生成一個child network:

螢幕快照 2018-06-09 下午1.05.18

而如果只用上圖的方式生成child network，只能生成基本的網路架構，並不能達到很好的performance，於是作者將resnet的skip connections元素帶進來，期待能達到更好的performance。

但將skip connections加入進來會有幾個問題，例如有些層沒有輸入、輸出，concat的feature map大小不一。作者針對這些問題也提出的改善方法：

1. 如果該layer沒有輸入，則將image當作輸入

2. 將所有沒有被connected輸出的layer concat起來，當作classify前一層

3. 若concat的feature map大小不一，則padding zero到相同大小

螢幕快照 2018-06-09 下午1.08.39

下圖是如何生成controller及生成的說明：

螢幕快照 2018-06-09 下午1.08.54 螢幕快照 2018-06-09 下午1.09.46

Result

螢幕快照 2018-06-09 下午1.10.50 螢幕快照 2018-06-09 下午1.11.11

李祐賢

Liocean

李祐賢發表在痞客邦留言(0) 人氣()

E-mail轉寄

Liocean

紀錄對生活點滴的看法