Paper Information
Peng et al., Learning Deep Object Detectors from 3D Models. ICCV 2016.
Introduction
Object detection 的label 很少而人工標注又很貴,因此此篇paper的目的是透過現有的3D模型合成出2D且帶有label的image當作要訓練object detection的dataset.一方面也探討low-level cues對深度網路的object detection能力有何影響.
Contribution
以下探討low-level cues 對深度網路的object detection能力有何影響,low-level cues可分為下列三種:
1. Pose: 對每一個object的3D model都取3、4個view, 再加上random rotation。
2. Texture: 分為兩種, 一種是RGB texture, 一種是uniform gray texture。
3. Background: 分別為RGB background、gray background、white background。
總之,texture分為兩種,background分為三種,所以總共的組合有六種.每一種都分別有一個代號,在result中的表格裡有註明.
Summarization
Result
由表格能看出在PASC-FT中表現最好的是表現最好的是W-RR跟RG-RR,它們的共通點是都使用real RGB的texture.
至於在IMGNET中表現最好的是RG—RR,同樣使用的是real RGB的texture. 顯示物體本身的資訊量是很重要的,至於背景就相對不那麼重要.