物体検出

4. 物体検出#

物体検出タスクでは、画像内に存在する物体を分類するだけでなく、それらの物体が存在している位置を囲んだ矩形（バウンディングボックス）の座標を特定する必要があります。このタスクには、物体の位置検出と種類判別を分けて行う two-stage method と、両者を同時に行う one-stage method の2つのアプローチがあります。

初期の物体検出手法では、まず物体らしき領域を推定し、その領域を切り出して分類を行う two-stage method が主流でした。この手法の代表例が Faster R-CNN ³ です。一方で、計算リソースの制約や処理速度の向上を考慮し、物体の座標推定と分類を一度に最適化する one-stage method が登場しました。代表的な手法には、YOLO（You Only Look Once） ² や SSD（Single Shot MultiBox Detector） ¹ があります。

../_images/object_detection_arches.png — Fig. 4.1 物体検出および領域抽出のアーキテクチャ。#

[1]

Wei Liu, Dragomir Anguelov, Dumitru Erhan, Christian Szegedy, Scott Reed, Cheng-Yang Fu, and Alexander C. Berg. SSD: Single Shot MultiBox Detector, pages 21–37. Springer International Publishing, 2016. URL: http://dx.doi.org/10.1007/978-3-319-46448-0_2, doi:10.1007/978-3-319-46448-0_2.

[2]

Joseph Redmon, Santosh Divvala, Ross Girshick, and Ali Farhadi. You Only Look Once: Unified, Real-Time Object Detection . In 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), volume, 779–788. Los Alamitos, CA, USA, June 2016. IEEE Computer Society. URL: https://doi.ieeecomputersociety.org/10.1109/CVPR.2016.91, doi:10.1109/CVPR.2016.91.

[3]

Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun. Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks . IEEE Transactions on Pattern Analysis & Machine Intelligence, 39(06):1137–1149, June 2017. URL: https://doi.ieeecomputersociety.org/10.1109/TPAMI.2016.2577031, doi:10.1109/TPAMI.2016.2577031.