4. 物体検出#
物体検出タスクでは、画像内に存在する物体を分類するだけでなく、それらの物体が存在している位置を囲んだ矩形(バウンディングボックス)の座標を特定する必要があります。このタスクには、物体の位置検出と種類判別を分けて行う two-stage method と、両者を同時に行う one-stage method の2つのアプローチがあります。
初期の物体検出手法では、まず物体らしき領域を推定し、その領域を切り出して分類を行う two-stage method が主流でした。この手法の代表例が Faster R-CNN 3 です。一方で、計算リソースの制約や処理速度の向上を考慮し、物体の座標推定と分類を一度に最適化する one-stage method が登場しました。代表的な手法には、YOLO(You Only Look Once) 2 や SSD(Single Shot MultiBox Detector) 1 があります。

Fig. 4.1 物体検出および領域抽出のアーキテクチャ。#
Wei Liu, Dragomir Anguelov, Dumitru Erhan, Christian Szegedy, Scott Reed, Cheng-Yang Fu, and Alexander C. Berg. SSD: Single Shot MultiBox Detector, pages 21–37. Springer International Publishing, 2016. URL: http://dx.doi.org/10.1007/978-3-319-46448-0_2, doi:10.1007/978-3-319-46448-0_2.
Joseph Redmon, Santosh Divvala, Ross Girshick, and Ali Farhadi. You Only Look Once: Unified, Real-Time Object Detection . In 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), volume, 779–788. Los Alamitos, CA, USA, June 2016. IEEE Computer Society. URL: https://doi.ieeecomputersociety.org/10.1109/CVPR.2016.91, doi:10.1109/CVPR.2016.91.
Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun. Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks . IEEE Transactions on Pattern Analysis & Machine Intelligence, 39(06):1137–1149, June 2017. URL: https://doi.ieeecomputersociety.org/10.1109/TPAMI.2016.2577031, doi:10.1109/TPAMI.2016.2577031.