画像分類

3. 画像分類#

畳み込みニューラルネットワーク(convolutional neural network; CNN)は、深層学習を代表する技術の一つであり、特に画像分類タスクにおいて画期的な進歩をもたらしました。2012 年に発表された AlexNet5 は、大規模なデータセットを活用して驚異的な性能を達成し、深層学習への関心を急速に高めました。この成果を契機に、研究開発が一気に加速し、多くの革新的なモデルが次々と登場しました。たとえば、VGGNet3 はシンプルな構造ながら深いネットワークを用いることで高い精度を実現しました。一方、ResNet1 は残差ブロックと呼ばれる技術を導入し、非常に深いネットワークでも効率的な学習を可能にしました。さらに、Inception4 は計算効率を重視しながら、複数の畳み込みフィルタを組み合わせた独自のアーキテクチャを提案しました。

[1]

Kaiming He, Xiangyu Zhang, Shaoqing Ren, and Jian Sun. Deep residual learning for image recognition. In 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), volume, 770–778. 2016. doi:10.1109/CVPR.2016.90.

[2]

Alex Krizhevsky, Ilya Sutskever, and Geoffrey E. Hinton. Imagenet classification with deep convolutional neural networks. Commun. ACM, 60(6):84–90, May 2017. URL: https://doi.org/10.1145/3065386, doi:10.1145/3065386.

[3]

Karen Simonyan and Andrew Zisserman. Very deep convolutional networks for large-scale image recognition. 2015. URL: https://arxiv.org/abs/1409.1556, arXiv:1409.1556.

[4]

Christian Szegedy, Wei Liu, Yangqing Jia, Pierre Sermanet, Scott Reed, Dragomir Anguelov, Dumitru Erhan, Vincent Vanhoucke, and Andrew Rabinovich. Going deeper with convolutions . In 2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), volume, 1–9. Los Alamitos, CA, USA, June 2015. IEEE Computer Society. URL: https://doi.ieeecomputersociety.org/10.1109/CVPR.2015.7298594, doi:10.1109/CVPR.2015.7298594.