3. 画像分類#
畳み込みニューラルネットワーク(convolutional neural network; CNN)は、深層学習を代表する技術の一つであり、特に画像分類タスクにおいて画期的な進歩をもたらしました。2012 年に発表された AlexNet5 は、大規模なデータセットを活用して驚異的な性能を達成し、深層学習への関心を急速に高めました。この成果を契機に、研究開発が一気に加速し、多くの革新的なモデルが次々と登場しました。たとえば、VGGNet3 はシンプルな構造ながら深いネットワークを用いることで高い精度を実現しました。一方、ResNet1 は残差ブロックと呼ばれる技術を導入し、非常に深いネットワークでも効率的な学習を可能にしました。さらに、Inception4 は計算効率を重視しながら、複数の畳み込みフィルタを組み合わせた独自のアーキテクチャを提案しました。
Kaiming He, Xiangyu Zhang, Shaoqing Ren, and Jian Sun. Deep residual learning for image recognition. In 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), volume, 770–778. 2016. doi:10.1109/CVPR.2016.90.
Alex Krizhevsky, Ilya Sutskever, and Geoffrey E. Hinton. Imagenet classification with deep convolutional neural networks. Commun. ACM, 60(6):84–90, May 2017. URL: https://doi.org/10.1145/3065386, doi:10.1145/3065386.
Karen Simonyan and Andrew Zisserman. Very deep convolutional networks for large-scale image recognition. 2015. URL: https://arxiv.org/abs/1409.1556, arXiv:1409.1556.
Christian Szegedy, Wei Liu, Yangqing Jia, Pierre Sermanet, Scott Reed, Dragomir Anguelov, Dumitru Erhan, Vincent Vanhoucke, and Andrew Rabinovich. Going deeper with convolutions . In 2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), volume, 1–9. Los Alamitos, CA, USA, June 2015. IEEE Computer Society. URL: https://doi.ieeecomputersociety.org/10.1109/CVPR.2015.7298594, doi:10.1109/CVPR.2015.7298594.