УДК 004.032.26
С.І. ШАПОВАЛОВА,
Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Київ, Україна,
lanashape@gmail.com
Ю.В. МОСКАЛЕНКО,
Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Київ, Україна,
yuramuv@gmail.com
О.М. БАРАНІЧЕНКО,
Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Київ, Україна,
baranichenko.work@gmail.com
ЗБІЛЬШЕННЯ РЕЦЕПТИВНОГО ПОЛЯ НЕЙРОНІВ ЗГОРТКОВИХ НЕЙРОННИХ МЕРЕЖ
Анотація. Проведено аналіз архітектур згорткових нейронних мереж для класифікації 1D- та 2D-сигналів.
Визначено, що у випадку вхідного сигналу великої розмірності достатню точність класифікації
можна забезпечити лише застосуванням великої кількості шарів, що не можна виконати за умови
обмежених обчислювальних ресурсів. Однак, у разі обмеження кількості шарів, починаючи
з деякого критичного значення розмірності, точність знижується. Запропоновано спосіб модифікації
згорткової нейронної мережі з відносно невеликою кількістю шарів для розв’язання цієї проблеми. Експериментально доведено його ефективність.
Ключові слова: згорткові нейронні мережі, ResNet, EfficientNet, WaveNet, рецептивне поле.
повний текст
СПИСОК ЛІТЕРАТУРИ
- He K., Zhang X., Ren S., Sun J. Deep residual learning for image recognition. Proc. 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR) (27-30 June 2016, Las Vegas, NV, USA). Las Vegas, 2016. P. 770–778. https://doi.org/10.48550/arXiv.1512.03385.
- Xie S., Girshick R., Dollїr P., Tu Z., He K. Aggregated residual transformations for deep neural networks. Proc. 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR) (21-26 July 2017, Honolulu, HI, USA). Honolulu, 2017. P. 5987–5995. https://doi.org/10.48550/arXiv.1611.05431 .
- Hu J., Shen L., Sun G. Squeeze-and-excitation networks. Proc. 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) (18-23 June 2018, Salt Lake City, UT, USA). Salt Lake City, 2018. P. 7132–7141. https://doi.org/10.48550/arxiv.1709.01507 .
- Tan M., Le Q.V. EfficientNet: Rethinking model scaling for convolutional neural networks. Proc. 36th International Conference on Machine Learning (ICML 2019) (9-15 June 2019, Long Beach, CA, USA). Long Beach, 2019. P. 6105–6114. https://doi.org/10.48550/arxiv.1905.11946.
- Tan M., Le Q.V. EfficientNetV2: Smaller models and faster training. Proc. 38th International Conference on Machine Learning (ICML 2021) (18–24 July 2021, virtual event). P. 10096–10106. https://doi.org/10.48550/arxiv.2104.00298.
- Li S., Tan M., Pang R., Li A., Cheng L., Le Q., Jouppi N. Searching for fast model families on datacenter accelerators. Proc. 2021 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR 2021) (20-25 June 2021, Nashville, TN, USA). Nashville, 2021. P. 8081–8091. https://doi.org/10.1109/CVPR46437.2021.00799 .
- Ridnik T., Lawen H., Noy A., Ben E., Sharir B.G., Friedman I. TResNet: High performance GPU-dedicated architecture. Proc. 2021 IEEE Winter Conference on Applications of Computer Vision (WACV) (03-08 January 2021, Waikoloa, HI, USA). Waikoloa, 2021. P. 1399–1408. https://doi.org/10.1109/WACV48630.2021.00144)
- Oord A., Dieleman S., Zen H., Simonyan K., Vinyals O., Graves A., Kalchbrenner N., Senior A., Kavukcuoglu K. Wavenet: A generative model for raw audio. 2016. P. 1–15. https://doi.org/10.48550/arxiv.1609.03499
- Shapovalova S., Moskalenko Y. Methods for increasing the classification accuracy based on modifications of the basic architecture of convolutional neural networks. ScienceRise. 2020. N 6 (71). P. 10–16. https://doi.org/10.21303/2313-8416.2020.001550 .
- Wavenet with SHIFTED-RFC Proba and CBR. Kaggle/Code. URL: https://www.kaggle.com/nxrprime/wavenet-with-shifted-rfc-proba-and-cbr .
- University of Liverpool — Ion Switching. Kaggle/Competitions. URL: https://www.kaggle.com/c/liverpool-ion-switching .
- Lin T.-Y., Goyal P., Girshick R., He K., Dollїr P. Focal loss for dense object detection. Proc. 2017 IEEE International Conference on Computer Vision (ICCV) (22-29 October 2017, Venice, Italy). Venice, 2017. P. 2999-3007. https://doi.org/10.1109/ICCV.2017.324.
- Salehi S.S.M., Erdogmus D., Gholipour A. Tversky loss function for image segmentation using 3D fully convolutional deep networks. Proc. MLMI 2017. In: Lecture Notes in Computer Science. Wang Q., Shi Y., Suk HI., Suzuki K. (Eds). 2017. Vol. 10541. P. 379–387. https://doi.org/10.1007/978-3-319-67389-9_44 .
- Sorensen T. A method of establishing groups of equal amplitude in plant sociology based on similarity of species content and its application to analyses of the vegetation on Danish commons. Biologiske Skrifter/Kongelige Danske Videnskabernes Selskab. 1948. Vol. V, N 4. P. 1–34.
- Quick, Draw! Doodle Recognition Challenge. Kaggle/Competitions. URL: https://www.kaggle.com/c/quickdraw-doodle-recognition .