DOI
10.34229/KCA2522-9664.24.5.3
УДК 004.8, 004.93
А.О. ОХРІМЕНКО
Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Київ, Україна,
antoh-ipt21@lll.kpi.ua
ПІБ
Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Київ, Україна,
nataliia.kussul@gmail.com
ВИКОРИСТАННЯ ПРОСТОРОВИХ ВАГОВИХ МАСОК
З НЕЗБАЛАНСОВАНИМИ ДАТАСЕТАМИ
ДЛЯ ЗАДАЧІ СЕГМЕНТАЦІЇ СУПУТНИКОВИХ ЗНІМКІВ
Анотація. Розглянуто проблему незбалансованих датасетів у задачі сегментації супутникових знімків, у якій моделі машинного навчання часто ігнорують класи з малою кількістю екземплярів на користь класів з більшою кількістю. Запропоновано використовувати вагові просторові маски під час обчислення функції втрат для врахування показника надійності окремих пікселів. Показано, що запропонований підхід підвищує якість сегментації, зокрема значно покращує метрики для класів з малою кількістю екземплярів. Розглянуто метод розширення датасету з використанням генеративних змагальних мереж (GAN), який також демонструє незначні покращення у розпізнаванні менш представлених у датасеті культур, та виконано його порівняння із запропонованим методом. Досліджено одночасне використання методу вагових масок та генеративних мереж.
Ключові слова: оцінка якості датасету, незбалансований датасет, класифікація, сегментація, генеративні змагальні мережі, генерація навчальних даних.
повний текст
СПИСОК ЛІТЕРАТУРИ
- 1. Banko M., Brill E. Scaling to very very large corpora for natural language disambiguation. Proc. 39th Annual Meeting on Association for Computational Linguistics (ACL’ 01) ( 6–11 July 2001, Toulouse, France). Toulouse, 2001. P. 26–33. doi.org/10.3115/1073012.1073017.
- 2. Wang L., Han M., Li X., Zhang N., Cheng H. Review of classification methods on unbalanced data sets. IEEE Access. 2021. Vol. 9. P. 64606–64628. doi.org/10.1109/ACCESS.2021.3074243.
- 3. Kumar A., Goel S., Sinha N., Bhardwaj A. A review on unbalanced data classification. Proc. International Joint Conference on Advances in Computational Intelligence (IJCACI 2021) (23–24 October 2021, online event). P. 197–208. doi.org/10.1007/978-981-19-03328_14.
- 4. Li X., Zhang L. Unbalanced data processing using deep sparse learning technique. Futur. Gener. Comput. Syst. 2021. Vol. 125, P. 480–484. doi.org/10.1016/j.future.2021.05.034.
- 5. Viloria A., Lezama O.B.P., Mercado-Caruzo N. Unbalanced data processing using oversampling: Machine learning. Procedia Computer Science. 2020. Vol. 175. P.108–113. doi.org/10.1016/j.procs.2020.07.018.
- 6. Hido S., Kashima H., Takahashi Y. Roughly balanced bagging for imbalanced data. Stat. Anal. Data Min. 2009. Vol. 2, Iss. 5–6. P. 412–426. doi.org/10.1002/sam.10061.
- 7. Lango M., Stefanowski J. Multi-class and feature selection extensions of Roughly Balanced Bagging for imbalanced data. J. Intell. Inf. Syst. 2018. Vol. 50, N 1. P. 97–127. doi.org/10.1007/s10844-017-0446-7.
- 8. Lssig N., Oppold S., Herschel M. Metrics and algorithms for locally fair and accurate classifications using ensembles. Datenbank-Spektrum. 2022. Vol. 22, N 1. P. 23–43. doi.org/10.1007/s13222-021-00401-y .
- 9. Tang Y., Gao J. Improved classification for problem involving overlapping patterns. IEICE Trans. Inf. Syst. 2007. Vol. E90-D, N 11. P. 1787–1795. doi.org/10.1093/ietisy/e90-d.11.1787.
- 10. Cui Y., Jia M., Lin T.Y., Song Y., Belongie S. Class-balanced loss based on effective number of samples. Proc. 2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition (15-20 June 2019, Long Beach, CA, USA). Long Beach, 2019. P. 9260–9269. doi.org/10.1109/CVPR.2019.00949.
- 11. Phan T.H., Yamamoto K. Resolving class imbalance in object detection with weighted cross entropy losses. arXiv:2006.01413v1 [cs.CV] 2 Jun 2020. doi.org/10.48550/arXiv.2006.01413.
- 12. Qiao X., Liu Y. Adaptive weighted learning for unbalanced multicategory classification. Biometrics. 2009. Vol. 65, Iss. 1. P. 159–168. doi.org/10.1111/j.1541-0420.2008.01017.x .
- 13. Shorten C., Khoshgoftaar T.M. A survey on image data augmentation for deep learning. J. Big Data. 2019. Vol. 6, N 1. Article number 60. doi.org/10.1186/s40537-019-0197-0.
- 14. Abady L., Barni M., Garzelli A., Tondi B. GAN generation of synthetic multispectral satellite images. Proc. Image and Signal Processing for Remote Sensing XXVI (21–25 September 2020, online event, UK). Vol. 11533. 115330L. doi.org/10.1117/12.2575765.
- 15. Shah M., Gupta M., Thakkar P. SatGAN: Satellite image generation using conditional adversarial networks. Proc. 2021 International Conference on Communication, Information and Computing Technology (ICCICT 2021) (25-27 June 2021, Mumbai, India). Mumbai, 2021. P. 1–6. doi.org/10.1109/ICCICT50803.2021.9510104.
- 16. Hu W., Yin Y., Tan Y.K., Tran A., Kruppa H., Zimmermann R. GAN-assisted road segmentation from satellite imagery. ACM Trans. Multimed. Comput. Commun. Appl. 2023. Just accepted. doi.org/10.1145/3635153.
- 17. Shumilo L., Okhrimenko A., Kussul N., Drozd S., Shkalikov O. Generative adversarial network augmentation for solving the training data imbalance problem in crop classification. Remote Sens. Lett. 2023. Vol. 14, N 11. P. 1131–1140. doi.org/10.1080/2150704X.2023.2275551.
- 18. Lavreniuk M., Kussul N., Novikov A. Deep learning crop classification approach based on sparse coding of time series of satellite data. Proc. IGARSS 2018 - 2018 IEEE International Geoscience and Remote Sensing Symposium (22–27 July 2018, Valencia, Spain). Valencia, 2018. P. 4812–4815. doi.org/10.1109/IGARSS.2018.8518263.
- 19. Охріменко А.О., Куссуль Н.М. Метод виявлення складних для розпізнавання зразків у наборах даних для задач класифікації у машинному навчанні. Проблеми керування та інформатики. 2023. Т. 68, №. 4. P. 84–95. doi.org/10.34229/1028-0979-2023-4-7.
- 20. Ronneberger O., Fischer P., Brox T. U-Net: convolutional networks for biomedical image segmentation. Proc. Medical Image Computing and Computer-Assisted Intervention (MICCAI 2015) (5–9 October 2015, Munich, Germany). Munich, 2015. LNCS. 2015. Vol. 9351, P. 234–241. doi.org/10.1007/978-3-319-24574-4_28.