УДК 517.2+519.977.58+519.8

В.І. Норкін,
Інститут кібернетики ім. В.М. Глушкова НАН України; Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Київ, Україна,


Анотація. У статті відмічено подібність між стохастичним оптимальним керуванням дис-кретними динамічними системами та навчанням багатошарових нейронних мереж. Роботу зосереджено на дослідженні сучасних глибоких мереж з неопуклими негладкими функціями втрат та активації. Проблеми машинного навчання розглянуто як неопуклі не-гладкі задачі стохастичної оптимізації. Як модель негладких неопуклих залежностей ви-користано так звані узагальнено диференційовні функції. Метод зворотного обчислення стохастичних узагальнених градієнтів функціоналу якості навчання для таких систем обґрунтовано на основі формалізму Гамільтона–Понтрягіна. Стохастичні узагальнені ал-горитми градієнтного навчання поширено для навчання неопуклих негладких нейронних мереж. Ефективність стохастичного узагальненого градієнтного алгоритму проілюстрова-но прикладом лінійної багатокласової класифікаційної задачі.

Ключові слова: машинне навчання, глибоке навчання, багатошарові нейронні мережі, негладка неопукла оптимізація, стохастична оптимізація, стохастичний узагальнений градієнт.



