Аннотация. EM-алгоритм для задачи разделения смесей распределений, описанных цепями Маркова, и связанная с ней проблема максимизации взвешенного правдоподобия. Предложены вспомогательные алгоритмы для выбора начального приближения и оптимального числа компонентов смеси, а также метод аппроксимации смеси распределений на основе известных данных с помощью метода опорных векторов. Полученные результаты применены к задаче классификации фрагментов генов.
Ключевые слова: цепь Маркова, классификация, ген, биоинформатика, нуклеотид, экзон, интрон, правдоподобие.
Сергиенко Иван Васильевич,
академик НАН Украины, директор Института кибернетики им. В.М. Глушкова НАН Украины, Киев,
e-mail: aik@public.icyb.kiev.ua.
Гупал Анатолий Михайлович,
чл.-кор. НАН Украины, профессор, заведующий отделом Института кибернетики им. В.М. Глушкова НАН Украины, Киев,
e-mail: gupal_anatol@mail.ru.
Островский Алексей Викторович,
младший научный сотрудник Института кибернетики им. В.М. Глуш¬кова НАН Украины, Киев,
e-mail: ostrovski.alex@gmail.com.