
Речевые информационные системы
ПАСПОРТ ПРОГРАММЫ

09.04.02 Информационные системы и технологии
Контрактных - 5
Речевые информационные системы
Русский
Биометрические информационные системы
Русский

ПАРТНЕРЫ ПРОГРАММЫ
ОПИСАНИЕ ПРОГРАММЫ
Магистерская программа «Речевые информационные системы» Университета ИТМО реализуется в партнерстве с предприятием «Центр речевых технологий», ведущим мировым разработчиком инновационных систем в сфере распознавания лиц, голосовой биометрии, распознавания и синтеза речи, многоканальной записи, обработки и анализа аудио- и видеоинформации. Обучение в магистратуре предполагает подготовку по базовым и продвинутым курсам по машинному обучению, многомодальной биометрии, распознаванию речи и акустических событий, синтезу речи и естественной обработке языка.
АКТУАЛЬНОСТЬ И ЗНАЧИМОСТЬ ПРОГРАММЫ
Биометрические и речевые технологии являются одним из наиболее актуальных направлений развития современных информационных систем. Такие системы с помощью развитых средств человеко-машинного взаимодействия делают жизнь людей в глобальном информационном сообществе эффективнее и безопаснее. Содержание дисциплин программы постоянно модифицируются с учетом последних достижений в науке и промышленности, что повышает конкурентоспособность выпускников на рынке труда.
ДИСЦИПЛИНЫ
Введение в интеллектуальный анализ данных
В рамках дисциплины студенты изучают этапы обработки данных в системах интеллектуального анализа данных, методы и алгоритмы интеллектуального анализа данных, решающие задачи поиска ассоциативных правил, кластеризации, классификации, регрессии, снижения размерности, в том числе современные архитектуры нейронных сетей. Рассматриваются подходы к построению ансамблей моделей, оценке эффективности и сравнению моделей.
Обработка естественного языка
В рамках дисциплины студенты знакомятся с теоретическими основами и программным обеспечением анализа текстов на естественном языке. Рассматриваются этапы обработки текстов (графематический, морфологический, фрагментационный, синтаксический и семантический анализ). В результате освоения дисциплины студенты получают практические навыки применения методов машинного обучения в решении задач информационного поиска, реферирования, классификации и рубрицирования документов, анализа тональности текстов, автоматической генерации текста и поддержки диалога на естественном языке.
Распознавание диктора
В дисциплине рассматриваются следующие основные вопросы: основные понятия теории распознавания дикторов, идентификационные признаки голоса диктора, экспертные, полуавтоматические методы распознавания дикторов, модели диктора в задачах автоматического распознавания диктора, методы принятия идентификационного решения.
Прикладной искусственный интеллект
В рамках дисциплины студенты изучают приложения и теоретические основы искусственного интеллекта включая: основные понятия искусственного интеллекта, методы машинного обучения, области применения искусственного интеллекта, методы и технологии инженерии знаний, базы знаний, интеллектуальные технологии цифрового производства, здравоохранения, безопасности, транспорта будущего, телекоммуникационные, сенсорики и робототехники, квантовые, обучающие, креативные, автоматизированной обработки и анализа текстовой информации, обработки звуков и изображений, когнитивные технологии, методы онтологического моделирования, разговорный интеллект.
Цифровая обработка сигналов
Основные разделы дисциплины: основные понятия теории цифровой обработки сигналов, цифровая фильтрация сигналов в пространственно-временной и частотной области, методы нелинейной фильтрации сигналов.
Обработка и анализ данных
В период освоения дисциплины студенты получают знания теоретических основ в области: методов хранения и первичной обработки данных, визуализации данных, видов баз данных, реляционных СУБД, большие данные, методов статистического и машинного обучения.
Цифровая обработка речевых сигналов
В дисциплине рассматриваются основы теории цифровой обработки аудио сигналов, а также вопросы реализации методов цифровой обработки аудио сигналов. Основное внимание уделяется методам описания и анализа речевых сигналов и помех и оценке их характеристик.
Анализ акустических событий
В курсе рассматривается актуальность, современное состояние, существующие и развивающиеся подходы, проблемы извлечения признаков (спектрограммы, Mell, MFCC, специализированные признаки), общие подходы в построении архитектуры систем по детектированию событий, использование алгоритмов классификации на основе GMM (EM/MAP), архитектуры нейронных сетей для типовых задач, вопросы фузирования результатов, вопросы интеграции с близкими технологиями (видео события, ПКС, биометрия + признаки).
Распознавание речи
Основные разделы дисциплины: физиологические методы обработки сигналов, распознавание команд методом динамического программирования, скрытые марковские модели, алгоритмы обучения и распознавания (Витерби, Баума-Уэлша), распознавание естественной речи, проблема OOV слов, речевые декодеры.
Машинное обучение
В рамках дисциплины рассматриваются продвинутые методы машинного обучения, глубокие нейронные сети, их применение при решении реальных задач. В результате освоения дисциплины студенты получают практические навыки, позволяющие применять методы глубокого обучения для задач обработки текстовой информации, изображений, звуков.
Синтез речи
В дисциплине рассматриваются основные этапы построения систем TTS (Text To Speech): лингвистика, просодика, фонетика и акустика. На каждом этапе применяются методы машинного обучения.
Многомодальные биометрические системы
Основные разделы дисциплины: основные понятия биометрии, поведенческие биометрические модальности, физиологические биометрические модальности, многомодальные биометрические системы.
Аудиоаналитика
В курсе рассматривается актуальность, современное состояние, существующие и развивающиеся подходы к решению, задачи извлечения признаков (спектрограммы, Mell, MFCC, специализированные признаки), общие подходы в построении архитектуры систем по детектированию событий, сравнение двух подходов – классификация потом детектирование или детектирование потом классификация, задачи связанные с поиском ключевых слов, задачи связанные с оценкой эмоционального состояния, использование алгоритмов классификации на основе GMM (EM/MAP), архитектуры нейронных сетей для типовых задач.
Основы речевых технологий
Современное состояние речевых технологий. Речеобразование, речь и информация. Восприятие и распознавание речи. Особенности речевой деятельности.
Методы адаптивной обработки речевых сигналов
В дисциплине рассматриваются основы теории цифровой обработки аудио сигналов, а также вопросы реализации методов адаптивной цифровой обработки аудио сигналов. Основное внимание уделяется методам адаптивной фильтрации речевых сигналов на этапе предварительной обработки в целях компенсации шумов и искажений различной природы.
Введение в машинное обучение
В дисциплине рассматриваются теоретические основы и фреймворки машинного обучения. Основное внимание уделяется реализации методов обучения «с учителем», обучения «без учителя», обучения «с подкреплением», метрикам качества моделей и визуальному анализу данных.
ПРЕПОДАВАТЕЛИ







НАБОР КОМПЕТЕНЦИЙ
Выпускники программы:
- решают задачи построения речевых и биометрических информационных систем различного назначения;
- выбирают и анализируют показатели и критерии качества таких систем;
- владеют навыками экспериментальных исследований на основе моделирования и тестирования речевых и биометрических информационных систем.
Разработки в области речевых и биометрических технологий пользуются все большим спросом во многих отраслях: государственный сектор, финансы, здравоохранение, правовая и судебная система, медиакоммуникации, военная промышленность. Выпускники магистратуры обладают актуальными компетенциями и квалификациями, востребованными в ведущих научно-исследовательских центрах по направлению информационных технологий и на предприятиях.
ТРУДОУСТРОЙСТВО И ВОСТРЕБОВАННОСТЬ ПРОФЕССИИ
Студенты программы приобретают аналитические и научно-исследовательские компетенции в области проектирования и разработки программного обеспечения, машинного обучения, искусственного интеллекта и алгоритмов. Сочетание теории и практики позволяет выпускникам программы получить чёткое понимание основ, а также методов и инструментов, характерных для конкретных практических областей. Студенты проходят практики и стажировки в международном научном центре «Компьютерные технологии». Выпускники являются востребованными специалистами не только в Санкт-Петербурге и России, но и за рубежом.