Задачка для нейросети

12:50, 23 декабря 2021г, Образование 1042


Задачка для нейросети Фото №1

Российский научный фонд (РНФ) поддержал проект доцента кафедры информационной безопасности Института цифровых технологий, электроники и физики АлтГУ Андрея Лепендина по очистке голосовых сообщений от посторонних шумов.

Ученые работают над проектом уже пару лет и в заявке на грант смогли продемонстрировать первые результаты, а именно модель, которая улучшает качество речевых сигналов в реальном времени, синхронно с тем, как говорит человек. До завершения работ команде из четырех человек потребуется еще два года. Мы расспросили руководителя проекта о том, каковы перспективы таких технологий и границы их возможностей.

Машинное обучение

Как объясняет Андрей Лепендин, методы улучшения качества речевых сигналов применяются в современных программах (например в видеочатах вроде Zoom или Skype). Но справляются они в основном с однородными фоновыми шумами вроде гудения машин, а на резкий звук система отреагировать не успевает.

– В подобной тематике сегодня заинтересованы разные исследовательские группы и компании, – говорит Андрей Александрович. – Но сразу оговорюсь, нашей задачей не является потенциальная коммерциализация, больший интерес представляет именно создание новых методов, которые позволяют решить научную задачу. РНФ поддерживает в первую очередь фундаментальные проекты.

На нашей кафедре я начинал с обработки акустических сигналов, правда, неречевых, в физических исследованиях, опыт в этой области есть. Очистка речи от фоновых шумов – это интересно поставленная задачка. Главное, в ней есть возможность применять методы, связанные с так называемым машинным обучением, или искусственным интеллектом, или глубокими нейронными сетями, – называйте это как угодно. Сейчас это передовая область, которая очень быстро развивается, и в нее интересно влиться.

– То есть интерес исключительно научный?

– Наши разработки могут быть внедрены в неких коллаборациях, что станет плюсом. Но это точно не является задачей грантового проекта, который мы сейчас выиграли.

Обычные методы не сработают

– В чем их новизна?

– Мы создаем, по сути, новые типы, новые архитектуры нейронных сетей. Ищем новые варианты алгоритмов. Дело в том, что до сих пор не существует единого стандартного подхода к любым проблемам и нельзя сказать, что какая-то одна нейронная сеть всех победит. Мы адаптируемся под нашу задачу и занимаемся полунаучными и полуинженерными вещами, пытаясь улучшить качество речевого сигнала в сложных условиях, где обычные методы не работают, и сделать это более интеллектуально.

Если в сигнал внесены существенные искажения, мы не просто его очищаем, но фактически пытаемся интеллектуально достроить то, что потеряно из-за сильного зашумления. Меня спрашивали, можно ли очистить запись, сделанную на фоне взлетающего самолета, – это, конечно, невозможно, нас интересуют более-менее реалистичные задачи (смеется). Например, если мы идем по улице и разговариваем, или в помещении громко кричит ребенок, лает собака, разговаривают другие люди. Скажем, когда на фоне разговора звучит песня, наша модель это уже вполне отфильтровывает.

– Ваша модель – это программа?

– Да, есть идея архитектуры, а есть программная реализация. По сути, наша модель – это алгоритм, который может быть обучен на каких-то данных. Нейронные сети всегда учатся на большом наборе примеров, а дальше обученная система применяется к новым вещам.

«К чему душа лежит»

Андрей Лепендин говорит, что эта технология пригодится не только в видеочатах, но и в решении задач информационной безопасности и вообще везде, где используется человеческая речь. «Одно из применений – верификация людей, то есть проверка, кто работает с системой. Если в процессе работы с машиной используется голосовой интерфейс, система периодически анализирует ваш голос, проверяя, это все еще вы или уже нет. Во всех этих случаях очистка речи – первоначальный этап».

По словам ученого, работа над проектом займет еще два года, за это время нужно получить новые научные результаты, опубликовать их и представить на конференциях.

– Поддержка РНФ в этой ситуации важна?

– Учитывая, что с финансированием науки все довольно сложно, для нас это событие. Альтернативных способов поддержки исследований сейчас мало, так что вы либо пишете заявку на грант, либо занимаетесь прикладными хоздоговорными работами. Но любая компания захочет получать выгоду, в таких условиях невозможно заниматься тем, к чему душа лежит, а в университете есть некоторая свобода. Хотя, если наш проект будет хорошо идти, можно подавать более крупные заявки или действительно начать какую-то коллаборацию.

Фото предоставлены пресс-службой АлтГУ.

На правах рекламы

Фоторепортаж
Блоги