Please use this identifier to cite or link to this item: https://er.nau.edu.ua/handle/NAU/64222
Title: Програмний модуль розпізнавання голосових повідомлень з використанням нейронної мережі
Authors: Вовк, Георгій Романович
Keywords: кваліфікаційна робота
нейронні мережі
тензор
спектрограма
згорткові нейронні мережі
програмний модуль
Issue Date: Dec-2023
Publisher: Національний авіаційний університет
Abstract: Актуальність теми. Сучасний стан систем із розпізнавання голосових повідомлень піддається критиці через ряд факторів, таких як залежність від хмарних сервісів та необхідність постійного стабільного підключення до глобальної мережі інтернет. Також необхідно виділити що при користуванні такими системами часто доводиться погоджуватись на користувацькі умови цих сервісів, які не завжди є оптимальними, особливо для великих компаній та корпорацій з власною політикою конфіденційності. Багато компаній саме через відсутність вибору використовують поширені системи для розпізнавання голосу від великих корпорацій. Відсутність власних рішень може заважати їх повноцінному та автономному функціонуванню, без залежності від доступу до мережі, і неможливості швидко та стабільно працювати незалежно від навантаження на хмарні сервіси, та їх працездатність в даний момент. Більшість систем голосового розпізнавання створені для загального користування, що звісно не завжди заважає використовувати їх в вузько направлених сферах, але інколи заважає ефективному використанню ресурсів та коштів. Основним застосуванням розпізнавання голосових повідомлень та команд являються переважно ІоТ системи та голосові асистенти, розпочинаючи від лампочок, телевізорів та іншої домашньої техніки яка вмикається по голосовій команді, закінчуючи портативними асистентами, які в будь-який момент дадуть відповідь на будь-яке ваше запитання, достатньо лише назвати ім’я помічника, та вимовити запитання. Сфера застосування також розповсюджується на медичні системи та системи безпеки, а в сфері логістики уже можна зустріти навіть голосове управління обладнанням. Враховуючи сучасні особливості розвитку технологій із розпізнавання голосу, та їх адаптації в усіх можливих сферах використання, мати власний інструмент для виконання задач із голосового розпізнавання, адаптований сугубо під ваші потреби та запити, допоможе зберегти час, та більш ефективно виконувати поставлені задачі. Мета і завдання виконання кваліфікаційної роботи. Мета виконання кваліфікаційної роботи – розробити мультиплатформенний програмний модуль для розпізнавання голосових команд, який відповідає сучасним вимогам, може працювати автономно, або виконувати функції розпізнавання на власному хмарному сервісі. При розгляді програмного модуля, що обробляє звукові сигнали і таким чином розпізнає голосові повідомлення доволі часто можна наткнутись на зв’язок програм розпізнавання не лише із більш звичними методами розпізнавання сигналів, а із доволі таки новими нейронними мережами. Нейронні мережі в таких запитаннях являються доволі універсальним та абсолютним рішенням, адже їх використання дозволяє програмному модулю розвиватись і навчатись разом із мережею, так ще й не виключає можливості застосування інших методів обробки сигналів. Актуальність застосування нейронних мереж в таких питаннях порівняно із іншими існуючими методами полягає в кількох аспектах, а саме можливість навчання, швидкість, зручність використання і інтеграції, гнучкість, а також можливість врахування різних перепон в процесі навчання моделі. Завдання роботи включають: 1. Дослідити особливості мереж із передавання мультимедіа; 2. Аналіз існуючих рішень для розпізнавання природної мови; 3. Вивчити та дослідити процес розпізнавання голосових сигналів; 4. Дослідити можливості розпізнавання голосу за допомогою нейромереж; 5. Розробити ефективний програмний модуль. Мета кваліфікаційної роботи – створення програмного модуля, який зможе із високою точністю розпізнавати голосові команди. Об’єкт і предмет дослідження. Об’єкт кваліфікаційної роботи – створення програмного модулю розпізнавання голосових команд із застосуванням нейронної мережі. Предмет кваліфікаційної роботи – модуль розпізнавання голосових команд із застосуванням нейронної мережі. Методи дослідження. Щоб досягти виконання зазначених завдань кваліфікаційної роботи було вирішено працювати в інтегрованому середовищі розробки Google Colab. Дане середовище було обрано через його здатність об'єднувати процеси розробки, підтримувати різні технології, проводити хмарні розрахунки на виділених серверах з сучасним апаратним обладнанням, яке забезпечує високу швидкість навчання та загальну швидкодію нейронних мереж. Мовою програмування для реалізації модуля було обрано Python. Мова була вибрана через велику кількість підтримуваних технологій та бібліотек, а також чудову підтримку бібліотеки TensorFlow, яка дозволяє працювати із нейронними мережами будь-якої складності та масштабу. Наукова новизна отриманих результатів. Новизна отриманих результатів полягає в застосуванні згорткових нейронних мереж для розпізнавання голосу. Такий підхід дозволяє забезпечити оптимальне використання ресурсів та підвищити загальну точність розпізнавання голосових команд. Використання нейронних мереж завдяки можливості легко адаптуватися до різних умов, обмежень та цілей користувача, підкреслюють своє безспірне лідерство серед усіх методів розпізнавання та обробки звуко-голосових повідомлень. Нейронні мережі, завдяки можливості їх навчання та тренування, здатні аналізувати інформацію при нечітких або невикористовуваних раніше параметрах або вхідних даних. Саме ця їх особливість надає їм перевагу над звичними методами, і дозволяє доволі ефективно працювати навіть в умовах з далеко не найкращою якістю вхідних даних, дозволяючи швидко обробляти інформацію і використовувати її в подальшому. Системи розпізнавання інформації з пристроїв вводу на основі нейронних мереж доволі часто є менш складними в реалізації, саме ця перевага робить їх привабливими для більш широкого кола застосувань, а в довгостроковій перспективі якість розпізнавання в таких системах може лише покращуватись завдяки новим навчальним даним. Особистий внесок випускника. Всі результати, представлені у кваліфікаційній роботі, отримані випускником особисто. Особливої уваги заслуговує налаштування згорткової нейронної мережі та процес її навчання, задля досягнення високих показників точності, навіть при високій подібності слів. Прогнозні припущення про розвиток об’єкту та предмету дослідження. Полягають у можливості застосування розробленого програмного модулю як системи для розпізнавання голосових команд. Подальший розвиток даного модулю відкриває багато перспектив та можливостей користуватися власними бібліотеками для ускладнення задачі із розпізнавання.
Description: Робота публікується згідно наказу Ректора НАУ від 27.05.2021 р. №311/од "Про розміщення кваліфікаційних робіт здобувачів вищої освіти в репозиторії університету". Керівник проекту: Кучеров Д.П.
URI: https://er.nau.edu.ua/handle/NAU/64222
Appears in Collections:Кваліфікаційні роботи здобувачів вищої освіти ОПП Системне програмування (ОС магістр)

Files in This Item:
File Description SizeFormat 
ФКНТ_2023_123м_Вовк ГР.docx.pdf8.43 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.