Библиотека диссертаций Украины Полная информационная поддержка
по диссертациям Украины
  Подробная информация Каталог диссертаций Авторам Отзывы
Служба поддержки




Я ищу:
Головна / Технічні науки / Системи та засоби штучного інтелекту


Людовик Тетяна Владленівна. Інформаційна технологія синтезу індивідуалізованого мовлення за текстом : Дис... канд. техн. наук: 05.13.23 / НАН України ; МОН України; Міжнародний науково-навчальний центр інформаційних технологій та систем. — К., 2006. — 176арк. : табл. — Бібліогр.: арк. 137-151.



Анотація до роботи:

Людовик Т.В. Інформаційна технологія синтезу індивідуалізованого мовлення за текстом. – Рукопис.

Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.13.23 – системи та засоби штучного інтелекту. – Міжнародний науково-навчальний центр інформаційних технологій та систем, Київ, 2006.

Дисертаційне дослідження присвячене розробленню та реалізації інформаційної технології автоматичного озвучення довільних текстів українською мовою з відображенням особливостей голосу та вимови окремих людей. Обґрунтовано принципи та етапи розроблення індивідуальних мовленнєвих баз даних. Проведено акустико-фонетичне дослідження мовленнєвих корпусів, встановлено загальні мовленнєві закономірності на сегментному та просодичному рівнях та виведено загальні моделі вимови, а саме, моделі транскрибування, синтагматичного членування, паузації, тривалостей фонем та інтонування. Розроблено автоматизовані засоби індивідуалізації загальних моделей вимови. Визначено архітектуру системи синтезу індивідуалізованого мовлення за текстом та розроблено відповідну програмну модель. Наведено результати тестування розбірливості та природності синтезованого мовлення.

В рамках дисертаційної роботи розроблено інформаційну технологію синтезу індивідуалізованого мовлення, яка забезпечує якісне озвучення довільних текстів природною мовою з відтворенням голосу та вимови різних дикторів. Основні наукові та практичні результати дисертаційної роботи:

1. Розроблено загальні принципи створення індивідуальних мовленнєвих баз даних: а) принцип фонемності, відповідно до якого в якості елементів МБД і елементів конкатенації під час синтезу мовлення обрано фонеми у сегментному контексті; б) принцип відображення у мовленнєвому матеріалі, на базі якого розробляється МБД, різних функціональних стилів мовлення; в) принцип використання в анотації МБД об’єктивних характеристик мовленнєвих сигналів – їх тривалості та поточних значень ЧОТ.

2. Визначено етапи розроблення МБД і відповідно до них розроблено шість експериментальних МБД чоловічих та жіночих голосів.

3. Запропоновано використовувати анотації МБД у двох режимах: а) для попереднього настроювання лінгвістичного процесора на вимову окремого диктора; б) під час синтезу мовлення для аналізу вхідного тексту, створення його індивідуалізованого опису та вибирання з МБД мовленнєвих відрізків, що відповідають цьому описові. Таке використання анотації МБД спрощує процедури пошуку та вибирання потрібних елементів з МБД під час синтезу і, таким чином, дозволяє не звертатись до акустичних файлів.

4. Розроблено комплекс формальних загальних сегментних та просодичних моделей вимови українського мовлення: модель фонемного транскрибування вхідних орфографічних текстів, модель синтагматичного членування тексту, модель паузації, модель тривалостей фонем та модель інтонування.

5. Розроблено процедури індивідуалізації загальних моделей вимови шляхом автоматизованого та автоматичного аналізу інформації, що міститься в індивідуальних МБД. Використання індивідуалізованих моделей вимови у системі синтезу мовлення дозволяє отримувати розбірливе та наближене до природного синтезоване мовлення, оскільки в ньому відтворюються особливості вимови та стилю читання. Водночас, реалізовано можливість генерування мовлення нейтрального стилю із дотриманням орфоепічних норм.

6. Розроблено архітектуру системи синтезу українського мовлення, основними компонентами якої є мовленнєва база даних, лінгвістичний процесор, модуль вибирання елементів з мовленнєвої бази даних та акустичний процесор. Природність синтезованого мовлення забезпечується застосуванням конкатенативного методу, який дозволяє відтворювати особливості голосу та вимови окремої людини завдяки використанню природних мовленнєвих сигналів.

7. Створено програмну експериментальну систему синтезу індивідуалізованого українського мовлення за текстом, в якій реалізовано запропоновану технологію. Розроблено методику тестування розбірливості та природності синтезованого мовлення. Експертами підтверджено прийнятність нової технології.

8. В цілому розроблено технологію синтезу мовлення за текстом, яка дозволяє швидко, в автоматизованому режимі, настроювати систему синтезу мовлення на голоси та вимову різних людей, а також автоматично отримувати розбірливе та наближене до природного синтезоване мовлення.

Публікації автора:

  1. Людовик Т.В. Особенности транскрибирования и интонирования текстов для синтеза многоязычной речи // Автоматизация дедуктивных построений, распознавание образов и интеллектуальные роботы. – Киев: ИК АН УССР, 1988. – С. 65–71.

  2. Биднюк С.А., Винцюк Т.К., Лысенко А.Б., Людовик Т.В., Шинкаж А.Г. Система речевого диалога “Речь-121” для ПЭВМ // Механизация и автоматизация управления. – 1988. – № 4. – С. 23–26.

  3. Людовик Т.В. Моделювання просодичних характеристик для синтезатора українського мовлення // Автоматизовані системи управління та прогресивні інформаційні технології. – К.: МННЦ ІТіС. – 2003. – Вип. 2. – С. 111–126.

  4. Людовик Т.В., Сажок Н.Н. Использование речевых баз данных большого объема при синтезе речи в системах искусственного интеллекта // Проблемы управления и информатики. – 2003. – № 6. – С. 82–87.

  5. Людовик Т.В., Сажок М. M., Селюх Р.А. Розроблення мовленнєвих баз даних для синтезу мовлення за текстом // Автоматизовані системи управління і прогресивні інформаційні технології. – К.: МННЦ ІТіС. – 2005. – Вип. 3. – С. 64–74.

  6. Людовик Т.В. Автоматический транскриптор для группы языков в системах речевого диалога линии "Речь" // Тр. Всесоюзн. конф. “Автоматическое распознавание слуховых образов” (АРСО–16). – Москва: МГУ, МГЛУ, 1991. – С. 165–166.

  7. Liudovyk T. Pitch contour modelling in a Speech Synthesis System // Праці Першої Всеукраїнської міжнар. конф. “Оброблення сигналів і зображень та розпізнавання образів” . – К.: УАсОІРО, 1992. – С. 135–136.

  8. Людовик Т.В. Лингвистическое обеспечение многоязычной системы речевого диалога // Тр. шестой республик. научной конф. молодых лингвистов. – Ереван: Изд-е Ин-та языка АН АрмССР, 1988. – С. 232.

  9. Людовик Т.В. Поддержка синтеза многоязычной речи со стороны ПЭВМ в речевой диалоговой системе // Тр. Всесоюзн. конф. “Диалог “Человек – ЭВМ”. – Свердловск: Изд-е Ин-та математики и механики УрО АН СССР, 1989. – Ч. 2. – С. 35–36.

  10. Vintsiuk T., Liudovyk T., Sazhok M. Phonetic Knowledge Base for Ukrainian // Proc. International Workshop "Speech and Computer" (SPECOM'98). – St.-Petersburg (Russia), 1998. – P. 279–282.

  11. Lyudovyk T., Sazhok M. Unit Selection Speech Synthesis Using Phonetic-Prosodic Description of Speech Databases // Proc. International Conf. "Speech and Computer" (SPECOM'2004). – St.-Petersburg (Russia), 2004. – P. 594–599.

  12. Lyudovyk T.V., Sazhok M.M. Speech Databases used for Concatenative Speech Synthesis // Праці 7-ї Всеукраїнської міжнар. конф. “Оброблення сигналів і зображень та розпізнавання образів” (УкрОбраз-2004). – К.: УАсОІРО, 2004. – С. 111–114.

  13. Вінцюк Т.К., Людовик Т.В., Сажок М.М., Селюх Р. Автоматичний озвучувач українських текстів на основі фонемно-трифонної моделі з використанням природного мовного сигналу // Пр. 6-ї Всеукраїнської міжнар. конф. “Оброблення сигналів і зображень та розпізнавання образів” (УкрОбраз’2002). – К.: УАсОІРО, 2002. – C. 79–84.

  14. Винцюк Т.К., Гаврилюк О.Н., Зимовина Г.В., Людовик Т.В. Структура и использование базы знаний при синтезе многоязычной речи в системах речевого диалога линии "Речь" // Тр. Всесоюзн. конф. “Автоматическое распознавание слуховых образов (АРСО-15)”. – Таллинн: Ин-т кибернетики АН ЭССР, 1989. – С. 139–140.

  15. Вінцюк Т.К., Гаврилюк О.М., Зимовіна Г.В., Людовик Т.В. Проблеми синтезу українського мовлення за текстом // Праці конф. “Проблеми українізації комп’ютерів”. – Львів: Львівський політехнічний ін-т, 1991. С.

  16. Вінцюк Т., Бабій Л., Ковч О., Людовик Т., Пилипенко В. Комп’ютеризовані засоби наповнення баз знань про українське мовлення // Праці конф. “Україномовне програмне забезпечення (УКРСОФТ-94) ”. – Львів: Львівська політехніка, 1994. – С. 15–16.