Библиотека диссертаций Украины Полная информационная поддержка
по диссертациям Украины
  Подробная информация Каталог диссертаций Авторам Отзывы
Служба поддержки




Я ищу:
Головна / Технічні науки / Системи та засоби штучного інтелекту


Валенда Наталя Анатоліївна. Методи та моделі функціонально-семантичної обробки текстів природної мови у системах штучного інтелекту : Дис... канд. наук: 05.13.23 - 2007.



Анотація до роботи:

Валенда Н. А. Методи та моделі функціонально-семантичної обробки текстів природної мови у системах штучного інтелекту. – Рукопис.

Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.13.23 – системи та засоби штучного інтелекту - Харківський національний університет радіоелектроніки, Харків, 2006.

Дисертація присвячена розробці методів і моделей аналізу текстів природної мови на основі функціонального подання семантики. У дисертації розроблено модель формалізації семантики природно-мовних конструкцій у вигляді суперпозицій семантичних функцій, що дозволяє поліпшити якість систем автоматичної обробки текстів під час аналізу багатозначних мовних одиниць. Розроблено метод перетворення мовних конструкцій у суперпозиції семантичних функцій. Розглянуто метод уніфікації, що дозволяє встановлювати значеннєву еквівалентність мовних конструкцій, які подано семантичними функціями. Набув подальшого розвитку метод аналізу на основі атрибутних транслюючих граматик, завдяки введенню семантичних функцій у вигляді символів дії. Розглянуто застосування розроблених методів і моделей у системах штучного інтелекту, для поліпшення якості аналізу текстів.

У дисертаційній роботі наведено результати, які у відповідності з поставленою метою є вирішенням актуальної задачі створення методів обробки текстів природної мови у системах штучного інтелекту на основі використання формалізованої семантичної інформації. Отримані результати мають важливе наукове і практичне значення для створення ефективних систем обробки текстової інформації: аналізаторів природної мови, інтелектуальних пошукових систем. У процесі виконання наукових досліджень отримано такі результати:

1. Проаналізовано сучасні підходи до аналізу текстової інформації, розглянуто найбільш використовувані рішення у цій галузі, обґрунтовано доцільність удосконалення методів обробки тексту за рахунок використання семантичної інформації, що дає можливість підвищити якість аналізу текстів природної мови.

2. Розроблено модель формалізації семантики природно-мовних конструкцій у вигляді суперпозицій семантичних функцій, яка дозволяє будувати методи та алгоритми перетворення мовних конструкцій у формальне подання з урахуванням багатозначності мовних одиниць, що дає можливість отримувати більш якісний аналіз конструкцій природної мови.

3. Розроблено метод аналізу мовних конструкцій на основі заповнення вільних позицій семантичних функцій. Це дозволяє побудувати транслятор, який здійснює автоматичне перетворення мовних конструкцій на суперпозиції семантичних функцій. Проведено порівняння з семантичним аналізом на основі відмінкових фреймів та встановлено, що завдяки зіставленню семантичної інформації усім словам досягається аналіз, який не залежить від чіткого порядку слів, що дає можливість застосовувати його до мов з вільним порядком слів у мовних конструкціях.

4. Розроблено метод виведення на основі логіки предикатів, що відрізняється від існуючих введенням уніфікації для суперпозицій семантичних функцій, яка дозволяє існування розбіжностей в уніфікованих формулах. Метод дозволяє проводити зіставлення формул, які відрізняються за структурою, але передають близькі значення, та може використовуватися для визначення еквівалентності мовних конструкцій, при встановленні значень багатозначних слів, у пошукових системах під час порівняння результатів пошуку з анотацією.

5. Розроблено модель вибору значення лексичних одиниць на основі заповнення вільних позицій та уніфікації суперпозицій семантичних функцій, яка дозволяє покращити якість роботи транслятору природної мови.

6. Набув подальшого розвитку метод аналізу природної мови на основі атрибутних транслюючих граматик, за рахунок використання семантичних функцій у символах дії, що дозволяє визначати значеннєву сумісність елементів допущеної конструкції. Перевірка семантики словосполучень на рівні синтаксичного аналізу веде до спрощення подальшого аналізу. За рахунок звуження області дії синтаксичного аналізу з речення до словосполучення спрощується структура транслятора.

7. Удосконалено метод семантичного аналізу природної мови, який відрізняється від аналізу на основі фрейму предиката за рахунок заповнення вільних позицій фрагментами, що вже пройшли семантичне узгодження, та використанням виводу на семантичних функціях під час вибору значення багатозначних слів. Це дає можливість підвищити якість обробки багатозначних слів та отримувати єдине формальне подання.

8. Розроблено спосіб організації словника на основі навантаженого дерева, який дозволяє зберігати інформацію у вигляді композиції векторів переходів та списків переходів. Це дає можливість зберігати словник частково або повністю в оперативній пам’яті чи на диску. Розроблено алгоритм пошуку помилок у слові, що дає можливість обробки некоректно введених слів.

9. Отримані методи аналізу текстів природної мови впроваджені в інформаційно-пошуковій системі підприємства "Торгівельна компанія "ЕлектроМир". Застосування результатів дисертаційної роботи дозволяє поліпшити якість пошуку інформації природною мовою, за рахунок порівняння суперпозицій семантичних функцій для пошукового запиту та анотацій документів (акт упровадження від 04.06.2005). Теоретичні результати дисертації використано у навчальному процесі на кафедрі Програмного забезпечення ЕОМ (акт упровадження від 17.11.2005).

Публікації автора:

  1. Валенда Н.А. Применение семантики для анализа конструкций естественного языка // Проблемы бионики. – 2001. – Вып. 55. – С. 63–66.

  2. Валенда Н.А. Применение методов анализа естественного языка для поисковых систем // Вестник Херсонского государственного технического университета. – 2002. – № 1 (14). – С. 236–239.

  3. Валенда Н.А. Анализ способов представления словарной информации // Вестник Херсонского государственного технического университета. – 2003. – № 2 (18). – С. 57–61.

  4. Валенда Н.А. Модель функционально семантической обработки текстов на основе унификации // Восточно-Европейский журнал передовых технологий. – 2005. –№ 4/2 (16). – С. 95–99.

  5. Валенда Н.А., Дюбко Г.Ф. Методы анализа естественного языка на основе функциональной модели семантики // Бионика интеллекта. – 2005. – № 2 (63). – С. 48–52.

  6. Валенда Н.А. Обработка и анализ информации на естественном языке // Системний аналіз, управління і інформаційні технології: Вісник Харківського державного політехнічного університету. Зб. наук. пр. – Харків: ХДПУ, 1999. – Вип. 51. – С. 84–88.

  7. Валенда Н.А. Способы организации морфологической базы данных // Актуальні проблеми сучасної науки у дослідженнях молодих вчених м. Харкова: Збірник доповідей Першої міської науково-практичної конференції. – Харків: АТ «Бізнес Інформ», 1997. – С. 111 – 113.

  8. Валенда Н.А. Принципы реализации морфологической базы данных // Тез. докл. 1-го Междунар. молодежного форума «Электроника и молодежь в XXI веке». – Харьков: ХТУРЭ, 1997. – С. 139.

  9. Дюбко Г.Ф., Валенда Н.А. Формальное преобразование программ в форму, удобную для их логического анализа // Сб. науч. тр. 4-й Междунар. конф. «Теория и техника передачи, приема и обработки информации». – Харьков: ХТУРЭ, 1998. – С. 517.

  10. Дюбко Г.Ф., Валенда Н.А., Водолажский А.С. Семантический подход к автоматическому анализу программ // Сб. науч. тр. 5-й Междунар. конф. «Теория и техника передачи, приема и обработки информации». – Харьков: ХТУРЭ, 1999. – С. 360 – 362.

  11. Дюбко Г.Ф., Валенда Н.А. Манипулирование информацией и организация доступа к ней в словарях большого объема // Сб. науч. тр. Междунар. конф. «Информационные технологии: наука, техника, технология, образование, здоровье». – Харьков: ХГПУ, 1999. – Ч. 1. – С. 64– 69.

  12. Дюбко Г.Ф., Валенда Н.А. Использование формального вывода для семантического анализа конструкций естественного языка // Сб. науч. тр. 6-й Междунар. конф. «Теория и техника передачи, приема и обработки информации». – Харьков: ХТУРЭ, 2000. – С. 251–253.

  13. Дюбко Г.Ф., Валенда Н.А. Организация работы анализатора естественного языка на основе использования семантической базы знаний // Сб. науч. тр. 1-го Междунар. радиоэлектронного форума «Прикладная радиоэлектроника. Состояние и перспективы развития» МРФ–2002. – Харьков: АН ПРЭ, ХНУРЭ, 2002. – Ч. 2. – С. 99–101.