Библиотека диссертаций Украины Полная информационная поддержка
по диссертациям Украины
  Подробная информация Каталог диссертаций Авторам Отзывы
Служба поддержки




Я ищу:
Головна / Технічні науки / Елементи та пристрої обчислювальної техніки та систем керування


Заболотня Тетяна Миколаївна. Інверсний контекстно-асоціативний метод та програмні засоби автоматизованої орфокорекції природомовних текстових об’єктів : Дис... канд. наук: 05.13.05 - 2008.



Анотація до роботи:

Заболотня Т.М. Інверсний контекстно-асоціативний метод та програмні засоби автоматизованої орфокорекції природномовних текстових об’єктів. – Рукопис.

Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.13.05 – комп’ютерні системи та компоненти. – Національний технічний університет України «КПІ», Київ, 2008.

Дисертаційна робота присвячена розробці контекстно-асоціативних методів та програмних засобів орфокорекції, реалізація яких забезпечує підвищення швидкості та точності виправлення орфографічних помилок комп’ютерними системами автоматичної обробки текстів (АОТ).

Запропоновано інверсний контекстно-асоціативний метод автоматизованого виправлення орфографічних помилок шляхом ітеративного чергування процедур відбору гіпотез із лексико-семантичного словника за ознакою близькості за змістом до контексту та наступної їх перевірки на відповідність формальним критеріям схожості на спотворене слово. Застосування даного методу дозволяє підвищити ефективність відповідних програмних засобів за рахунок зменшення кількості операцій щодо обробки наборів гіпотез у ході орфокорекції.

Подано спосіб структурно-алгоритмічної організації орфокоректора у формі спеціалізованого реактивного програмного агента, який забезпечує його взаємодію з модулями відкритих систем АОТ.

Експериментально досліджено ефективність запропонованого методу орфокорекції та його програмної реалізації згідно з агентним підходом до побудови ПЗ за умови їх використання в інформаційно-пошуковій системі Єдиного інформаційного середовища НТУУ «КПІ». Отримані результати підтвердили теоретичні положення дисертації та дозволили визначити рекомендовані значення параметрів алгоритмів виправлення помилок, встановлення яких забезпечує ефективну роботу розробленого орфокоректора.

В дисертаційній роботі запропоноване нове вирішення задачі створення програмних засобів автоматизованого виправлення орфографічних помилок, яке знайшло відображення в розробці та експериментальному дослідженні інверсного контекстно-асоціативного методу орфокорекції, спрямованого на підвищення швидкодії та точності роботи відповідного ПЗ, а також у розробці способу структурно-алгоритмічної організації орфокоректора, яка забезпечує його інтегрованість до відкритих систем АОТ.

1. На основі дослідження існуючих методів та засобів автоматизованого виправлення орфографічних помилок у природномовних текстових об’єктах аргументовано доцільність використання алгоритмів семантичного аналізу текстових даних у ході орфокорекції, показано необхідність визначення місця процедури семантичноорієнтованого аналізу контексту в загальній схемі орфокорекції, обґрунтовано актуальність розробки способів структурно-алгоритмічної організації програмного орфокоректора, здатного гнучко налаштовуватись на взаємодію з модулями довільних сучасних систем АОТ.

2. Доведено доцільність формування множини гіпотез, виходячи з наявності у них семантико-асоціативних зв’язків з контекстом. Такий спосіб реалізації етапу вибору гіпотез дозволяє обмежити число операцій щодо перевірки наборів альтернатив на відповідність спотвореному слову та зменшити потужність множини нерелевантних варіантів виправлення, які пропонуються орфокоректором.

3. Запропоновано інверсний контекстно-асоціативний метод виправлення орфографічних помилок шляхом ітеративного чергування процедур відбору гіпотез із словника за ознакою семантичної близькості до контексту та наступної їх перевірки на відповідність формальним критеріям подібності до спотвореного слова, такий, що забезпечує підвищення швидкості та точності роботи орфокоректора.

4. Запропоновано спосіб оцінювання ступеня семантичної близькості альтернативи виправлення до оточення спотвореного слова за мінімальною з довжин найкоротших шляхів від неї до елементів контексту у графі словника. Застосування даного способу дозволяє зменшити кількість операцій щодо перевірки наборів гіпотез на відповідність спотвореному слову у ході орфокорекції.

5. Розроблено спосіб формування предметноорієнтованого словникового ресурсу шляхом автоматизованої модифікації існуючого універсального лексико-семантичного словника з урахуванням вимог до терміносистеми конкретної предметної галузі. Використання спеціалізованого словника відповідними програмними засобами дозволяє оперативно та точно аналізувати текстові дані з певної тематики.

6. Запропоновано спосіб структурно-алгоритмічної організації орфокоректора у формі спеціалізованого реактивного програмного агента, що забезпечує його інтегрованість до існуючих відкритих систем АОТ та оперативну взаємодію з їх модулями.

7. Розроблено програмні засоби, які реалізують запропонований інверсний контекстно-асоціативний метод виправлення орфографічних помилок у природномовних текстових даних та використовуються у межах Єдиного інформаційного середовища НТУУ «КПІ». Створено програмний інструментарій модифікації універсального лексико-семантичного ресурсу формату WordNet 3.0. Отримані результати експериментальних досліджень розробленого орфокоректора підтвердили теоретичні положення даної дисертаційної роботи, що дозволило визначити рекомендовані значення параметрів алгоритмів виправлення помилок, встановлення яких забезпечує ефективну роботу даного програмного продукту.

Публікації автора:

  1. Петрашенко А.В., Михайлюк А.Ю., Блєдний Д.В., Заболотня Т.М. Підхід до побудови блоку логічного виведення експертної системи // Вісник технологічного університету «Поділля». – 2004. – Т.2, №2. – С.69–72. – Автором розроблений алгоритм обчислення арифметичних значень блоком логічного виведення ЕС.

  2. Тарасенко В.П., Михайлюк А.Ю., Заболотня Т.М. Спеціалізовані інтелектуальні агенти як засіб інтеграції гетерогенного програмного забезпечення // Інформаційні технології та комп’ютерна інженерія. – 2006. – № 3(7). – С. 96–101. – Автором запропоновані структурна організація програмних адаптерів для забезпечення інтеграції гетерогенного ПЗ, а також загальні шаблони їх поведінки.

  3. Михайлюк А.Ю., Заболотня Т.М. Комбінований метод виправлення орфографічних помилок у текстових даних // Вісник Хмельницького національного університету. – 2007. – Т.2, № 2. – С. 21–26. – Автором запропонована змістовна суть комбінованого методу виправлення орфографічних помилок.

  4. Заболотня Т.М. Селективний підхід до автоматизованого формування оперативного спеціалізованого лексико-семантичного словникового ресурсу // Бионика интеллекта. – 2007. – № 2(67). – С. 27–31.

  5. Заболотня Т.М. Оптимізація процесу контекстноорієнтованої орфокорекції шляхом спрощення обчислення міри семантичної близькості слів // Проблеми інформатизації та управління. – 2007. – № 3(21). – С.55–59.

  6. Заболотня Т.М., А.Ю.Михайлюк, В.П.Тарасенко Структурно-алгоритмічна організація програмного агента-орфокоректора // Наукові вісті НТУУ “КПІ”. – 2008. – № 1. – С.88–96. – Автором розроблено спосіб структурно-алгоритмічної організації орфокоректора з врахуванням характеристик САОТ як його зовнішнього середовища.

  7. Михайлюк А.Ю., Заболотня Т.М., Нужний В.В., Осипов М.С., Сапсай Т.Г. Оптимізація управління інформаційними процесами як універсальний засіб підвищення ефективності сучасних технологій // Мікропроцесорні пристрої та системи в автоматизації виробничих процесів: зб.наук.праць за мат-ми міжн. наук.-практ. конф., 15–17 трав. 2003р. / МОНУ, Технологіч. ун-т «Поділля». – Хмельницький: Техн. ун-т «Поділля», 2003. – С. 81–85. – Автором сформульовані рекомендовані характеристики системи управління інформаційними процесами.

  8. Mykhailyuk A., Tarassenko V., Nuzhny V., Osipov M., Zabolotnya T. Some Aspects of the Efficiency Evaluation Problem of Heterogeneous Information // ACSN2003: мат. І міжн. конф. «Сучасні комп’ютерні системи та мережі: розробка та використання», (Львів, 24–26 вер. 2003р.) / МОНУ, Нац. ун-т «Львівська політехніка». – Львів: Львівська політехніка, 2003. – С.125–127. – Автором запропоновано застосування методу експертних оцінок для оперативного моніторингу показника ефективності роботи системи управління.

  9. Блєдний Д.В., Дробязко І.П., Заболотня Т.М., Медвідь Є.П., Сапсай Т.Г. Організація підсистеми прогнозування для інформаційно-аналітичного комплексу // Сучасні проблеми і досягнення в галузі радіотехніки, телекомунікацій та інформаційних технологій: тези доп. міжн. наук.-практ. конф., м.Запоріжжя, 13–15 квіт. 2006р. / Запоріжжя: ЗНТУ, 2006. – С. 120–121. – Автором розроблено алгоритм попереднього аналізу даних, які надходять до підсистеми прогнозування інформаційно-аналітичного комплексу.

  10. Заболотня Т.М., Кебкало О.С., Михайлюк А.Ю., Наливайчук О.Ю., Підмаляк Б.Я. Автоматизований контроль семантичної складової узгодженості електронних документів у базі даних // Сучасні проблеми і досягнення в галузі радіотехніки, телекомунікацій та інформаційних технологій: тези доп. міжн. наук.-практ. конф., м.Запоріжжя, 13–15 квіт. 2006р. / Запоріжжя: ЗНТУ, 2006. – С. 142–143. – Автором запропонований алгоритми обробки основного змісту електронних документів.

  11. Заболотня Т.М. Застосування семантичного словника для автоматизованої корекції помилок в текстах // Радіоелектроніка і молодь в ХХІ ст.: зб. мат. ХІ міжн. молодіж. форуму, м.Харків, 10-12 квіт. 2007р. / Харків: ХНУРЕ, 2007. – Ч.2. – С.21.

  12. Сапсай Т.Г., Заболотня Т.М. Модифікація комп’ютерного словникового ресурсу як етап створення спеціалізованого програмного забезпечення обробки правових документів // Современные информационные и электронные технологии: мат. VIII міжн. наук.-практ. конф., м.Одеса, 21–25 трав. 2007р. / М-во пром. політики України, МОНУ [та ін.]. – Одеса, 2007. – С.76. – Автором запропонований алгоритм формування вмісту спеціалізованого словника на основі ресурсу WordNet.

  1. Сапсай Т.Г., Заболотня Т.М., Єзжельонок С.О. Проблема інформаційної безпеки пошукових інтелектуальних агентів // Методи та засоби кодування, захисту й ущільнення інформації: мат. І міжн. наук.-практ. конф. м.Вінниця, 15–17 трав. 2007р. [Електронний ресурс]. / Вінниця: ВНТУ, 2007. – Автору належить постановочна частина роботи, а також структурна організація програмного агента, здатного до утворення цілей.