Терентьєв Олександр Миколайович. Моделі і методи побудови та аналізу байєсівських мереж для інтелектуального аналізу даних : Дис... канд. наук: 05.13.06 - 2009.
Анотація до роботи:
Терентьєв О.М. Моделі і методи побудови та аналізу байєсівських мереж для інтелектуального аналізу даних. – Рукопис.
Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.13.06 – інформаційні технології. – Національний технічний університет України “Київський політехнічний інститут”, Київ, 2009 р.
Робота присвячена проблемі підвищення швидкості та якості інтелектуального аналізу даних шляхом розробки нової методики побудови та застосування дискретних байєсівських мереж (БМ), методу формування ймовірнісного висновку і створення на їх основі нової системи підтримки прийняття рішень. Зроблено огляд і аналіз методів інтелектуального аналізу даних та обґрунтована ефективність застосування апарату БМ.
Для побудови структури БМ запропоновано евристичний метод навчання лінійної складності за статистичними даними. Для визначення міри зв’язку між вершинами метод використовує значення взаємної інформації, а в якості функції оцінювання структури моделі – опис мінімальною довжиною (ОМД). Також розроблено метод побудови точного ймовірнісного висновку в БМ за навчальними даними. Для обчислення значень ймовірностей станів вершин замість таблиць умовних ймовірностей використовується матриця емпіричних значень спільного розподілу ймовірностей всієї мережі. Для оцінки якості побудованої структури отримано нову модифіковану функцію, яка на відміну від функції Купера-Герсковича, суттєво прискорює процес обчислення та знімає обмеження на розмір вибірок навчальних даних.
Розроблена і програмно реалізована оригінальна система підтримки прийняття рішень для інтелектуального аналізу даних на основі БМ, яка грунтується на запропонованих методах побудови структури та ймовірнісного висновку. СППР впроваджена в першій київській філії ВАТ VAB “ВіЕйБі Банк”, що дало можливість побудувати ефективні прогнозуючі моделі для підтримки прийняття рішень з метою оцінки ризиків при кредитуванні фізичних осіб. Наукові результати використані у навчальних курсах НТУУ „КПІ”.
1. Виконано аналіз методів інтелектуального аналізу даних та обґрунтована ефективність застосування апарату байєсівських мереж (БМ). Встановлено, що основним недоліком методів побудови топології БМ є нелінійна поліноміальна складність обчислень; недоліком існуючих методів формування ймовірнісного висновку є їх обчислювальна складність, яка залежить від кількості вершин мережі та кількості дуг, які з’єднують ці вершини мережі між собою, а також неоднозначність – різні методи можуть давати різні числові результати.
2. Для побудови структури БМ запропоновано евристичний метод навчання лінійної складності за статистичними даними. Для визначення міри зв’язку між вершинами метод використовує значення взаємної інформації, а в якості функції оцінювання структури моделі – опис мінімальною довжиною (ОМД). Швидкодія побудови моделей, у порівнянні з методами повного перебору, зростає в 10-20 разів.
3. Розроблено метод побудови точного ймовірнісного висновку в БМ за навчальними даними. Для обчислення значень ймовірностей станів вершин замість таблиць умовних ймовірностей використовується матриця емпіричних значень спільного розподілу ймовірностей всієї мережі. Головними перевагами методу є залежність швидкості роботи тільки від розміру навчальної вибірки, відсутність потреби у попередньому перетворенні структури БМ та простота її реалізації. Швидкодія побудови ймовірнісного висновку зростає в 2-5 разів.
4. Для оцінювання якості побудованої структури запропоновано нову модифіковану функцію, яка, на відміну від функції Купера-Герсковича, суттєво прискорює процес обчислень та знімає обмеження на розмір вибірок навчальних даних.
5. Розроблена і програмно реалізована оригінальна інформаційна система підтримки прийняття рішень для інтелектуального аналізу даних на основі БМ, яка грунтується на запропонованих методах побудови структури та ймовірнісного висновку. СППР впроваджена в першій київській філії ВАТ VAB “ВіЕйБі Банк”, що дало можливість побудувати ефективні прогнозуючі моделі для підтримки прийняття рішень з метою оцінювання ризиків кредитування фізичних осіб.
Наукові результати використано у навчальних курсах з математичного моделювання і проектування комп’ютерних інформаційних систем. Рекомендується подальше використання отриманих результатів при розв’язуванні практичних системних задач різної природи та розробці нових методів інтелектуального аналізу даних на основі мереж Байєса.
Публікації автора:
Пат. 28751 U України, МПК G 06 F 17 / 17, F 17/18, F 17/30 . Пристрій для обробки слабоструктурованих даних на основі мереж Байєса / Терентьєв О.М., Бідюк П.І., Коршевнюк Л.О. (Україна). – № u200707506 ; заявл. 04.07.2007; опубл. 25.12.2007, Бюл. “Промислова власність” № 21.
А. с. 20853 України Комп’ютерна програма “Інформаційна система підтримки прийняття рішень для інтелектуального аналізу даних на основі Байєсових мереж” / О. М. Терентьєв – № 20918; заявл. 16.04.2007; опуб. 11.06.2007.
Терентьев А. Н., Методы построения байесовских сетей / А. Н. Терентьев, П. И. Бидюк // Межведомственный научно-технический сборник „Адаптивные системы автоматического управления”. – Днепропетровск: Системные технологии, 2005. – № 8. – С. 130-141.
Бидюк П. И. Построение и методы обучения байесовских сетей / П. И. Бидюк, А. Н. Терентьев, А. С. Гасанов // Кибернетика и системный анализ. – 2005. – № 4. – C. 134-147.
Бидюк П. И. Метод вероятностного вывода в байесовских сетях по обучающим данным / П.И. Бидюк, А.Н. Терентьев // Кибернетика и системный анализ. – 2007. – № 3. – C. 93-99.
Згуровский М. З. Методы построения байесовских сетей на основе оценочных функций / М. З. Згуровский, П.И. Бидюк, А.Н. Терентьев // Кибернетика и системный анализ. – 2008. – № 2. – C. 81-88.
Терентьев А. Н. Эвристический метод построения байесовских сетей / А.Н. Терентьев, П.И. Бидюк // Математические машины и системы. – К.: ТОВ “РВПК ЕКСЛИБРИС”, 2006. – № 3. – С. 12-23.
Терентьев А. Н. Байесовская сеть – инструмент интеллектуального анализа данных / А.Н. Терентьев, П.И. Бидюк, Л.А. Коршевнюк // Проблемы управления и информатики. – К.: ИКИ НАНУ-НКАУ, 2007. – № 4. – С. 83–92.
Згуровський М. З. Системна методика побудови байєсових мереж / М.З. Згуровський, П.І. Бідюк, О.М. Терентьев // “Наукові вісті” НТУУ “КПІ”. – 2007. – №4. – С. 47–61.
Бідюк П. І. Застосування байєсівського підходу в медичній діагностиці / П. І. Бідюк, О. М. Терентьєв / Автоматика-2004: зб. наук. праць за матеріалами XI міжнар. конф., 27–30 вер. 2004 р., Київ. – К.: НУХТ, 2004. – Т. 3 – С. 32.
Бидюк П.И. Прогнозирование экономических показателей при помощи сетей Байеса / П.И. Бидюк, А.Н. Терентьев, Л.А. Коршевнюк / Автоматика-2007: зб. наук. праць за матеріалами XIV міжнар. конф., 10-14 вер. 2007 р., Севастополь. – Севастополь: СНУЯЄтаП, 2007. – Т. 2 – С. 91–93.
Терентьев А.Н. Использование метода минимальной длины описания при обучении байесовской сети доверия / А.Н. Терентьев, П.И. Бидюк / Интеллектуальные системы принятия решений и прикладные аспекты информационных технологий: сб. науч. трудов по материалам I-й междунар. конф., 18-21 мая 2005 г., Евпатория. – Херсон: ХМИ, 2005.– Т. 1. – С. 151–152.
Терентьев А.Н. Эвристический метод построения байесовских сетей / А.Н. Терентьев, П.И. Бидюк / Интеллектуальные системы принятия решений и прикладные аспекты информационных технологий: сб. науч. трудов по материалам II междунар. конф., 15-18 мая 2006 г., Евпатория. – Херсон: ХМИ, 2006.– Т. 1. – С. 401–403.
Бидюк П. И. Применение байесовских сетей для интеллектуального анализа данных / П. И. Бидюк, А. Н. Терентьев, Л. А. Коршевнюк / Интеллектуальные системы принятия решений и прикладные аспекты информационных технологий: сб. науч. трудов по материалам III междунар. конф., 15–18 мая, 2007 г., Евпатория. – Херсон: ПП Вишемирський В. С., 2007 – Т. 2. – С. 15-17.
Терентьев А. Н. Использование байесовских сетей в кредитном скоринге / А. Н. Терентьев, П. И. Бидюк / Интеллектуальные системы принятия решений и проблемы вычислительного интеллекта: сб. науч. трудов по материалам междунар. конф., 19 мая-23 мая 2008 г., Евпатория. – Херсон: ПП Вишемирский В. С., 2008. – Т. 3, №2 – С. 101-103.
Терентьев А.Н. Алгоритм вероятностного вывода в байесовских сетях / А.Н. Терентьев, П.И. Бидюк, Л.А. Коршевнюк / Системный анализ и информационный технологии: сб. науч. трудов по материалам IX междунар. науч.-тех. конф., 15–19 мая 2007 г., Киев. – К.: Екмо, 2007. – С. 76.
Бидюк П.И. Использование модифицированной логарифмической функции Купера-Герсковича при построении сетей Байеса / П.И. Бидюк, А.Н. Терентьев, Л.А. Коршевнюк / Информационные технологии и информационная безопасность в науке, технике и образовании: сб. науч. трудов по материалам междунар. науч.-прак. конф., 10 –16 сентября 2007 г. – Севастополь: СевНТУ, 2007. – Т. 2. – С. 6–8.
Бидюк П.И. Метод формирования вывода в Байесовских сетях и его использование для прогнозирования ФЭП / П.И. Бидюк, А.Н. Терентьев, А.С. Гасанов / Проблемы внедрения информационных технологий в экономике: сб. науч. трудов по материалам междунар. науч.-прак. конф., 31 мая – 1 июня.2007 г., Ирпень,. – С. 334-337.
Терентьєв О.М. Застосування SPI-методу для формування ймовірносного висновку в мережах Байєса / О.М. Терентьєв, П.І. Бидюк / Математичне та програмне забезпечення інтелектуальних систем: зб. наук. праць за матеріалами V міжнар. наук.-прак. конф., 14-16 лист. 2007 р., Дніпропетровськ. – Дніпропетровськ: ДНУ, 2007. – С. 189-190.
Бидюк П.И. Дифференциальный подход для формирования вероятностного вывода в сетях Байеса / П.И. Бидюк, А.С. Гасанов, А.Н. Терентьев / Моделирование: сб. науч. трудов по материалам междунар. науч.-тех. конф., 10-11 января 2008 г., Киев. – Львов: ПП “Системы, технологии, информационные услуги”, 2008. – С. 7-8.
Terentyev A. N. Bayesian networks in credit scoring / A. N. Terentyev, L. T. Gasanova / The second international conference on control and optimization with industrial applications (COIA-1008), June 2-8, 2008, Baku, Azerbaijan. – Baku: Institute of applied mathematics BSU, 2008. – P. 171.
Терентьєв О.М. Оцінювання кредитоспроможності фізичних осіб за допомогою дерев рішень / О.М. Терентьєв, П.І. Бідюк, А.С. Гасанов, К.О. Свердел / Математичне та програмне забезпечення інтелектуальних систем: зб. наук. праць за матеріалами VI міжнар. наук.-прак. конф., 12-14 лист. 2008 р., Дніпропетровськ. – Дніпропетровськ: ДНУ, 2008. – С. 296-297.