
Защита диссертации Қалман Гүлжамал на соискание степени доктора философии (PhD) по специальности «8D06103 - Информационные системы»
В Евразийском национальном университете имени Л.Н. Гумилева состоится защита диссертации на соискание степени доктора философии (PhD) Қалман Гүлжамал на тему «Разработка моделей и методов разрешение референции в текстах на естественном языке на основе знаний о предметной области» по специальности «8D06103 – Информационные системы».
Диссертация выполнена на кафедре «» Евразийского национального университета имени Л.Н. Гумилева.
Язык защиты - казахский
Рецензенты:
Мансурова Мадина Есимхановна - кандидат наук, доцент, Казахский национальный университет им. Аль-Фараби, Заведующий кафедры
Оралбекова Дина Орымбаевна - доктор философии(PhD), Научный сотрудник
Временные члены Диссертационного совета:
Кайбасова Динара Женисбековна
Тукеев Уалшер Ануарбекович
Барахнин Владимир Борисович
Научные консультанты:
Самбетбаева Мадина Аралбаевна
Сидорова Елена Анатольевна
Защита состоится: 24 апреля 2024 года 11:00 часов в Диссертационном совете по направлению подготовки кадров «8D061 – Информационно-коммуникационные технологии» по специальности «8D06103 – Информационные системы» Евразийского национального университета имени Л.Н. Гумилева. Проведение заседания диссертационного совета в онлайн формате.
Ссылка: https://clck.ru/39TZvf
Адрес: Астана қ., Қ.Сатпаев көшесі, 2, 302 аудитория
Аннотация (рус.): АННОТАЦИЯ диссертационной работы Калман Гулжамал «Разработка моделей и методов разрешение референции в текстах на естественном языке на основе знаний о предметной области» представленной на соискание степени доктора философии (PhD) по образовательной программе 8D06103 – «Информационные системы» Актуальность темы исследования. Разработка моделей и методов разрешения референции в текстах на естественном языке на основе знаний о предметной области" обусловлена следующими факторами. Рост объема текстовых данных. С появлением Интернета и цифровых технологий объем текстовых данных, доступных для обработки, значительно возрос. Это создает необходимость в разработке новых методов и моделей разрешения референции, которые могут обрабатывать большие объемы текстов и извлекать полезную информацию из них. Необходимость точного разрешения референции: Решение задачи разрешения референции имеет важное значение в различных областях, таких как автоматический анализ текстов, информационный поиск и машинный перевод. Отсутствие или ошибки в разрешении референции могут привести к неправильному пониманию текстов и неверным выводам. Одним из факторов, влияющих на актуальность данной темы, считается отсутствие исследований по анализу текстов и поиску референциальных отношений на казахском языке. Сложность задача разрешения референции: Разрешение референции является сложной задачей в обработке естественного языка, особенно когда речь идет о многозначных выражениях и многократном использовании одних и тех же выражений в тексте. Разработка эффективных методов и моделей для разрешения референции на основе знаний о предметной области является актуальной задачей, которая может привести к более точному и эффективному анализу текстов. Необходимость учета предметной области: для эффективного разрешения референции необходимо учитывать знания о предметной области, в которой используются выражения и объекты, на которые они указывают. Это требует разработки моделей и методов, которые могут использовать знания о предметной области для разрешения референции. Цель диссертационного исследования и научные результаты. Разработка новых моделей и методов для разрешения референции в текстах на естественном языке на основе знаний о предметной области. Для достижения данной цели в работе были поставлены следующие задачи: 1. Изучение существующих методов и моделей разрешения референции в текстах на естественном языке на основе знаний о предметной области. 2. Изучение теоретических основ и практических аспектов знаний о предметной области и их применения в задачах обработки естественного языка. 3. Разработка новых методов и моделей разрешения референции на основе знаний о языке и предметной области. 4. Разработка архитектуры прототипа системы разрешения референции на основе знаний о языке и предметной области. 5. Разработка методики подготовки данных и датасетов на трех языках для проведения экспериментального сравнительного исследования. 6. Проведение экспериментальных исследований и оценка качества разработанных моделей и методов на наборе тестовых данных. На защиту выносятся: Модель референция для казахского языка, метод разрешения референции, методика подготовка данных, программное обеспечение метода разрешения референции. Научная новизна: Впервые комплексно изучена референциальная структура научно-популярного текста на казахском языке: от общих прагматических установок, задаваемых предметной областью и жанром текста, до референциальной интерпретации отдельных языковых средств. 1. Разработана модель референции для казахского языка, описывающая кореференциальные и анафорические отношения в казахском языке. 2. Предложен метод разрешения референции в текстах на казахском, русском, английском языках на основе морфологических, синтаксических и предметных знаний. Объектом исследования являются способы выражения референции в текстах на естественном языке на примере казахского, русского и английского языков. Предмет исследования – методы и алгоритмы для разрешения референций в текстах на казахском языке. Методология и методы исследования. В диссертационной работе использовались методы и методология онтологического инжиниринга, методы корпусного исследования текстов, методы лексикографического исследования, а также метод относящиеся к информационным технологиям и используемые при обработке текстов на естественном языке, а именно: - описательно-аналитический метод - для отбора и изложения положений научной литературы связанной с объектом и предметом исследования; - семантическая классификация лексики - для определения структуры «референтного мира» научно-популярной статьи; - референциальный анализ лексики со значением лица и групп/множеств лиц - для определения типов соотнесения объектов научно-популярной статьи с участниками прагматической ситуации - семантико-синтаксический анализ - для определения референциальных свойств фрагментов статей; - контекстуальный анализ - для определения объема и содержания референтов языковых выражений, обозначающих лиц и их множества; - компьютерное моделирования - для моделирования референцной структуры и процессов разрешения референциальных конфликтов - количественный анализ распределения выборок- для проведения подсчета и получения количественных выводов исследования. Личный вклад автора. Вклад автора в получении результатов исследовательской работы существенен. По материалам диссертации были опубликованы статьи в журналах, цитируемых в базах Scopus, Web of Science, КОКСНВО МНВО РК. Все предложенные в диссертации методы и программы разработаны и реализованы автором лично или при его непосредственном участии. Практическая значимость исследования. Информационный поиск: Разработанные модели и методы могут использоваться для улучшения качества информационного поиска в больших объемах текстовых данных. Они могут помочь точнее определять, какие объекты в текстах относятся к искомым запросам и уменьшить количество неверных результатов. Автоматический анализ текстов: Разработанные модели и методы могут использоваться для улучшения качества автоматического анализа текстов, например, в области медицины, где точность и эффективность анализа текстов имеет важное значение для диагностики и лечения заболеваний. Машинный перевод: Разработанные модели и методы могут использоваться для улучшения качества машинного перевода, особенно в случаях, когда в текстах используются выражения, которые могут иметь различные значения в зависимости от предметной области. Апробация результатов диссертации. Основные результаты диссертационной работы и результаты исследований докладывались и обсуждались на следующих зарубежных, международных, республиканских научно-практических конференциях: 2 публикации в международных изданиях с ненулевым импакт-фактором, входящих в базы данных Scopus: 1. Yerzhan zhumabay, Gulzhamal Kalman, Madina Sambetbayeva, Aigerim Yerimbetova, Aassem Ayapbergenova, Almagul Bizhanova. Building a model for resolving referential relations in a multilingual system. Eastern-european journal of enterprise technologies: 2 pp. 27-35 (2 (116)). Https://doi.Org/10.15587/1729-4061.2022.255786 2. Gulzhamal kalman, Yerzhan Zhumabay, Elmira Nurgalieva, Assel Kuanysheva, Musatay Esmaganbet. Algorithm for solving pronominal anaphora in the kazakh language. Journal of theoretical and applied information technology 31st march 2023. Vol.101. No 6 ISSN: 1992-8645 E-ISSN: 1817-3195 2 статьи в рецензируемых печатных изданиях, рекомендованных КОКСНВО МНВО РК: 1. Gulzhamal, K., М.Ғ. Есмағанбет, М.М. Жаманкарин, А.И. Габдулина, Д.В. Плескачев. Решение кореференции методом кластеризации. Известия НАН РК. Серия физико-математическая, (1), 121–135. Https://doi.Org/10.32014/2022.2518-1726.173 2. Калман Г., Самбетбаева М., Актаева Д., Илюбаев А. Модель решения анафоры, основанная на методах машинного обучения. Известия НАН РК. Серия физико-математическая, (4), 56–67. Https://doi.Org/10.32014/2022.2518-1726.156 5 статей в материалах международных конференций дальнего зарубежья и РК: 1. Е.С. Жұмабай, Г Қалман, М.А.Сәмбетбаева. Разработка модели для решения референциальных отношений в многоязычной системе труды международной научно-практической конференции" Сатпаевские чтения-2022. тренды современных научных исследований " 12 апреля 2022 г. ІІтом 2. Калман Г, Жумабай Е. С, Самбетбаева М. А. Референциального отношения алгоритм решения. Труды международной научно-практической конференции" Сатпаевские чтения-2022. тренды современных научных исследований " 12 апреля 2022 г. ІІ том. 3. Г. Калман. Мультиагентная система для естественного языка. Сборник материалов международной научной конференции. Современная наука: новые подходы и актуальные исследования . 24-25 декабря 2020 4. Guljamal Kalman, Madina Sambetbayeva, Yerzhan Zhumabay. Algorithm for Solving Pronominal Anaphora in the Kazakh Language. 7th Intl. Conf. “Digital Technologies in Education, Science and Industry” DESI-2022. kazakhstan 5. Kalman G., Dauletbek A. Creating a genre model of a scientific publication. International Scientific-Practical conference «Advances in Science and Technology» Research and Publishing Center «Actualnots.RF», Moscow. Russia January, 31, 2023, pp 107. Moscow, Структура и объем диссертации. Диссертационная работа написана на русском языке, состоит из введения, трех взаимосвязанных разделов, которые разбиты на подразделы, заключения, списка использованных источников и приложений. Работа изложена на 90 страницах, содержит 20 рисунков, 8 таблицы. Список использованных источников содержит 122 наименования. Во введении указывается научный аппарат исследования, обосновывается актуальность темы, степень ее развития в теории и практике, определяются цель, объект, предмет и задачи исследования, раскрывается научная новизна исследования, теоретическая и практическая значимость работы, определяются методы исследования, указываются выводы, представленные к защите, представляется личный вклад автора, список публикаций и апробация результатов работы. В первом разделе в данном разделе проводится теоретическое исследование, направленное на разработку новых методов решения референциальных отношений; понятие референции и ее типы, типы анафоранов местоимений в английском, русском и казахском языках с использованием методов сравнительного анализа. разработаны теоретические исследования современных моделей и методов решения референций, рассказано о понятии и контекстном состоянии и перспективах референции на казахском языке. Вторая часть в данном разделе разрабатывается модель решения референции на казахском языке с учетом особенностей референциальных отношений на казахском языке и излагается общая характеристика метода решения референции на основе знаний морфологической, синтаксической и предметной областей. В третьем разделе В данном разделе представлены реализация в программной среде visual c++ модели решения референциальных отношений в казахском языке на основе предметных знаний и метода решения референций на основе знаний морфологической, синтаксической и предметной областей, а также архитектура прототипа системы решения референций, описание ее компонентов, методика подготовки данных и наборов данных, проведение экспериментальных исследований и разработка модели и метода излагаются количественные показатели оценки эффективности и изученной работы. В заключении обобщаются результаты исследования, и выводы, представленные на защиту, подтверждают и доказывают истинность основных выводов. В приложении представлены материалы практических исследований.
Отзыв зарубежного консультанта
Заключение комиссии по этической оценке исследований
Решение диссертационного совета
Защита диссертации: https://www.youtube.com/watch?v=roA3uU9vt2Y
