2.3 СЕМАНТИЧЕСКИЕ СЕТИ (Беляева Света)
Семантическая
сеть -
структура для представления знаний в виде узлов, соединенных дугами. Впервые
семантические сети были использованы в системах машинного перевода в конце 50-х
- начале 60-х годов. Самые первые
семантические сети были разработаны в качестве языка-посредника для систем
машинного перевода, а многие современные версии до сих пор сходны по своим
характеристикам с естественным языком. Однако последние версии семантических
сетей стали более мощными и гибкими и составляют конкуренцию фреймовым системам,
логическому программированию и другим языкам представления.
Начиная с конца
50-ых годов были создано и применены на
практике десятки вариантов семантических сетей. Несмотря на то, что
терминология и их структура различаются, существуют сходства, присущие
практически всем семантическим сетям:
1. узлы
семантических сетей представляют собой концепты предметов, событий, состояний;
2. различные
узлы одного концепта относятся к различным значениям, если они не помечено, что
они относятся к одному концепту;
3. дуги
семантических сетей создают отношения между узлами-концептами (пометки над
дугами указывают на тип отношения);
4. некоторые
отношения между концептами представляют собой лингвистические падежи, такие как
агент, объект, реципиент и инструмент (другие означают временные,
пространственные, логические отношения и отношения между отдельными
предложениями;
5. концепты
организованы по уровням в соответствии со степенью обобщенности так как,
например, сущность, живое существо,
животное, плотоядное,;
Однако существуют
и различия: понятие значения с точки зрения философии; методы представления кванторов общности и
существования и логических операторов; способы манипулирования сетями и правила
вывода, терминология. Все это варьируется от автора к автору. Несмотря не
некоторые различия, сети удобны для чтения и обработки компьютером, а также
достаточно мощны, чтобы представить семантику естественного языка.
Классификация семантических сетей
Для всех
семантических сетей справедливо разделение по арности и количеству типов
отношений.
По количеству
типов отношений, сети могут быть однородными и неоднородными. Однородные сети
обладают только одним типом отношений (стрелок), например, таковой является
классификация биологических видов. В неоднородных сетях количество типов
отношений больше двух. Классические иллюстрации данной модели представления
знаний представляют именно такие сети. Неоднородные сети представляют больший
интерес для практических целей, но и большую сложность для исследования.
По арности,
типичными являются сети с бинарными отношениями (связывающими ровно два
понятия). Бинарные отношения очень просты и удобно изображаются на графе в виде
стрелки между двух концептов. Кроме того, они играют исключительную роль в
математике. На практике, однако, могут понадобиться отношения, связывающие
более двух объектов — N-арные. При этом возникает сложность — как изобразить
подобную связь на графе, чтобы не запутаться. Концептуальные графы снимают это
затруднение, представляя каждое отношение в виде отдельного узла. Помимо
концептуальных графов существуют и другие модификации семантических сетей, это
является ещё одной основой для классификации (по реализации).
Семантические отношения
Количество типов
отношений в семантической сети определяется её создателем, исходя из конкретных
целей. В реальном мире их число стремится к бесконечности. Каждое отношение
является, по сути, предикатом, простым или составным. Скорость работы с базой
знаний зависит от того, насколько эффективно реализованы программы обработки
нужных отношений.
Иерархические
Наиболее часто
возникает потребность в описании отношений между элементами, множествами и
частями объектов. Отношение между объектом и множеством, обозначающим, что
объект принадлежит этому множеству, называется отношением классификации (ISA).
Говорят, что множество (класс) классифицирует свои экземпляры. Название
произошло от английского «IS A» (наиболее точный русский перевод, используемый
в основном в научных кругах — «суть», например, «все зайцы суть
млекопитающие»). Иногда это отношение именуют также MemberOf, InstanceOf или
подобным образом. Связь ISA предполагает, что свойства объекта наследуются от
множества. Обратное к ISA отношение используется для обозначения примеров,
поэтому так и называется — «Example», или по-русски, «Например».
Отношение между
надмножеством и подмножеством называется AKO — «A Kind Of» («разновидность»).
Элемент подмножества называется гипонимом, а надмножества — гиперонимом, а само
отношение называется отношением гипонимии. Альтернативные названия — «SubsetOf»
и «Подмножество». Это отношение определяет, что каждый элемент первого
множества входит и во второе (выполняется ISA для каждого элемента), а также
логическую связь между самими подмножествами: что первое не больше второго и
свойства первого множества наследуются вторым.
Объект, как
правило, состоит из нескольких частей, или элементов. Например, компьютер
состоит из системного блока, монитора, клавиатуры, мыши и т. д. Важным
отношением является HasPart, описывающее части/целые объекты (отношение меронимии).
Мероним — это объект, являющийся частью для другого. Двигатель — это мероним
для автомобиля. Холоним — это объект, который включает в себя другое. Например,
у дома есть крыша. Дом — холоним для крыши. Компьютер — холоним для монитора.
Мероним и холоним — противоположные понятия.
Часто в
семантических сетях требуется определить отношения синонимии и антонимии. Эти
связи либо дублируются явно в самой сети, либо в алгоритмической составляющей.
Вспомогательные
В семантических
сетях часто используются также следующие отношения (Гаврилова):
функциональные
связи (определяемые обычно глаголами «производит», «влияет»…);
количественные
(больше меньше, равно…);
пространственные
(далеко от, близко от, за, под, над…);
временные
(раньше, позже, в течение…);
атрибутивные
(иметь свойство, иметь значение);
логические (И,
ИЛИ, НЕ);
лингвистические.
Этот список
может сколь угодно продолжаться: в реальном мире количество отношений огромно.
Например, между понятиями может использоваться отношение «совершенно разные
вещи» или подобное: Не_имеют_отношения_друг_к_другу(Солнце, Кухонный_чайник)
Недостатки семантических сетей:
-сетевая модель
не дает (точнее, не содержит) ясного представления о структуре предметной
области, поэтому формирование и модификация такой модели затруднительны;
-сетевые модели
представляют собой пассивные структуры, для обработки которых необходим
специальный аппарат формального вывода;
-проблема поиска
решения в семантической сети сводится к задаче поиска фрагмента сети,
соответствующего подсети, отражающей поставленный запрос. Это, в свою очередь,
обуславливает ---сложность поиска решения в семантических сетях;
-представление,
использование и модификация знаний при описании систем реального уровня
сложности оказывается трудоемкой процедурой, особенно при наличии множественных
отношений между ее понятиями
Практическое применение семантических сетей
Семантические
сети могут быть записаны практически на любом языке программирования на любой
машине. Самые популярные в этом отношении языки LISP и PROLOG.
Однако многие версии были созданы и на FORTRANе, PASCALе, C и других
языках программирования. Для хранения всех узлов и дуг необходима большая
память, хотя первые системы были
выполнены в 60-х годах на машинах, которые были гораздо меньше и медленнее современных
компьютеров.
Один из самых
распространенных языков, разработанных для записи естественного языка в виде
сетей, - это PLNLP (Programming Language for Natural Language Processing) Язык
Программирования для Обработки Естественного Языка, созданный Хайдерном. Этот
язык используется для работы с большими грамматиками с обширным покрытием.
PLNLP работает с двумя видами правил:
1. с помощью
правил декодирования производится синтаксический анализ линейной языковой
цепочки и строится сеть.
2. с помощью правил кодирования сканируется сеть порождается
языковая цепочка или другая трансформированная сеть.
Помимо
специальных языков для семантических сетей было также разработано специальное
аппаратное обеспечение. На обычных компьютерах могут быть успешно выполнены
операции с языками синтаксического анализа и операции сканирования сетей. Однако для больших баз знаний нахождение
нужных правил или доступ к предзнаниям может потребоваться очень много времени.
Чтобы позволить различным процессам поисках проходить одновременно Фальман
разработал систему NETL, которая представляет собой семантическую сеть, которая
может использоваться с параллельным аппаратным обеспечением. Таким образом он
хотел создать модель человеческого мозга, в котором сигналы могут двигаться по
различным каналам одновременно. Другие ученые разработали параллельное
программное обеспечение для поиска наиболее вероятной интерпретации
двусмысленных фраз естественного языка.
Список литературы
1.Башмаков А.И.,
Башмаков И.А. Интеллектуальные информационные технологии: Учеб. пособие. - М.:
Изд-во МГТУ им. Н.Э. Баумана, 2005. - 304 с : ил. - (Информатика в техническом
университете).
2.
Басакер, Р. Конечные графы и сети / Р. Басакер, Т. Саати. - М. 2011
3.Беренсон
Х., Бернштейн Ф., Грэй Д., Мелтон Д., О"Нил Э., О"Нил П. Критика
уровней изолированности в стандарте ANSI SQL //СУБД. - 1996. - №2. - С. 45-60.
4.Бойко
В.В., Савинков В.М. Проектирование баз данных информационных систем. - М.:
Финансы и статистика, 1989. - 351 с.
5.Пушников
А.Ю. Введение в системы управления базами данных. Часть 1. Реляционная модель
данных: Учебное пособие/Изд-е Башкирского ун-та. - Уфа, 1999. - 108 с.
6.http://ru.wikipedia.org/wiki/Семантическая_сеть
Комментарии
Отправить комментарий