Онтология и семантика, Преодоление "узких мест" семантики
Здравствуйте, Гость ( Вход | Регистрация )
Онтология и семантика, Преодоление "узких мест" семантики
Алексей Шухов |
Feb 14 2005, 11:17 AM
Отправлено
#1
|
Старожил Группа: Advanced Users Сообщений: 235 Пол: Male |
Федя, привет!
Здесь речь пойдет о проблеме, которая помешала мне создать "онтологический каталог" таким образом, чтобы онтологическое представление стандартизировалось бы с принципами построения "реляционных баз данных". Ну вот так ... Такая, казалось бы, "только техническая" проблема выводит на отношения "онтологии и семантики" как таковые. Итак, вспомним единственную проблему, помешавшую реляционно описать "онтологический каталог" - я имею в виду теорию способа, при помощи которого рубрики семантического каталога следует разносить в поля базы данных. Вспомним позиции сторон - я предлагал (и далее так и делал) вносить в поле базы данных полное имя объекта со всеми его атрибутами. Если объектом является "призовая породистая лошадь", то мой способ состоял в том, что целиком все выражение из трех слов вносилось бы в поле базы. Позиция программиста заключалась в другом - согласно "идеологии реляционных баз" он требовал деления этого выражения на три элемента - "призовой", "породистый" и "лошадь" и, как уж не помню, это совсем не важно, разносить их в одно или несколько полей базы. Теперь моя идея заключается в том, что даная проблема, можно назвать по разному - "комбинирования записей", но, скорее, "семантического разнесения" значений, сложно отображаемых в понятийных системах по полям простых элементов, требует особой теории. Рассмотрим тогда некий сложный случай понятийного представления и сравним его с простым. Но вначале я оговорюсь, что имя объекта будет отделено от имени признака (или, правильнее, одно слово в составном имени объекта будет выделен как маркер имени объекта), а далее мы будем работать с _именем_признака_. Положим у нас есть описанный составным именем объект "варено-копченая украинская колбаса". "Колбасу" откидываем в поле "маркеров имен объектов" и начинаем работать с признаком этого маркера "варено-копченая украинская". Согласно "идеологии" реляционных баз данных, мы можем добавить в поле "признаков" три записи - "вареный", "копченый" и "украинский". Если мы далее мы обработаем более простое имя "вареная колбаса", то никаких записей в поле "признаков" мы вносить не будем, поскольку "вареный" уже там есть. И если речь идет о базе данных как просто о способе хранения данных, то базе все эти тонкости по барабану. Но если база служит для нас источником, на основании которого строится _семантический_каталог_, то в таком случае просто записать слово "вареный" в поле "признаки" неверно. Мы теряем знание о том, в каком - простом или составном - понятии это слово использовалось. И вообще каким-то непонятным образом у нас элемент составного понятия стал равен самостоятельному понятийному элементу. В таком случае следует сделать вот что, и в этом и состоит моя идея: делать отдельную таблицу для простых имен признаков и делать отдельную таблицу для составных имен признаков. При этом признаки, описываемые составными именами, я хочу назвать особым термином _дробящиеся_ признаки. Пока мы забудем о простых признаках и займемся "дробящимися". Предположим, что характер этих признаков выражает нечто, что обычно называется "одноуровневой структурой". У нас есть одноуровневая структура "варено- копченая украинская", как ее разложить? Здесь следует вводить принцип "доминирования", под которым подразумевать некоторое построение "ряда" этой структуры. Но нам в данном случае мешает составное слово, и давай тогда вначале рассмотрим структуру где его нет. Предположим, у нас есть "первая школьная научная конференция", где маркер объекта "конференция", а признак - "первая школьная научная". Я предлагаю в таком случае простой метод составления таблицы и определения доминирования (и то, и другое решения связаны). Таблица строится из полей: "доминанта", "второй элемент", "третий", и пусть их будет десять (сейчас не важно, сколько их реально нужно). Тогда "доминанта" и последующие элементы определяются по принципу "вектора": если признак стоит перед маркером, то доминантой называется слово слева от маркера, и элементы считаются справо налево; если признак стоит после маркера, как в "цветы срезанные садовые", то доминанта стоит справа от маркера и элементы считаются слева направо. Для составных слов порядок хитрее: доминанта - всегда склоняемая часть составного слова, потом считаются справо налево элементы составного слова, далее по предыдущему правилу остальные элементы. Тогда для "варено-копченой украинской" доминанта будет "копченый", второй элемент "вареный" и третий элемент "украинский". Вероятно, тут можно столкнуться с тем, что язык богаче всяких моделей и когда Ленин пишет выражение "все более тонкая фальсификация марксизма", начинаешь сомневаться, может ли такая классификация работать, однако, если выполнить перестановку и получить "все более тонкую марксизма фальсификацию", то жить еще можно. Но наша проблема получает новое продолжение - группу случаев, в которых требования благозвучия вынуждают искажать логическую модель. Здесь можно думать над вопросом - следует ли в обработанном дробящемся признаке указывать на то, что внесенный в базу признак был предварительно обработан (или он вносился "таким как есть")? Но здесь существует еще много нюансов. Связи между элементами дробящегося признака могут быть простыми, а могут быть и предложными. Например, возьмем "стремление к самому высокому в первоначальном пространственном смысле". Такие возможности требуют введения в таблицы указателей связок между элементами дробящегося признака - либо прописывания в этом поле знака простой связки, либо прописывания используемого предлога. Но мы рассматривали только такие случаи, в которых элементами дробящихся признаков были только прилагательные (или - по преимуществу прилагательные), на языке констуитивной онтологии - "универсалии", а ведь элементами дробящхся признаков могут быть и существительные и другие части речи (видимо, не могут быть только глаголы), например, "город-сад" или "предвзятость решения Маркса". Здесь следует руководствоваться Баррисмитовской констуитивной онтологией и описывать или обозначать (мне неясно - выделять ли каждый вид элемента в отдельные поля или ставить знак в особом поле "тип элемента дробящегося признака") элементы дробящихся признаков как "состояния", "случаи" и "универсалии". Отметим еще следующее: когда мы описывали обработку признаков, разложение их на элементы, мы не обратили внимание на проблему представления порядковых значений и их величин. Если в исходных данных слова представлены в порядке "1710 год" и "январь месяц", то в наши таблицы их следует вносить в таком порядке, чтобы первым шло порядковое имя, а вторым имя экземпляра. Тогда мы обязаны будем записывать эти элементы дробящихся признаков только таким образом "год 1710", "месяц январь", "число 3". Кроме всех уже обозначенных нами проблем нам следует высказаться и по проблеме "сублиний", нередко включаемых в одноранговую структуру дробящихся признаков. Сравним два выражения: "слова сказанные Беркли в 1710 году" и "слова, сказанные католическим епископом Беркли в 1710 году". Во втором выражении у нас появляются элементы описания, не связанные с объектным маркером "слова". Связь со "словами" отсутствует у признака "католический епископ". Это говорит о том, что, возможно, дробящиеся признаки следует описывать еще и структурой входящих в них "сублиний". С другой стороны, такие связи можно относить уже к межобъектным отношениям. Если же, все же, описывать сублинии дробящихся признаков, то тогда следует создавать практически похожие на саму таблицу дробящихся признаков таблицы простых и дробящихся признаков сублинии. Но вообще этот вопрос мне пока не ясен. Итак, следует подумать над тем: имеются ли у показанной здесь "теории" хоть какие-то надежды на воплощение в конструкции базы данных? Реально ли описать дробящиеся признаки так, как это здесь показано? Алексей |
Текстовая версия | Сейчас: 26th April 2024 - 08:21 PM |