Онтология и семантика, Преодоление "узких мест" семантики
Здравствуйте, Гость ( Вход | Регистрация )
Онтология и семантика, Преодоление "узких мест" семантики
Алексей Шухов |
![]()
Отправлено
#1
|
Старожил ![]() ![]() ![]() Группа: Advanced Users Сообщений: 235 Пол: Male ![]() |
Федя, привет!
Здесь речь пойдет о проблеме, которая помешала мне создать "онтологический каталог" таким образом, чтобы онтологическое представление стандартизировалось бы с принципами построения "реляционных баз данных". Ну вот так ... Такая, казалось бы, "только техническая" проблема выводит на отношения "онтологии и семантики" как таковые. Итак, вспомним единственную проблему, помешавшую реляционно описать "онтологический каталог" - я имею в виду теорию способа, при помощи которого рубрики семантического каталога следует разносить в поля базы данных. Вспомним позиции сторон - я предлагал (и далее так и делал) вносить в поле базы данных полное имя объекта со всеми его атрибутами. Если объектом является "призовая породистая лошадь", то мой способ состоял в том, что целиком все выражение из трех слов вносилось бы в поле базы. Позиция программиста заключалась в другом - согласно "идеологии реляционных баз" он требовал деления этого выражения на три элемента - "призовой", "породистый" и "лошадь" и, как уж не помню, это совсем не важно, разносить их в одно или несколько полей базы. Теперь моя идея заключается в том, что даная проблема, можно назвать по разному - "комбинирования записей", но, скорее, "семантического разнесения" значений, сложно отображаемых в понятийных системах по полям простых элементов, требует особой теории. Рассмотрим тогда некий сложный случай понятийного представления и сравним его с простым. Но вначале я оговорюсь, что имя объекта будет отделено от имени признака (или, правильнее, одно слово в составном имени объекта будет выделен как маркер имени объекта), а далее мы будем работать с _именем_признака_. Положим у нас есть описанный составным именем объект "варено-копченая украинская колбаса". "Колбасу" откидываем в поле "маркеров имен объектов" и начинаем работать с признаком этого маркера "варено-копченая украинская". Согласно "идеологии" реляционных баз данных, мы можем добавить в поле "признаков" три записи - "вареный", "копченый" и "украинский". Если мы далее мы обработаем более простое имя "вареная колбаса", то никаких записей в поле "признаков" мы вносить не будем, поскольку "вареный" уже там есть. И если речь идет о базе данных как просто о способе хранения данных, то базе все эти тонкости по барабану. Но если база служит для нас источником, на основании которого строится _семантический_каталог_, то в таком случае просто записать слово "вареный" в поле "признаки" неверно. Мы теряем знание о том, в каком - простом или составном - понятии это слово использовалось. И вообще каким-то непонятным образом у нас элемент составного понятия стал равен самостоятельному понятийному элементу. В таком случае следует сделать вот что, и в этом и состоит моя идея: делать отдельную таблицу для простых имен признаков и делать отдельную таблицу для составных имен признаков. При этом признаки, описываемые составными именами, я хочу назвать особым термином _дробящиеся_ признаки. Пока мы забудем о простых признаках и займемся "дробящимися". Предположим, что характер этих признаков выражает нечто, что обычно называется "одноуровневой структурой". У нас есть одноуровневая структура "варено- копченая украинская", как ее разложить? Здесь следует вводить принцип "доминирования", под которым подразумевать некоторое построение "ряда" этой структуры. Но нам в данном случае мешает составное слово, и давай тогда вначале рассмотрим структуру где его нет. Предположим, у нас есть "первая школьная научная конференция", где маркер объекта "конференция", а признак - "первая школьная научная". Я предлагаю в таком случае простой метод составления таблицы и определения доминирования (и то, и другое решения связаны). Таблица строится из полей: "доминанта", "второй элемент", "третий", и пусть их будет десять (сейчас не важно, сколько их реально нужно). Тогда "доминанта" и последующие элементы определяются по принципу "вектора": если признак стоит перед маркером, то доминантой называется слово слева от маркера, и элементы считаются справо налево; если признак стоит после маркера, как в "цветы срезанные садовые", то доминанта стоит справа от маркера и элементы считаются слева направо. Для составных слов порядок хитрее: доминанта - всегда склоняемая часть составного слова, потом считаются справо налево элементы составного слова, далее по предыдущему правилу остальные элементы. Тогда для "варено-копченой украинской" доминанта будет "копченый", второй элемент "вареный" и третий элемент "украинский". Вероятно, тут можно столкнуться с тем, что язык богаче всяких моделей и когда Ленин пишет выражение "все более тонкая фальсификация марксизма", начинаешь сомневаться, может ли такая классификация работать, однако, если выполнить перестановку и получить "все более тонкую марксизма фальсификацию", то жить еще можно. Но наша проблема получает новое продолжение - группу случаев, в которых требования благозвучия вынуждают искажать логическую модель. Здесь можно думать над вопросом - следует ли в обработанном дробящемся признаке указывать на то, что внесенный в базу признак был предварительно обработан (или он вносился "таким как есть")? Но здесь существует еще много нюансов. Связи между элементами дробящегося признака могут быть простыми, а могут быть и предложными. Например, возьмем "стремление к самому высокому в первоначальном пространственном смысле". Такие возможности требуют введения в таблицы указателей связок между элементами дробящегося признака - либо прописывания в этом поле знака простой связки, либо прописывания используемого предлога. Но мы рассматривали только такие случаи, в которых элементами дробящихся признаков были только прилагательные (или - по преимуществу прилагательные), на языке констуитивной онтологии - "универсалии", а ведь элементами дробящхся признаков могут быть и существительные и другие части речи (видимо, не могут быть только глаголы), например, "город-сад" или "предвзятость решения Маркса". Здесь следует руководствоваться Баррисмитовской констуитивной онтологией и описывать или обозначать (мне неясно - выделять ли каждый вид элемента в отдельные поля или ставить знак в особом поле "тип элемента дробящегося признака") элементы дробящихся признаков как "состояния", "случаи" и "универсалии". Отметим еще следующее: когда мы описывали обработку признаков, разложение их на элементы, мы не обратили внимание на проблему представления порядковых значений и их величин. Если в исходных данных слова представлены в порядке "1710 год" и "январь месяц", то в наши таблицы их следует вносить в таком порядке, чтобы первым шло порядковое имя, а вторым имя экземпляра. Тогда мы обязаны будем записывать эти элементы дробящихся признаков только таким образом "год 1710", "месяц январь", "число 3". Кроме всех уже обозначенных нами проблем нам следует высказаться и по проблеме "сублиний", нередко включаемых в одноранговую структуру дробящихся признаков. Сравним два выражения: "слова сказанные Беркли в 1710 году" и "слова, сказанные католическим епископом Беркли в 1710 году". Во втором выражении у нас появляются элементы описания, не связанные с объектным маркером "слова". Связь со "словами" отсутствует у признака "католический епископ". Это говорит о том, что, возможно, дробящиеся признаки следует описывать еще и структурой входящих в них "сублиний". С другой стороны, такие связи можно относить уже к межобъектным отношениям. Если же, все же, описывать сублинии дробящихся признаков, то тогда следует создавать практически похожие на саму таблицу дробящихся признаков таблицы простых и дробящихся признаков сублинии. Но вообще этот вопрос мне пока не ясен. Итак, следует подумать над тем: имеются ли у показанной здесь "теории" хоть какие-то надежды на воплощение в конструкции базы данных? Реально ли описать дробящиеся признаки так, как это здесь показано? Алексей |
![]() ![]() ![]() |
Алексей Воробьев |
![]()
Отправлено
#2
|
Старожил ![]() ![]() ![]() Группа: Club Members Сообщений: 342 Пол: Male ![]() |
Уважаемый Алексей!
Заявленное Вами начинание относительно семантики представляется мне столь же претенциозным, сколь и (возможно) далеко идущим. Попробую высказать по этому поводу несколько замечаний. Во-первых, попытки организовать ( перестроить) язык по принципу его адекватного выражения объективной реальности начали предприниматься еще со времен Ф.Бэкона. Подобные Вашим таблицы, составлялись Дальгарно, Уилкинсом и прочими классификаторам, по ряду принципиальных теоретических причин, потерпевшими на этом поприще неизбежную неудачу. В 20 в. был написан «Логико-философский трактат» Витгенштейна, анализирующий фундаментальную логику высказывания, исходя из оснований, которые (как признаются специалисты) удалось понять только единицам. Но сам же Витгенштейн, признав глубинную избыточность языка по отношении ко всякой попытке его формализировать, позже был вынужден свои взгляды пересмотреть. Что есть язык, так или иначе, по- прежнему остается загадкой. Отсюда, во-вторых, я хочу затронуть вторую строну, предложенной Вами проблемы. Она связана с теми возможностями, что сегодня может реализовать в отношении знания (языка) человек в связи с информационной вычислительной техникой. По этому поводу (я воздержавшись от ее достаточно трудного и неоднозначного обоснования) укажу на одну идею. Она заключается в уникальном случае математической выразимости некого (как бы привилегированного) языка, которым является иврит. Его обуславливает, например, однородная система трехсогласных корней, четкая структура глагольных форм, матричная грамматическая структура получения неологизмов, чрезвычайно малое количество исключений и т.д., но это только как бы внешняя сторона функционирования языка, помимо всего прочего подлежащего так же исчерпывающему каббалистическому числовому отображению. Для «человеческого» счета подобное «отображение» невыполнимо, но при ряде условий с ним может справиться компьютерная программа. Я пока никак не характеризую эту перспективу, но если она покажется Вам заслуживающей внимание, могу продолжить. |
Алексей Шухов |
![]()
Отправлено
#3
|
Старожил ![]() ![]() ![]() Группа: Advanced Users Сообщений: 235 Пол: Male ![]() |
Здравствуйте, Алексей!
Меня интересует такая задача как система формальных средств качественного анализа. Подобное решение невозможно без создания эффективных каталогов, где, например, философия четко определялась как область познания, построенная на своих алгоритмах познания, чья познавательная организация оказывается таковой, что философию не спутаешь ни с какими другими способами познания. В каталогах подобное определение должно существовать для всего - начиная от таких абстракций как "философия" или "трансцендентность" и нисходя до таких мелочей как капельки дождя, винтики, песчинки и т.п. Единственный способ качественного представления данных, которым мы можем пользоваться - это язык. Но представленные в языке способы идентификации информации восходят к грамматическим, а не к онтологическим правилам. В чем состоит идея - воспользоваться языком как реально действующим носителем, но придать ему упорядочение онтологического характера. Можно ли это сделать? Очевидно можно если пользоваться фразеологизмами. Выражения "марксистско-ленинская философия" как и "фундаментальная логика высказывания" - это фразеологически построенные имена. Построить систему из таких конструкций трудности не представляет, но дело в том, что "поисковой единицией" в таких системах должны быть именно лексические единицы. Я поднимаю проблему того, как можно построить теорию "онтологически - лексического преобразования", попутно обращаясь к вопросу о том, насколько язык является носителем онтологических единиц, и насколько язык представляет собой систему единиц коммуникативной среды. Ведь если мы обратимся к языку, мы найдем в нем и лексические единицы, онтологическое содержание которых или неясно, или вообще отсутствует - "несколько", "прочие", "ряд", "некие". Здесь я хотел бы разобрать проблему лексического разложения фразеологических имен. Эту задачу решает прикладная наука лингвистическая семантика, но решает ее в рамках лингвистических норм. Я не согласен с таким ее подходом, но приведу пример ее решений (один частный пример решения одной частной проблемы): ------------- Конструкции с внешним посессором бывают двух типов: во-первых, возможна экстрапозиция обладаемого и подъем посессора в ту позицию, которая заполнялась бы всей группой: (4) Она очаровала его своим умом (< ее ум очаровал его) и, во-вторых, возможна экстрапозиция посессора: (5) Он нянчил мне детей (< моих детей). При попытке формального описания этого явления возникает много спорных моментов, которые, однако, в целом несуществены для нашего доклада. Мы выделили следующие синтаксические основания классификации. Во-первых, отношения часть тела - обладатель могут выражаться или каноническим генитивом или иначе, т.е. конструкцией с внешним посессором. Что касается различий в управлении глагола при конструкциях с внешним посессором, то мы считаем возможным описать эти различия используя два параметра: выбор обобщенной модели управления, в которой не учитываются различия между различными предложными группами (все они обозначаются как PP, Preposition Phrase), и выбор одного из локативных предлогов (за ~ по ~ в) для обозначения места контакта (для тех обобщенных диатез, которые используют PP). В Интернете: Пискунова, Минлос "КОНСТРУКЦИИ С ВНЕШНИМ ПОСЕССОРОМ В РУССКОМ ЯЗЫКЕ" ------------- "Логико-философский трактат" в практическом смысле работы с функциями языка - это уже пройденный уровень (я не говорю о философских обобщениях). Но проблема остается - можно ли использовать язык для формализованных качественных описаний, а если возможно, то в каких отношениях находятся онтология и семантика, подчиняющаяся собственным, а далеко не онтологическим законам. Ответил так подробно потому, что вижу, что моя идея не настолько понятна аудитории, может быть, и данный ответ ее не сможет объяснить. Алексей |
![]() ![]() ![]() |
Текстовая версия | Сейчас: 7th June 2025 - 11:13 PM |