Онтология и семантика, Преодоление "узких мест" семантики
Здравствуйте, Гость ( Вход | Регистрация )
Онтология и семантика, Преодоление "узких мест" семантики
Алексей Шухов |
![]()
Отправлено
#1
|
Старожил ![]() ![]() ![]() Группа: Advanced Users Сообщений: 235 Пол: Male ![]() |
Федя, привет!
Здесь речь пойдет о проблеме, которая помешала мне создать "онтологический каталог" таким образом, чтобы онтологическое представление стандартизировалось бы с принципами построения "реляционных баз данных". Ну вот так ... Такая, казалось бы, "только техническая" проблема выводит на отношения "онтологии и семантики" как таковые. Итак, вспомним единственную проблему, помешавшую реляционно описать "онтологический каталог" - я имею в виду теорию способа, при помощи которого рубрики семантического каталога следует разносить в поля базы данных. Вспомним позиции сторон - я предлагал (и далее так и делал) вносить в поле базы данных полное имя объекта со всеми его атрибутами. Если объектом является "призовая породистая лошадь", то мой способ состоял в том, что целиком все выражение из трех слов вносилось бы в поле базы. Позиция программиста заключалась в другом - согласно "идеологии реляционных баз" он требовал деления этого выражения на три элемента - "призовой", "породистый" и "лошадь" и, как уж не помню, это совсем не важно, разносить их в одно или несколько полей базы. Теперь моя идея заключается в том, что даная проблема, можно назвать по разному - "комбинирования записей", но, скорее, "семантического разнесения" значений, сложно отображаемых в понятийных системах по полям простых элементов, требует особой теории. Рассмотрим тогда некий сложный случай понятийного представления и сравним его с простым. Но вначале я оговорюсь, что имя объекта будет отделено от имени признака (или, правильнее, одно слово в составном имени объекта будет выделен как маркер имени объекта), а далее мы будем работать с _именем_признака_. Положим у нас есть описанный составным именем объект "варено-копченая украинская колбаса". "Колбасу" откидываем в поле "маркеров имен объектов" и начинаем работать с признаком этого маркера "варено-копченая украинская". Согласно "идеологии" реляционных баз данных, мы можем добавить в поле "признаков" три записи - "вареный", "копченый" и "украинский". Если мы далее мы обработаем более простое имя "вареная колбаса", то никаких записей в поле "признаков" мы вносить не будем, поскольку "вареный" уже там есть. И если речь идет о базе данных как просто о способе хранения данных, то базе все эти тонкости по барабану. Но если база служит для нас источником, на основании которого строится _семантический_каталог_, то в таком случае просто записать слово "вареный" в поле "признаки" неверно. Мы теряем знание о том, в каком - простом или составном - понятии это слово использовалось. И вообще каким-то непонятным образом у нас элемент составного понятия стал равен самостоятельному понятийному элементу. В таком случае следует сделать вот что, и в этом и состоит моя идея: делать отдельную таблицу для простых имен признаков и делать отдельную таблицу для составных имен признаков. При этом признаки, описываемые составными именами, я хочу назвать особым термином _дробящиеся_ признаки. Пока мы забудем о простых признаках и займемся "дробящимися". Предположим, что характер этих признаков выражает нечто, что обычно называется "одноуровневой структурой". У нас есть одноуровневая структура "варено- копченая украинская", как ее разложить? Здесь следует вводить принцип "доминирования", под которым подразумевать некоторое построение "ряда" этой структуры. Но нам в данном случае мешает составное слово, и давай тогда вначале рассмотрим структуру где его нет. Предположим, у нас есть "первая школьная научная конференция", где маркер объекта "конференция", а признак - "первая школьная научная". Я предлагаю в таком случае простой метод составления таблицы и определения доминирования (и то, и другое решения связаны). Таблица строится из полей: "доминанта", "второй элемент", "третий", и пусть их будет десять (сейчас не важно, сколько их реально нужно). Тогда "доминанта" и последующие элементы определяются по принципу "вектора": если признак стоит перед маркером, то доминантой называется слово слева от маркера, и элементы считаются справо налево; если признак стоит после маркера, как в "цветы срезанные садовые", то доминанта стоит справа от маркера и элементы считаются слева направо. Для составных слов порядок хитрее: доминанта - всегда склоняемая часть составного слова, потом считаются справо налево элементы составного слова, далее по предыдущему правилу остальные элементы. Тогда для "варено-копченой украинской" доминанта будет "копченый", второй элемент "вареный" и третий элемент "украинский". Вероятно, тут можно столкнуться с тем, что язык богаче всяких моделей и когда Ленин пишет выражение "все более тонкая фальсификация марксизма", начинаешь сомневаться, может ли такая классификация работать, однако, если выполнить перестановку и получить "все более тонкую марксизма фальсификацию", то жить еще можно. Но наша проблема получает новое продолжение - группу случаев, в которых требования благозвучия вынуждают искажать логическую модель. Здесь можно думать над вопросом - следует ли в обработанном дробящемся признаке указывать на то, что внесенный в базу признак был предварительно обработан (или он вносился "таким как есть")? Но здесь существует еще много нюансов. Связи между элементами дробящегося признака могут быть простыми, а могут быть и предложными. Например, возьмем "стремление к самому высокому в первоначальном пространственном смысле". Такие возможности требуют введения в таблицы указателей связок между элементами дробящегося признака - либо прописывания в этом поле знака простой связки, либо прописывания используемого предлога. Но мы рассматривали только такие случаи, в которых элементами дробящихся признаков были только прилагательные (или - по преимуществу прилагательные), на языке констуитивной онтологии - "универсалии", а ведь элементами дробящхся признаков могут быть и существительные и другие части речи (видимо, не могут быть только глаголы), например, "город-сад" или "предвзятость решения Маркса". Здесь следует руководствоваться Баррисмитовской констуитивной онтологией и описывать или обозначать (мне неясно - выделять ли каждый вид элемента в отдельные поля или ставить знак в особом поле "тип элемента дробящегося признака") элементы дробящихся признаков как "состояния", "случаи" и "универсалии". Отметим еще следующее: когда мы описывали обработку признаков, разложение их на элементы, мы не обратили внимание на проблему представления порядковых значений и их величин. Если в исходных данных слова представлены в порядке "1710 год" и "январь месяц", то в наши таблицы их следует вносить в таком порядке, чтобы первым шло порядковое имя, а вторым имя экземпляра. Тогда мы обязаны будем записывать эти элементы дробящихся признаков только таким образом "год 1710", "месяц январь", "число 3". Кроме всех уже обозначенных нами проблем нам следует высказаться и по проблеме "сублиний", нередко включаемых в одноранговую структуру дробящихся признаков. Сравним два выражения: "слова сказанные Беркли в 1710 году" и "слова, сказанные католическим епископом Беркли в 1710 году". Во втором выражении у нас появляются элементы описания, не связанные с объектным маркером "слова". Связь со "словами" отсутствует у признака "католический епископ". Это говорит о том, что, возможно, дробящиеся признаки следует описывать еще и структурой входящих в них "сублиний". С другой стороны, такие связи можно относить уже к межобъектным отношениям. Если же, все же, описывать сублинии дробящихся признаков, то тогда следует создавать практически похожие на саму таблицу дробящихся признаков таблицы простых и дробящихся признаков сублинии. Но вообще этот вопрос мне пока не ясен. Итак, следует подумать над тем: имеются ли у показанной здесь "теории" хоть какие-то надежды на воплощение в конструкции базы данных? Реально ли описать дробящиеся признаки так, как это здесь показано? Алексей |
![]() ![]() ![]() |
Алексей Воробьев |
![]()
Отправлено
#2
|
Старожил ![]() ![]() ![]() Группа: Club Members Сообщений: 342 Пол: Male ![]() |
Здравствуйте, Алексей. Видимо, мы с вами несколько по-разному понимаем тему «онтология и семантика». Для меня эта рубрика представляет интерес в отношении понимания того, как эмпирическая звуковая материя оказывается организованной в универсальную (относительно мышления) знаковую систему, со всеми связанными с ней проблемами происхождения и функционирования. Ваш же проект (может быть неправильно) вызывает у меня ассоциации с неким философским «тезауросом», который (если он будет ориентирован на «объективные» характеристики предметов) столкнется в отношении обработки философского семантического пространства с теми же проблемами, что когда-то проявились в аналитической философии. Мне трудно судить насколько принцип «внутренней диссоциации языка» оказывается определяющим для языковых конструкций, а насколько он может работать в качестве «программного средства». Однако «наивная онтология» естественного языка в любом случае не так наивна и не развита, как может показаться с высоты всяких, надстроенных на ней, наукообразных пирамид. После революции, когда была провозглашена смена производственных отношений, рассматриваемых в марксизме как базисные, в советской лингвистике, ратующее за «новый язык». Аргументация его необходимости сводилась к определению языка в качестве надстройки, которая при смене базиса должна так же пережить революцию. Конец этой «реформе» положил Сталин, проявивший незаурядную философскую интуицию, объявив, что «Язык» (в отличии, например, от философии) - не «надстройка». Хайдеггер во «Времени и бытии» писал, что бытие всегда уже истолковано в языке. Отсюда у него следует ряд положений, которые сводятся к тому, что не человек говорит языком, но сам язык говорит через человека. Это противопоставление отсылает к соссюровской оппозиции языка и речевой деятельности. В речи, в том числе и профессионально- философской, мы можем рассуждать о бытии, при этом всегда его не умея выразить, поскольку она, будучи производной, сама не в состоянии возвратиться к тому, что ее порождает, то есть к языку, в котором сказывается бытие, помимо и вне человеческого его понимания. Наверняка я опять не попал не попал в такт вашей идеи, может быть попытаюсь сделать это в другой раз. |
Алексей Шухов |
![]()
Отправлено
#3
|
Старожил ![]() ![]() ![]() Группа: Advanced Users Сообщений: 235 Пол: Male ![]() |
Здравствуйте, Алексей.
Теперь, можно сказать, с какой-то по очереди попытки мне удалось обрисовать тему, и теперь можно попытаться ее развить. Следует оттолкнуться от представления о степени "наивности" онтологической модели естественного языка и далее перейти к проблеме использования предоставляемых языком возможностей классифицирующего обозначения. Но, все же, несколько слов по второй проблеме. Онтология не может быть построена без использования классификаций и такие системы классификаций могут пользоваться только языком (забудем о возможности математических или иных формальных интерпретаций). Когда онтология приступит к строительству своих классификаций на базе понятийного и лексического корпуса, она будет вольна как угодно и любым образом пользоваться средствами языка. Какие ограничения могут подстерегать онтологию на данном направлении? Но это проблема будущего. Я сейчас хочу показать пример семантического анализа языковых конструкций (и заранее извиниться за его объем) и задать вопрос - что такое эти семантические конструкции, как не онтологические модели? (Полностью материал доступен по ссылке: www.dialog-21.ru/Archive/2004/Kibrik.htm . 4.3 Тип посессивного отношения Были выделены следующие 26 типов посессивных отношений (в названии отношения первый член - зависимое имя в генитиве (посессор), второй член - вершинное имя (обладаемое)): 1. AD: отношение смежности “сущность - смежная сущность” (спутник земли, окрестности города, кобура пистолета) 2. ATR: атрибутивное отношение “атрибут сущности - сущность” (площадь Ногина, таблица умножения, закон инерции) 3. BP: отношение части тела “личность - часть тела личности” (его голова / рука / челка, моя душа, мой ум) 4. CL: “личность - одежда / часть одежды личности” (его рубаха / сапог / хлястик / рукав / штанина / ошейник / рюкзак) 5. EXM: отношение экземпляра “явление / сущность - экземпляр ~” (экземпляр книги, штука кафеля, пучок травы, початок кукурузы, глоток вина, капля крови, лист бумаги) 6. FM: отношение формы “сущность - форма сущности” (квадрат полей, круг зрителей, слой обоев, полоса света, пружина дыма, гроздь форели, обрубок хвоста) 7. GR: групповое отношение “однотипные элементы группы - группа” (их артель / группа / бригада / колонна / клуб / команда / партия / кружок / отряд / эскадра, их барак / родина, пара людей, колода карт, букет цветов, коллекция картин) 8. GRsg: отношение включения в группу “элемент группы - группа” (его команда / компания / семья / бригада) 9. KIN: отношение родства “личность - родственник личности” (отец Пети, жена президента) 10. MAT: отношение материала “вещь - материал вещи” (вата подкладки, бревна галереи, древесина удилища) 11. MB: отношение членства “совокупность / коллектив / организация - член ~” (член группы, передовик производства, капитан корабля, чемпион мира) 12. MES: отношение количества “вещество - количество вещества” (литр вина, туча комаров, излишек энергии, процент успеваемости) 13. MPH: метафорическое отношение “сущность - метафора сущности” (вуаль печали, марля тумана, ягоды зрелости, сети рабства, змеи молнии, щетина забора) 14. OB: объектное отношение “объект события - событие” (вывих ступни, раздача / выпечка хлеба, ремонт пути, поглощение пищи) 15. OB`: объектное отношение “объект действия - субъект действия” (искательница приключений, подносчик шлакоблоков) 16. PAR: параметрическое отношение “сущность - параметр сущности” (ее характер / внешность / поза / взгляды, история болезни, смысл слова, тематика совещаний) 17. PLC: отношение места “сущность - место / время сущности” (наш ресторан / край / завод; поле битвы, дата смерти) 18. PLC’: отношение “ место / время сущности - сущность” (обитатели дома, проза будущего) 19. POS: посессивное отношение “обладатель - обладаемое” (его дом / спальня / койка / тумбочка / чемодан / окурок / лодка) 20. POS*: посессивное отношение “обладаемое - обладатель” (владелец чемодана / дачи, обитатели дома) 21. PRD: отношение продукта “деятель / сущность - продукт ~” (его слова / речь / вопрос / идея / мысль / мнения / поступки; зола костра, дым папиросы, результат дела, следы разгула, плоды трудов, отходы производства, звук шагов, лучи солнца) 22. PRD*: отношение продукта “продукт деятельности - деятель / причина” (автор цитаты, источник мучений) 23. SOC: социальные отношения “личность - социальный партнер личности” (наш хозяин / знакомый / товарищ / противник / враг, друг мастера, ровесник Кузьменышей, помощник бригадира) 24. SUB: субъектное отношение “субъект события / состояния - событие / состояние” (его действия / занятия / старание / усилия, простой бригады, крушение парохода, прохлада комнат) 25. SYM: символическое отношение “сущность - символ сущности” (ее имя / фамилия / адрес / отражение, названия гор, заглавие рассказа, номер дела / магазина, список членов, карта Прованса, фотография дочери, изображение пики, знак радости, эмблема власти, гримаса разочарования) 26. WH: отношение часть?целое “сущность (целое) - часть сущности” (ограда парка, огонек папиросы, двери склада, ложе реки, глубина озера, правление колхоза, развалины санатория) Накладывает ли сложность лексической и грамматической конструкции какое-то ограничение на лексику и описательные возможности онтологического представления? Следует ли из семантического опыта какой-либо вывод - на каких именно отношениях должна сосредоточиться онтология при составлении своего базисного описания? Язык, насколько я могу заключить, ориентирован на потребности описания предметов, становящимися целями активности деятельного субъекта. Видимо, онтологический "язык" должен приобрести большую "нейтральность". Как этого достичь - это интересная проблема. Алексей |
![]() ![]() ![]() |
Текстовая версия | Сейчас: 7th June 2025 - 11:41 PM |