Онтология и семантика, Преодоление "узких мест" семантики
Здравствуйте, Гость ( Вход | Регистрация )
Онтология и семантика, Преодоление "узких мест" семантики
Алексей Шухов |
![]()
Отправлено
#1
|
Старожил ![]() ![]() ![]() Группа: Advanced Users Сообщений: 235 Пол: Male ![]() |
Федя, привет!
Здесь речь пойдет о проблеме, которая помешала мне создать "онтологический каталог" таким образом, чтобы онтологическое представление стандартизировалось бы с принципами построения "реляционных баз данных". Ну вот так ... Такая, казалось бы, "только техническая" проблема выводит на отношения "онтологии и семантики" как таковые. Итак, вспомним единственную проблему, помешавшую реляционно описать "онтологический каталог" - я имею в виду теорию способа, при помощи которого рубрики семантического каталога следует разносить в поля базы данных. Вспомним позиции сторон - я предлагал (и далее так и делал) вносить в поле базы данных полное имя объекта со всеми его атрибутами. Если объектом является "призовая породистая лошадь", то мой способ состоял в том, что целиком все выражение из трех слов вносилось бы в поле базы. Позиция программиста заключалась в другом - согласно "идеологии реляционных баз" он требовал деления этого выражения на три элемента - "призовой", "породистый" и "лошадь" и, как уж не помню, это совсем не важно, разносить их в одно или несколько полей базы. Теперь моя идея заключается в том, что даная проблема, можно назвать по разному - "комбинирования записей", но, скорее, "семантического разнесения" значений, сложно отображаемых в понятийных системах по полям простых элементов, требует особой теории. Рассмотрим тогда некий сложный случай понятийного представления и сравним его с простым. Но вначале я оговорюсь, что имя объекта будет отделено от имени признака (или, правильнее, одно слово в составном имени объекта будет выделен как маркер имени объекта), а далее мы будем работать с _именем_признака_. Положим у нас есть описанный составным именем объект "варено-копченая украинская колбаса". "Колбасу" откидываем в поле "маркеров имен объектов" и начинаем работать с признаком этого маркера "варено-копченая украинская". Согласно "идеологии" реляционных баз данных, мы можем добавить в поле "признаков" три записи - "вареный", "копченый" и "украинский". Если мы далее мы обработаем более простое имя "вареная колбаса", то никаких записей в поле "признаков" мы вносить не будем, поскольку "вареный" уже там есть. И если речь идет о базе данных как просто о способе хранения данных, то базе все эти тонкости по барабану. Но если база служит для нас источником, на основании которого строится _семантический_каталог_, то в таком случае просто записать слово "вареный" в поле "признаки" неверно. Мы теряем знание о том, в каком - простом или составном - понятии это слово использовалось. И вообще каким-то непонятным образом у нас элемент составного понятия стал равен самостоятельному понятийному элементу. В таком случае следует сделать вот что, и в этом и состоит моя идея: делать отдельную таблицу для простых имен признаков и делать отдельную таблицу для составных имен признаков. При этом признаки, описываемые составными именами, я хочу назвать особым термином _дробящиеся_ признаки. Пока мы забудем о простых признаках и займемся "дробящимися". Предположим, что характер этих признаков выражает нечто, что обычно называется "одноуровневой структурой". У нас есть одноуровневая структура "варено- копченая украинская", как ее разложить? Здесь следует вводить принцип "доминирования", под которым подразумевать некоторое построение "ряда" этой структуры. Но нам в данном случае мешает составное слово, и давай тогда вначале рассмотрим структуру где его нет. Предположим, у нас есть "первая школьная научная конференция", где маркер объекта "конференция", а признак - "первая школьная научная". Я предлагаю в таком случае простой метод составления таблицы и определения доминирования (и то, и другое решения связаны). Таблица строится из полей: "доминанта", "второй элемент", "третий", и пусть их будет десять (сейчас не важно, сколько их реально нужно). Тогда "доминанта" и последующие элементы определяются по принципу "вектора": если признак стоит перед маркером, то доминантой называется слово слева от маркера, и элементы считаются справо налево; если признак стоит после маркера, как в "цветы срезанные садовые", то доминанта стоит справа от маркера и элементы считаются слева направо. Для составных слов порядок хитрее: доминанта - всегда склоняемая часть составного слова, потом считаются справо налево элементы составного слова, далее по предыдущему правилу остальные элементы. Тогда для "варено-копченой украинской" доминанта будет "копченый", второй элемент "вареный" и третий элемент "украинский". Вероятно, тут можно столкнуться с тем, что язык богаче всяких моделей и когда Ленин пишет выражение "все более тонкая фальсификация марксизма", начинаешь сомневаться, может ли такая классификация работать, однако, если выполнить перестановку и получить "все более тонкую марксизма фальсификацию", то жить еще можно. Но наша проблема получает новое продолжение - группу случаев, в которых требования благозвучия вынуждают искажать логическую модель. Здесь можно думать над вопросом - следует ли в обработанном дробящемся признаке указывать на то, что внесенный в базу признак был предварительно обработан (или он вносился "таким как есть")? Но здесь существует еще много нюансов. Связи между элементами дробящегося признака могут быть простыми, а могут быть и предложными. Например, возьмем "стремление к самому высокому в первоначальном пространственном смысле". Такие возможности требуют введения в таблицы указателей связок между элементами дробящегося признака - либо прописывания в этом поле знака простой связки, либо прописывания используемого предлога. Но мы рассматривали только такие случаи, в которых элементами дробящихся признаков были только прилагательные (или - по преимуществу прилагательные), на языке констуитивной онтологии - "универсалии", а ведь элементами дробящхся признаков могут быть и существительные и другие части речи (видимо, не могут быть только глаголы), например, "город-сад" или "предвзятость решения Маркса". Здесь следует руководствоваться Баррисмитовской констуитивной онтологией и описывать или обозначать (мне неясно - выделять ли каждый вид элемента в отдельные поля или ставить знак в особом поле "тип элемента дробящегося признака") элементы дробящихся признаков как "состояния", "случаи" и "универсалии". Отметим еще следующее: когда мы описывали обработку признаков, разложение их на элементы, мы не обратили внимание на проблему представления порядковых значений и их величин. Если в исходных данных слова представлены в порядке "1710 год" и "январь месяц", то в наши таблицы их следует вносить в таком порядке, чтобы первым шло порядковое имя, а вторым имя экземпляра. Тогда мы обязаны будем записывать эти элементы дробящихся признаков только таким образом "год 1710", "месяц январь", "число 3". Кроме всех уже обозначенных нами проблем нам следует высказаться и по проблеме "сублиний", нередко включаемых в одноранговую структуру дробящихся признаков. Сравним два выражения: "слова сказанные Беркли в 1710 году" и "слова, сказанные католическим епископом Беркли в 1710 году". Во втором выражении у нас появляются элементы описания, не связанные с объектным маркером "слова". Связь со "словами" отсутствует у признака "католический епископ". Это говорит о том, что, возможно, дробящиеся признаки следует описывать еще и структурой входящих в них "сублиний". С другой стороны, такие связи можно относить уже к межобъектным отношениям. Если же, все же, описывать сублинии дробящихся признаков, то тогда следует создавать практически похожие на саму таблицу дробящихся признаков таблицы простых и дробящихся признаков сублинии. Но вообще этот вопрос мне пока не ясен. Итак, следует подумать над тем: имеются ли у показанной здесь "теории" хоть какие-то надежды на воплощение в конструкции базы данных? Реально ли описать дробящиеся признаки так, как это здесь показано? Алексей |
![]() ![]() ![]() |
Алексей Воробьев |
![]()
Отправлено
#2
|
Старожил ![]() ![]() ![]() Группа: Club Members Сообщений: 342 Пол: Male ![]() |
Здравствуйте, Алексей.
Попробую отвечать по порядку. 1. Проблема первоначал, или первоначала действительно оказывается очень важной, поскольку в начале заключен исток и происхождение, а тем самым и суть существующего. Но на всякое начало в его продолжении сразу же падает и тень забвения того, с чего все началось. Хайдеггер писал о забвении бытия уже на самой заре западной метафизики, Деррида и вовсе провозгласил в способе человеческого мышления фатальное отсутствие истока, большинство дальнейших философских направлений пытаются сейчас от необходимости давать ответы на изначальные вопросы уклониться, и переводят свои интересы в плоскость более приближенную к обыденным проблемам. Но раскрыть язык во многом означает понять все же то, как он возник. Не смотря на то, что о происхождении языка существует множество теорий, все они на данный момент признаны несостоятельными. Где-то читал, что Французская Академия отказалась принимать работы по возникновению языка еще в 19 в. как лишенные всяческих доказуемых оснований. В связи с этим интересно все же вспомнить о диалоге Платона «Кратил», который упоминается во всех пособиях по языкознанию в качестве первого теоретического оформления учения о языке. «В дошедших до нас древнегреческих источниках основанная проблема (я не собираюсь подробно описывать все перипетии и нюансы дискуссий по этому вопросу, но лишь важнейшие для нас отрывки) была сформулирована как спор между « натуралистами» и « конвенционалистами» по поводу происхождения слов (чаще называвшихся «именами»)… Диспут между натуралистами и конвенционалистами возник задолго до Сократа, но своей четкой формулировкой он обязан платоновскому диалогу, посвященному идеям Сократа по этому поводу. Указанная проблема может считаться центральной для древнегреческой лингвистической философии». (Соломник А. Семиотика и лингвистика. М.1995.) Здесь мы натыкаемся на вопрос, как вообще соотноситься сама наша возможность говорить, с тем существованием, к которому наши слова, подразумевая при этом реальность наличия мира, отсылают? Какая-то связь тут, несомненно, наличествует, но из чего она исходит и во что разрешается? Один из основных тезисов, подлежащих в диалоге Платона разбору, выражен так: « Кратил вот здесь говорит, Сократ, что существует правильность имен, присущая каждой вещи от природы, и вовсе не та произносимая вслух частица нашей речи, которой некоторые из нас договорились называть каждую вещь, есть имя, но определенная правильность имен прирождена и эллинам, и варварам, всем одна и та же». Он утверждает натуралистическую или естественную природу включенности языка в выразимость сущего. Противоположный ему постулат гласит : «Ни одно имя никому не врождено от природы, оно зависит от закона и обычая тех, кто привык что-либо так называть». Сам Сократ более склоняется к тому, чтобы признавать именно врожденную правильность имен, однако окончательное решение в споре двух противоборствующих позиций им не выносится. Большая часть диалога посвящена демонстрации того, что смысл имени заключен в древности того именования, которое оно изначально было предназначено выразить, причем этот смысл (который мы теперь комментируем так же посредством смысла) позже оказывается забыт, искажен, затемнен и стерт. Этимологические экскурсы Сократа, в которые он пускается, чтобы доказать эту мысль, современной лингвистикой оцениваются не очень высоко, но это потому, что она мало обращает внимание на то, что ее интерес к языку с интересом к нему Сократа не имеет ничего общего. Для последнего важно не собрание исторических фактов, а некое продвижение к основанию сущности языка, и по ходу этого продвижения он показывает, что всякое слово заведомо имеет своей подосновой нечто более ключевое, чем это кажется при непосредственном позднейшем его употреблении, причем эта подоснова есть откровение для самовыговаривающего себя Логоса, некий, предваряющий явленность бытия сказ о его устройстве и назначении. 2. Отход от первоначала в последующем наращивании технических и информационных возможностей языка, представляется мне вовсе не произвольным, но имеющим свою собственную логику процессом, значение которого начинает подлежать осмыслению только при приближении к неким его финальным итогам. Одним из таких итогов мне представляется проблема вычислительной формализации естественного языка, которая решается в рамках проекта по созданию искусственного интеллекта. Еще несколько десятилетий назад казалось, что добиться от машины «понимания» человеческих слов можно будет в самое ближайшее время. Сегодня так уже не думают, в решение поставленной перед компьютером задачи оказываются втянуты все более «онтологически нагруженные» дисциплины, но тем не менее мне кажется, что вся трудность того, что здесь надо сделать, все еще не осознается. Взять, например, интесубъективный аспект «понимания», проанализировав его в темпоральном значении и т.д. 3. и 4. Я, кажется, слишком отвлекся на другие размышления, чтобы добраться сегодня до, обсуждения поставленных Вами вопросов. Кое-какие мысли относительно «фразеологизации» и «лексикализации» вроде бы появились, но их еще надо обдумать. |
![]() ![]() ![]() |
Текстовая версия | Сейчас: 7th June 2025 - 11:37 PM |