Онтоинженерия на службе филологии: как создавать онтологии литературных произведений.
Современная инженерия знаний, на мой взгляд, исходит из предпосылок введенных Монтегю и Льюисом о понятии онтологии: выражения естественного языка откосятся к реальному миру во всем его богатстве, причем к миру в «широком смысле», и к воспринимаемой нами реальности, и к нашему внутреннему миру, включающем и мыслимые, и возможные миры. Мир этот богат, красочен и неисчерпаем.
В такой теории выражения искусственных языков интерпретируются на моделях, т.е. на математических структурах, и их значение четко определяется интерпретацией. Хотя модели — это математические абстракции, их структура отражает структуру языка, для интерпретации которого они служат. Но искусственные языки создаются, как правило, для описания некоторой реальности, и в этом случае модели должны отражать структуру этой реальности. Мы говорим в логике о модели языка или модели теории, и говорим в то же время о модели в физике (атома) или о модели экономических отношений. «Устройство» моделей искусственных языков — это основные предположения об устройстве мира, описываемого этими языками, иногда называемой онтологией.
Язык OWL обладает двумя видами понятий: классами и свойствами, что роднит их с теорией композициональности Фреге: значение выражение есть функция значений его компонентов и способа их связей. Как свойство языка это легло в основу онтоинженерии ABBYY Compreno, а вот как методологический прием анализа литературных или публицистических произведений он может использоваться в качестве Digital Humanities. Для этого можно сфокусироваться на контекстуальной интерпретации: предложения обретают смысл контекстуально, исходя из значения предложений в которые входят. Причем можно пойти еще дальше и анализировать все случаи контекстуального употребления. В случае филологии мы можем использовать пространство литературоведческих фактов с целью максимально адекватного отражения реальности и экземплификации нетривиальных связей между классами.
Для нашей цели мы используем роман «Москва-Петушки» Венедикта Ерофеева как достаточно веховое произведение советской эпохи, исходя, главным образом из двух соображений.
Мемуаристы свидетельствуют, что уже не герой, а автор Ерофеев обладал тягой к ненормативному классификаторству:
"Помню, например, длиннейший список нормальных температур диких и домашних животных, который он знал, как таблицу умножения (кошка? 37,8; лошадью…и т. п.) .
Каждое лето он вел дневник грибника. Возвратившись с добычей… он открывал записную книжку и, тщательно рассортировав находки и пересчитав каждую кучку, вносил в соответствующие графы (далее таблица, сколько в какой день найдено отдельно белых, подберезовиков, свинушек, лисичек и сыроежек.- В. К.).
В этой связи построение онтологии алкогольных напитков может стать своеобразной формой логического постмодернизма — рациональной реконструкцией личности писателя.
Другая, более существенная задача — это экземплификация гуманитарных знаний из произведения для изучения культуры повседневности в тех смыслах, в которых это понимает корпус дисциплин под общим названием Soviet studies. Мы попытаемся показать на примере онтологии алкоголя гипотезу Юркевича о двух типах отношений субъекта к советской реальности. С другой стороны, это и первый шаг к гипертекстовой энциклопедии знаний о повседневности.
В-третьих, это еще и способ построения базы знаний для литературных и журналистских ресурсов, которые, опираясь на ABBYY Compreno, как нам кажется, исходят из жесткой композициональной трактовки, а не контекстуальной, и не используя другие формулировки из других баз знаний, не обращая внимания на проблему непереводимости в духе Крипке и т.д.
В качестве материалов мы будем использовать текст источника+ работу «Энциклопедического словаря-справочника поэмы В.В. Ерофеева "Москва — Петушки» как пример подключения к онтологии дополнительных баз знаний.
Онтология классов и вхождений индивидов:
Выводы:
1) Венечка действительно парадирует большинство коктейлей — учитывая, что большинство напитков состоят всего из двух компонентов, его коктейли (множества) обладают большей мощностью. Частично — но только частично — это может быть интерпретировано как противопоставление народной культуры пития — официозной.
2) Контрафакт, который Венечка называет «Дерьмом» , исходя из дополнительных баз знаний, используется фрагментарно, и редко входит в состав большинства напитков, потребляемых главным героем.
3) Построенная онтология грешит разделением повторяющихся подклассов — большинство готовых напитков, не употреблялись в чистом виде, а исполосовывались в качестве готовых ингредиентов. Потребление в чистом виде готовых образцов промышленного производства отвергалось, предпочитая смешиваемость напитка, как подлинно «народный» стиль.
4) Концепция добавки и основы в духе Леви-Стросса и его структуралистких пассажей о приправе и основном блюде.
В конце концов, Стефан Хейсбруггер прав — онтология, это просто инструмент, и выбор онтологии должен задаваться прагматическими задачами.