Donate

Онтоинженерия на службе филологии: как создавать онтологии литературных произведений.

Vitaliy Bolataev14/12/15 17:501.8K🔥

Современная инженерия знаний, на мой взгляд, исходит из предпосылок введенных Монтегю и Льюисом о понятии онтологии: выражения естественного языка откосятся к реальному миру во всем его богатстве, причем к миру в «широком смысле», и к воспринимаемой нами реальности, и к нашему внутреннему миру, включающем и мыслимые, и возможные миры. Мир этот богат, красочен и неисчерпаем.

В такой теории выражения искусственных языков интерпретируются на моделях, т.е. на математических структурах, и их значение четко определяется интерпретацией. Хотя модели — это математические абстракции, их структура отражает структуру языка, для интерпретации которого они служат. Но искусственные языки создаются, как правило, для описания некоторой реальности, и в этом случае модели должны отражать структуру этой реальности. Мы говорим в логике о модели языка или модели теории, и говорим в то же время о модели в физике (атома) или о модели экономических отношений. «Устройство» моделей искусственных языков — это основные предположения об устройстве мира, описываемого этими языками, иногда называемой онтологией.

Язык OWL обладает двумя видами понятий: классами и свойствами, что роднит их с теорией композициональности Фреге: значение выражение есть функция значений его компонентов и способа их связей. Как свойство языка это легло в основу онтоинженерии ABBYY Compreno, а вот как методологический прием анализа литературных или публицистических произведений он может использоваться в качестве Digital Humanities. Для этого можно сфокусироваться на контекстуальной интерпретации: предложения обретают смысл контекстуально, исходя из значения предложений в которые входят. Причем можно пойти еще дальше и анализировать все случаи контекстуального употребления. В случае филологии мы можем использовать пространство литературоведческих фактов с целью максимально адекватного отражения реальности и экземплификации нетривиальных связей между классами.

Для нашей цели мы используем роман «Москва-Петушки» Венедикта Ерофеева как достаточно веховое произведение советской эпохи, исходя, главным образом из двух соображений.

Мемуаристы свидетельствуют, что уже не герой, а автор Ерофеев обладал тягой к ненормативному классификаторству:

"Помню, например, длиннейший список нормальных температур диких и домашних животных, который он знал, как таблицу умножения (кошка? 37,8; лошадью…и т. п.) .

Каждое лето он вел дневник грибника. Возвратившись с добычей… он открывал записную книжку и, тщательно рассортировав находки и пересчитав каждую кучку, вносил в соответствующие графы (далее таблица, сколько в какой день найдено отдельно белых, подберезовиков, свинушек, лисичек и сыроежек.- В. К.).

В этой связи построение онтологии алкогольных напитков может стать своеобразной формой логического постмодернизма — рациональной реконструкцией личности писателя.

Другая, более существенная задача — это экземплификация гуманитарных знаний из произведения для изучения культуры повседневности в тех смыслах, в которых это понимает корпус дисциплин под общим названием Soviet studies. Мы попытаемся показать на примере онтологии алкоголя гипотезу Юркевича о двух типах отношений субъекта к советской реальности. С другой стороны, это и первый шаг к гипертекстовой энциклопедии знаний о повседневности.

В-третьих, это еще и способ построения базы знаний для литературных и журналистских ресурсов, которые, опираясь на ABBYY Compreno, как нам кажется, исходят из жесткой композициональной трактовки, а не контекстуальной, и не используя другие формулировки из других баз знаний, не обращая внимания на проблему непереводимости в духе Крипке и т.д.

В качестве материалов мы будем использовать текст источника+ работу «Энциклопедического словаря-справочника поэмы В.В. Ерофеева "Москва — Петушки» как пример подключения к онтологии дополнительных баз знаний.

Онтология классов и вхождений индивидов:

Выводы:

1) Венечка действительно парадирует большинство коктейлей — учитывая, что большинство напитков состоят всего из двух компонентов, его коктейли (множества) обладают большей мощностью. Частично — но только частично — это может быть интерпретировано как противопоставление народной культуры пития — официозной.

2) Контрафакт, который Венечка называет «Дерьмом» , исходя из дополнительных баз знаний, используется фрагментарно, и редко входит в состав большинства напитков, потребляемых главным героем.

3) Построенная онтология грешит разделением повторяющихся подклассов — большинство готовых напитков, не употреблялись в чистом виде, а исполосовывались в качестве готовых ингредиентов. Потребление в чистом виде готовых образцов промышленного производства отвергалось, предпочитая смешиваемость напитка, как подлинно «народный» стиль.

4) Концепция добавки и основы в духе Леви-Стросса и его структуралистких пассажей о приправе и основном блюде.

В конце концов, Стефан Хейсбруггер прав — онтология, это просто инструмент, и выбор онтологии должен задаваться прагматическими задачами.

P. S.: Рисовал в Protégé — этаком недо-UML. Вообще, думаю, что рисовать архитектуру текста основываясь только на семантике — фигня. Нужно как-то прописать иллокутивную силу, мб при помощи анализа общности и изменчивости как в объектно-ориентированном программировании.

Author

panddr
Vitaliy Bolataev
Comment
Share

Building solidarity beyond borders. Everybody can contribute

Syg.ma is a community-run multilingual media platform and translocal archive.
Since 2014, researchers, artists, collectives, and cultural institutions have been publishing their work here

About