Современный этап развития ряда гуманитарных наук, занимающихся изучением традиционной культуры, характеризуется накоплением значительного массива полевых материалов разного типа: аудио-, фото- и видеозаписей, рукописных текстов. На этом этапе одними из важнейших задач признаются архивация собранного материала, совершенствование поисковых систем [2], перевод в цифровую форму рукописных, печатных, визуальных коллекций.
Власкина Н. А. (г. Ростов-на-Дону), кандидат филологических наук,
старший научный сотрудник,
Институт социально-экономических и гуманитарных исследований
Южного научного центра Российской академии наук
Современный этап развития ряда гуманитарных наук, занимающихся изучением традиционной культуры, характеризуется накоплением значительного массива полевых материалов разного типа: аудио-, фото- и видеозаписей, рукописных текстов. На этом этапе одними из важнейших задач признаются архивация собранного материала, совершенствование поисковых систем [2], перевод в цифровую форму рукописных, печатных, визуальных коллекций [3].
Интенсивное развитие компьютерных технологий обеспечивает сегодня вариативность программных решений поставленной задачи. Создание компьютерных баз данных, начавшееся в российской фольклористике в первой половине 1990-х гг., сейчас осуществляется практически во всех крупных научных центрах.
Оцифровка материалов различного типа по традиционной культуре позволит решить ряд задач: расширить круг возможностей для оптимизации хранения имеющихся фольклорных собраний [4]; для комплексного поиска в базах данных, объединяющих материалы различного происхождения [5]; ввести в научный оборот значительный массив этнодиалектных материалов [6]; апробировать и использовать новые методы, требующие обращения к значительным по объему корпусам текстов [7]; облегчить сторонний доступ к архивным материалам (в том числе для педагогов, научных работников, творческих коллективов) [8].
Разнообразие структуры фольклорных и этнографических баз данных обусловлено стратегиями собирательской деятельности, типами единиц хранения.
С.В. Алпатов и В.А. Ковпик делят существующие базы данных на группы в соответствии с главным принципом, избираемым для описания и структурирования фольклорного материала. Они называют два таких принципа: жанрово-тематический и тезаурусный [9].
Исследовательский принцип, в соответствии с которым записи фольклорных текстов или фрагментов интервью распределяются между несколькими тематическими или жанровыми группами, используется в работе нескольких организаций: кафедры русского устного народного творчества филологического факультета МГУ имени М.В. Ломоносова, Государственного республиканского центра русского фольклора, Нижегородского государственного университета.
Основой при построении базы данных в этом случае оказываются жанровый и — внутри жанров — сюжетный или мотивный классификаторы [10], а единицей хранения выступает фольклорный текст, относящийся к тому или иному жанру.
Главным недостатком системы такого типа признается серьезное вмешательство исследователя в структуру источника. Осуществление выборки из цельного текста интервью обусловливает деконтекстуализацию искомых фрагментов. В результате, как отмечает А.Б. Мороз, «исследователь … не может уяснить, по какому поводу они были исполнены и насколько актуален данный текст для исполнителя [11].
Альтернативой данному принципу служит принцип тезаурусный, при котором систематизация осуществляется с помощью ключевых слов. Он активно используется в базах данных Института славяноведения РАН «Полесский архив» и лаборатории фольклора РГГУ «Традиционная культура Русского Севера (Каргополье)».
В первом из упомянутых собраний единицей хранения выступает диалектный текст, содержащий ответ на один из вопросов программы сбора этнолингвистического материала [12]. Т.е. работа над архивом также предполагает отбор материала, членение его собирателем или обработчиком на независимые друг от друга фрагменты. Каждый текст описывается с помощью набора ключевых слов и терминов, являющихся единицами культурной терминологии. Инвентарь ключевых слов ориентирован на словник этнолингвистического словаря «Славянские древности» [13].
Разработки Института славяноведения были взяты за основу при формировании мультимедийной базы данных сотрудниками РГГУ [14]. Основной единицей хранения, как и в предыдущем случае, является фрагмент интервью, описываемый с помощью ключевых слов, которые А.Б. Мороз определяет как «устойчивый набор лексем, выражающих основные категории традиционной культуры, обозначающих понятия, релевантные для этнографических описаний, включающие предметы и явления, действия, признаки, а также принятые в науке жанровые обозначения текстов и обрядов» [15].
Принципы классификации первого и второго типа частично совмещаются создателями распределенного межрегионального электронного архива этнографических данных первичных материалов этнографических исследований, создаваемого совместно СПбГУ и МАЭ РАН. Для систематизации материала используются двухуровневый классификатор этнографических тем и тематический индекс [16]. Каждая запись атрибутируется с помощью ключевых слов, однако в версии архива, доступной на период подготовки данной статьи, они выступают как разновидность неформализованной, достаточно аморфной характеристики записанного текста, в рамках блока «Аннотация, содержание, ключевые слова» [17].
Преимущества систематизации материала с помощью ключевых слов открываются при сравнении этого типа классификации с другими: (1) произвольным поиском и (2) поиском, направляемым тематическим, жанровым или сюжетным классификаторами. В сравнении с первым поиск по ключевым словам обеспечивает значительную экономию исследовательских ресурсов, поскольку одно и то же понятие может быть выражено с помощью ряда диалектных слов, конечный список которых пришлось бы приводить в случае произвольного поиска. Наряду с этим передача фонетических особенностей говора умножает количество единиц, вводимых в строку свободного поиска, из-за наличия у каждого слова нескольких произносительных вариантов. Затрудняют произвольный поиск также табуирование, присущее некоторым блокам традиционной культуры, и стилистические особенности разговорной речи, в частности наличие эллиптических конструкций и замена знаменательных частей речи местоимениями. Как следствие, искомое понятие может содержаться в тексте имплицитно, но не будет выражено вербально [18].
Тематический и жанровый классификаторы оказываются более общими в сравнении с перечнем ключевых слов, при том что последний может среди прочего включать в себя наименования жанровых единиц и, таким образом, характеризует систематизируемый материал более детально.
Критические замечания к данному способу упорядочивания материала можно свести к трем тезисам. Во-первых, проблематичной оказывается классификация текста, включенного в подобную базу данных, по жанровым признакам; во-вторых, в перечне ключевых слов часто «оказываются смешаны разнородные понятия … и определение жанра, действительно извлеченные из текста ключевые слова … и отсутствующие непосредственно в тексте наименования концептов традиционной культуры» [19].
Наконец, третьей претензией, предъявляемой к обоим способам систематизации фольклорного материала, является ограниченность поисковых возможностей. Как отмечает Т. Тангерлини, «поиск в корпусе, правильно проиндексированном в соответствии с одной из схем, будь это индекс типов, мотивов, жанровый классификатор или онтологический классификатор … выдаст все элементы, которые соответствуют классификации, и только их … Все эти классификационные системы потерпят неудачу, если исследовательский вопрос не будет соответствовать классификатору» [20].
Очевидно, что при создании новых баз данных по диалекту и традиционной культуре необходимо учитывать опыт, наработанный ведущими научными центрами. Однако каждое новое собрание материалов ставит перед исследователями новые задачи, формулирует новые вызовы.
Одной из коллекций в объединенном архиве полевых диалектологических и этнолингвистических экспедиций Института социально-экономических и гуманитарных исследований Южного научного центра РАН и Южного федерального университета является собрание материалов, записанных в ходе выездов к казакам-некрасовцам, проживающим в пос. Новокумском, Кумская Долина, Малосадовый Левокумского района Ставропольского края. В 2010–2012 гг. было организовано 4 экспедиционных выезда, целью которых было изучение современного состояния традиционной культуры казаков-некрасовцев [21].
Этот фрагмент архива был выбран для первоочередной каталогизации [22] по нескольким причинам, среди которых – количественная обозримость систематизируемых источников; представленность в базе разных типов источников. Параметры этой базы данных после апробации и вероятного усовершенствования могут быть использованы при создании и заполнении базы данных по более обширным территориям, на основании коллекции материалов, пополняемой с начала 1980-х гг. в рамках сплошного обследования территории традиционного проживания донских казаков (Ростовская и Волгоградская области).
В рамках экспедиций к казакам-некрасовцам материал собирался по комплексной методике, предполагающей использование максимума доступных исследователю способов фиксации информации. В результате был сформирован фотоархив, содержащий копии снимков из семейных архивов информантов, фотографии самих респондентов, бытовых реалий, жилых и культовых построек, кладбища, значимых для сообщества событий (подготовка и проведение поминальных и престольных обедов, церковных служб); видеоархив, содержащий записи интервью и общинных событий; аудиоархив с материалами интервью. В настоящее время ведется расшифровка аудиозаписей.
В ходе работы большинство собирателей использовали динамичную смену стратегии ведения интервью в зависимости от типа личности информанта [23]. По возможности использовалось формализованное интервью, ориентированное на опросники, охватывающие основные разделы материальной и духовной культуры. Однако ведущая роль в процессе все же отдавалась информанту. В случае переключения на другую тему или ассоциативных отступлений собиратели следовали логике информанта и давали возможность построить разговор тем способом, который был наиболее комфортен для информанта. Таким образом, широко использовалось также неструктурированное интервью. Подобная исследовательская стратегия была обусловлена особым статусом носителей некрасовской традиции. Степень сохранности культурного комплекса в этой этноконфессиональной общности значительно выше, чем в любых других современных исследователю славянских группах. Это обусловило длительное внимание ко многим некрасовцам со стороны фольклористов, этнографов и историков, в результате чего каждый респондент обладает собственным представлением о значимости и структуре традиции [24], которое так же важно запечатлеть, как и фольклорные тексты или этнографические описания. Поэтому в этнолингвистических экспедициях ИСЭГИ ЮНЦ РАН приоритетной стала максимально полная фиксация репертуара, комплекса знаний, культурно окрашенных воспоминаний каждого носителя традиции.
Единицей хранения в создаваемой базе данных решено было сделать полную расшифровку одной аудиозаписи интервью. Таким образом, было соблюдено актуальное для современной фольклористики требование к учету вербального и невербального контекста фиксируемых фрагментов традиции. Однако это же обстоятельство создало и дополнительные трудности, связанные со структурированием записанного материала, сложностью членения его на фрагменты.
Параметры сбора материала определили набор характеристик, используемых для создания электронной базы данных. Текст интервью последовательно разбивается на логически законченные фрагменты, каждый из которых можно описать с помощью набора ключевых слов. Параллельно заполняются справочники, содержащие информацию о респонденте, месте, времени записи и собирателе. Каждый фрагмент создаваемой выборки атрибутируется сведениями из этих справочников. При формировании списка ключевых слов исследователи опираются на перечень, разработанный создателями базы «Полесский архив» и ориентированный на словник этнолингвистического словаря «Славянские древности». Однако специфика исследовательских интересов научной группы определила необходимость расширения этого словника за счет единиц, характеризующих этнографические описания (среди таких единиц — пища, одежда, способы хозяйствования, орудия производства и промысла) и устноисторические тексты об особенностях повседневности некрасовцев в Турции и в России, об их возвращении на Родину и адаптации в новых условиях и т.д.
Ассоциативные и тематические связи между различными фрагментами интервью возможно выявить благодаря нескольким особенностям системы. В базе данных предусмотрены два способа формирования выборок. Первый — в соответствии с тематическим классификатором, называющим наиболее крупные блоки традиционной духовной культуры (родинно-крестильная обрядность, свадебная обрядность, мифологические представления и др.), материальной культуры (хозяйство, поселение и др.), основные группы жанров, принадлежность к меморатам устноисторического характера. При отборе по данному параметру в распоряжении исследователя оказываются достаточно большие фрагменты связного текста, в рамках которых возможен дальнейший поиск, благодаря обращению ко второму классификатору — перечню ключевых слов. Кроме того, оба типа поиска могут использоваться независимо друг от друга.
При разделении текста интервью на смысловые части каждому блоку автоматически присваивается порядковый номер. Сделав выборку по ключевому слову, пользователь может определить, последовательно ли расположены текстовые фрагменты или между ними есть высказывания на другую тему. Таким образом, пользователь получает доступ к более объемным фрагментам текста и может выделять смысловые взаимосвязи, неочевидные при обращении к каждому из фрагментов по отдельности. Наряду с этим в каждом случае планируется делать отсылку к полной расшифровке интервью.
В перспективе предполагается также реализация системы произвольного поиска, при котором в ответ на пользовательский запрос будет выводиться фрагмент, включающий предложение с искомым словом и несколько предложений до и после него, чтобы обеспечить минимальный контекст слова.
Один из вызовов, который стоит перед создателями базы, — это требование о комплексном характере источника [25]. Исследовательские коллективы, занимающиеся архивацией и изучением полевых материалов, решают эту задачу по-разному. Так, работники Американского центра фольклора, функционирующего в рамках Библиотеки Конгресса, выдвигают в качестве методологического принцип этнографической коллекции, при котором работа архивиста направлена на то, чтобы «продемонстрировать взаимосвязь физически разделенных компонентов и, таким образом, вернуть исследование к главной мысли этнографа» [26]. Источники разного типа (фото-, видео-, рукописные материалы), собранные одним этнографом, рассматриваются как элементы одной коллекции.
Над установлением взаимосвязей между источниками разного типа работает коллектив СПбГУ. Предполагается, что по единому запросу исследователь-пользователь архива будет получать доступ к различным категориям данных (текст, планы, фотоизображения, звук и др.), отвечающие параметрам запроса [27].
В базе данных по традиционной культуре казаков-некрасовцев также предполагается установление гиперссылок и других вариантов связей между материалами различного типа. На первом этапе планируется подготовить описание фотографий с помощью того же набора ключевых слов, что и текстовых фрагментов, для того чтобы они могли индексироваться системой в ходе поисковых запросов. В дальнейшем возможно ассоциирование аудиозаписей или их фрагментов с текстами расшифровок.
Подготовка базы данных в программе MS Excel с последующей обработкой в MS Access позволяет в случае необходимости переконфигурировать базу: добавлять и удалять поля, включающие метакультурную, справочную, классифицирующую информацию.
Как представляется, работа над базой данных позволит решить ряд проблем как теоретического, так и практического характера: ввести в научный оборот значительный объем текстов, характеризующих диалект, культуру и устноисторические представления казаков-некрасовцев; разработать принципы для системного стандартизированного описания комплекса источников разного типа; сформировать перечень ключевых слов, характеризующих по основным параметрам некрасовскую традицию; в процессе работы над атрибуцией текста с помощью ключевых слов исследовать вопрос смыслового членения текстового массива.
Примечания
1. Статья подготовлена в рамках проекта «Историческая динамика традиционной культуры казаков-некрасовцев» Программы фундаментальных исследований Президиума РАН «Традиции и инновации в истории и культуре».
2. Верняев И.И., Панкратов В.Б., Чугунов А.В. Распределенный межрегиональный электронный архив полевых этнографических данных // Этнографический архив. Электронный ресурс. Режим доступа: http://www.ethnography.ru/win/print2004_01.htm.
3. Tangherlini T.R. The folklore macroscope. Challenges for a computational folkloristics // Western Folklore. 2013. Vol. 72. № 1. P. 8.
4. Алпатов С.В., Ковпик В.А. Принципы построения полнотекстовой базы данных по фольклорным материалам // Типология фольклорной традиции: Актуальные проблемы полевой фольклористики. Материалы Международной научной конференции к юбилею Нины Ивановны Савушкиной (Москва, 22–23 ноября 1999 г.). М., 2004. С. 77.
5. Верняев И.И. и др. Указ. соч.
6. Плотникова А.А. Полесский архив: база данных и исследования // Живая старина. 2012. № 4. С. 35, 38.
7. Tangherlini T.R. Указ. соч.; Плотникова А.А. Указ. соч. С. 35.
8. Алпатов С.В., Ковпик В.А. Указ. соч. С. 77.
9. Там же. С. 79.
10. Там же. С. 79; Корепова К.Е., Шеваренкова Ю.М. Ключевые слова как способ систематизации устной религиозной прозы // Актуальные проблемы полевой фольклористики. Вып. 2. М., 2003. С. 99.
11. Мороз А.Б. От полевого исследования к архиву. Принципы архивации фольклорных материалов в российской фольклористике // Словенски фолклор и фолклористика на размећи два милениjума / Уредник Љ. Раденковић. Београд, 2008. С. 205.
12. Плотникова А.А. Указ. соч. С. 36.
13. Там же.
14. Мороз А.Б. Фольклорный архив лаборатории фольклористики Российского государственного гуманитарного университета // Славянская этнолингвистика. Комиссия по этнолингвистике при Международном комитете славистов. Проект Растко. Электронный ресурс. Режим доступа: http: //www.rastko.rs/rastko/delo/12045
15. Там же.
16. Верняев И.И. и др. Указ. соч.
17. См. напр.: SPBGU-ADEA-TD-Novotorzhskiy-2011-Petrova-1. Тетрадь полевых записей студентки I-го курса Д.О. Петровой Екатерины // Полевой архив. Электронный ресурс. Режим доступа: http://archive.history.spbu.ru/expedition/spbgu-adea-td-novotorzhskiy-2011-petrova-1.
18. Мороз А.Б. Фольклорный архив…
19. Алпатов С.В., Ковпик В.А. Указ. соч. С. 79.
20. Tangherlini T.R. Указ. соч. С. 16.
21. Предварительные результаты полевых работ были проанализированы Т.Ю. Власкиной в статье «К вопросу о современном состоянии традиционной культуры казаков-некрасовцев, проживающих на Ставрополье: итоги комплексной экспедиции ЮНЦ РАН – ЮФУ 2010 г. (Мир славян Северного Кавказа. Выпуск 6 / Науч. ред., сост. О.В. Матвеев. Краснодар, 2011. С. 111–119).
22. Разработкой принципов классификации материала и наполнением базы занимаются исполнители проекта «Историческая динамика традиционной культуры казаков-некрасовцев» Н.А. Архипенко, Н.А. Власкина, Т.Ю. Власкина, Н.С. Попова, Т.Е. Гревцова. Также в базе используются материалы, собранные участниками экспедиций ИСЭГИ РАН М.А. Карпун, И.Ю. Калиниченко, А.И. Зудиным. Программным воплощением исследовательской модели руководит специалист в области информационного образования И.А. Ефимова.
23. Примеры зависимости исследовательской стратегии от личностных особенностей информантов могут быть найдены в обобщении результатов экспедиции к донским калмыкам, сделанном Т.Ю. Власкиной (Архипенко Н.А., Власкина Н.А., Власкина Т.Ю., Калиничева Н.С., Попова Н.С. Традиционная культура в современных общественно-политических процессах южного макрорегиона // Проблемы социально-экономического и этнополитического развития южного макрорегиона / Г.Г. Матишов, В.А. Авксентьев, М.А. Агларов и др. / Матишов Г.Г. (гл. ред.). Ростов н/Д: Изд-во ЮНЦ РАН, 2012. С. 464–466).
24. Власкина Т.Ю. «Вернулись казаки до своего языка»: реэмиграция 1962 г. в устной традиции казаков-некрасовцев // Проблемы новистики и исторического славяноведения: памяти С.В. Павловского. Материалы международной научно-практической конференции / под ред. Э.Г. Вартаньян, О.В. Матвеева. Краснодар, 2010. С. 158; Зудин А.И. К вопросу о формировании и трансформации идентичности казаков-некрасовцев // Традиционная народная культура и современность: проблемы сохранения и возвращения в жизнь: материалы научно-практической конференции. Краснодар, 29–30 ноября 2011 г. Краснодар, 2011. С. 196–197.
25. Мороз А.Б. От полевого исследования к архиву… С. 204.
26. M. Maguire, G. Parsons, цит. по: Kerst C.H. Providing access to multi-format ethnographic field documentation: archieval practice in the American folklife center // Folklore Forum. 2004. № 35. P. 30.
27. Верняев И.И. и др. Указ. соч.
Материал опубликован в том виде, как был предоставлен организатором конференции - Научно-исследовательским центром традиционной культуры ГБНТУ «Кубанский казачий хор».
Оставить свои комментарии или задать вопросы авторам докладов Вы можете с 29.11.2013 г. по 29.12.2013 г. по электронной почте slavika1@rambler.ru
«Этнокультурное пространство Юга России (XVIII – XXI вв.». Всероссийская научно-практическая интернет-конференция на официальном сайте Кубанского казачьего войска http://slavakubani.ru/.
Краснодар, ноябрь-декабрь 2013 г.