索尔人英雄史诗研究中的数字文本语料库资源
    
工作单位: 俄罗斯科学院民族学与人类学研究所
译者: 玉兰    审校: 阿地里•居玛吐尔地

  索尔人是西伯利亚地区人口较少的族群,俄罗斯2010年的人口统计中只有12,888人。这个民族以其丰富的史诗传统著称。在过去的150年中,拉德洛夫等众多学者和爱好者前来对他们的史诗传统搜集、录音。据本人所知,各种档案库和个人收藏的索尔史诗文本至少有280种。从1861年到2010年,有26个文本已经以绍尔文出版,其中只有17个文本是全篇。更糟的是,早期的多数出版物现在很难找到,对于本地的索尔人来说更是如此。

  为了让学者和其他爱好者能够利用西伯利亚本地语言的一些资料,2011年我主持了一个项目“西伯利亚原住民语言的民俗文本语料库” (http://corpora.iea.ras.ru), 负责的团队是俄罗斯科学院民族学与人类学研究所北方和西伯利亚研究室。

  该语料库有以下特点:

  搜索某一词和其语境;

  找出某一词汇的搭配方式;

  统计词频,对不同文本的词频表进行比较;

  对任意两个文本进行句式比较,找出重复表述;

  通过该语料库,学者可用各种方式分析史诗文本。鉴于上述功能,该语料库对语言学家,民俗学家,文化人类学家等都有很大价值。在本次发言中我将探讨对绍尔史诗以及萨彦-阿尔泰突厥部落(Sayan-Altai Turkic groups)史诗文本的搜集、录音、标准化、出版等过程中的基本原则和存在的问题。