陈建宪 发表于 2005-7-31 16:37:48

[论文]陈建宪:《中国洪水故事数据库试探》

中国洪水故事数据库试探
                                      
(论文提要)
(华中师范大学文学院 陈建宪)

以口语媒介为载体的民间叙事,必然具有多文本存在的特质,故互文性批评是研究口头叙事的基本原则之一。从历史地理学派风行以来,尽可能搜集一个故事的多个文本,通过分析这些文本的异同来追寻这个故事的原型、亚型及其流传演变轨迹,成为国际口头叙事文学研究的主流。时至今日,民间口头叙事的研究需要尽可能多的异文,已经是学界的常识了。
由于口头故事寄存于书面文献中,于是人们在研究一个故事类型时,总是千方百计去寻找不同时空中关于这个故事的书面文本。但当人们花费千辛万苦获得庞大的口头叙事文本时,常常感到既高兴又无奈。高兴的是有了丰富的研究资料,无奈的是要把握大量文本中细节上的千变万化,是一件非常困难的事情。
以中国洪水再殖型故事为例,笔者所搜集到的相关文本多达568篇,如何通过互文性批评来揭示如此之多的文本内容之间的关联性,是一个非常棘手的问题。尝试过民间故事类型研究的人都知道,对于异文数量相对较少、变化不太复杂,母题不是太多的故事类型来说,我们凭借不太复杂的分析技术,就能归纳出它的各种亚型。但对于洪水再殖型故事这样一个流传历史久远、涉及民族众多、异文数量巨大、结构复杂多变的类型来说,凭感觉、卡片和表格已经很难把握其共性与变化了。即使勉强做出亚型划分,也容易漏洞百出。
为了克服中国洪水故事文本数量巨大而又形式多变难以把握的困难,笔者考虑到电脑强大的功能和数据库的普及,经过多次尝试,终于研究出一种方法,运用电脑办公软件OFFICE中最常用的数据库ACCESS,对洪水故事进行既简明又能无限深入的描述。
任何一个故事类型,在其文本集合中都有常量和变量两种因素,所谓常量,就是只要属于这个类型就必须具有的情节元素,我们称其为不变母题。以洪水再殖故事为例,洪水、遗民和再殖,是这个故事类型中不可缺少的元素,就是不变母题。而什么原因导致洪水、洪水后的遗民是什么身分、他们以什么方式再殖人类等,就是变量,也称作可变母题。我们只要将每篇异文中的不变母题与可变母题输入数据库,就能按照研究的需要,从数据库中进行任意组合的检索,从取得的不同母题以及不同母题组合的数据,来对故事进行不同深度的描述。
操作方式是:首先,我们将洪水再殖型故事归纳为四句话:1、由于A原因,天神发洪水毁灭了人类;2、由于B原因C得到神的护佑或其它帮助,用D法在洪水中幸免于难;3、在神的护佑或帮助下,C通过E考验而结成家庭;4、C以F方式使人类得到再繁衍,这成为G事物的由来。
上面四句话,每一句都是一个“情节段”,每个情节段皆由一系列母题构成,可称为一个“母题链”。四个母题链按基本上一致的顺序与叙事语法接续起来,就成为这个故事类型的“情节基干”。但是一个故事类型常有若干个变体,也就是“亚型”。
中国洪水再殖型故事中最重要的可变母题有7个,即上面提到的A(洪水起因)、B(获救原因)、C(遗民)、D(避水方式)、E(难题求婚)、F(再殖方式)、G(事物解释)。每个可变母题的变化值,以该母题的代码加阿拉伯数字来表示,如在“A”(洪水起因)中,有原始之水、天灾、天神相争、人神不和、过失降洪等变化值,就分别以A1、A2、A3、A4……来表示。如果在这一级变量中还有变化值,例如天灾,可以是洪水、地下水、地震、海啸等等,则仿照美国国会图书馆分类法的方式,在上一级代码之后,再以不同数字层累为:A21、A22、A23……。这样,就形成了一个可以无限展开的主题词表。如A类可表达为:
A、洪水起因      
0、无
1、原始之水
2、天灾
3、天神相争
4、人神不和
5、过失降洪
6、动植物致洪(61、树 62、鱼 63、螃蟹 64、青蛙 ……69、其他 )   
9、其他起因
……
按上述方法,从理论上说,我们可以用这个代码系统将洪水再殖型故事中所有异文的所有变量都表达出来。不过我们目前的数据库,只是针对研究需要,将每篇异文中最重要的7个可变母题的变化值进行了标识。此外,对于每篇异文的相关背景,如国家、民族、地区、篇名、讲述者、记录者、翻译者、记录时间、出版项、文本形式等等,当然也作了著录。有了这个数据库,我们就能对中国洪水再殖型故事的文本数量及母题变化状态作出描述,这就为今后的研究打下了客观基础。

(说明:数据库样例粘贴后变形,如果附件上传成功,请参看附件。)

陈建宪 发表于 2005-7-31 16:40:30

RE:[论文]陈建宪:《中国洪水故事数据库试探》

哈哈,上传成功了。
还要有劳版主按统一要求处理,谢了!

刘宗迪 发表于 2005-7-31 21:06:51

RE:[论文]陈建宪:《中国洪水故事数据库试探》

对于像民间故事这种存在大量重复性数据又体现出灵活的变异性的现象,数字化研究是一条彻底解决之道,陈老大第一个吃螃蟹,率先垂范,成果可贺,盼望早日看到全璧。

之农 发表于 2005-8-7 11:21:33

RE:[论文]陈建宪:《中国洪水故事数据库试探》

新媒介视野。
[ 本帖由 之农 于 2005-8-7 11:27 最后编辑 ]

吉国秀 发表于 2005-8-10 12:15:25

RE:[论文]陈建宪:《中国洪水故事数据库试探》

愿意与陈老师多学学!!!

民俗学爱好者 发表于 2005-8-11 09:43:04

RE:[论文]陈建宪:《中国洪水故事数据库试探》

一种新的研究视角。

老蒙 发表于 2005-8-11 21:33:37

RE:[论文]陈建宪:《中国洪水故事数据库试探》

很有启发,非常佩服!可惜读到这篇文章的时间太晚了,如果早几年读到,我的一个东西可能会做得漂亮些。对于非结构性知识的结构化处理是一个很劳神的事情。我曾尝试用归因分析、语言投射分析、词频统计分析来对付数据库里一大堆很有价值的非结构性语句材料,都没有得到满意的结果,留下一个遗憾。楼主这种方法对于知识的梳理、表达、理解和共享都是很有价值的,尤其是对非结构性知识的分析应该有普遍的参考价值。感谢!
另外,楼主的方法也让我想起有一份材料讲到施乐 (Xerox) 公司的Eureka知识管理系统,可惜一时没有翻出来,那种知识处理的方法对于这个问题的认识可能会有帮助。
[ 本帖由 老蒙 于 2005-8-11 21:36 最后编辑 ]

陈建宪 发表于 2005-8-12 08:41:40

RE:[论文]陈建宪:《中国洪水故事数据库试探》

承蒙过奖。老蒙先生,不知你所尝试处理的是一种什么对象,此外,你所说的归因分析、语言投射分析,不知什么地方有实用性的讲解,烦请介绍几种,供大家共同学习。
此外,我正在修订这个数据库,希望能在不久后让大家共享,并且共同充实和完善它,以造福于所有对这个故事和民间叙事研究感兴趣的人。

老蒙 发表于 2005-8-12 12:08:44

RE:[论文]陈建宪:《中国洪水故事数据库试探》

对于民俗学俺是门外汉,为了做一个乡村文化的项目,想借助文化人类学的方法,此番到坛子里来是偷拳的。你的两个问题:
(1)我尝试处理的是问卷调查的一些语句。那是1995到1998年,俺主持了两次全国问卷调查,叫做“全国公众看安徽”。在问卷设计的时候就考虑到,封闭性的问题和半封闭性问题这类结构性数据比较容易做计算机的统计处理,但是,结构性太强可以会丢失一些非常关键的东西。如果没有开放性题目,即非结构性的题目出现在问卷里,无论如何都是一种缺憾。最后,还是安排了几题,比如:“提到安徽,你首先想到的是什么?”以及“之所以安徽_______,是由于_______。”等等。这些数据录入计算机以后,尝试过很多方法想挖出一些东西来。但是,当时我的“工具箱”里的手段还是太少,加之样本量太大(发了一万份,回收七千多份)。最后只做了一个词频统计分析,还很不理想。
(2)俺教过几年心理学,归因分析和语言投射分析都是心理学里的工具,不知道对先生的工作有没有用。归因分析认为,语句或判断取决于我们对给定行为以何种意义的解释。具体内容可以参考心理学中海德的归因指向(内、外、内部为主的综合、外部为主的综合),以及维纳的归因变异(稳定、变化)。语言投射分析就是建立一个包括对象、广度和深度在内的三维框架,对非结构性语句做结构化的处理,主要用于了解公众舆论关注的中心和强度。这里“对象”就是公众语句中反映出来的、所关注的事物和领域,比如器物、经济、政治、精神文化、国际等;“广度”是关注的水平强弱(或者态度倾向);“深度”是与主体现实生活的密切水平,有直接联系、间接联系、几乎没有联系、没有联系。上述方法与先生使用的方法有相似的地方,都在解决非结构性语句的结构化问题,但是没有你的方法更系统和更有灵活性.施乐 (Xerox) 公司的Eureka知识管理系统的方法也给我这个印象,但是我却没有与我要做的事情联系起来。再次感谢你!

陈建宪 发表于 2005-8-12 15:48:54

RE:[论文]陈建宪:《中国洪水故事数据库试探》

老蒙先生,谢谢你的介绍,为我打开新的眼界。从简介来看,语言投射分析似乎是新闻学或传播学的方法,不知对否?

老蒙 发表于 2005-8-12 17:51:47

RE:[论文]陈建宪:《中国洪水故事数据库试探》

是不是可以这样看,方法本身是一种工具,在哪个学科里使用主要取决于这种方法能否达到目的,以及是否合用。我所见到的这种语言投射分析应该说还是比较粗陋的,还有很大的改进空间。但是即使如此,还是可以设想到它的许多应用领域,比如:传播学、新闻学、舆论学、社会学、社会心理学、精神病学、……,当然如果有必要也可以用于民俗学。上面所言仅是在下一孔之见。不揣浅陋,是希望能够得到各位的指教。
[ 本帖由 老蒙 于 2005-8-13 07:20 最后编辑 ]

2003916 发表于 2005-8-15 01:36:50

RE:[论文]陈建宪:《中国洪水故事数据库试探》

因我的书还在行李里,所以我的发言是由记忆而来,可能有不够准确的地方.我记得张光直先生早在二十世纪的六十年代(?),就利用计算机对殷周青铜器作了种种令人耳目一新的分类,不过他分类后所得出的结论,却没有太多的引人入胜之处!这个例子可以说明:机器的分类只是人的分类的改善和推进,它并不能从根本上取代人的工作!实际上,正是有了陈建宪老师在前期对洪水神话类型的正确划分,才使得计算机发挥了巨大的作用!

老蒙 发表于 2005-8-17 14:57:08

RE:[论文]陈建宪:《中国洪水故事数据库试探》

在下以为,楼主的贡献在于,通过故事表述结构的标准化和故事情节元素的标准化,找到了一种适合于整理、统计、分析洪水再殖型故事的知识管理方法。

所谓“故事表述结构的标准化”,就是楼主所说的“1、由于A原因,天神发洪水毁灭了人类;2、由于B原因C得到神的护佑或其它帮助,用D法在洪水中幸免于难;3、在神的护佑或帮助下,C通过E考验而结成家庭;4、C以F方式使人类得到再繁衍,这成为G事物的由来。”这个结构是所有洪水故事共性的表述结构。

所谓“故事情节元素的标准化”,就是楼主把所有母题的亚型编了号,而且这种编号是可扩展的。

如果能够把故事流传的背景信息(比如,故事流传区域、民族、时间,甚至讲述者的情况)输入数据库,结合相关历史文化资料深入研究,有可能把这个故事的来龙去脉弄清楚,并且绘出一张故事演变示意图来。

2003916 发表于 2005-8-18 00:00:29

RE:[论文]陈建宪:《中国洪水故事数据库试探》

陈老师的工作是非常有意义的,其重要的意义在于:为分析洪水神话的逻辑结构提供了"竭泽而渔"式的可能!但各民族洪水神话的逻辑结构与历史结构之间的对应关系,却是很难证明的一些难题,光看纯粹的逻辑结构是无法弄清它们的来龙去脉的,而结合了相关的历史文化资料就能看清楚吗?民间文学类型学是应当成为同仁们相互交流的专业语言,或标准器;可彻底的数理化对计算机的分析而言是提供了方便,对人的分析而言呢?我决不是在挑陈老师的刺,而是希望大家不要太把新方法视为灵丹妙药,我们应根据研究对象的复杂情形,思考适应性更强的研究途径!
[ 本帖由 2003916 于 2005-8-18 00:01 最后编辑 ]

老蒙 发表于 2005-8-18 09:12:05

RE:[论文]陈建宪:《中国洪水故事数据库试探》

我一贯有理想主义的传统。3916批评得是,我是过于理想和简单地看待故事的演变图景了,目前的方法能够提供资源与理想状态之间还有许多链没有接起来,还应该继续探寻。
页: [1] 2
查看完整版本: [论文]陈建宪:《中国洪水故事数据库试探》