摘 要:语料库语言学兴起于20世纪80年代,是一门新兴学科,它致力于文本的检索、取样、分析以及统计。语料库工具如Word Smith、AntConc等都可以为文本,尤其是有情节性的文学文本的分析提供重要的理性依据。通过语料库语言学的研究方法,主要运用AntConc软件中“Word List、Concordance、Concordance Plot、Keyword List”等工具来分析毕飞宇《推拿》的文本内容和主题、人物性格特点和情节发展等。
关键词:语料库 AntConc 《推拿》
一、引言
语料库语言学作为一门新兴的边缘学科,很好地结合了自然科学与文学,近年来语料库语言学正以其独特的优势迅猛发展(杨惠中,2002)。语料库工具可以对任何一部文学著作进行分析,无论其长短难易。无论是否看过文本内容,语料库语言学可通过强大的加工、分析及统计功能,对文本的主题、人物及情节发展进行趋理性的分析,“剔肉取骨”,使在短时间内把握文本的核心骨架成为可能,甚至通过语料库的加工分析可以发现直观情况下所不能发现的某些规律。
本文通过使用AntConc工具对文本进行提纲挈领式的分析研究,如“Word List”通过词频进行排序,词频由高到低一目了然;检索功能“concordance”可以将所有包含被检索词的句子片段罗列出来,方便对被检索词所处情景进行分析;检索情节“concordance plot”可以直观地再现被检索词在整个文本中的位置及疏密程度。总之,语料库强大的检索工具可以通过各种功能分析统计出文本中词语的出现频率,文本中词汇量的大小以及在全文本的各个章节关键词(人物、事件等)出现的疏密程度等。另外,一个文本还可以通过与另一个文本的对比分析其主题词,发现一个文本区别于其他文本的独特之处。
以往的文学鉴赏家对于著作本身的研究,仅仅局限于对原文斟词酌句的研究,分析言外意,得出对文学作品中的情节转化与人物塑造的理解与阐述。然而,不容忽视的是,结论带有很强的主观性,不免有些偏颇(贺亚男,2009)。因此,引进理性主导的语料库检索研究,能够很好地从客观的视角对文本进行分析和加工,从而提供更加令人信服的鉴赏成果,再结合传统的主观鉴赏,无异于为文学鉴赏锦上添花,同时也输入了新鲜的血液。
本文以中国作家毕飞宇的《推拿》作为研究文本,主要运用AntConc中的“Word List、Concordance”等工具来分析小说的概要、语言特色、情节发展以及人物塑造等方面,达到对原著更加理性化的分析,从而为文学名著的研究开辟一个新的途径。
二、运用语料库软件AntConc分析小说《推拿》
(一)通过AntConc中“Word List、Concordance Plot”等工具分析主题及文本内容
运用Word List对小说《推拿》文本中出现频率在前54位的词进行检索,绘制成以下表格。
表1:《推拿》中出现频率在前54位的词
通过对表1频率前54位的人称代词的观察,“他”出现1514次,“她”出现1118次,分别位于第8和第10位;而“你”出现702词,位于第19位;“我”出现515次,位于第33位;“他们”出现409次,位于第40位。通过人称代词的频率和排名,可以清楚地看到,在《推拿》这篇小说中主要运用的第三人称来叙述,且男性代词的使用要远远超过女性代词的使用。
“王大夫”出现的频率是920,位居第14位;“沙复明”出现的频率是787,位居第16位;“都红”出现的次数是640,位于第24位;“小孔”出现的次数是615,位于第27位;“金嫣”出现的次数是583,位居第29位;“小马”出现的次数是531,位于第32位。从这么多的人名中可以发现,此故事涉及到的人物很多。
通过对前54位频率词的搜索,其中最为关键的词是“推拿”,虽然“推拿”这个词出现的次数是297,位居第53位,但是其他的高频词也是其他文本所共有的高频词(人名除外),像出现次数较多的“的”“了”“是”等。所以,从这里可以推断出这是一部关于“推拿”的小说;其次,在用“concordance plot”检索“王大夫”等人的关键词时,发现了都会有“盲人”这个词与之相搭配,这说明了这部小说在描写一群盲人的生活,他们是以推拿为生的。
(二)运用“Word List”和“Concordance”分析人物性格
从表1中可以发现,“了”字出现的频率是5039,位居第二位,所以本文叙述的很多事情都是已经完成的。另外,“说”字在文中出现的频率是1262,位居第9位,表明文中多是以对话的形式展开的,这是此小说文体特征的一个很大的特点。用对话的形式可以将文中各个人物的语言特色清晰地表达出来,从而能够鲜明地表现出各个人物的性格。
在“concordance plot”里面输入“王大夫”,得到
从上***可以看到,“王大夫”是主要人物,是出现次数最多的人名,共达920次。从分布***上来看,王大夫这个人物主要在小说的前几章和后几章出现,而中间部分出现得较少。在“Collocate”里检索“王大夫”时,和它搭配的有“盲人”“挣钱”“疑惑”“魁梧”“愤怒”“笑”“恋爱”等词,从这些词,结合小说,我们可以知道王大夫是一个盲人,在他的人生中有哭有笑,有着和正常人一样和不一样的地方。
在“concordance plot”里面输入“沙复明”,得到
沙复明也是小说中的主要人物,从上***中可以看出,沙复明一直贯穿于小说的始终。在“Collocate”里检索“沙复明”时,和他搭配的词有“恭恭敬敬”“笑笑”“老板”“推拿中心”“胃痛”等。从这些词中我们可以发现沙复明这个人物是一个正面人物,是推拿中心的老板,且为人十分温和、有头脑。
在“concordance plot”里面输入“都红”,得到
“都红”在文本中出现的频率是640,也是小说的主要人物,从以上***例可以看出,都红大部分是在小说后面部分出现的,也就是说都红在故事的结尾是十分重要的。在Collocate里搜索“都红”时,和他搭配的词有“聪明”“唱歌”“推拿”“盲人”“烂手艺”“热火朝天”等,从这些词中可以推断出都红也是一个盲人,之前是从事唱歌的,但之后又从事了推拿这一行,刚开始可能手艺比较差,但之后她的生意特别红火。
(三)通过语料库语言学“Keyword List、Concordance Plot”等工具分析小说的情节发展
要理解一部小说的精髓,必须掌握其行文的脉络和情节。这种对情节发展的把握可以通过对原著的通读来完成。本文使用的方法是通过使用AntConc语料库检索软件中的“Keyword List,Concordance Plot”及“File View”功能对小说的情节进行统计分析。由于只通过词频用“Word List”对文本的故事脉络把握得还不是很明晰完整,所以本文通过《推拿》和同样为毕飞宇所著的《青衣》比较获得的“Keyword List”对文本进行进一步的分析。“Keyword List”所列单词是观察文本相对于另一参照文本所列出的与其有显著差别的词,这对于突出《推拿》文本的特征及区别于其它文本的独特之处有很大的帮助。
表2:《推拿》对比《青衣》按照差异性显著性(Keyness)排列的单词
表2排在前几位的词大部分是人名,这告诉了我们小说中的主人公都有哪些;其次,差异性较大的还有“推拿”和“盲人”这两个词,显然,盲人是小说所要描绘的一个群体,而且,小说是围绕着“推拿”来进行的。因此,《推拿》这部小说讲述的是一群以推拿为生的盲人的人生境遇。在显著性排名第31位的是“南京”,这说明小说中故事的地点是南京;“婚礼”这个词的显著性在第28位,“恋爱”在第36位,这都在一定程度上说明此小说有很大一部分是描写爱情的。“手机”的显著性排第21位,从这里可以看出这部小说是发生在现代的,在许多方面都是和我们日常生活相关的。其中,《推拿》这部小说喜欢用声音词“咔嚓”,这也是这部小说的一个特点。通过对这些显著性差异较大的词进行分析,可以大致地揣摩出整个小说的故事情节,这群盲人推拿师在过着他们心目中的现代恋爱生活,但透过这小小的故事可以窥探出属于这个特殊群体的别样的人生感悟。
三、结语
基于语料库的文学作品分析方法“虽然在语言特征判断方面无重大突破,但实施起来却快捷、准确,省时省力,而且证据充实,令人信服”。(何安平,2001)
以上运用语料库检索对毕飞宇的小说《推拿》进行了分析,准确清晰地把握了小说的发展脉络,并对其主题、人物特点和情节发展进行了统计分析。当然,以语料库为工具对文本的分析不能代替对文学文本本身的鉴赏,但毕竟为我们认识作品提供了佐证。因此,将自然科学中的计算机技术与文学中的文本进行结合,可以为文学研究另辟蹊径,即以***形、列表、统计等量化的方法分析文本,从而得到对文本更加理性的诠释。
参考文献:
[1]Biber,D.Conrad,and Reppen,R.Corpus linguistics:Investing language structure and use[M].Cambridge:Cambridge
University Press,1998.
[2]何安平.用语料库研究语言[M].北京:外语教学与研究出版社,2001.
[3]贺亚男.基于语料库的文学语篇分析――以《外婆的日用家当》为例[J].内江师范学院学报,2009,(5).
[4]李绍兴.基于语料库的文学语篇分析――以《屋顶丽人》为例[J].咸宁学院学报,2011,(8).
[5]王雁.《傲慢与偏见》的语料库分析[J].江苏教育学院学报(社会科学版),2007,(5).
[6]王立非,孙晓坤.国内外英语学习者语料库的发展:现状与方法[J].外语电化教学,2005,(5).
[7]杨惠中.语料库语言学导论[M].上海:上海外语教育出版社,2002.
[8]张厚振.基于语料库的海明威作品《一个干净、明亮的地方》[J].新乡教育学院学报,2004,(2).
(丁晓 浙江宁波 宁波大学外语学院 315211)
转载请注明出处学文网 » 语料库AntConc软件对《推拿》的分析研究