摘要: 女书是中华文明的瑰宝,本文通过开展女书信息化工程对女书文化进行保护和传承,女书信息化工程分为构建女书字符集、设计女书输入法、开发女书网站、设计文书文献FLASH演示系统、建设女书虚拟碑林园、女书字符规范化和女书文献识别七个环节,这七个环节循序渐进而又各有侧重,前五个环节重在利用信息技术对女书进行保护和传承,后两个环节则将以女书为载体,开展模式识别、人工智能等领域的科学研究。最新的研究成果在文中一一作了介绍。
关键词: 女书;信息化;规范化
1开展女书信息化工程的意义
1983年,中南民族大学女书文化研究中心鉴定出流传在湖南省江永县一带妇女中的女书,是一种独特的女性文字体系。该消息迅即引起了海内外众多媒体和学者的浓厚兴趣和广泛关注[1]。
女书是世界上最具性别意识的文字,是女性文字的唯一“活化石”[2]。它在结构和书写上有非常显著的特点:女书的笔画只有点、竖、斜、弧四种,其最富有特色的笔画是它的“弧笔”,弧度或大或小,变化多端(如***1所示)。字符形体呈长斜体菱形,一般右上角为全字的最高点,左下角为全字的最低点。书写格式自上而下,从右到左,没有标点符号,不分段落,一书到底[4,5]。
尽管女书在学术上的价值已得到国内外学者的共识,但对于女书本身,随着女书老艺人的相继去世,则出现了生存处境艰难、未解之谜众多、文献散失严重、收集整理困难等问题,属于濒危的文化遗产。采用信息化技术对复杂背景下的女书字符进行规范化与识别,对抢救和保护女书这种中华民族珍贵的文明基因具有非常重要的理论意义与实用价值。女书的信息化工程是一个文化抢救工程,对延续中华民族传统文化,对妇女学、女性文化、民俗学、古文字学、语言学等领域的研究都具有不可估量的价值。随着时间的推移,通过它所产生的社会效益和历史价值是用金钱无法衡量的。本项目的研究成果可用于其他少数民族文献及古籍(如水书、古彝文)的保护和信息化工作。
2女书信息化工程的总体思路
女书信息化工程的总体思路如***2所示。
从信息化的角度来讲,首先要有能够在计算机中显示女书字符的女书字库,这是信息化的基础。其次还应有相应的输入法与之配合,使得女书的计算机显示、输入、修改、复制、剪切、粘贴和打印成为可能。以上两步可统称为建立女书信息交换用显示输入应用平台,这一基础性平台将使女书获得通向信息时代的通行证,实现“数字化生存”。这一平台建立好之后,可着手建立一个“中华女书网”,主要从事女书文字、音像资料的收集整理,女书字库和输入法推广,女书教学,女书创作,女书专家和爱好者交流、女书论坛等工作。与此同时,采用Flas技术、虚拟现实技术对女书中重要的文献以Flash电子画卷和虚拟碑林的形式加以固化保护,Flash电子画卷和虚拟碑林将从形、音、义、唱等多角度全方位对女书加以推广。
3女书信息化工程进展情况
3.1 女书字符集构建构建女书字符集首先要保证所收录的字符是真正“原汁原味”的女书。女书虽然古本失存,史志无载,给女书历史的研究带来了巨大的困难。但是语言文字的历史与民族文化的历史往往是并行发展的,而且语言文字比民族文化更具稳定性,不少古代民族文化消失了,其中某些因素却仍保存在语言文字中,因而语言文字本身就是一部历史,研究者有可能发掘语言文字中的历史沉积揭示语言文字的某些被淹没了的历史。这就要求研究者必须坚持严肃的研究态度,实事求是,运用科学的研究方法,摒弃追名求利的影响。为此,我们的女书字库将采用凝结谢志民教授半生心血的《中国女字字典》为字源。这本字典的编纂从1983年的女书单字汇编即已开始,至2006年底完稿,历时二十有四年。使用的材料包括:①谢志民教授收集的:1983年前遗存的女书作品25篇,36462字;公认的女书传人高银仙老太太抄存的女书作品390篇(首),84008字;高银仙老太太本人撰写的女书作品45篇(首),8937字;义年华老太太抄存的女书作品117篇(首),10287字;义年华老太太早期撰写的女书作品5篇,5294字。共计原始传统女书作品582篇(首),144988字。②《中国女书合集》(赵丽明编著,中华书局,2005)第一册,传世佚名女书作品62篇,35000字;第二册,高银仙女书作品180篇(首),62000字。从中辨析,采集出女书单字2435个。每字严格保持其字符形体结构原貌,按已故公认的女书传人高银仙和义年华两位老太太读解女书作品使用的女书书面语音系标音注义,并一一标明出处,以备查考。该书稿由国家新闻署资助,已于2009年3月由民族出版社出版。
其次,建立女书字符集要有一套比较规范的女书手写字符作为信息化标准字符集的底本。女书字符集应尽可能的保持女书的原貌,原因依旧是在女书尚有众多未解之谜的情况下,不希望后人的擅自变化或是艺术化处理破坏了女书原始的形体结构。为此,我们专门聘请了高银先的孙女胡美月女士来中南民族大学作为研究顾问,按照当年高银先教她的女书笔法,为我们书写了全部2435个女书字符。所有字符均经过谢志民教授严格批阅审查,确保字符书写的原生态化。
在得到2435个规范女书字符之后,我们采用***像处理的方法对字符逐个进行了边沿平滑和放大,再将修正的字符***片导入字符处理软件中对字符做进一步修订,最后生成可被Windows系统使用的True Type字体文件,于是计算机就可以正确的显示女书字符了。(***3)
3.2 女书输入法设计建立女书字符集之后,需要有与之相配合的输入法。在信息时代,女书输入法不仅承担女书字符的输入、传播功能,还担负着女书教学和延续的重要功能,是女书文化传承与发扬的重要工具。输入法与其每一个女书字符之间的关系,要考虑女书自身的特点,输入者的输入习惯,基于工程心理学的原理***设计,同时不需要预装汉字字库和汉字输入法,这对女书走向国际有着重要意义。
如前文所述,字符集中的每个字符均按已故公认的女书传人高银仙和义年华两位老太太读解女书作品使用的女书书面语音系标注国际音标,但国际音标在中国并不普及。为了首先让女书在其故乡中国得以顺利传播,谢志民教授在中国女书字典的最后附上了《女书音标与汉语拼音字母对照表》,我们根据这张对照表,将女书国际音标“翻译”成了女书拼音,然后根据这些女书拼音,制作了女书拼音输入法。(***4)
拼音输入法需要使用者熟悉2300多个女书字符的发音,这并不容易。为了让一般的打字员经过短时间的培训就可以输入女书文稿,我们参考了汉字中五笔输入法,设计女书的部首输入法。其思路是将女书依一定的规则分成为一些部件的组合,将这些部件分布在键盘不同的字母上,按一定顺序输入这些字母,就可以组合成一个女书字符。如果说拼音输入法的要求是知音会打,那么对女书部首输入法的要求则是“规则简洁,见字能打”。女书部首输入法现已申请国家发明专利。(***5)
我们现已用两种输入法完成了大量女书文章的录入工作,共录入女书文章200余篇,累计输入女书文字3万多个。
3.3 女书网站建设如何向从未接触过女书的国内外人士介绍和传播女书文化是一直困扰在谢志民教授心中的难题,在其二十多年的女书研究中,谢教授、撰写专著、办讲座、搞女书小课堂,但受益者始终有限。随着信息技术的发展,互联网技术以其丰富的资源、众多的使用者,强大的沟通和互动能力使其成为新知识大众传播最佳途径。正因如此,我们采用自行开发的女书字符集和女书输入法软件,建立中华女书网网站。目前已准备好的中华女书网网站素材资源有:①女书原文资料272篇(首),共9万字左右,均系女书原始资料。这些资料是女书的精华,当代女书水平的标志;②女书原作录音资料51盘。课题组收集的所有女书原始资料,均保存有公认的女书传人高银先、义年华老太太的读唱录音;③女书流传区语言资料:语汇10000余条,录音26盘;④女书流传区人文历史资料:江永习俗调查录音15盘,妇女文化调查录音5盘,以及与女书研究有关的居民族谱、碑文等资料;⑤与女书研究有关的文献资料卡片3000余张及富川、江华、江永等地平地瑶口语记音原始材料;⑥女书流传区地方志。