句子成分分析篇1
关键词:层次性;整体性;多样性
中***分类号:H14 文献标识码:A 文章编号:1005—5312(2012)27—0117—01
在浩瀚无边的语言世界中,语言给我们充分展现了它的丰富多彩性,同时也夹杂着一些内在固有的规则和法令,变异性与稳固性相互依存、相互斗争,各种语言事实应运而生,语言作为一门学科不断向前发展。因此,分析句法结构,既要确定结构成分,也要说明结构关系和结构层次。细说下去,在选择句法分析方法的时候,我们应兼收并蓄、博采众长,全面掌握各种句法分析方法的特点,并对它们的优劣进行比较,以便找到恰当合适的方法。
一般说来,句子分析方法有句子成分分析方法、直接成分分析方法和树形***解法等,这三种方法及其赖以产生的语法理论大体上都是从国外引进的,它们大致上反映了传统语法、结构语法和转换生成语法三个历史发展阶段。本文主要就第一种方法作浅显、初略的阐述,对或不对存乎大家一念之间,请不吝批评指正。
谈句子成分分析法,一般以“暂拟汉语教学语法系统”或据此系统写成的中学汉语教科书语法部分或据此教科书改编成的《汉语知识》为代表。它主要包括以下几个要点:人为地将句子成分分成主语、谓语、宾语、补语、状语、定语等六部分;从这六个组成成分出发,把句子的基本成分和附加成分在一个平面上全部分析出来;根据句子成分间的一般搭配关系说明一切句子的格局。吕叔湘先生曾称赞句子成分分析法“有提纲挈领的好处,不仅对于语言教学有用,对于科学地理解一种语言也是不可少的。”句子成分分析法的优点总结下来有三点:
第一,句子成分分析法是建立在以句法为中心的学说之上的,从理论上说,这种既重视句法而又不轻视词法的观点是对欧洲传统语法学重视词法而轻视句法的观点的批判,对于语法学的发展有很大的推动作用。
第二,句子成分分析法是我国语法史上第一个用***解和符号标记分析汉语语法的方法,它较之任何文字说明都要简明、清晰和便捷,这在汉语语法史上算得上是一大创造。它试***把抽象的语法形象化,使之符合直观教学的原理,尤其是加线法,比***解法更显简化、易学、好用,可以在原读物上作业,不必另行抄写,这对于初学语法的人来说,无疑是一大利好之事。
第三,句子成分分析法易于检查出句子的毛病所在。因为句子成分分析法着重抓句子的各种成分,那么句子成分的多余或残缺,这个句子成分同那个句子成分的搭配有无毛病就比较容易发现了,紧缩法就是句子成分分析法的化身。
句子成分分析法有令人称赞的地方,当然也有令人诟病的地方,这些缺点主要体现在以下三个方面:
首先,句子成分分析法忽视了句子结构的层次性。“层次”是个运用广泛而且复杂的概念,可以有多种不同的理解。就语言而言,它本身就是一个层层组合构成的复杂层次系统,大层次里包含着小层次,小层次里又可包含若干更小的层次。层次可以表现在各个方面:既可表现在语言单位的聚合关系方面,比如词素就是逐层划分出来的一个层级系统;也可以表现在语言单位的组合方面,比如语素组合成词,词与词组合成句子等等。比如:
那时候的这些“很”‘明白的’工人,“决”‘不’承认那个“极”‘苛酷的’条件。(《新著国语文法》)
用句子成分分析法剖析,主语是“工人”,述语是“承认”,宾语是“条件“,句子主干就变成了:工人承认条件。而这跟原意恰好相反了。这是由于句子成分分析法在理论上不承认短语可以充当句子主干成分,在析句时一味地要找出主要成分、连带成分和附加成分,强调句子内部成分间的层次性,而对句子结构的层次性不予考虑,结果便把主语和宾语以及述语的附加成分和连带成分割裂开来,这不仅造成形式和意义之间的矛盾,甚至还会影响整个句义的理解。
上面提到句子成分分析法忽视语言结构的层次性,并不是说句子成分分析法不讲句子结构的层次,只是未加专擅表达语言结构的层次性而已。用这种析句法分析句子,只是标志出了分析的结果,并不象层次分析法完全反映出分析的过程,这只是在程序上颠倒过来罢了,但在分析的过程中并未忽视句子结构的层次性,只是为了突出句子的基本成分,更为了显示句子的格局——句型,才没有象层次分析法那样在纸上一层一层地铺展开来。试问在摘出一两个词来,说这是主语,那是谓语之前,不看清句子结构的层次能行吗?因此,句子成分分析法还是在某种程度上显示了句子结构的层次性。
其次,句子成分分析法忽视了句子结构的完整性。这主要是就“暂拟系统”里提到的向心结构①而言,句子成分分析法把整块运用的向心结构拆散成各自分立的造句零件。比如:
爸爸显出很不高兴的样子。
按照句子成分分析法对例句进行剖析,限定“样子”的本是“很不高兴”,却只标出“高兴”是“样子”的定语,而“很不”只能划为“高兴”的状语。这样的划分,把整块结构拆散为许多零件,弄得句子里层次不清,关系模糊,反而使人不能正确地理解词语间的基本关系了。否定向心结构的整体性,出了上例的定语不完整外,还有主语、谓语的完整性缺失,也是经常碰到的。比如:
古龙||江西人。
毫无疑问,“江西人”是一个偏正短语,它整个儿说明“古龙”的情况,是不能被分割的。但根据句子成分分析法,把“人”分析为谓语,而“江西”只能分析为“人”的定语。试问一下,哪有“古龙人”的说法?这种做法到底是从语言的实际出发,还是从分析的“原则”出发?照此分析下去,很多本无语病的句子都会被查出毛病来的,那还谈什么准确性呢?因此,从这一角度看,句子成分分析法的确有其值得斟酌之处。
最后,句子成分分析法忽视了句子结构的多样性。依据《汉语知识》,句子成分分析法共有十八种一般单句的最基本的格式,如“主—谓”“主—谓—宾”“主—谓—宾—补”“定—主—谓—定—宾”等,并且可以按照这些基本格式层层扩充得到更多新的格式。但是,不管怎么强调所产生基本格式的“能产性”,六种成分互相配合所能产生的句子模式毕竟是有局限性的,不可能做到真正的包罗万象,也就不可能准确地分析汉语里的一切句子。这样一来在丰富多彩的语言事实面前,我们无法用句子成分分析法去分析一些特殊的句式,只能来点强迫命令,结果只是对某个片段给一个特殊对待,揭示不了句子本身的特点,致使语法分析成了名词术语之争,没有多大的实际意义。究其具体表现而论,句子成分分析法只适用于句法,不适用于词法,即它不能有效地堆合成词的内部构造进行分析;另外,句子成分分析法虽能用于句法,但也只适用于对单句的分析,不适用于对复句的分析;再者说,即使用它分析单句也有很大的局限性。因为据句子成分分析法之后,有些句子与原意严重脱节,这对语义接受者来说无疑是一大困惑。比如:
封建思想必须根除。
用句子成分分析法分析的结果是,句子的主干变成“思想根除”,这没有完整确切地表达原意。因此,句子成分分析法确立的这些基本格式虽然对教学、学习语法分析法有一定的益处,但也容易让学习者陷入格式框架的泥潭不能自拔,长此以往,对深入了解和细致描述汉语语法的构造实际上市不利的。
句子成分分析法有值得肯定的地方,对语言事实具有一定的解释能力,在汉语语法研究和语法教学中发挥积极的作用。但是,这种分析法由于在一定程度上忽视句子结构的层次性、整体性及多样性,无法从广度和深度上对语言事实进行有效的解释。因此,在实际的语言应用过程中,我们应该如何扬长避短,争取效率最高化,这个问题是值得深思的。
注释:
①向心结构:“暂拟系统”把基本单句的六个成分之间的关系概括为“两心相照、非心向心”。前者指以主语为中心的主语部分和以谓语为中心的谓语部分,后者指定语、状语、补语、宾语四者与主语或谓语组成的句子内部结构,如充当主语的各种词组。
句子成分分析篇2
广泛被认可的行动研究定义是:由社会情境(教育情境)的参与者,为提高对所从事的社会或教育实践的理性认识,为加深对实践活动及其依赖的背景的理解所进行的反思研究。本文就“高一英语句子成分教学”中的行动研究案例及其分析,让我们了解、认识行动研究,并通过案例分析来增进我们对课程、教学方法的理解,帮助我们解决实际教学过程的问题。
一、开展什么行动研究
本项行动研究旨在探究:高一新生在升入高中之初如何理解、掌握“句子成分”这一语法项目。本文记述我和乐老师是如何建立这项合作研究的。
二、问题:句子成分的理解和运用
句子成分的理解和运用是理解句型、分析句子和遣词造句的基本要求之一。以往我们在教学过程中分析句型、剖析复合句时,发现相当部分的高一同学课堂不敢或不能准确地和老师互动。初高中英语衔接的困难之一便是句子成分掌握不好。学生在高一初期掌握句子成分可以为以后的学习扫除理解障碍。
评语:我今年任教高三,是一位“局外人”,乐老师任教高一,是“当事人”。我们合作进行研究,便都成了“研究者”、“实践工作者”。 研究的课题是“教师能有所作为的”课题。
三、明确研究目标
我们是否研究复杂复合句中的每一个成分?是否研究我校集团内所有高一同学?应该采用那些循序渐进的方法?研究的目的:以解决实践中(平时教学中)遇到的问题,即:为了行动而研究。
评语:为了制定计划,我们两位老师进行了“勘察”――发现事实和分析比较。
四、协商工作范围
我们不得不对各种可能进行讨论。这类交流在平时教学中其实并不多见。我们决定:研究对象是集团内二部的高一一个班级的同学。理由是:1.让高一同学认识自己进入新的学段是的确存在薄弱环节的,不要以为初中已经学习了句子成分,甚至不屑一顾,这能为他们以后的高中英语学习扫清障碍。2.人力的考虑,不想扩大范围,求助于更多的老师。3.二部同学的英语水平居中,具有代表性。
评语:在行动研究中,协商具有两大意义:一是通过协商使方案更清晰,行动计划更周全;二是获得相互信任和约束。Brookfield 说过:我们通过四个镜头来观察、理解自己的教学:作为教师和学习者的自传、学生的眼睛、同事的感受和理论文献。
五、应该研究哪些技能
识别句子成分,在简单句中理解和运用,在复杂的复合句中识别并运用。比如:I found the book difficult to read. I found it difficult to read the book. I found the book different from what I read last week. 上述三句中的和黑体部分分别充当:宾语补足语,宾语补足语和宾语从句。然后再让学生翻译给定句式的句子,或者自由按照给定要求造句,甚至在一段书面表达中要求使用上述句型。我们可以分阶段逐步提高此项技能要求。乐老师的经验是学生能在课堂上跟老师学 (听得懂),但是,一旦要他们自己做,就会犯各种各样的错误。
评语:基本设想更加具体、明确和集中。
六、怎么实施教学
我们协商决定:5节课逐步完成。由简到繁,从模仿、真实到运用,课堂多操练,课后有后续的练习。乐老师按照计划实施,我提供反馈。我们课堂全程录像,文字反映过程,以便后续循环反思。
评语:完成第一步设计方案、教学方式和反思评价。
七、合作者的作用
我是合作者,不能打破乐老师正常课堂教学的自然情境。学生们见我在课堂录像、记录,感到紧张。第一节课后,我告诉学生:我们的工作还需要同学们的合作,一起来寻找能使他们更感兴趣、也更有效的教学方法。
评价:两个实践者进入了共同的工作领域。与学生协商,获得他们(也是参与者)的信任和合作。这一过程中研究方式有:参与性观察、轶事记录、学生日记、开放式态度问卷、录像、访谈、讨论等。
八、这样才能记录教学情况
除了上课录像、轶事记录(课后又对轶事记录追记几条简明的想法)外,每节课后,我们都发给学生一张日记单,要求他们写下对这堂课的想法。这是我们获取学生反馈的办法之一。为了帮助学生思考,我们还常出一些问题,让学生回答。如:这堂课上得如何?你认为今天教的内容哪些部分容易?你认为今天教的内容哪些部分难?你能不能使用今天所学的知识?请你给乐老师提些建议,使课上得更有趣、更有用、更易学。请你指出本课中令你最难忘的内容。
句子成分分析篇3
关键字:版本介绍;析句方法;编写特点
中***分类号:H13 文献标识码:A
文章编号:1005-5312(2012)18-0091-02
现代汉语作为语言学范围内的一门基础课程,一直是我国高等院校汉语言文学专业的基础课。目前,我国通行的现代汉语教材种类繁多且各具特色。本文选取了其中最具代表性的的三本现代汉语教材:黄伯荣、廖序东主编的《现代汉语(增订四版)》(以下简称黄廖本);张斌主编的《新编现代汉语》(以下简称张本)和周芸、邓瑶、周春林主编的《现代汉语导论》(以下简称周本),从析句方法入手,分析三本教材在析句方法部分存在的异同及特色,评述三本教材析句部分中理论指导、编写特点以及具有的优点和不足。
一、三本教材在析句方法部分的各自特色
(一)黄廖本的析句方法
黄廖本在教材第四页介绍的“句法成分”上明确指出:句法成分分析中,中心词分析法只能看到句子的唯一一个平面,因此指出句法分析应该采用层次分析法较为合理,教材以层次分析法为主,为了弥补层次分析法不便于找句型和找句病的不足,采用句子成分分析法找主干和枝叶。例证如下:
首先,在“句法分析”这节中,黄廖本一直强调在句子中,句法成分不是孤立存在,两个句法成分相依存,发生一定的语法关系,即为层次分析法——二分法。教材第五页的句法成分表也指出句子中成分之间的关系包括陈述关系——主谓关系(例:他做了)、支配或关涉关系——动宾关系(例:做作业)、修饰限定关系——定中关系(例:语法作业)、修饰限定关系——状中关系(例:都做了)补充说明关系——(中补关系)(例:做完了)。
其次,黄廖本在第51页“多义短语”分析中,所有的短语分析方法都是采用层次分析法;第56页的“思考与练习四”中,五、六两题要求的也是用层次分析法分析复杂短语和多义短语。
第三,黄廖本第77—81页 的“八、句子成分小结及例解”中,一直是采用了两种析句方法来分析句子,一种是以层次分析法为例分析单句,另一种是以《暂拟系统》的成分分析法来分析单句。
(二)张本的析句方法
张本在句法分析中最主要的特色在于,在层次分析的基础上采用了变换分析和语义分析的方法,不仅从句法平面,而且从语义和语用平面对句子进行分析,对句法形式上的各种现象作出更加恰当的解释。例证如下:
首先,关于层次分析法部分:张本365—369页 “复杂短语和短语的分析”一节,明确指出层次分析法是结构主义语言学最常用的方法,短语的分析最好使用从大到小的框式层次分析法比较恰当。
其次,关于语义特征分析法部分:张本413—414页“什么是被字句”一节中,就是通过语义特征的分析来阐述被字句的定义,并举例进行论证;420—421页“连动句的语义关系”一节中,正是通过主语与多个谓语的语义特征来进行分析讲述;422—423页“兼语句的结构特点”一节,也是通过语义特征分析法来讲述主谓短语作宾语与兼语的区别与联系;424—427页“兼语句的类型”和“兼语句的层次分析”两节都是立足于语义特征,结合层次分析法对兼语句进行分析和分类。
第三,关于变换分析法部分:张本407—412页“把字句”一节中,就是通过这种析句方法来分析把字句,指出“把字句是利用介词‘把’将谓语动词涉及的事物置于动词前做状语的一种句式,把字句和一般主谓句具有明显的变换关系”,并通过变换分析的方法对把字句进行深入浅出的分析;414页“被字句的特点”中,也指出被字句与把字句和一般主动宾语句在句子形式上存在着明显的变换关系;423—433页“存现句的句法分析与语义分析”则是通过变换分析法和语义特征分析法对存现句进行详细的句法分析和语义特征分析。
(三)周本的析句方法
周本主要是以传统的成分析法为主,层次分析法为辅来对句子进行分析。分别详细介绍了层次分析法和句子成分分析法的原则和运用,并详细罗列了句子成分分析法的优点和缺点,并指明:成分分析法和层次分析发都可以用来分析单句的句法结构,但由于两种方法所依据的语法理论并不相同,所以各有其优点及适用的领域。例证如下:
一方面,关于成分分析法部分:周本147页描述述宾短语、述补短语、连谓短语和兼语短语都是通过成分分析法来进行定义和划分;155—167页“单句与单句分析(上)”一节内容中,所有句子分析都采用成分分析法,其中包括上百个例句;170—183页“单句与单句分析(下)”一节中,所有句子的分析也都采用了成分分析法。
另一方面,关于结构分析法部分:周本149—152页使用层次分析法对短语的层次分析进行详细描述;152—153页“语法组合造成的多义短语”也使用层次分析的方法来描述形式相同意义不同的多义短语;周本167—168页,专门列出一个专题内容为“中心词分析法和层次分析法的比较”,着重描述了成分分析法和层次分析法的优缺点和适用领域。
二、三本教材的析句方法部分评鉴
三部教材析句方法部分的建构体系与描写方法各具特色,都详细且准确的描述了现代汉语的单句句法分析方法。但联系现代汉语教学实际情况,笔者认为,三本教材也存在着不同程度的瑕疵。
黄廖本选择了层次分析法为主,成分分析法为辅的析句方法,可以很大程度上适应现代汉语的句法分析需要,而且让学习者的学习更为简单和方便,然而,黄廖本依然存在着大量的问题。首先,黄廖本花费了大量的篇幅讲述句子分析最好使用层次分析法,以至于教材甚至放弃了成分分析法。其次,黄廖本没有针对成分分析法和结构分析法的基本使用原则和具体运用进行描述,也没有指出这两种析句方法的优缺点,容易让学习者难以具体把握使用两种分析方法的时机。
张本是三本教材中采用析句方法最多的一本,它在层次分析的基础上采用了变换分析和语义分析的方法,不仅从句法平面,而且从语义和语用平面对句子进行分析,对句法形式上的各种现象作出更加恰当的解释。四种析句方法交叉使用,让教材的析句方法变得多姿多彩,也使学习者可以更容易地掌握各种句型句式的特点所在。然而在现代汉语的实际应用中,使用具体方法的时机、缘由,以及各种分析方法使用的基本原则、具体应用情况和各自的优缺点,都没有提及。这样的编写不利于学习者准确把握析句方法。
周本作为三本教材中最新的一本教材,吸取了以往教材编写的经验教训。它主要是以传统的成分析法为主、层次分析法为辅对句子进行分析,并分别详细介绍了层次分析法和句子成分分析法的基本原则和实际运用,并罗列了句子成分分析法的优点和缺点。
综上所述,笔者认为现代汉语教材关于析句方法部分编写应该做到以下几点:首先,析句方法应该是多种方法交叉并存;其次,教材应针对具体的析句方法进行定义概括、使用原则归纳、具体应用情况及优缺点的详述;第三,教材应注重不同析句方法的对比分析。
路漫漫其修远兮,学术的探索道路更是如此。我们相信,对现代汉语教材的对比分析,对现代汉语教材编写的不断尝试,必将鼓励一批又一批的学者在求实创新的路上,越走越远。
参考文献:
[1]周芸,邓瑶,周春林.现代汉语导论[M].北京大学出版社,2011.
[2]黄伯荣,廖旭东.现代汉语(增订四版)[M].高等教育出版社,2007.
[3]张斌.新编现代汉语[M].复旦大学出版社,2002.
[4]王大新.到底采用的是哪种析句方法——黄廖本《现代汉语》的析句方法举疑[J].牡丹江师范学院学报(哲学社会科学版),2003,(02).
[5]王咏梅.浅谈几种语法分析方法[J].龙岩师专学报(社会科学版),1997(11).
句子成分分析篇4
一、 引言
尽管各个省市的高考英语分值有所不同,但无论如何都削弱不了英语在高考中的地位。学生学了那么多年的英语,最头疼的是语法的学习。《普通高中英语课程标准(实验稿)》重申了语法教学在高中英语教学中的重要性,《新课标》也强调“知识是语言能力的重要组成部分,是发展语言技能的重要基础”。
一直以来,传统的语法教学只是注重在教英语时逐条讲解各个语法项目的规则以及它们的用法,教师满堂灌,学生课上、课后都得背这些枯燥的语法规则。老师以为讲得已经非常透彻了,可是学生还是一头雾水,做题时总是不能达到预期的目的。现代的语法教学表现出来了很多无法解决的问题,这集中表现在呈现语法项目的时候都采取的是单元呈现,呈现的方法都比较新颖,而且练习也都很充分。但是一个最基本的问题是它割裂了语法之间的那种联系,没有系统、连贯地讲解语法,学生学习单个语法项目时感觉也好像听懂了,练习做得也还可以,但是稍微综合一点的题目就不会做了。比如牛津教材第一模块的三个单元都讲的是定语从句,学生一开始连定语是什么,从句是什么都不知道,就更不知道什么是定语从句了。
二、 在高一语法教学过程中句子成分分析的重要性
基于新形势下语法教学的重要性和特殊性,高一一开始就应该首先规划好语法教学,应该对语法教学进行改进。新课标中提出高中英语教学的总目标是“培养学生的综合语言运用能力”,而语法是语言知识的重要组成部分,语言知识是语言能力的基础,而学生的交际能力又是以语言能力为前提的,所以,我认为,高一的英语语法教学应该更系统一些,当然系统地讲授语法时得首先找到一个切入点,根据多年的高一英语教学经验,我认为应该从句子成分的分析入手。句子成分的分析是基础,因为其他的项目都和句子成分的分析有关。
英语语法分成词法和句法,以下主要从这两个方面进行分析。
1. 词法方面
首先是词的分类标准。英语的词按照词义、句法作用以及形式、特征分成名词、代词、数词、动词、形容词、副词、冠词、介词、连词、感叹词等十类。
另外的一个分类标准是以这些词在句子中能否***担当成分来分成实词和虚词。这其中实词可以分成名词、代词、数词、动词、形容词和副词;虚词包括冠词、介词、连词和感叹词。换句话说,实词和虚词的分类标准就是以词能否在句子中充当成分来划分的,主要是看这个词在句子中作什么成分,然后再根据这个词在句子中所作的成分来判断它的词性。
2. 句法方面
首先是句子的划分标准,按照从句在整个句子中所充当的成分可以把它们再细分成主语、表语、宾语、同位语、定语和状语从句。当然另外一种分类标准是按照词性分的,主语、表语、宾语、同位语从句是名词性的从句,定语从句是形容词性的从句,状语从句是副词性的从句,这个同样还是离不开句子成分的分析。
其他语法条目如间接引语与宾语从句,非谓语动词,省略,倒装等都离不开句子成分的分析。
所以从以上词法和句法两方面来看,分子成分的分析在高中英语语法中起到的作用就显得非常重要,所以在学习中需要首先明白句子成分分析的重要性,然后再具体问题具体分析,既能系统地学习又能根据其中的联系各个击破。
三、 从句子成分的分析切入,理清语法的内在联系,轻松学好高中语法
因为句子成分的分析的重要性和对英语语法的基础作用,我们应该从句子成分的分析入手找清楚语法的内在联系和系统性,做到事半功倍轻松学好英语。
在一开始讲定语从句和其他语法之前,先明确一下句子成分。首先从句子的主、谓、宾、表、定、状、补开始,让学生明确分析出句子的成分来,记住句子成分的最根本的意义,可以作某种成分的词有哪一些。然后反过来分析一下实词和虚词的区别,这些词都可以作什么成分,二者相辅相成。句子成分的分析有益于记住词性、实词和虚词,记住实词和虚词的作用也有益于句子成分的记忆。这样就能够为以后的语法学习打下坚实的基础。
在讲授词法时,可以从词能作的句子成分入手,这样就可以从熟悉到陌生,由浅入深,然后再用句子成分串起来,知识就系统多了。比如,高中语法中最难和最重要的语法项目是非谓语动词,顾名思义,非谓语动词就是不能单独做谓语的动词,这个和谓语的时态就分得很清楚了。时态的划分主要是在谓语动词上体现出来动作发生时间的不同,确定时态时主要看谓语动词和状语就行了。
在讲授句法的时候同样也可以用句子成分的分析来串起来。比如说从句,可以按照从句在句子中所作的成分来划分为主语、表语、宾语、同位语、定语和状语从句。其他的语法项目如直接引语和间接引语其实就是用宾语从句或复合宾语来作为间接引语的。间接引语就是把直接引语的话改成宾语从句。在倒装句中主要考察的其实就是句子的语序,主语和谓语倒过来就是完全倒装,句子的谓语只有一部分倒过来就是部分倒装。还有主谓一致,其实主要是看主语和谓语在人称、数、时态上的一致的关系。省略句主要是看省去句子中的相同成分或者是省去了不被误解的相关的成分。虚拟语气又叫虚拟条件句,这个条件句就是状语从句的一种,还是按照句子成分来看的。
句子成分分析篇5
邵春华
(南京市第二十七高级中学,江苏 南京 210001)
摘 要:英语的句子成分能够帮助英语学习者了解句子的构成及其组织规律、内在特征等;通过学习英语句子成分,学习者能够在英文写作中提高正确性,也可以更加深入地理解英文长句和难句。
关键词:句子成分;定语从句;非谓语
英语中将单词组织成为正确句子的规律是为语法,它在英语语言中有着至关的重要性。而在英语学习中要把握语法这一规律,就必须要用的句子成分这一有力武器。英语的句子成分能够帮助英语学习者了解句子的构成及其组织规律、内在特征等;通过学习英语句子成分,学习者能够在英文写作中提高正确性,也可以更加深入地理解英文长句和难句。作为非英语母语的学习者,必须要先学会理清句子成分,这是学习英语语法的基础。
以前的英语教材中存在大量的句子成分分析的内容,而新课改以来这些内容不复存在,教师们在课堂教学中相应地对这部分知识的涉及也少了。这样造成了学生们在英语课堂上不知主谓宾、定状补这样的基本句子成分为何物,故而在定语从句、非谓语动词以及其他的语法教学中,学生们往往听得一头雾水,很多学生因为不懂句子成分和句子结构而在书面表达中常犯错误。因此,在新课改背景下,为帮助学生学好定语从句、非谓语以及其他高中英语语法,我们必须重视句子成分分析的作用。
一、句子成分分析对定语从句学习的作用
定语从句是高考的一个重要内容,也是高中英语学习中的一个难点。如果把定语从句看成一个单词,那么它就相当于一个形容词。在一个句子中必须要有修饰的名词(先行词),定语从句才会有它存在的意义,它在一个句子中所充当的成分只能是定语。在英语学习中,理清句子成分,善用句子成分分析法能够有助于理解定语从句。
我们来看三道例题:
1、This is the shop I visited last Sunday.
2、This is the shop I went last Sunday.
3、This is the shop I went to last Sunday.
在例题1中,先行词shop在定语从句中做的是动词visit的宾语,所以我们可以在空里填上that或which或者省略不填;在例题2中,先行词shop在定语从句中做的是地点状语,所以我们应该在其后的空里天上where;在例题3中,先行词shop在定语从句中做的是介词to的宾语,所以我们应该在横线处填that或which或者省略不填。
通过上面简单的例子,我们可以看出,如果学习者能够理清先行词在定语从句中所充当的成分,再理解定语从句或者做定语从句相关的习题,相对就简单得多了。因此,理清句子成分,对主谓宾、定状补等基本的句子成分有了充分的了解,可以在很大程度上帮助学习者提高定语从句的学习效率。
二、句子成分分析在非谓语学习中的作用
非谓语动词在高中英语语法教学中是一个重点,同时也是一个难点。在历年的高考中,这部分的语法知识都会在单选、完形、改错以及书面表达等多种题型中有所考察。因此,在英语课堂教学中,教师们应该适当给学生们讲一下句子成分的有关知识,让学生对主谓宾、定状补等基本的句子成分有所了解,知道这些句子成分要由什么词性的词来充当。
一般情况下,主语位于谓语动词前面,由名词或相当于名词的单词、短语或者从句来充当,充当主语的从句叫做主语从句;谓语由动词、动词短语充当,它一般谓语主语后面,对主语的动作和状态进行说明,它是一个句子的核心和灵魂,决定着句子的结构;宾语一般位于及物动词以及介词的后面,位于及物动词后面的叫做动词宾语,位于介词后面的叫做介词宾语,它和主语一样由名词或者相当于名词的单词、短语以及从句来充当,充当宾语的从句我们称其为宾语从句;定语用来修饰名词,它是由形容词或者相当于形容词的单词、短语以及从句来充当的,我们把充当定语的从句叫做定语从句;状语是用来修饰动词、形容词、副词以及整个句子的成分,它一般由副词或者相当于副词的单词、短语或者从句来充当,我们将充当状语成分的从句称为状语从句;补语是一种形容词性的句子成分,它可以分为主语补语和宾语补语两种,其作用是对主语或者宾语进行适当的补充说明,以说明这两者的性质或者状态,名词短语、形容词短语、介词短语、现在以及过去分词短语和不定时短语等都能充当补语成分;表语即为主语补语的一种,它位于系动词的后面,用来补充署名主语的性质、状态、特征等,它一般由名词、代词、形容词、分词短语、介词短语、不定时以及从句充当,我们将充当表语的从句称为表语从句。
通过教师向学生传授这些有关句子成分的知识,能够使学生了解一个句子的基本结构,使其明白在英语中一个句子之所以成其为句子是因为它有一个谓语动词,当学生们在做单选题或者改错题时,如果发现一个句子有两个谓语动词,就必须将其中的一个加以转换,使其成为一个非谓语动词,或者将两个动词用连词连接起来。学生们学会了分析句子成分,学习非谓语动词这一语法难点也就不会那么难了。
三、句子成分分析在高中语法学习中的作用
句子成分分析无论是在初中的英语教学还是在高中的英语教学中,对于语法教学都起着十分重要的作用,高中语法中的定语从句、名词性从句、动词-ing形式以及非谓语动词这些非常重要的内容的学习都离不开对句子成分的分析,如果在高中英语学习中,学生们无法理解句子成分,完全依靠死记硬背去学习语法,这些重点的语法内容根部不可能学好,这将给学生的高中英语学习造成十分严重的障碍。对于非英语母语学习者来说,英语语法的学习是一个必需环节,没有良好的语法基础就不会有良好的语言运用能力,而没有对句子成分的学习和了解,就不可能学好语法基础。因此,句子成分分析是高中英语语法学习的基础,是高中英语学习的基础中的基础。
在新课程标准下的英语教学中分析句子成分,不等于走传统英语教学的老路,我们要根据其必要性,进行适度的教学。分析句子成分,首先能够节省学生们很多学习时间,避免他们走一些不必要的弯路,有助于提高学生的英语水平,其在高中英语教学中的作用不可小视。
参考文献:
[1]张卫.理清句子成分,轻松学习英语[J],语数外学习(初中版中旬),2012,(08).
句子成分分析篇6
1.1 自然语言理解的含义
广义“语言”是指任意有结构的符号系统。在这之中,自然语言和形式语言是常用的最关键的两种语言。然而狭义“语言”是说人类在社会生活中发展出来的用来互相交际的声音符号系统,是“自然语言”。
“自然语言理解”又名为人机对话,说的是让计算机根据这种语言所传递的指令做出相对应的回应的体系。
1.2 自然语言理解技术的含义
(1)自然语言是非常繁琐的符号系统。
(2)自然语言所有层次都具有非常高的不稳定性。
(3)自然语言是时时刻刻都在改变的,它在人们的日常生活中变化,在不同语言的使用者之的相互影响和发展。
(4)自然语言是人们交流思想的工具。
2 自动理解系统涉及到的问题
(1)人类拥有***的语言能力,可以做出词与词之间的区分,为了使计算机能够达到类似的效果,需要将有可能用到的词语搜集到计算机系统中并构建相应的词语库。
(2)人们是通过识别出题目语句中的各个成分来对应用题题目进行理解的。计算机必须具有对句子中重要成分进行划分并标注,才能拥有像人类一样的能力。
(3)本文的最终目的是为了理解应用题,分析句子成分之后如何提炼成分之间的数量关系,即如何将题目中涉及的知识提取表述出来。
综上所述,为获得能达到以上三点要求的一个系统,应解决如下问题:
① 句子成分的自动分析
句子成分的自动分析意味着识别出句子中的各个单词。这包括了确定句子中的各个成分,以及判断不同成分的必要性,并如何实现其中的具体过程。
② 题目所含信息的提取与表示
题目所含信息的提取与表示则意味着要在分析句子成分后提取有效的信息,并将这些信息以计算机能够理解的方法进行表达。
3 句子不同成分的分析
3.1 语义块
语义块在句子中起着最小语义构成单位的作用,常用词或短语来表达。语义块的具体分类如下所示:
(1)主语义块:主语义块是句义中最重要的成分之一,可以将他们的组成部分分成核心部分和说明部分。
(2)辅语义块:相比于主语义块显得无足轻重。
在概念网络理论中,特征语义块的上装代表前说明成分,特征语义块的下装代表后说明部分。特征语义块的构成可表示如下:
E=上装+Ek+下装 公式1
其中,Ek是E块的核心部分。
3.2 句类
句类定义了句子的语义类别,具体分类如下所示:
(1)基本句类:基本句类只表达作用效应链的一个环节。
(2)混合句类则表达作用效应链的任意多个环节。
E语义块可以构成效应句、作用句、转移句、过程句、状态句和关系句。每一个基本句类有其下属类别,下属类别之下还可以再分子类。
3.3 概念层次网络理论的句类分析技术
概念层次网络理论的句类分析技术是专门为了对语句进行句子语义成分分析的一类技术,是识别句子中各语义块的一种方法。
概念层次网络理论的句类分析通过以下步骤来完成:
(1)对语义块进行感知。
(2)作出语义假设。
(3)旬类检验。通过对句类的合理性进行分析,确定出句子的句类。
(4)分析语义块的构成。在旬类检验通过之后,分析各个语义块的内部结构。
本文主要是利用HNC的句类分析技术,对句子中的各个语义块进行识别,识别之后按照一定规则提取出各个语义块之间的数量关系。
4 系统的设计
为了将以句类知识提取思想诉诸实践,实现前面所设计的算法,对这一思想的可行性以及实用性进行检验,本文设计并实现了一个自动理解系统。系统的总体模型如下:
依据本文中设计的系统总体模型框***,设计出的应用题自动理解系统的具体流程为:
(1)先处理各个分句;再处理各个分句中的各个分词,以词的序列来代替各个分句。
(2)通过字词结合规则预处理阶段,标注一些特殊的语义块。
(3)识别语义块,具体途径则参照概念层次网络理论的句类知识和语义块知识。
(4)结合特定规则提炼出各个子句蕴含的知识;最后扫描问题,寻找出需要求的未知量。
5 结束语
5.1 本文总结
本文通过研究自动理解应用题系统的设计原理与设计思路,分析了自动理解时需要注意的问。本文做的主要工作如下:
(1)针对高中生应用题的具体特点,在概念层次网络主要理论基础上,概括总结了常用的3种句子成分的划分模块。
(2)给出了高中生应用题自动理解系统的总体设计模型和基本设计流程。
5.2 进一步研究
本文在概念层次网络理论的基础上设计出了高中生应用题自动理解,在未来的科研工作中,本文准备再做以下几个方面的深入研究:
句子成分分析篇7
句法分析任务是对文本进行分析,将输入句子从序列形式变为树状结构,从而刻画句子内部词语之间的组合或修饰关系。这是自然语言处理领域的核心研究课题,已经广泛应用到其它自然语言处理任务中,如机器翻译、自动问答、信息抽取等。和其他句法分析形式如短语结构句法分析相比,依存句法分析具有形式简单、易于标注、便于学习、分析效率更高等优点[1,2]。另外,依存句法描述词和词之间的关系,因此更适合于表达非连续的、远距离的结构,这对于一些语序相对自由的西方语言非常重要。依存语法历史悠久,最早可能追溯到公元前几世纪Panini提出的梵文语法。依存语法存在一个共同的基本假设:句法结构本质上包含词和词之间的关系。这种关系称为依存关系(Dependency Relations)。一个依存关系连接两个词,分别是核心词(Head)和修饰词(Dependent)。依存关系可以细分为不同的类型,表示两个词之间的句法关系(Dependency Relation Types)。目前,依存语法标注体系已经为自然语言处理领域的许多专家和学者所采用,并应用于不同语言中,且对其不断地发展和完善。研究者们提出并实现了多种不同的依存分析方法,达到了较好的准确率。近年来,依存句法分析多已广泛用于统计机器翻译[3]、自动问答[4]和信息抽取[5]等任务,并取得了良好的效果。
依存句法分析任务的输入是一个已完成分词的自然语言句子。形式化地,输入句子可以表示为:x=W0W2…Wi…Wn,其中,wi表示输入句子的第i个词;W0表示一个伪词,指向整个句子的核心词,也就是根节点(ROOT)。***1表示输入句子“刚满19岁的欧文现在效力利物浦队。”的依存树。
[JZ][HT5”H]***1 依存树示例[ST5”HZ][WT5”HZ][JZ]Fig.1[ST5”BZ] Example of a dependency parse
最一般地,一个依存句法树由多个依存弧构成,表示为:d={(h,m,l):0≤h≤n,0
依存句法分析的目标是给定输入句子x,寻找分值(或概率)最大的依存树d*,具体公式为:
因此,依存句法分析存在四个基本问题:
(1)如何定义Score(x,d),即采用哪种方式将依存树的分值分解为一些子结构的分值。这是模型定义问题;
(2)采用哪些特征来表示每一部分子结构,即特征表示问题;
(3)如何获取特征的权重,即模型训练算法问题;
(4)给定模型参数,即已知特征的权重,如何搜索到分值最大的依存树。这是解码问题。
2依存句法分析的方法
数据驱动的依存句法分析方法主要有两种主流的方法:基于***(Graph-based)的分析方法和基于转移(Transition-based)的分析方法。这两种方法从不同的角度解决这个问题。CoNLL上的评测结果表明这两种方法各有所长,并且存在一定的互补性[2,6]。下面对各类方法展开细致分析。
2.1基于***的依存句法分析方法
基于***的依存分析模型将依存句法分析问题看成从完全有向***中寻找最大生成树的问题。一棵依存树的分值由构成依存树的几种子树的分值累加得到。模型通过基于动态规划的解码算法从所有可能的依存树中搜索出分值最高的依存树。相关的研究工作主要包括:
(1)模型定义。根据依存树分值中包含的子树的复杂度,基于***的依存分析模型可以简单区分为一阶、二阶和三阶模型。一阶模型中,依存树的分值由所有依存弧的分值累加得到,即依存弧之间相互***,互不影响[7]。二阶模型中,依存树的分值中融入了相邻兄弟弧(Sibling)和祖孙弧(Parent-child-grandchild)的分值[8,9]。三阶模型中,进一步增加了祖孙兄弟弧(Grandparent-parent-sibling)等三条依存弧构成的子树信息[10]。
(2)特征表示。在上述模型定义的基础上,研究人员也提出了相应的一阶、二阶、三阶子树特征[7-10]。每种子树特征考虑句子中的词语和词性信息、依存弧的方向和距离信息等。随着高阶子树特征的使用,依存句法分析模型的准确率也有较大幅度的提高。
(3)训练算法。基于***的依存分析方法通常采用***训练算法(Online Training),如平均感知器算法(Averaged Perceptron)[11]、被动进取算法(Passive-Aggressive)[12]和Margin Infused Relaxed算法(MIRA) [13]。***学习算法以迭代的方式训练特征的权重。一次迭代中遍历整个训练数据集合,每次根据一个训练实例的分析结果对当前的权重向量进行调整。
(4)解码算法。一阶模型对应的解码算法为Eisner算法[14]。Eisner算法的本质是动态规划,不断合并相邻子串的分析结果,直到得到整个句子的结果,其时间复杂度为O(n3)。进而,McDonald和Pereira (2006)对Eisner算法进行扩展,增加了表示相邻兄弟节点的数据类型,时间复杂度仍为O(n3)。Carreras (2007)同样对Eisner算法进行扩展,得到面向二阶模型的基于动态规划的解码算法,时间复杂度为O(n4)。Koo和Collins (2010)提出了面向三阶模型的解码算法,时间复杂度为O(n4)。一些研究者提出采用基于柱搜索的解码算法,允许模型方便地融入更高阶的解码算法,同时保证较低的时间复杂度[15,16]。
2.2基于转移的依存句法分析方法
基于转移的依存分析模型将依存树的搜索过程建模为一个动作序列,将依存分析问题转化为寻找最优动作序列的问题。模型通过贪心搜索或者柱搜索的方式找到近似最优的依存树。其优点在于可以充分利用已形成的子树信息,从而形成丰富的特征,以指导模型决策下一个动作。相关的研究工作主要包括:
(1)模型定义。基于转移的依存句法分析方法提出早期,研究者们使用局部分类器(如最大熵分类器)决定下一个动作,选择概率最大的动作[17,18]。这样,一个依存树的概率由其对应的动作序列中每一个动作的概率累乘得到。近年来,研究者们采用线性全局模型来决定下一个动作,一个依存树的分值为对应动作序列中每一个动作的分值的累加[19-21]。
(2)特征表示。基于转移的依存句法分析方法的优势在于可以充分使用已构成的子树信息。Zhang和Nivre (2011)在前人工作的基础上,提出了丰富的特征集合,如三阶子树特征,词的配价信息等[21]。
(3)训练算法。早期,研究者们在训练语料上训练出一个局部分类器,在解码过程中重复使用,决定下一个动作。通常采用的分类器有基于记忆的分类器、支持向量机等。近年研究发现采用全局线性模型可以提高句法分析的准确率,通常采用平均感知器***训练算法。
(4)解码算法。其任务是找到一个概率或分值最大的动作序列。早期采用贪心解码算法,即每一步都根据当前状态,选择并执行概率最大的动作,进入到下一个状态。如此反复直至达到接收状态,形成一棵合法的依存树[17,18]。进而,研究者们提出使用柱搜索的解码方式扩大搜索空间,即同时保留多个分值最高的状态,直到搜索结束时选择最优的动作路径[22,19]。Huang和Sagae (2010)提出在柱搜索中加入动态规划,通过合并等价状态进一步扩大搜索空间[20]。随着搜索空间的增大,依存句法分析的准确率有显著提高。
2.3模型融合的方法
基于***的方法和基于转移的方法从不同的角度解决问题,各有优势。基于***的模型进行全局搜索但只能利用有限的子树特征,而基于转移的模型搜索空间有限但可以充分利用已构成的子树信息构成丰富的特征。McDonald和Nivre (2011)通过详细比较发现,这两种方法存在不同的错误分布。因此,研究者们使用不同的方法融合两种模型的优势,常见的方法有:stacked learning [2,23];对多个模型的结果加权后重新解码[24,25];从训练语料中多次抽样训练多个模型(Bagging)[26,27]。
2.4词性标注和依存句法分析联合模型
依存句法分析模型中,词性是非常重要且有效的特征。如果只使用词语特征,会导致严重的数据稀疏问题。自然语言处理中,词性标注和依存句法分析这两个问题通常被当成两个***的任务,以级联的方式实现。即对于一个输入句子,假定其分词结果已知,先对句子进行词性标注,然后在词性标注结果的基础上进行依存句法分析。这种级联的方法会导致错误蔓延。也就是说,词性标注的错误会严重影响依存分析的准确率。由于汉语缺乏词形变化信息(如英语中的词后缀变化如-ing,-ed,-es,-ly等),因此汉语的词性标注比其他语言如英语更具挑战性。近年来,研究者们通过建立词性标注和依存句法分析联合模型,在同一个模型中解决这两个紧密相关的任务,允许词性信息和句法结构互相影响和帮助,取得了不错的效果。一方面,联合模型中,句法信息可以用来指导词性标注,从而帮助解决一部分需要句法结构才能够消解的词性歧义。另一方面,更准确的词性标注,也可以反过来帮助依存分析。Li等通过扩展基于***的依存句法分析模型,首次提出汉语词性标注和依存句法分析联合模型[28],并且提出了适用于联合模型的训练算法[29],显著提高了词性标注和依存句法分析的准确率。进而,一些研究者们提出基于转移的词性标注和依存句法分析联合模型[30,31]。Ma等(2012)尝试了基于Easy-first的汉语词性标注和依存句法分析联合模型[32]。
2.5基于多树库融合的方法
对于统计的数据驱动的分析模型而言,标注数据的规模很大程度上影响着分析结果的准确率。依存句法分析是一种结构化分类问题,比二元分类和序列标注问题更具挑战性,因此依存句法分析更容易受到数据稀疏问题的影响,树库规模对依存句法分析的准确率影响很大。然而,标注树库是一件艰巨的任务,通常需要耗费很大的人力和物力。目前的研究结果表明在一个树库上训练出的句法分析的模型似乎很难进一步提高句法分析的准确率。然而,汉语存在多个树库。这些树库由不同的组织或机构标注,遵循不同的标注规范,面向不同的应用。尽管各个树库遵循不同的标注规范,但却都是根据人们对汉语语法的理解而标注,因此包含很多共性的标注结构。同时,不一致的标注结果应该也是有规律可循的。所以,一些研究者们尝试同时利用多个树库,帮助句法分析的准确率。李正华等(2008)曾尝试统计和规则相结合的方法,将短语结构的源树库CTB转化为符合CDT标注规范的依存结构,然后将转化后的树库和CDT合并,提高训练数据的规模,以提高依存句法分析准确率[33]。Niu等(2009)提出一种基于统计的树库转化方法,将依存结构的CDT树库转化为满足CTB标注规范的短语结构树库,进而使用语料加权的方式增大训练树库的规模,提高了短语结构句法分析的性能[34]。Li等(2012)提出一种基于准同步文法的多树库融合方法,不是直接将转化后的树库作为额外的训练数据,而是使用准同步文法特征增强依存句法分析模型,从而柔和地学习标注规范中规律性的不一致,提高依存句法分析的准确率[35]。
3依存句法分析面临的挑战
自从2006年开始,CoNLL国际评测一直关注依存句法分析,不但提供了多语言、高质量的树库,并通过对各种方法的比较分析,让研究者们对依存分析问题的理解更加清晰,极大地促进了依存句法分析的发展。依存分析已经成为自然语言处理的一个热点问题,方法也越来越成熟,并且在许多领域得到了应用。然而,目前依存句法分析还存在很多挑战,这些挑战也可能是未来依存分析发展的趋势。具体分析如下:
(1)提高依存分析准确率。目前主流的两种依存分析方法都存在一定的缺陷。基于***的方法很难融入全局特征。而基于转移的方法虽然原理上可以利用丰富的特征,但是实际使用的特征还是属于局部特征,另外也还存在错误级联的问题(柱搜索只能缓解这个问题)。融合不同依存分析模型的方法可以提高分析性能,但是提高幅度比较有限。研究可知,只有从新的角度理解这个问题本身,提出新的建模方法,或者应用新的机器学习方法,才有望大幅度提高依存分析性能。一些学者提出的利用未标注数据帮助依存分析模型是一个很好的思路,值得深入研究。
(2)提高依存分析效率。基于***的依存分析方法融入高阶特征可以提高性能,但是效率很低,无法适应实际应用的需求。在不明显降低分析性能的前提下,如何提高依存分析效率也是一个很有实际价值的问题。
(3)领域移植问题。研究发现,当训练数据领域与测试数据领域不相同时,即使差距不大,也会导致句法分析性能下降很大。以英语为例,从华尔街日报树库移植到Brown语料时,句法分析性能下降近8%。目前依存树库所覆盖的领域、规模都很有限,而标注树库的代价很大。因此解决领域移植问题,对于依存分析的实际应用至关重要。
(4)语言相关的依存分析。目前最主流的两种依存分析方法都是语言无关的,纯粹依靠机器学习方法从数据中学习,加入人类知识只能限于特征选择。然而,每种语言都有其特点。因此语言相关的依存分析研究,如针对每种语言的特点设计更有效的模型和算法,利用一些语言特有的资源等,也是很有必要的。近年来,国内学者已经在汉语依存句法分析上做出了很多成绩,然而如何利用汉语的特点,提高汉语句法分析的准确率和效率,仍然是一个开放的问题。
句子成分分析篇8
关键词:句法分析;性能;Stanford parser;Berkeley parser
中***分类号:TP391 文献标识码:A 文章编号:1009-3044(2013)08-1984-03
1 概述
句法分析判断输入的单词序列(一般为句子)的构成是否合乎给定的语法,并通过构造句法树来确定句子的结构以及各层次句法成分之间的关系,即确定一个句子中的哪些词构成一个短语,哪些词是动词的主语或宾语等问题。随着自然语言应用的日益广泛,特别是对文本处理需求的进一步增加,句法分析的作用愈加突出,它在机器翻译、信息检索与抽取、问答系统、语音识别等研究领域中都有重要的应用价值[1]。
现阶段,基于统计的方法是句法分析的主流技术。常见的概率句法分析模型包括概率上下文无关模型、基于历史的句法分析模型、层次化渐进式的句法分析模型和中心词驱动的句法分析模型。综合多种模型而实现的句法分析器种类繁多,该文实验使用的是目前在开源中文句法分析器中比较具有代表性的Stanford parser和Berkeley parser,。前者基于因子模型,后者基于非词汇化分析模型。
英文句法分析性能已经达到90%以上的水平,然而中文句法分析性能却停留在80%左右,如何提高中文句法分析的性能成为了一个关键问题。由于概率句法分析主要是由数据来驱动的一项任务,故用于训练分析器的树库规模的大小将直接决定该分析器的性能。事实上,当前中文句法分析性能确实在很大程度上受到了训练数据规模小的限制,此外,分词和词性标记的准确率对句法分析性能的影响也是十分显著的[2]。如果能引入一个高质量的外部词法分析器来辅助句法分析,将在一定程度上提高中文句法分析的性能。该文选取 LDC Chinese Gigaword Second Edition 中的14年新华社新闻语料(共计约12, 163, 828个句子),外部分词工具使用中科院计算技术研究所的ICTCLAS汉语分词系统(2011版),中文句法分析器使用Stanford parser和Berkeley parser,实验将基于两种句法分析器共4种分析模型下的分析结果,进而在分析速度、准确率、分词对句法分析质量的影响等方面进行性能对比。另外,实验中得到的句法分析结果数据也将为后续相关研究提供大规模的语料支持。
论文内容的安排如下:第2部分介绍Stanford parser、Berkeley parser和ICTCLAS;第3部分介绍实验结果与分析,第4部分是总结与未来工作展望。
2 分析器
目前支持中文的句法分析器越来越多,其中作为开源软件的Stanford parser和Berkeley parser受到了较为广泛的关注和应用,两者都基于统计句法分析模型并支持多种语言,用来训练分析器中文模型的训练数据和句法分析树格式都是源自宾州中文树库的相应规范。
2.1 Stanford parser
Stanford parser是由斯坦福大学自然语言处理小组开发的开源句法分析器,是基于概率统计句法分析的一个JAVA实现,从2002年12月的Version 1.0 到2012年11月的Version 2.0.4,共历经了22个版本。分析器目前提供了5个中文文法[3],与传统的单一句法分析器相比,Stanford parser的设计更为合理和多样化:
1) 既是一个高度优化的概率上下文无关文法和词汇化依存分析器,也是一个词汇化上下文无关文法分析器。
2) 基于权威可靠的宾州树库作为分析器的训练数据,目前已面向英文、中文、德文、阿拉伯文、意大利文、保加利亚文、葡萄牙文等语种提供句法分析功能。
3) 提供了多样化的分析输出形式,除句法分析树输出外,还支持分词和词性标注文本输出、短语结构树输出、斯坦福依存关系输出等。
4) 分析器内置了分词工具、词性标注工具、基于自定义树库的分析器训练工具等句法分析辅助程序。
5) 通过设置不同的运行参数,可实现句法分析模型选择、自定义词性标记集、文本编码设置和转换、语法关系导入和导出等功能的定制。
2.2 Berkeley parser
Berkeley parser是由伯克利大学自然语言处理小组开发的开源句法分析器,目前支持的语种主要有英文、中文、德文、阿拉伯文、保加利亚文、法文等。与Stanford parser相比,Berkeley parser具有如下特点:
1) Berkeley parser是一个纯粹的基于PCFG的句法分析器。
2) 分析器的输入形式可以文件为单位(每行一个句子),分析完成后得到的输出文件中包含了输入文件中所有句子的句法分析结果。
3) 默认的分析结果输出形式是文本,但为了让分析结果更加直观,可以设置程序的输出形式为句法分析树***像。
4) 可指定输出基于一个句子的排名前n的句法分析树及每棵树的概率值。
5) 分析器提供了用于读取标准树库的代码,可基于用户指定的树库来训练新的文法。
6) 支持多线程分析,在多处理机系统上能获得更高的句法分析性能。
7) 由于分析器不含分词功能,所以必须先借助外部分词工具来进行分词,再将经过预处理的分词结果串作为句法分析器的输入。
2.3 ICTCLAS
中文词法分析是中文信息处理的重要基础。ICTCLAS是由中国科学院计算技术研究所研制的汉语词法分析系统,主要功能包括中文分词、词性标注、命名实体识别、新词识别、导入用户词典等,相比其它中文分词系统具有如下特点[4]:
1) 支持繁体中文分词,可自动识别GB2312、GBK、UTF8等多种编码格式。
2) 采用多线程技术,进一步提高了分词精度和速度。
3) 采用层叠隐马尔可夫模型实现了统一的语言计算理论框架,将汉语词法分析的所有环节都统一到了一个完整的理论框架中,获得最好的总体效果。
4) 在国内和国际权威的公开评测中,其分词速度在单机上是500KB/s,分词精度98.45%,API不超过100kb,各种词典数据压缩后不到3M,被评价为当前最好的汉语词法分析器。
3 实验结果与分析
3.1 实验设计
3.1.1 语料预处理
考虑到LDC原始语料文件采用了SGML标记规范,因此需要对168个语料文件进行预处理。预处理的任务首先是删除、、这类标记对;然后保留和
标记对之间的文本内容,并将
之间的所有文本合并为一个文本行;最后通过定义一些过滤规则来修正在语料中发现的一些错误(主要是少量特殊字符和连续多个空格等情况)。
3.1.2 结合外部ICTCLAS分词系统的句法分析
第一步,通过API调用ICTCLAS,对经过预处理的168个语料文件进行中文分词处理。
第二步,将分词结果文件中的句子按照句子长度(该句子的词数)进行句长区间分类,即每个文件被切割为句子长度为[1,9],[10,19],[20,29],[30,39],[40,49],[50,59],[60,100]的7个文件。
第三步,通过API调用Stanford parser(PCFG model)、Stanford parser(Factored model)、Berkeley parser,分别对第二步中得到的不同句长区间的文件进行句法分析,并将上述3种分析模型的分析结果进行合并汇总,统计得到句法分析的平均速度:Standford(PCFG)为1.1273秒/句,Stanford(Factored)为11.6939秒/句,Berkeley为1.8173秒/句。
第四步,在每个句长区间中随机挑选出100个句子,在宾州树库的规范基础上,通过人工分析得出句法分析树,通过与第三步中的句法分析器分析结果进行对比,统计得到句法分析的平均准确率:Stanford(PCFG)为72.4%,Stanford(Factored)为74.4%,Berkeley为74%。
3.1.3 使用内置分词功能的句法分析
在Stanford parser和Berkeley parser中,只有Stanford parser的Factored segmenting model内置了分词功能。基于该模型重复3.1.2中实验的第三步,统计得到实验结果:平均速度为12.0966秒/句,平均准确率为68.9%。
3.2 实验分析
第一,速度分析:Stanford的三种模式中,PCFG最快,Factored其次,FactoredSegmenting最慢,其中PCFG和Factored速度差异很大,主要是因为Factored模式要对概率上下文无关文法分析器和依存分析器进行权衡,从中获取一个最佳分析结果,特别是当句子长度大于40,Factored速度变得非常缓慢。而FactoredSegmenting与Factored的速度差异很小,这个差异主要是分词的时间开销。由于Berkeley是一个纯PCFG分析器,其速度与Stanford PCFG相近。
第二,准确率分析:Stanford的三种模式中,综合了两种分析器的Factored准确率最高,其次是PCFG,FactoredSegmenting最低。Berkeley在分析准确率上与Stanford比较接近,但随着句子长度的增加,每种句法分析器的准确率都呈现明显下降的趋势,特别是当句子长度大于60,分析准确率已经低于43%。
第三,3.1.2和3.1.3的实验数据表明,采用性能更好的外部分词工具,对于提高句法分析器的分析质量是明显有帮助的。
4 总结与展望
从实验结果来看,在开放式语料环境下,Stanford parser和 Berkeley parser的整体性能都存在一定的缺陷,说明目前中文句法分析的整体水平还有待提高。
目前基于依存分析的方法和短语结构分析的方法仍是句法分析研究的主流方向,但如本文概述中所述,如何建设与句法分析研究密不可分的相关资源库是一个关键因素,包括如何有效利用异构树库(例如依存树库)来帮助短语结构分析系统,以及如何帮助在再排序系统中高效率地利用更多的候选分析树来提高句法分析性能。
最后,期望在本文实验中生成的14年新华社新闻语料的句法分析结果数据能为后续相关研究提供大规模的语料支持。
参考文献:
[1] 何亮,戴新宇,周俊生,陈家骏.中心词驱动的汉语统计句法分析模型的改进[J].中文信息学报,2008,22(4):3-9.
[2] 米海涛,熊德意,刘群.中文词法分析与句法分析融合策略研究[J].中文信息学报,2008,22(2): 10-17.
句子成分分析篇9
一、分析教学目标,有针对性地实施教学
专业英语和通用英语的教学内容和教学目标有着显著的差异。专业英语教学是为实际工作服务的。为了能更好地达到教学目标,教师需要培养学生的自学能力,使其掌握适合自己的学习方法。在实际教学中,专业英语主要涉及专业词汇的教学、常见句子结构的分析、句子翻译等方面。针对这些教学内容,教师在教学中必须采取不同的教学方法,进行有针对性的教学。
二、采取多种教学方法,培养学生记忆专业英语词汇的能力
专业英语词汇是学好专业英语的必备条件。教师在教学中需要培养学生记忆专业词汇的能力。笔者在教学中主要采取以下几种方法进行教学。
1.教会学生正确拼读单词
笔者在教学中首先教会学生正确拼读音标,学会音节的划分,然后在单词学习中让学生反复拼读直到熟练划分音节并能够正确拼读。
2.注重单词构词法特点的讲解
笔者在单词教学中注重给学生讲解常见词汇的前缀、后缀、专业英语词汇常见的构词法(合成、转化和派生)等。
3.采用多种教学方法帮助学生记忆英语词汇
笔者在教学中主要通过让学生反复拼读单词、填词游戏、***片讲解、词汇练习、分组比赛、单词造句、默写等方式记忆专业词汇。
三、通过分析讲解,培养学生分析句子结构的能力
1.分析并讲解专业英语常见语法现象
专业英语句子特点是L句多、句子结构复杂。常用句型中通常会涉及形式主语、定语从句、不定式短语、非谓语动词(动名词或分词)、被动语态等语法。学生掌握了这些语法的应用,就能正确地分析句子。笔者在教学中主要针对这些语法问题进行分析讲解。
2.分析句子种类及构成特点
在掌握了专业英语所涉及的基本语法后,教师要引导学生正确判断句子的种类,并根据句子特点找出句子的主语、谓语和短语动词等成分。简单句的主谓成分比较容易理解,而长句通常会涉及并列句和复合句,复合句中最常用的是定语从句。长句的主语通常由几个并列的名称或名词性短语构成。谓语则一般由几个并列的谓语动词构成。短语动词则常包括介词短语、分词短语、动名词短语、不定式短语和形容词短语。分词和介词短语通常紧跟在名词后面,动名词短语常常充当主语和宾语。
3.及时纠正学生在句子结构分析中存在的常见问题
句子结构分析中,很多学生不能正确判断句子的谓语。他们通常会把分词短语和动名词短语当成谓语,不能找出长句中应用最广的定语从句以及从句中的主谓成分。因此,教学中教师要引导学生找出谓语动词和非谓语动词短语之间的区别;而专业英语文章中经常会出现由that引导的定语从句,它通常放置在名词或代词的后面作定语,但如果that在句中不充当成分,一般是同位语从句。这样,在多个句子分析讲解后,多数学生能正确地分析判断句子结构并轻松地理解句子。
四、反复操练,培养学生快速理解和翻译文章的能力
学习专业英语的最终目的是在熟练掌握词汇的基础上理解并翻译所学文章,最终能阅读英文说明书、操作手册等。在教学中,教师在引导学生正确分析句子结构后,要让学生对句子进行翻译练习,帮助学生分析中英文句子结构的区别,指导他们根据中英文的不同特点进行翻译,及时纠正学生在翻译中出现的问题,并安排学生课后翻译一些相关内容的专业文章或说明书。
五、编设情境对话,提高学生英语口语能力
为了提高学生的学习兴趣,培养其口语水平,教师可以在专业文章讲授结束后编设与文章相关的情境,鼓励学生利用所学专业词汇编写对话,并采用分组练习、竞赛等方法促使学生更好地熟悉专业词汇,提高自身的英语口语水平。
句子成分分析篇10
如何对英语长句进行分析。一般来说。造成长句的原因有三方面:(1)修饰语过多;(2)并列成分多;(3)语言结构层次多。在分析长句时可以采用下面的方法:
(1)找出全句的主干——主语、谓语和宾语,从整体上把握句子的结构,使句子简洁化。
(2)找出句中所有的谓语结构、非谓语动词、介词短语和从句的引导词。
(3)分析从句和短语的功能,例如,是否为主语从句,宾语从句,表语从句等,若是状语,它是表示时间、原因、结果、还是表示条件等等。
(4)分析词、短语和从句之间的相互关系,例如,定语从句所修饰的先行词是哪一个等。
(5)注意插入语等其他成分。
(6)注意分析句子中是否有固定词组或固定搭配。
下面我们结合一些实例来进行分析:
例:(1)(Theunionleaders)(declared)(thattheultimateaimoftheirstrugglewastoincreasepayandimprovedworkingconditionsfortheworkers.)不难看出在这些括号里的词就是句子的主语、谓语、宾语。句子可以简化为Theunionleadendeclared+thatclause结构。抓住句子的主干后翻译时可先译主干部分。译成“工会领导人宣称……”再继续分析。我们知道该句共有三个谓语结构,它们的谓语动词分别为declared,wastoincreasepay,improved,这三个谓语结构之间的关系为:Theunionleadersdeclared+thatclause结构主句,wastoin-creasepay,improved,是宾语从句中的并列谓语。在做了如上的分析之后,我们就会对该句具有了一个较为透彻的理解,然后根据我们上面所讲述的各种翻译方法,就可以把该句翻译成汉语为“工会领导人宣称,他们举行罢工的最终目的是增加工人工资,改善工作条件”。
例(2)Thepicturesthatlingerinhismind,calledupinamomentbysuchsensationsasthesmellofrosesorofnewmownhay,areofasimplernature.很显然,斜体词部分Thepictures.are,ofasimplernature这些词是主语,系词,表语,就是句子的主干。这个句子是主、系、表结构。通过对句子的分析,我们可以清楚地把这个长的句子简洁化译成“…***画简洁自然”。再继续分析,斜体词pictures后的词that引起了一个定语从句,同时还作了定语从句的主语,从句中的谓语是linger。该句共有二个谓语结构,它们的谓语动词分别为:linger,is,而calledup为分词短语,其它词还有介词短语等都作为状语修饰linger。
这个句子译成汉语为:“那些闻取玫瑰花香或新鲜干草的气息,便会猛然闯入记忆萦绕心头的画面,其实并不复杂。”这里我们将简洁明了转译为“并不复杂”使句子更符合汉语习惯。翻译这样带有定语从句的复杂句子感到困难的根本原因在于汉语的定语结构局限性。它在形式上虽然很接近英语的定语从句,其载荷能力却相差很大,在翻译时要特别注意。再看一个含有定语从句的句子。例(3)BeforeIknewit,Ihadbegunmycareerinbusiness-atimeinmylifethatIfeelwaswasted.在这个句中,before引起了时间状语,主句为Ihadbe-gunmycareerinbusiness-atimeinmylifethatIfeelwaswasted。主句中含有一个插入成分atimeinmylifethatIfeelwaswasted,还出现了that引起的定语从句,分析清楚复杂句子结构形式,句子可以为:“在我了解其真正含义前,我就开始了我的经商生涯——我认为,那是我一生当中的蹉跎岁月”。
例(4)Forafamilyoffour,forexample,itismoreconve-nientaswellascheapertositcomfortablyathome.withalmostunlimitedentertainmentavailable,thantogooutinsearchofa-musementelsewhere.(85年考研试题)
分析:该句中共有三个谓语结构,它们之间的关系为:itismoreconvenientaswellascheaperto…为主体结构,但it是形式主语。真正的主语为第二个谓语结构:tositcomfort-ablyathome,并与第三个谓语结构togooutinsearchofa-musementelsewhere作比较。
例(5)Althoughsomeexperimentsshowthat.asanobjectbe-comesfamiliar.itsinternalrepresentationbecomesmoreholis-ticandtherecognitionprocesscorrespondinglymoreparallel,theweightofevidenceseemstosupporttheserialhypothesis.atleastforobjectsthatarenotnotablysimpleandfamiliar.分析:在Although引导的分句中,谓语shows后面跟着一个长长的宾语从句,从句中先出现一个插入语asanobjectbecomesfamiliar,之后的内容是由and连接的两套并列的主谓宾。其实and前后就是两个句子,只不过作者省略了后面的句子中与前面相同的引导词that和谓语become。
例句译为;“虽然某些实验表明,随着一个物体变得熟悉起来,其内心再现***像亦更具整体感,辨认过程相应地更趋于平行,但证据的砝码似乎在支持序列假设,至少是对于那些不甚简单、不甚熟悉的物体来说也是这样。”在句子中采用了复杂修饰、插入语、省略等。句子中有一个生词holistic,其实即使不认识,也能用合理化原则猜出它是后面serial的反义词、parallel的同义词,大约是统一、完整或同时的意思;其实只要能理解到其是与serial相反的意思即可。
综合上述翻译方法,这个句子我们可以翻译为“譬如,对于一个四口之家来说,舒舒服服地在家中看电视,就能看到几乎数不清的娱乐节目,这比到外面别的地方去消遣又便宜又方便”。
英语习惯于用长的句子表达比较复杂的概念,而汉语则不同,常常使用若干短句,作层次分明的叙述。通过对上述句子的分析,我们学会把长难句子简洁化,但只会分析句子是不够的,还需要采用正确的方法进行翻译,才能使英语长难句成为与汉语语言相符的句子。因此,在进行英译汉时,要特别注意英语和汉语之间的差异,将英语的长句分解,翻译成汉语的短句。在英语长句的翻译过程中,我们一般采取下列的方法。
1.按顺序直译法翻译。当英语长句的内容的叙述层次与汉语基本一致时,可以按照英语原文的顺序翻译成汉语。例:Forinstance,followingthehugefloodsof1998,(thegovern-ment)(prohibited)(logging)intheupperreachesoftheYangtzeRiverinordertoprotectforestsandreduceflooddangers,在例句中我们看到括号中的词语是句子的主干部分,for…,following…,intheupper…到句末这些词语都是状语部分是对整个句子进行补充,修饰的。分析完句子后再采用顺序法进行翻译,全句可译成“例如,在1998年特大洪水过后,为了保护森林和减少水患,***府明令禁止在长江上游伐木”。
2.按语意倒序法翻译。英语有些长句的表达次序与汉语表达习惯不同,甚至完全相反,这时必须从原文后面开始翻译。
例:Aluminumremainedunknownuntilthenineteenthcen-tury.becausenowhereinnatureisitfoundfree.owingtoitsal-waysbeingcombinedwithotherelements,mostcommonlywithoxygen.forwhichithasastrongaffinity.
分析:这个句子由一个主句,两个原因状语和一个定语从句组成,“铝直到19世纪才被人发现”是主干句,也是全句的中心内容,全句共有四个谓语结构,按照汉语的表达习惯通常因在前,果在后,这样,我们可以逆着原文的顺序按汉语语义将该句翻译成“铝总是跟其他元素结合在一起,最普遍的是跟氧结合;因为铝跟氧有很强的亲和力,由于这个原因,在自然界找不到游离状态的铝。所以,铝直到19世纪才被人发现”。
3.按句意以分句方式翻译。有时英语长句中主语或主句与修饰词的关系并不十分密切,翻译时可以按照汉语多用短句的习惯,把长句的从句或短语化成句子,分开来叙述,为了使语意连贯。有时需要适当增加词语。
例:Alltheyhavetodoispressabutton,andtheycanseeplays,films,operas,andshowsofeverykind,nottomentionpo-liticaldiscussionsandthelatestexcitingfootballmatch.(85年考研题)
例句译为:“他们所必须做的只是按一下开关。开关一开,就可以看到电视剧、电影、歌剧,以及其他各种各样的文艺节目。至于***治问题的辩论、最近激动人心的足球赛更是不在话下。”
4.直译法,意译法综合使用翻译。事实上在翻译过程中,翻译一个英语长句时。并不只是单纯地使用一种翻译方法,而是要求我们把各种方法综合使用。这在我们上面所举的例子中也有所体现。尤其是在一些情况下,一些英语长句单纯采用上述任何一种方法都不方便时,这就需要我们的仔细分析,或按照时间的先后,或按照逻辑顺序,顺逆结合,与汉语语意结合,主次分明地对全句进行综合处理,才能把英语原文翻译成通顺流畅,忠实汉语习俗的句子。
例:HesaidthathewasassuredbytheStateDepartmentthattheU.S.iswillingtonormalizerelationswithhiscountry.该句译为:“他说,***向他担保美国愿意同他的国家恢复正常关系。”