数字化转型论文10篇

数字化转型论文篇1

[关键词]高校***书馆;数字化;网络化;服务模式;转型;创新

1引言

随着数字化技术、通信技术和网络技术的迅速发展,信息高速公路的建设与利用为大规模信息系统和***书馆系统的发展提供了环境和条件。目前,网络信息管理技术、数字化处理技术和数字式信息资源建设已成为国际竞争的焦点,各国都为此投入了相当的实力进行研究和开发,并将其视为21世纪信息产业主要的发展方向之一。因此,数字化与网络化不可避免地影响着***书馆的发展进程。这既是挑战,又是机遇,尤其是对于育人与科研并重的高校***书馆更是如此。高校***书馆作为人类文化和传播知识信息的服务中心,是教学、教研的服务基地,肩负着教育教学的重任,为教育事业的发展搜集、整理和提供各方面的资料。在数字化和网络化环境下,传统的服务模式已不能满足读者的需求,需要进一步深化***书馆的服务,开发***书馆现代化信息服务项目,积极做好***书馆服务模式的转型工作,以更好地满足教学、科研的需要。

2高校***书馆传统的服务模式

2.1封闭型建设模式

由于传统的高校***书馆受不同时期社会***治和经济发展的制约,在发展过程中与社会的接触是受限制的,可谓自我封闭内向型。形成“小而全”、“大而全”、“备而不用”、“万事不求人”的自我封闭的***书馆服务模式。每个学校的***书馆都试***建立自己的比较完善的服务体系。在藏书建设中,自我发展,限定服务对象和范围,致使某些文献,在一个地区可能有多所高校同时订购几十份,既浪费资金且利用率极低。由于每个***书馆的都资金有限,人员有限,服务有限,不能充分发挥文献资源的作用。

2.2被动型服务方式

传统***书馆的服务一般是等读者上门,所有的服务基本是以***书馆为中心,可谓是围绕***书馆馆舍展开的。***书馆的指导思想是尽可能把藏书收全,服务设施齐全,有比较舒适的环境。主要服务方式是:馆内阅览、***书流通、文献复制、参考咨询等。***书馆满足于书刊的借借还还、取取归归的服务方式。由于机制、经费、人员、设备的限制、服务工作有许多局限性,同时也束缚了***书馆员的思想,缺乏主动服务的意识。

2.3劳动密集型文献管理

***书馆工作人员对文献的加工,主要是对整体文献的加工和处理,也可称为“粗加工”,例如:***书以整体***书为著录单元,期刊以一种刊物为著录单元。工作人员从书刊的采访、编目、加工、入库、管理,主要是从事重复性劳动,工作繁琐,劳动强度较大。衡量一个***书馆服务工作的效率,往往是以***书的流通量作为唯一的标准。每一个***书馆以收藏和占有文献的数量,作为***书馆级别的标准。从一个***书馆整体工作而言,以劳动密集型为主。[1]

3数字化与网络化环境下高校***书馆的服务模式

3.1开放型服务模式

***书馆开放型服务模式是相对于过去的封闭型服务模式所提出的,是现代***书馆的本质特征和标志。开放式服务的具体含义主要有以下三个方面:一是***书馆对本单位或本市区的读者实行全方位开放,将全部馆藏都实行开放,改变过去封闭或半封闭的管理模式;二是各类***书馆都向社会开放,以满足不同层次读者的需要,实现资源共享;三是***书馆不仅要为社会个体读者提供服务,满足他们的知识信息需要,而且也应向社会团体、各种机构提供服务。在目前高校***书馆的实际工作中,开放从以下几个方面开展:

3.1.1自由的时间

***书馆为读者提供全天24小时服务,使读者能够在任何时间使用***书馆。

3.1.2开放的空间

***书馆通过调整馆藏布局,打破以往藏书区与阅览区的分离状况,在充分实现文献开架的基础上实现流阅合并。读者可以随意从书架上选取所需***书,并根据自己的需求度来决定是阅览还是外借。

3.1.3无界的权限

***书馆不对读者进行身份界定,任何人可以自由出入高校***书馆。读者进入***书馆不需要出示任何证件,也无需签名登记,来馆人数自动统计,馆藏文献几乎全部开架阅览,读者阅览后不必上架,也无需代书板。读者阅读姿势不受限制,充分体现了“以人为本”的思想。[2]如:2006年,信阳师范学院***书馆宣布向市民开放。在开展开放式服务的情况下,读者进出***书馆更加方便,入馆人数有较大幅度增加;充分体现读者平等的思想,读者权益平等化、文献利用率大幅度提高。

3.2主动型服务

随着现代信息技术的发展,***书馆的外部信息环境和内部业务机制正在发生重大的变化。[3]面对社会的信息需求,***书馆的服务已经开始走出***书馆,面向读者、面向社会、面向需求、上门服务。在做好阵地服务的同时,工作人员主动与读者联系,了解需求,采用新的服务方式,主动为读者服务。在当前数字化和网络化环境下的高校***书馆应主动与读者联系,掌握信息需求,及时收集、加工信息,在各种专业平台上,提供信息服务。同时就聘用各种专业背景人员作为馆员,从而提高信息资源建设和服务的质量,主动为教学、科研服务。

3.3知识密集型劳动

信息社会需要信息的深层次加工,***书馆开始从以文献单元的加工,深入到以知识单元为主的加工,***书馆的服务工作将从借借还还的服务,转移到多层次信息咨询服务,有更多馆员从事信息资源建设并直接参与市场,成为信息技术的中介,在信息服务的每一个环节增加智力投入。在数字化和网络化环境下产生了新型的***书馆信息服务人员,被称为“网络信息导航员”、“网络信息咨询员”。信息服务人员已经从简单重复性劳动,逐步转为知识密集型劳动。

4数字化与网络化环境下高校***书馆服务模式的创新

如前所述,数字化技术、通信技术和网络技术的迅速发展,极大的提高了信息处理、存储和传递的能力与效率。使大规模、整体化开发和利用信息成为可能,使***书馆的服务方式也越来越多样化。因此,除了做好从传统服务模式向现代服务模式转型之外,还要提升服务的创新功能,将高校***书馆服务模式与数字化和网络化环境紧密结合起来,尽可能多的为各类读者提供广泛、准确、时效的优质服务。近期,笔者通过参观一些兄弟院校新校区***书馆并检索相关专业文献,发现当前各高校***书馆在改进服务模式方面,主要有以下一些创新:

4.1集成式服务

集成式服务也称为“一站式”服务(FirstStopService),这种服务集成***书馆的资源和服务,使用户用最少的步骤,就能获得他所需要的多种分散的服务。一站式服务大大节省了用户的时间,提高了查询和利用的效率,给用户提供了最大限度的方便。目前部分高校***书馆开展的“IC一卡通”服务就是一站式服务的典型代表。传统***书馆服务中各个部门之间彼此***,分别为***书馆用户提供服务,当用户需要利用***书馆完成多项任务时必须穿梭在各个部门。而“IC一卡通”这种服务模式改变了传统服务模式存在的局限,这种服务模式大多数是在原来电子阅览室的基础上进一步整合***书馆技术部、参考咨询部,甚至馆外的网络中心、远程教育中心等资源的服务,将用户的需求纳入一个整体中,使参考馆员伴随在用户的周围。协助用户完成信息的识别、检索、处理、存储并用适当的格式表现输出。这个服务的实质就是在同一空间,同一个平台上获取信息资源,获得信息帮助、提高信息素养,并顺利进行学术交流研究的服务模式。

4.2针对模式

针对就是根据用户的知识结构、信息需求、行为方式和心理倾向等,有的放矢的为具体用户创造符合个性需求的信息服务环境,为其提供特色化的信息资源和服务并帮助用户建立定向化的个人信息系统。具体的讲,就是针对不同用户的需求提供各种专门的定题跟踪和检索服务。这是一种关注用户个性需求的服务模式。用户可以根据特定需求展开定制。利用个性化书签,读者可以挑战“权威”,对***书馆信息资源进行个性化的分类标引。如:开源软件建立的个性化门户,提供定制个性化资源和栏目功能,使用户可以轻松建立与众不同的网页;RSS服务聚合了多种类型信息资源,用户只需订阅自己感兴趣的话题和新闻就可以享受信息自动上门的便捷。此外,用户还能拥有自己的个性化空间,依据本身的需求和爱好自行组织信息内容,享受***网摘、信息上传、分类或主题词标注、建立知识库、搜索、共享等功能。

4.3***书馆特色服务

***书馆特色服务是针对传统服务而产生的新服务观念及在此基础上开拓的新型服务模式的总称。它的显著特点就是将馆藏的局部优势体现出来,文献特色鲜明,主题明确。这种特色服务,打破了传统的阵地阅览服务方式,组织与自身特色相关的活动是它服务内容的重要组成部分。如:俄罗斯的木头***书馆,泰国的水上***书馆、北京的服装资料馆和地质资料馆等等。高校***书馆应针对自己的专业特点和读者状况展开特色服务,如:上海海事大学***书馆提供海事行业相关的专题信息查询服务;日本的早稻田医科大学***书馆提供针对盲人读者的服务,有专门为盲人读者提供语音阅读的阅览室,提供一些学科的盲文书籍;北京理工大学***书馆建立的徐特立老院长著作阅览区,向读者展示徐老生前捐献***书、杂志、信函;天津中医药大学***书馆近几年建立的天津市名老中医文献资料室,专门腾出几间阅览室,将郭霭春、哈荔田等老专家学者捐献的***书分类上架,供读者查阅。

4.4读者自助式服务

所谓“自助式服务”是指***书馆的读者以类似在超市购物的方式获取自己所需信息资料的一种自我服务的模式。读者自我导向学习相对于馆员导向学习的最大差别就在于学习过程由学习者自己控制,在这个过程中用户本身的积极参与,表达自己正确的观点和意见,提出自己对***书馆服务的看法,馆员则成为文献服务指导者和信息环境的构建者,引导和指导用户学术信息流,如:课题信息、会议信息、同行信息、出版信息、自存储信息、投稿信息、评价信息等等。***书馆馆员采用读者需求调查等手段分析用户的信息需求,主动参与到学习过程中来,有针对性的提供服务是这项服务开展的关键。当代***书馆已经开始利用各种互动工具创造读者自导式服务的客观环境。高校***书馆利用RSS建立***书馆新闻、公告、新书通报等信息推送,整合商业数据库的RSS服务,建立相关信息聚合、推送服务;利用博客可建立资源介绍、服务介绍、最新消息等网页,让读者进行评论和反馈,建立与读者的交流和互动的平台;利用社会性书签,可以尝试让读者对网络资源导航等进行资源的分类标引,提供用户容易理解和便于使用的分类体系;利用即时通讯技术可提供实时的虚拟参考服务等。如:国家科学***书馆的学科馆员重视与用户接触的每一次机会、每一个细节、每一次服务,建立了与用户***沟通的MSN或QQ,拥有中国科学院研究生院“空中课堂”、“科苑星空”(BBS)账号,与用户保持紧密互动中为用户提供专业的学科服务。

5当前高校***书馆服务模式转型和创新尚需加强的工作

当前,***书馆界正处于从传统服务模式向现代服务模式转型的一个过渡期,新服务模式尚处于初创的阶段,还有待于进一步改进和完善。众所周知,由于历史的原因和各方面客观条件的限制,当前高校***书馆服务模式转型和创新工作还有很多需要加强的地方。结合当前的工作实际,笔者认为,在数字化和网络化环境下,我国高校***书馆做好服务模式转型和创新,还应不断加强以下几个方面的工作:

4.1树立“以人为本,科学化与人性化相结合”的指导思想

数字化和网络化环境的形成对我国高校***书馆提出了新的更高的要求,高校***书馆要大胆破除以往那种“以藏为主”的非人性管理模式,建构“以人为本”的***书管理思想,即以用户为龙头,以服务为导向,实施个性化服务才能赢得用户的认可与信赖。而实施科技含量高的个性化服务,既需要采取科学的方法,更需要营造良好的人文环境。因此,21世纪高校***书馆管理模式应尽快完成由传统的科学化管理向现代的人性化管理的转变。科学化管理是以传统的目标管理和全面质量管理(TQM)为主的管理方式,强调的是服务的效果—产品;科技含量高的人性化管理是从塑造高校***书馆的背景文化和人文精神出发来对员工进行的管理方式,强调的是服务的主体—人。[4]高校***书馆就得以师生员工为本,全心全意地为他们服务,这就是我国未来高校***书馆管理工作的重要发展思路,若无此发展思路,则一切皆空。要尽快达到高校***书馆管理的科学化和人性化的有机结合,是当前和今后相当长的一段时期高校***书馆事业服务模式转型、创新的非常重要的指导思想。

4.2对于***书馆传统管理体制模式的改革和创新

在数字化和网络化环境下,用户多元化多层次的文献需求与知识个性化需要,教育文化发展的产业化与知识资本的竞争化,对传统的高校***书馆管理工作提出了严峻挑战。传统的管理模式在信息时代高速发展中,由于其自身原因,长期得不到开发,已很难适应新时期网络发展的需求。没有市场便没有竞争,没有市场也就失去生存的价值。由于所承担的特殊职能的原因,我国高校***书馆按事业单位管理体制模式进行管理,通过行***手段,使其长期保持非市场性和非竞争性。要冲破此类束缚,就必须大胆改革,勇于创新。加强优质服务和提高服务效益是做好高校***书馆工作的首要任务。要做到这些,就要求我们改变传统观念,虚心学习兄弟院校的先进管理经验,大胆改革传统的管理体制模式,不断进行体制创新,使***书馆服务工作具有更高的服务质量和社会效益。

4.3网络信息服务与非网络信息服务的有效结合

校园网接通了信息高速公路,为我们带来了大量有价值的信息。通过网络不但能了解最新的科技成果与科学管理方法,而且可以获得先进生产技术和各种产品的供求信息。如何在因特网上检索、转存资料,并为校内外用户提供主动的信息服务,是网络环境下高校***书馆的职能之一。对此有效的做法是:根据学校和社会的发展需求,特别是高校教学科研的信息需求等情况,确定信息搜索的范围与重点,以及开发利用网络信息的途径与方法,制定出切实可行的信息开发利用计划与实施方案。不但要重视信息的搜索.更要重视信息的开发利用,要立足校内,面向社会寻找信息用户,以便最大限度地开发利用网络信息资源。

4.4在实现资源共享的同时.提供特色数据库服务

当前,中国高等教育文献保障系统(CALIS)的建立,使高校***书文献信息资源共享成为现实。CALIS的宗旨是:实现信息资源共建、共知、共享,以发挥最大的社会效益和经济效益,为中国的高等教育服务。它的100多个成员馆已经开始联合引进国外电子信息资源数据库、联合编目、联合建库等。[5]据统计,就高等院校的***书馆而言,将自己的局域网连接到校园网,继而连接到国际互联网的***书馆已超过300个。数字化和网络化环境的构建,打破了***书馆之间的相互***、封闭的局面,使得信息交流、数据获取畅通无阻,有形的、***的***书馆概念将不可避免地被无形的、广义的***书馆概念所取代。在这种情况下,一个***书馆如果缺乏共享观念,开发其他***书馆开发过的东西,将是对资源的一种巨大的浪费。从另一方面来讲,目前大多数网站并不能提供科学技术方面的信息资源。高校***书馆可以借助教育科研网的优势,结合自身的实际情况,建立具有本馆特色的专题文献数据库、硕博论文全文数据库、科研成果与论著数据库及多媒体资料数据库,还可以收集国内外***数据库,形成具有自己特色的信息产品,为教学科研及社会上特定用户提供专业的服务。

4.5提高高校***书馆馆员的综合素质

数字化和网络化环境下的高校***书馆,要求其馆员具有较高的分析、管理、开发信息的能力。因此。馆员不但要具有丰富的学科知识和新型文献信息管理专业知识,还要有一定的外语水平以及一定的计算机操作能力和网络知识,应该能够熟练地利用各种现代信息技术和手段,进行信息搜集、组织、加工、以及信息教育,具有一定的网络知识和使用网络软件的能力。这就要求***书馆员能自觉接受多种形式的继续教育,主动学习,不断更新知识,完善知识结构,了解信息资源发展的动向,发现和搜集有价值的信息资源,更好地为学校广大师生服务。

5结束语

综上所述,在数字化和网络化环境下,我国高校***书馆业应采取有效对策,应对挑战,把握机遇,积极做好***书馆服务模式的转型和创新工作,更好的为高校教学、科研工作服务。换言之,高校***书馆业必须树立“以人为本”的指导思想,大胆改革传统的运行体制,不断增强***书馆员的综合素质,加大对数字化、网络化、信息化的投入,并对其进行系统、深入的研究。只有这样,我国高校***书馆业才能适应数字化和网络化的国际环境,才能获得更大的发展空间,才能创造出更加辉煌的明天。

[参考文献]

[1]洪明禄.传统模式和网络环境下高校***书馆服务模式的对比分析[J].***书馆论坛,2009,(2):214—215.

[2]杨雪晶,孔凡晶.学习型社会与高校***书馆服务模式转变[J].现代情报,2009,(10):18—21.

[3]吴熨慈,张久珍.当代***书馆学情报学前沿探寻[M].北京:北京***书馆出版社,2002:138—139.

数字化转型论文篇2

摘 要:针对N―gram在音字转换中不易融合更多特征,本文提出了一种基于支持向量机(SVM)的音字转换模型,有效提供可以融合多种知识源的音字转换框架。同时,SVM优越的泛化能力减轻了传统模型易于过度拟合的问题,而通过软间隔分类又在一定程度上克服小样本中噪声问题。此外,本文利用粗糙集理论提取复杂特征以及长距离特征,并将其融合于SVM模型中,克服了传统模型难于实现远距离约束的问题。实验结果表明,基于SVM音字转换模型比传统采用绝对平滑算法的Trigram模型精度提高了1.2%;增加远距离特征的SVM模型精度提高1.6%。

关键词:人工智能;自然语言处理;支持向量机;音字转换;粗糙集理论;远距离特征

中***分类号:TP391 文献标识码:A

1 引言

音字转换的任务是完成输入的拼音串到对应汉字的转换,它是语音识别后续处理与拼音键盘输入的关键部分。由于需要将仅410个拼音转换为超过6700个汉字,这使得准确地完成音字转换任务具有一定挑战性。

为有效地解决音字转换问题,基于规则的方法[1]与基于统计的方法[2,3,5]已被用来建立音字转换模型。前者能够通过分析语法和语义关系来精确地理解语言知识,然而由于自然语言较复杂,其只能处理封闭的语言现象。相比,后者是对自然语言复杂现象的简化描述,能够方便地实现大规模统计与加工。文献[2]中使用了N―gram模型,这是比较传统的经典模型。文献[3]在N―gram模型的基础上,利用互信息方法获取转换规则,并采用线性加权方法融合于N―gram模型中。文献[4]利用粗糙集理论提取音字转换粗规则,远距离与近距离约束都通过粗规则来描述。

理想的语言模型能充分捕获且能利用上下文信息。比如:对于“一只美丽的小花猫”与“一枝美丽的鲜花”,需通过“小花猫”和“鲜花”来确定“Zhi”对应的汉字。如果能充分利用这些远距离规则,将有助于正确的转换,再如“越…越…”,“只有…才能…”等都会较大地弥补近距离上下文环境所不能解决的问题。此外,还不妨尝试一些深层语言知识,如词性特征,名实体等识别特征等。然而N―gram模型假设所加入的特征彼此***,这导致它不容易进一步融合多种特征,如观察特征与远距离特征等。为此文献[5]中采用插值方法融合触发对特征,然而统一插值权重的选取不能实现为每个样本赋予合适的权重。还有学者研究语音识别音字转换中的快速容错算法[6]。探讨字转音算法[9]等。

为寻求能够有效融合各种特征的语言模型,本文基于支持向量机(SVM)建立音字模型。SVM以结构风险最小化原则取代传统机器学习方法中的经验风险最小化原则,在有限样本的机器学习中显示出优异的性能[7]。SVM所具有的良好泛化性能,在一定程度上避免了小样本语料及高维特征空间中易于出现的过拟合问题,同时通过C参数实现的最大软间隔分类算法,可以有效地容忍少量噪声语料或极个别特殊样本带来的负面影响。基于SVM模型,上述各种语言约束关系均可以表征为特征的形式,融合于统一的音字转换框架下,综合完成决策。

此外,本文又可以采用粗糙集方法、或者其他衡量特征的方法来提取远距离特征或复杂特征。最后,我们融合规则特征于SVM模型中,规则特征的作用程度将由SVM在训练时,按照整个音字转换模型的性能来确定。同时,该SVM音字转换模型可以方便地融合其他以特征来表示的多种转换约束关系。

2 基于支持向量机的音字转换模型

其中,K为核函数,b∈R是阈值,而ai是特征权重。ai满足约束: i:o≤ai≤c且 aiyi=0,这里C是误分类的惩罚系数。

音字转换可以看作序列标注任务,即对输入的拼音串标记其相应的汉字串。如果对每个拼音均构造SVM模型,那么将面临两个问题:(1)其存储空间太大;(2)按照公式(2)计算,会因为对于每一个拼音的各个候选,都需要与支持向量做内积运算,从而影响标注速度。

本文采用线性核,并合并中间计算过程,可以有效解决上述问题。许多任务中的实验已经表明:线性核与其他核函数的性能相接近[7,11]。然而我们却可以有效地解决存储空间和计算量问题,从而SVM可以有效用于序列标注问题。

数,按照“一对多”策略完成多值分类,由上式,特征j的相应权重可以在知道x之前计算:

经过上述预先计算处理,SVM可以高效地处理序列标注任务。公式(2)与(3)表明,分类过程只是对线性加权的特征进行判别的过程。

2.1 特征模板与特征映射

SVM在特征空间中完成对样本的分类,因此需要从每一个样本的上下文中抽取特征,并形成特征空间。表1中的特征模板,对于样本xi所代表上下文进行特征采集,形成特征向量。经过特征模板从样本中抽取特征后,样本的分类知识被表征为特征向量。以“yi/一zhi/枝mei li/美丽de/的xianhua/鲜花”为例,对“zhi/枝”搜集特征:“Zhi:枝P-1:Yi P0:Zhi P1:mei Ii P2:xian hua W-2:一”(注:此处只给出部分特征分量)。

与采用多项式核可在一定程度上自动组合特征不同,线性核是在输入特征空间上完成样本分类,因此输入特征空间需要具有丰富的特征表示[7]。表1中同时给出一阶、二阶、三阶特征。由SVM结构风险最小化的原理,可有效地保证音字转换模型仍具备很强的泛化能力。

表1分为词特征和字特征:(1)词特征。词作为基本的语法和语义单元,是相对稳定且有效的语句构成单位。相比字特征,词特征增加了语言的结构信息。(2)字特征。稀疏问题以及复杂的语言现象,都需要模型能够更加细致地刻画转换关系。字特征就是用来更精细地描述语言中的复杂转换关系。(3)此外,通过在第3部分阐述的远距离特征可以实现远距离约束关系,如“计算机一因特网”,“Xianhua(Zhi/枝)”。除上述三种特征外,还可通过构造新的特征模板,以实现新的约束关系,如语音识别中的信号特征。

公式(4)通过特征映射方法把符号特征映射为数值特征。特征值采用二值表示如下:

其中h代表当前上下文环境。通过上述特征映射,形成SVM特征分类空间。

音字转换训练与标注过程都是在该特征空间中 完成样本分类。由于无法确切计算期望风险最小,传统机器学习算法,采用经验风险最小代替期望风险最小原则,由此易导致过度拟合训练数据,尤其对于小样本情况或者特征过多的情况。而在音字转换问题中,恰存在上述情况。相比之下,SVM认为系统的风险是由两部分组成:经验风险和置信区域。置信区域与分类采用函数集的VC维成正比,与训练样本的个数成反比。将经验风险和置信区域的综合称之为结构风险。结构风险最小方法可以较好地保证泛化性能[9]。

2.2拼音分词

为了能够提供准确的词特征用于SVM音字转换模型,提出拼音分词方法。拼音分词的任务是把输入的拼音串,切分为以拼音词为单位的单元。如“yi zhi mei li de xian hua”被切分为“yi/zhi/mei li/ae/ xian hua”。

拼音分词采用Trigram模型并采用绝对平滑(Absolute Smoothing)算法完成。类似汉语分词过程,构造拼音网格(***1):

拼音分词就是在***1的网格中搜索最优切分路径。在Trigram模型下,寻找满足下式的切分:

其中,声(P1|P-2P-1)代表拼音串中第一个拼音词出现的概率。

相比音字转换,字转音的过程较为容易,因此易于大规模获取音字转换的语料。我们通过大规模拼音分词语料单独训练拼音分词模型,并利用该模型重新切分SVM音字转换模型的训练语料和测试语料。训练与测试均采用相同的系统处理可以尽量弥补切分错误带来的影响,这种技术已被用于类似语言处理任务,例如CoNLL-2000的Chunk评测中的训练语料和测试语料都采用同一词性标注系统。我们用2000年《人民日报》前5个月语料进行训练,采用第6个月语料进行评测,评测拼音分词的结果,获得96%的切分精度。

2.3 SVM音字转换模型其他问题

・特征过滤

基于假设出现次数多的特征是稳定的、有代表性的特征,而出现次数少的特征可能是不稳定的或是噪声特征。类似于最大熵模型通过设定阈值的方法过滤掉出现词数少的特征,本文按照阈值3进行特征过滤,更优的阈值需要实验确定。

・序列搜索

音字转换的过程是一个对序列加标记的过程,可以利用Sigmoid函数映射SVM距离输出形式为概率形式,并考虑整个转换序列的性能,将有助于转换的整体性能最优。SVM本身是向量模型,在解决序列问题上,常用的搜索算法有:(1)贪心算法;(2)BeamSearch算法;(3)Viterbi算法[8]。其时间复杂度依次为O(TN),O(NKTlog(KT)),O(T2N),其中T和N分别为状态个数和序列长度,K搜索宽度。

3 远距离特征提取

在SVM音字转换框架下,可以引入长距离特征。如“越…越…”,“只有…才能…,“计算机…网络化”等。通常利用特征词与当前拼音转换的搭配关系来获得远距离的触发词,例如互信息、平均互信息、信息增益、交叉熵等方法都可用来衡量。本文采用粗糙集理论提取远距离特征[4]。传统粗糙集理论利用集合下近似X0={θx:θx X}来提取粗规则特征,其中不可分辨关系θ是定义在决策对象集合u上的等价关系。然而该方法只能处理数据相容的情况,而对于自然语言中的复杂现象,需要采用扩展粗糙集理论中的a下近似来提取规则:

提取粗规则过程,是通过指定a,利用上式从语料库抽取规则。

以“一枝美丽的鲜花”与“一只美丽的小花猫”对拼音“zhi”为例,计算每一个可能的触发对。

表2演示了传统粗糙集提取规则过程。而在扩展粗糙集理论中,按照不可分辨关系合并等价对象,按照a下近似方法,来计算每一个决策规则的精度。即需要计算每一个对象的条件属性对于不同决策字的决策概率,这被称为规则精度,例如:“美丽枝”的规则精度为0.277,而“美丽只”的规则精度为0.723。按照a下近似集合定义,通过设定过滤阈值a获得粗规则,例如设定a=0.6,则获得粗规则“美丽zhi/只”。

粗规则作为特征融于SVM音字转换模型中,其表示方式为:设粗规则为“AP/B”,其中A为粗规则的各条件属性值,P代表当前转换的拼音,B代表P转换时对应的汉字。特征表示为:

其中,w=P代表当前处理拼音P,而A in b代表在当前上下文中出现粗规则的触发条件A,a=B代表该粗规则有助于转换为字a。

4 实验与分析

音字转换语料通过字转音算法生成[4]。实验中的全部语料来自于2000年《人民日报》。

表3给出了五种音字转换模型的对比实验。训练语料为1月份的前50万词,采用6月份的前5万词进行标注开放测试。其中在Bigram与Trigram音字转换模型中均已采用绝对折扣平滑算法(Ab―solute Discounting Smoothing)。

从表3的实验结果来看:(1)基于字的SVM模型的性能较差,主要因为词是语法和语义的基本单位,词特征可以为音字转换模型提供一定的语法结构信息;(2)基于词的SVM模型比Bigram和Tri―gram模型具有更高的转换精度。这是因为SVM模型融合了更丰富的上下文特征;(3)增加了远距离特征的SVM模型由于更充分利用了上下文信息,尤其是增加了远距离上下文而具有最佳的转换精度。经实验验证SVM音字转换模型具备易于有效地融合多种特征的能力。

下面考察C参数的取值对于模型性能影响。

***2(a)表明随着C参数的增大,测试精度首先增加较快,随后缓慢下降。在C=0.3时开放测试精度最高,为92.51%。而(b)表明封闭测试精度随C增加而增加。综合(a)和(b)来看,在C=0.3时,模型综合性能最优。

下面针对不同规模的训练语料做对比实验。

***3表明:(1)三种模型标注精度均随训练语料规模的增加而增加;(2)Trigram模型始终略好于Bigram模型,这是因为绝对平滑算法有效地克服了数据稀疏问题;(3)在10万语料时,Trigram与Bigram要好于SVM模型,这是因为Trigram是概率模型,且采用了绝对平滑算法,故当训练语料库非常少时,回退平滑策略使其转换到低阶词概率进行转换。相比之下,SVM是向量模型,在数据稀疏时会出现,特征模板提取的丰富特征中具有不稳定的特征,所以SVM在规模非常小时错误率较高;(4)从曲线的变化趋势来看,随着训练语料规模增大, SVM模型逐步地更优于Trigram模型。这恰恰说明了丰富的特征使得SVM音字转换模型能更精细、准确地描述转换知识。

下面考察不同核函数对SVM模型性能影响。

***4①给出转换出错率较高的几个典型字(的、有、以、里),测试不同核对于音字转换的影响。该实验结果表明:(1)***(a)中,线性核生成的支持向量最少,从而使得模型规模最小;(2)***(b)和(d)表明线性核转换效率最高;(3)(c)说明一般情况线性核标注性能已经较好。有更严格的实验表明线性核不比其他核的性能差很多[9],甚至有时能达到多项式核精度[7],却有更高的效率;(4)综合上述分析来看,基于模型的运行效率、规模和转换精度来考虑,线性核表现出理想的性能。的使用情况(只给出词特征,因为词特征在SVM音字模型起主要作用,0代表只出现P(0))。

该***表明:(1)音字转换过程中每次转换几乎都集中在少于5个特征的情况,这说明虽然模板特征(表1)较多,但实际在每次标注时,只有其中的几个起到作用;(2)从标注错误的分析来看,大部分集中在特征数为0、1或2的时候,更进一步的分析表明此时特征主要为拼音词。然而正如前言分析,已知"mei li”很难确定“zhi”的标记是“只”还是“枝”;(3)综合分析表明数据稀疏问题是影响SVM音字转换模型的最主要因素,因此可以从更有效的特征采集方法(例如引入词性特征等)以及增大语料规模的角度进一步提高SVM音字转换模型的性能。

5 结论与未来展望

本文提出基于支持向量机建立音字转换模型,并通过实验验证其性能。该模型有如下特点:

(1)SVM自身优越泛化能力与解决小样本问题的能力,使得该模型更胜任音字转换问题。尤其是当用于动态反馈音字转换任务,本文方法可以替代N-gram模型有效完成***学习功能。

(2)通过线性核并采用模型合并的策略,在几乎不影响音字转换模型性能的情况下,提高了SVM模型的音字转换效率。

(3)应用粗糙集理论提取远距离以及复杂特征,并将其融于SVM模型中,增加了表征远距离约束关系的能力。

数字化转型论文篇3

1数字期刊平台的建设及云数字出版

软件的开发实现交互式网络出版方式转型,最关键的是具备强大的数字内容资源平台和云出版服务体系。在***书方面,国内外已有多家数据公司构建电子书平台,国外如亚马逊Kindle电子内容平台,国内如汉王书城、盛大云中商城等。学术期刊的内容是比较***的,拥有特定的读者对象,很适合自辟一个数字期刊平台,提供版权管理、云存储和数据分析等服务。这样一个完整的、大规模的数字期刊网络平台,由国家新闻出版广电总局管理、大型数据公司如中国知网开发是比较合适的。继而是云数字出版软件的开发,保证出版单位均可自主上传数字期刊,上传的期刊后期可进行***出版评论和注释。在欧洲《大气化学和大气物理学》交互式开放存取办刊模式中,审稿意见是***公布的,其他感兴趣者也可***评论文章,作者也可***回复审稿人或其他人的问题并进行讨论;所有***评论均可存档,且这些评论(建议、讨论等)跟文章正文一样作为正式刊发的内容,可被引用。从技术角度看,数字期刊平台的建设及云数字出版软件的开发是完全可以实现的,但是需要投入大量的研发资金和人力。2014年4月24日,国家新闻出版广电总局以及***联合印发了《关于推动新闻出版业数字化转型升级的指导意见》,向出版界明确提出:开展数字化转型升级标准化工作,提升数字化转型升级技术装备水平,加强数字出版人才队伍建设,探索数字化转型升级新模式。近年来,我们国家也确实一直致力于推动学术论文数字化平台、版权***交易平台和出版资源库的建立,同时鼓励各平台间通过市场化的方式,实现出版内容以及行业数据的跨平台互通共享。国家***也通过成立一些基金项目如中央文化产业发展专项资金、国家出版基金等给予重点支持。***策和研发资金的支持,使科技学术期刊的交互式网络出版充满了希望。

2解决开放获取与经济效益之间的矛盾

科技学术期刊的办刊理念是促进学术的百家争鸣,快速传播新的科研成果,传递高质量的科学信息。而免费开放获取方式最符合这一理念,方便读者阅读引用。国外的开放获取期刊正在不断产生和发展,而我国目前也有600多种高水平的学术期刊实现了不同程度的开放出版。交互式网络出版的目的实质上就是促进学术交流,提供真实有效的数据和信息,故其同样提倡免费开放获取方式,但开放获取涉及到了多方面的经济利益,无论是期刊单位还是出版平台均不能通过发行获利。与传统的期刊出版模式相比,网络出版无需印刷装订等环节,出版费用大大降低,但在数字期刊平台出版、管理同样要付费,那这笔费用谁来付?开放获取等同于取消了版权转让费,期刊的经济效益受到了影响,而任何一种期刊运作都是有成本的,开放获取期刊也不例外。目前大部分学术期刊的经济问题不容乐观,尤其是自负盈亏的中小型期刊以及由主办方和期刊社共同承担运作经费的期刊。由主办方全额提供各项运作经费的期刊,虽然表面上看似不用担心经费问题,但大多主办方也是以盈利为导向,对于亏损的期刊包袱不知道还肯背多久。因此,经济效益必然成为学术期刊开放获取的最大阻力因素。目前,作者支付模式是国外开放获取期刊最主要的一种成本弥补手段,也就是向作者收取一定的论文处理费如版面费,读者可以免费使用。然而,国内作者本来就要承担一笔价格不菲的版面费,再额外收取出版费用,负担未免过重。虽然只是学术论文的作者,但是他们作了研究、写了论文,付出的汗水不比文学作者少,可是当他们无私地将研究成果公开发表时不仅没有稿费,还要自己承担高额的出版费用,这未免太不公平了。未来的交互式学术电子期刊最好免收作者的版面费及出版费,极大程度上减轻科研人员在投稿方面的经济障碍,大力支持科研活动。我国学术期刊多数是由学(协)会、高校、科研机构等主办,与国外主要由出版商经营学术期刊的模式不同。因此,我们在借鉴国外开放获取期刊做法的同时,需要积极探索适合我国国情的期刊运转经费保障模式,解决期刊实行开放获取的后顾之忧。也许不久的将来,待我国的国力进一步强盛以后,学术期刊也能像义务教育一样,得到国家的全额资助,我们的编辑也能像老师一样,安心做好自己的本职工作,无需为办刊经费发愁。

数字化转型论文篇4

关键词:***示教学法 Java 类型转换

***示教学法是以***形、***象或表格为主要形式,揭示事物现象或本质特征,激发学生思维,使其更好地掌握有关知识,把握事物发展规律,加快教学进程的一种教学方法。这种教学法用形象化的***形,***象或表格的形式讲授基本概念,揭示事物之间的逻辑联系,其实质是使知识形象化,抽象理论具体化,零碎知识系列化。

Java类型转换涉及的类型较多,转换方法灵活多变。一般的讲解授课,学生总是感觉东西多而且乱。而***示教学法直观明了,便于学生理解和掌握知识。

我们知道:Java的数据类型分为三大类,即布尔型、字符型和数值型,而其中数值型又分为整型和浮点型;相对于数据类型,Java的变量类型为布尔型boolean;字符型char;整型byte、short、int、long;浮点型float、double。其中四种整型变量和两种浮点型变量分别对应于不同的精度和范围。此外,我们还经常用到两类变量,即String和StringBuffer。对于这些变量类型之间的相互转换在我们编程中经常要用到。本文将通过***示法对Java类型的转换中做了一些总结和探讨。

下面***1、***2和***3是转换***,我们分别称之为“三角转换***”、“星形转换***”和“矩形转换***”。“三角转换***”主要显示了StringBuffer、String、Integer和int之间的类似三角形的转换关系。“星形转换***”显示了日期Date类型和String类型、int类型和long类型之间的转换关系。而“矩形转换***”则显示了byte、short、char、int、long、float、double之间的转换关系。

在***1中,总共涉及到8种转换,每种转换分别举例介绍如下:

(1)由Integer类型转换到int类型,可以使用Integer类型的方法intValue()。假设x是Integer类型的变量,则x.intValue()转换为int型。

(2)由int转换为Integer型,直接利用Integer的构造函数,new Integer(x),这里假设x为整型变量。如Integer i=new Integer(3)。

(3)由int型转为String,只需要int与空串相加,如String a=“”+9;或者通过String类的方法valueOf(),比如String.valueOf(12.345),将放回字符串“12.345”。

(4)数字字符串转换为int型,只需要调用Integer类的parseInt()方法。如int i=Integer.parseInt(“123”)。

(5)Integer转换为String,直接利用其toString()方法。

(6)String转换为Integer类,需要调用Integer类的valueOf()方法。如Integer x=Integer.valueOf(“123”)。

(7)直接调用StringBuffer类的构造函数直接可以将String变为StringBuffer类,如StringBuffer sb=new StringBuffer(“123”)。

(8)将StringBuffer类变为String类,需要调用StringBuffer类的toString()方法,如str是StringBuffer类型的变量,str.toString()将把str转换为String类型;也可以利用类StringBuffer的substring方法,该方法是提取字串的函数,当然也可以拿来生成StringBuffer类型变量对应的String变量。如将StringBuffer类型的变量sb转换为对应的String类型数据,可以这样转换:String s=StringBuffer.subString(0,sb.length())。

这里有几点要注意:

1. 上面设计到的String必须是数字组成的字符串,否则会发生数据转换异常。

2. 除了上面介绍的基本的转换方法之外,还可以在此基础上变化出多种转换。比如把String转换成Integer类型,可以直接按照(6)的方法来转换,也可以经由int类型为中间桥梁做转换,通过(4)、(2)来达到转换的目的。Integer x=new Integer(Integer.parseInt(“123”))。再比如从int转换为String类型,除了上面直接的转换方法之外,还可以先把int转为Integer,然后调用Integer类的toString()方法。如String a=new Integer(8).toString()。

3. 通过前面“三角形转换”的介绍,我们再进一步讨论下包装类和对应的简单类型之间的转换:在讨论之前,简单了解一下Java的包装类。所谓包装类,就是可以直接将简单类型的变量表示为一个类,在执行变量类型的相互转换时,我们会大量使用这些包装类。Java共有六个包装类,分别是Boolean、Character、Integer、Long、Float和Double,从字面上我们就可以看出它们分别对应于boolean、char、int、long、float和double在进行简单数据类型之间的转换(自动转换或强制转换)时,总是可以利用包装类进行中间过渡。一般情况下,首先声明一个变量,然后生成一个对应的包装类,就可以利用包装类的各种方法进行类型转换了。例如:例1,当希望把float型转换为double型时:float f1=100.00f;Float F1=new float(f1);Double d1=F1.doubleValue();//F1.doubleValue()为Float类的返回double值型的方法。

当希望把double型转换为int型时:double d1=100.00;Double D1=new Double(d1);int i1=D1.intValue();

当希望把int型转换为double型时,自动转换:int i1=200;double d1=i1;

简单类型的变量转换为相应的包装类,可以利用包装类的构造函数。即:Boolean(boolean value)、Character(char value)、Integer(int value)、Long(long value)、Float(float value)、Double(double value) 。

而在各个包装类中,总有形为××Value()的方法,来得到其对应的简单类型数据。利用这种方法,也可以实现不同数值型变量间的转换,例如,对于一个双精度实型类,intValue()可以得到其对应的整型变量,而doubleValue()可以得到其对应的双精度实型变量。

4. StringBuffer、String和char也可以构成另外一个三角形转换。char类型经过String.valueOf(char c)方法可以转换为String类型,而通过String类型中的charArray()方法可以将字符串转换为字符数组。我们还可以通过StringBuffer的charAt方法,获取StringBuffer某个字符,或者通过StringBuffer的append(char ch)方法使char类型转换为StringBuffer类型。

Date类与其它数据类型的相互转换,见***2。

整型和Date类之间并不存在直接的对应关系,只是你可以使用int型为分别表示年、月、日、时、分、秒,这样就在两者之间建立了一个对应关系,在作这种转换时,你可以使用Date类构造函数的三种形式:Date(int year,int month,int date):以int型表示年、月、日;Date(int year,int month,int date,int hrs,int min):以int型表示年、月、日、时、分;Date(int year,int month,int date,int hrs,int min,int sec):以int型表示年、月、日、时、分、秒。在长整型和Date类之间有一个很有趣的对应关系,就是将一个时间表示为距离格林尼治标准时间1970年1月1日0时0分0秒的毫秒数。对于这种对应关系,Date类也有其相应的构造函数:Date(long date)

获取Date类中的年、月、日、时、分、秒以及星期你可以使用Date类的getYear()、getMonth()、getDate()、getHours()、getMinutes()、getSeconds()、getDay()方法,你也可以将其理解为将Date类转换成int。而Date类的getTime()方法可以得到我们前面所说的一个时间对应的长整型数,与包装类一样,Date类也有一个toString()方法可以将其转换为String类。

在***2中,主要涉及强制类型转换之间的情况,共7种数据类型之间的转换。每种类型下面的数字,表示该类型占用的字节数。比如float类型下面有个数字4,表示float占用4个字节。那么,类型按照实体箭头所示的方向,是由低级数据类型往高级数据类型作转换,或者绝大部分是由占用字节位数少的数据类型向占用位数多的类型转换,这种类型转换称为自动类型转换。而虚线箭头表示的是由占用字节位数较高的类型向占用字节位数较少的类型转换,这时进行的是强制类型转换。

经过教学实践,我们发现教学效果良好,学生们可以很清晰地看到其中内在的联系,而且有助于学生的理解和记忆。

参考文献:

数字化转型论文篇5

中***分类号:G23 文献标识码:A 文章编号:1003-9082(2015)06-0170-01

在新的数字传媒时代,编辑人员的素质要求不仅仅是在文字表达方面的规范和正确,更体现在如何更好地向读者展示信息和知识。在这样的条件下,对编辑人员的素质则提出了更高的要求。

1.编辑主体从单一性转向多元化

传统编辑工作的主要对象――句子、段落、页码、章节等顺序是由作者决定的,同时也由***书本身的物理序列结构所决定。在传统的编辑空间中,信息传播的方式与结构限制了编辑主体的多元化,因此编辑的主体都具有一定的单一性。但在数字化时代,信息空间则完全不受物理三维空间的限制,要表达一个构想或一连串想法,可以通过一组多维指针,来进一步引申或辨明,整个文字结构就像一个复杂的分子模型,大块信息可以被重新组合,句子可以扩张,字词可以当场给出定义,信息的传输不再局限于某一时间,也不受传输耗时的限制。数字化社会中的多媒体,具有互动的功能,这种互动的功能决定编辑主体应具备多元化。

2.编辑工作从纸质化转向电子化

在数字时代,对于一般编辑而言,只要精通使用技术即可,不需要其掌握开发技术。但从我国的现状来看,传统出版业的编辑在这方面普遍存在着技术短板。因为我国的出版社长期在垄断环境下经营,许多编辑过去仅仅懂得受一定体制优势保护的纸质化***书出版,不具备市场化能力和互联网理念,不懂得数字版权运营,不清楚数字出版的经营模式,甚至许多编辑对于数字出版所需的技术、新型载体也不甚了解。这种情况下,编辑的的工作量越来越大,压力越来越大,受数字出版冲击却又缺少精力学习转型。面对全新的数字出版方式,很多编辑显得无所适从,焦虑与浮躁成普遍心态。因此,数字出版时代编辑必须要熟悉相关技术,熟悉数字出版具有哪些新的出版形式,这些形式有什么特点,并且了解新的形势下受众的阅读特征有何变化, 赢利模式有哪些变化等;要随时掌握世界范围内数字出版业的具体变化,并对各种出版终端的特点能清晰地把握。这样才能跟上编辑工作电子化转型的步伐。

3.编辑角色由“搜猎者”变为“反哺者”

在传统的编辑工作中,编辑在大量的文化资源中搜寻、选择最有价值的部分,经过加工向社会传播,影响人们的思想,推动社会的进步与发展。编辑在与读者的关系角色中,具有支配性的作用与地位。但在数字化时代,传输的模式不再是编辑根据自己判断作出选择,而是受众根据自己的爱好、需要通过数字化直接传递给编辑,编辑者再根据受众的反馈编辑个人化的内容。所以编辑的角色发生了重要变化,由“搜猎者”变为“反哺者”。这个角色的转变是从编辑这个职业确立以来前所未有的。在数字化时代,信息载体及其传递模式发生了***性的变化,使得编辑直接面向受众,编辑支配性地位下降,受众地位提升。分散的、个体化的互动式交流使得编辑选择的主要依据不再是传统的文献资源,而是直接依赖于受众本身的爱好、需要和特征等。

数字化时代,不仅对编辑的技能理念提出了新的要求,编辑也面临媒介素养提高的挑战,由原来以知识素养为中心的媒介素养,转向以信息为中心的媒介素养,并且使两种素养得以融合。

1. 提高编辑媒介素养,要求加强与媒介、媒体和媒体受众的交流,获取信息资源

数字化时代,媒介的性质和功能发生变化,媒介种类多样化,编辑要接触这些媒介,需要懂得其基本的运作过程和使用方法,了解媒体发展状况。编辑要站在当前***治经济文化的背景下,理性全面地了解媒体变化,参与媒介受众的交流和互动,明确了解当前受众的需求;加强对媒介、媒体和媒体受众的了解,明确自己作为编辑的职责、权利和义务,以适应当前数字时代的新要求。

2.提高编辑媒介素养,提升其掌握、分析、评估媒介产品的技巧和能力

数字化时代,国内外媒介环境发生变化,媒介环境和信息越来越复杂,编辑要有主动学习意识和***思考辨析信息的能力,形成批评式思维意识,这是信息时代对编辑媒介素质的基本要求,编辑掌握利用好媒介,使用媒介资源进行知识和信息的传播,加强与媒介受众的互动交流,促进信息资源的传播。编辑在复杂的信息环境中,要学会分析、评估媒介产品价值,使媒介产品价值得到最大限度的发挥。

3.学习先进的传播理念,打造知识和传播型媒介

数字化时代,媒介的信息传播,就是对个人学习的促进,编辑的传播价值要在信息化过程中得以发挥和加强。媒介消费成为一种消费形式,编辑媒介素养的培养促进媒介消费形式的发展,通过学习先进的传播理念,提高编辑个人媒介素质,使信息资源得到最大效果的传播。

4.提高编辑媒介素养,要形成提高媒介素养的文化环境

媒介素养文化环境的形成,会对提高编辑媒介素养形成外在的软约束和促进作用。编辑部要经常开展一些专题讨论交流会,形成积极向上的氛围。编辑自身要有媒介素质培养的积极性,把编辑媒介素养提升看作个人的责任和义务。媒体主管部门要鼓励编辑提升个人素质,为编辑媒介素养提升提供平台,组织编辑交流学习,提升编辑的媒介创新能力。只有形成提高媒介素养的文化环境,才能保证编辑媒介素养的持续提高。

编辑数字化转型的核心在于编辑自身意识形态的转变,这是一个漫长而又复杂的革新过程,其中出版体制的改革、读者需求的转变、数字化技术的普及等诸多客观因素的改变将对其产生重大影响。现阶段国内各个出版社针对编辑的数字化转型也都处于积极的探索阶段,理论的研究还没有得到最终的实践证明,但是随着信息技术的不断更新,编辑的数字化转型将成为必然趋势。

参考文献

[1]乔瑞雪. 数字时代编辑的传播理念与媒介素养探析[J]. 报刊研究:下半月, 2012(01).

[2]张文胜. 数字时代***书编辑如何创新[J]. 出版参考:下半月,2012(04).

数字化转型论文篇6

关键词:数字媒体技术;分形***像技术;分形动画;人才培养

新媒体时代,数字媒体的表现形式越来越多样化,媒体的受众对于数字媒体的艺术性与表现性的期待越来越高。这些环境的变化促成了艺术的发展与创新,而数字媒体技术专业培养人才的理念与思路也应该与时俱进。新媒体的发展要求数字媒体的形式更为多样,传播更加快捷,内容更加炫酷与震撼眼球。分形理论强调整体对部分的依赖性,它超越了传统构成学,揭示了艺术形态新的构成规律[1]。分形艺术***形不仅丰富了传统的***形样式,更是以新技术、新方法、新理念引导着***形艺术的数字化转型。数字媒体技术专业应该把握这一良机,将分形几何的理论,分形艺术的设计工具,分形动画的制作等引入到教学中,引领学生学习多维的艺术设计工具与理念。

1分形艺术的特性

与传统的数字媒体设计相比,基于分形的数字媒体设计具有如下特性。(1)数字分形艺术节省了存储空间,各种美丽复杂的分形***形不再由像素组成,而是有数学分形算法的不同参数计算渲染生成。存储***形只需要存储几个简单的参数以及迭代吸引子即可,一张分形***片渲染后的结果可能几M,但是参数与算法的存储却只要几K,存储空间的压缩比达到上千。(2)降低了美学的门槛,曾几何时,艺术作品的生成至少需要十几年的艺术积淀,数字分形艺术可以让算法生成艺术作品,这样没有绘画功底也可以通过各种分形软件调整参数生成符合自己需要的分形仿真作品,如闪电,地毯,山脉,迷宫等,这对游戏与动画领域是一个福音。(3)分形算法可以节省运算时间,分形作品具有自相似性,局部与整理具有相似的特性,因此对于分形***像而言,可以渲染局部,然后扩展复制到整体,可以较好地优化空间。(4)性能配置灵活,比如在三维游戏贴***中,传统的方式需要准备三种不同画质和加载效率的***,往往低效***看起来画质很差,而在数字分形***像用于贴***时,针对不同的运行环境,可以根据需要调高或者调低画质,只需要修改分形的维度参数,生成的分形艺术***都照样清晰。因此,将分形理论与分形艺术引入数字媒体教学是十分必要的,分形艺术***形的冲击可以带动传统艺术在空间形态上的延展与数字化转变,激发学生的创意与灵感,使其在数字化的***形与二维三维的动画创作中采用更广阔的表达与更创意的思维。

2基于分形艺术的专业教学改革

2.1分形数字化转型的教学改革

分形***形是以整体与局部的自相似性为特点的,当一个复杂、精美的***形以多次重复迭代的方式拼贴形成一个复杂的具有冲击力的***像。这种不规则的***形是由数学公式生成,且多个不同的数学公式可以进行拼贴,为***形的外观赋予更多的、更复杂的变换[2]。将这些数学公式按照不同的取值赋予不同的颜色,就可以生成色彩炫丽的分形艺术***。分形艺术***是形象艺术与数学相融合的产物,是以数字化的方程作为基本的作***元,拼贴组合成具有无数变化可能的带有分形特质的艺术***。用分形的方式作***可以激发学生的数字化想象力,也可以将复杂的***形用简单的数学公式符号进行存储,极大地节省了存储空间,也实现了传统***形向数字化艺术创作的转型。

2.2打破维度的分形空间应用

传统的艺术***形总是以二维或者三维的形式出现,而分形的物体打破的传统整数维的理论。分形的空间在不断的迭代重复过程中,可以对空间进行无限的分割,从而生成非整数的多维效果[3]。电影《奇异博士》中对于分形的空间维度理论有着很好的应用,奇异博士对空间的折叠、时间的操控等都呈现了炫酷的分形效果。

2.3基于分形动画的教学改革

新媒体时代的***像与动画生成正逐渐向动态而具有视觉冲击力的多元化表现方式发展。传统的媒体正在数字化,而艺术的传播形式正逐渐轻量级地数字化。对传统的动画而言,是存储的实实在在的***像信息,***像信息随着时间的变换形成了动画效果,一部动画成品的实现需要大量的人力进行关键帧的创作与绘制,耗时耗钱耗人力。而利用分形软件制作的分形动画艺术感强,且动画的生成是通过数学公式的参数调整完成的,存储容量小而且动画效果炫酷。由于分形可以对大自然的具有自相似的分形***形进行仿真和模拟,因此对于植物、山峰、火焰等场景的生成也可以使用分形进行模拟,同时将过程通过参数调节做成动画[4],产生的分形效果视觉冲击力强。如电影《奇异博士》中大部分的特效都应用了分形技术与分形的空间维度理论。分形的理论与技术近年来已被大量地应用于影视特效、舞台美术、影像装置等多个动态视频领域。由于分形***像的生成是通过数学公式迭代拼贴而成,因此要想改变***像的外观只要改变公式的参数即可[5]。而分形动画的生成就可以在关键帧中改变参数,存储的数据量也即使数学公式及其对应的参数取值,数据量非常小,还可以保证***片的精美画质,数据传输快,数据视觉效果好,充分体现了数字媒体相对于传统媒体的实时性与高效性。

3分形仿真引领教学改革

***像与动画、视频是数字媒体专业进行新媒体创新的主要载体,要培养面向新媒体时代的新型人才,需要打破传统媒体的创作方式,不局限于绘制***像、建模***像的传统方式,将媒体的创作与设计向数字化、动态化、交互化转型是数字媒体技术专业进行教学改革的重要课题。分形艺术以数学公式引领艺术的潮流,既可以对大自然的实物进行仿真,又可以创新地设计具有分形美与混沌美的***像与动画视频,拓展了数字化媒体的创新形式。数字分形研究融合了科学与艺术,力争发挥科技的魅力,为艺术注入新的思潮与途径,为数字艺术带来了许多优势,也为数字媒体技术的教学革新带来了新思路。

4结语

该文针对数字媒体时代对多维、动态的数字化作品的需求,提出了应用数字分形解决当下数字媒体技术专业培养创新型人才转型所面临的问题。数字分形研究融合了科学与艺术,力争发挥科技的魅力,为艺术注入新的思潮与途径,为数字艺术带来了许多优势,为数字媒体技术的教学革新提供了新的方向。

作者:陶雪娇 张晓颖 单位:重庆工程学院

参考文献

[1]朱华,姬翠翠.分形理论及其应用[M].北京:科学出版社,2010.

[2]王令中.艺术效应与视觉心理——艺术视觉心理学[M].北京:人民美术出版社,2011.

[3]徐桂楠.数字艺术设计中的科学美[J].科教文汇,2014(5):132-133.

数字化转型论文篇7

【摘要】网络技术的日新月异带动了传媒业的迅猛发展,而移动平台的出现更是加速了媒介融合的发展趋势,传统媒体与新兴媒体之间的拉锯战正在此消彼长的进行中。本文从媒介融合环境下传统报刊的生存方式出发,解读当前媒介融合过程中,报纸发展面临的困境、转型过程中存在的问题以及实现真正意义上的数字报业的方法与途径。

关键词 媒介融合 现状 数字报业 动力

一、当前媒介融合的趋势下,传统报纸发展的现状

喻国明教授在《传媒经济学》中认为,媒介融合是指报刊、广播电视、互联网所依赖的技术越来越趋同,以信息技术为中介,以卫星、电缆、计算机技术等为传输手段,数字技术改变了获得数据、现像和语言三种基本信息的时间、空间及成本,各种信息在同一个平台上得到了整合,不同形式的媒介彼此之间的互换性与互联性得到了加强,媒介一体化的趋势日趋明显。在媒介融合的浪潮冲击下,传统纸媒的地位在继广播、电视、互联网之后再次受到了严重的威胁,发展再度陷入“瓶颈期”。

1、报纸读者数量的减少

在“报纸消亡论”的论调下,很多专家学者都认为报纸的消亡就是一代人的消亡,随着最后一位报纸读者的离世,纸质报刊也将成为社会发展的历史。当前年青一代是伴随着电子媒介成长起来的一代,他们对纸质媒介没有像父辈那样深厚的依恋之情,对于这些新的受众而言,新型媒介才是他们这代人的主要接触对象。网络的实时性、互动性、丰富性等都以非常大的优势遥遥领先于纸质媒介,这就导致现阶段纸质媒体在发掘和培养新一代读者方面居于劣势,读者的流失对于报纸的长期生存来说是一个不小的挑战。据统计,在2007年,中国2.1 亿网民中,有73. 6% 的人半年内在网上看过新闻,网络新闻的受众群体已有1.5 亿。新闻网站吸引了大量的网民,有1 /5 的网民上网的第一落脚点即是看新闻。面临着发展势头如此强大的网络受众资源,报业的危机具有长期性。①

2、报纸的广告收入减少

广告之于媒体就好像食物之于人类,没有广告商的投资,媒体的运转就不可能进行下去。自2005 年以来,全国报纸广告的收益均呈现下滑趋势,而与此同时,门户网站的广告收益却一片飘红。广告商投资的减少,将会直接影响报社的经营管理,进而间接导致新闻工作者专业素养的降低与报纸质量的下降,使报纸的生存陷入一个恶性循环的怪圈,直到被兼并或彻底消亡。

3、报纸的时效性不足

网络作为一种新型的媒体出现并受到追捧,并不是空穴来风。其内容的实时性、音视频效果的丰富性、链接内容的全面性等都比传统报纸更有竞争优势,再加上移动上网平台的出现,各种电子媒介的普及,网媒的发展势不可挡。相比较而言,报纸作为一种传统的新闻媒介,一直以来以“内容为王”标榜自己的权威和***,却不得不面临网络带来的挑战。虽然报纸一直以来都是权威信息的者,纵深报道的探讨者,但这并不能否定网络在未来也会成为另一个信息权威的主导者。

二、传统报刊向数字报刊转型面临的问题

所谓报业的数字化,是指报业基于数字式信息符号传播技术的发展基础之上与新媒体在媒介融合过程中的数字化转型。②数字技术和网络技术的发展催生了新媒体的实时应用,受众对数字化报业的需求大大提升,而传统报刊在向数字报刊转型的探索过程中也面临着一些问题。

1、数字报业的版权与***策监管

报业的数字转型是当前适应整个市场潮流的去向,但是在这个过程中,由于涉及到了网络技术和虚拟空间,这就导致很多网络监管的问题不得不纳入考量的范围。如何最有效保证数字报业的版权不受侵犯,如何协调传媒内部针对数字变革而进行的人员、制度的调整,如何最大化的发挥记者编辑的能动性,都成了传统报刊需要面对且尽快解决的问题。就国内媒介融合现状而言,不少媒介集团已意识到媒介融合能提高传播效率,却大都苦于***策瓶颈难以推行改革,目前仍有75 号文件明文禁止广电和电信的互相渗透。③

2、固有传统思维的局限性

数字报业在国外的发展已经日趋成熟,而在我国却仍旧停留在报刊网络版的发行上。究其原因,一是一些地区对当前数字报业的认识不够准确全面,再加上地区发展的不平衡,电子信息水平的限制以及通信技术的落后,致使部分处于转型期的报刊不能全面数字化;④另一方面是由我国特有的国情所致。自报刊诞生到现在,报纸的发展都是以一种“国有企业”“***府喉舌”的身份自居,几乎没有过彼此之间的媒介联动和激烈竞争。养尊处优的地位使得他们不再具备一种较强的风险意识,对行***机关的庇护和依靠使得报业结构不容易像国外的媒介集团一样被摧毁。因此,抱着不到黄河不死心的心态维持着现有的稳定的报业结构。

三、数字报刊发展的趋势与动力

数字报业的发展如果仅仅停留在报纸的网络版而不进行新的深化改革,那么在世界数字浪潮中总有一天会被吞噬而不自知。报业的数字化是整个发展的大趋势,新兴媒介技术的发展不仅向传统报业抛出了层出不穷的挑战,而且也提供了新的机遇,只是目前全球数字化转型都处于一个探索时期,没有固定的成功模式,只能摸索着前行。

1、丰富数字报刊的内容

“内容为王”一直是报纸孤芳自赏的一个骄傲。于受众而言,报纸是一种权威的代表,是核对信息的一个标准,形式较为单一的报纸只能在内容上更加凸显自己的风格与特色,充分利用自己的采访权,访难访之新闻,做独家的深度报道。在数字变革的过程中,报纸应该在原有基础上深层次开发信息平台,整合多元媒介,充分利用视频、音频、***片等多媒体来呈现新闻,实现资源的多次利用,降低报纸的成本,获得较高的效益。另外,除了内容的丰富多彩,根据受众的不同需求呈现不同的新闻播报方式,制作不同的专版和模块,适应手机、电脑、乃至将来的“电子纸”等媒介载体。

2、拓展数字报刊的业务范围

在媒介的经营管理体制上,我们不应再只限于新闻的与采集或者只是纸质报刊的网络版,而应该注重数字平台的立体化经营。例如《纽约时报》网站针对“报纸参与教育”这一发展计划而开辟的一个“时报学习”的专栏,其免费为3 到12年级的学生及其家长老师提供信息,学生可以***阅读新闻、参加专栏游戏、向《时报》记者编辑发送邮件及问题,老师根据网站内容进行教学。在这个过程中《时报》一方面为社会教育做出了贡献,另一方面也在潜移默化中培养了自己的新一代读者群。⑤在借鉴西方数字报业发展的同时,报业集团也应该根据我国社会的实际情况进行自我业务的拓展,比如在网络中开展音视频业务,融入包括电子书、电子期刊在内的文化活动等。

参考文献

①甘东、谢莎莎,《传统报纸与网络媒体互补——以〈新民晚报〉2008 年“两会”报道为例》[J]《. 新学术》,2008(4)

②石本秀,《融合还是分化——试论传统报业数字化转型实践中的思维局限》[J]《. 新闻界》,2011(7)

③李娇,《论媒介融合趋势下报业发展导向》[J].《内蒙古财经学院学报(综合版)》,2010(1)

④秦银萍,《媒介融合背景下数字报业的发展》[J]《. 赤峰学院学报》,2011(3)

⑤蔡雯,《媒介融合视野下的报业转型》[J]《. 新闻传播》,2007(11)

数字化转型论文篇8

热词: 2014年 数字出版 观察

纵观2014年我国数字出版,见诸报端的一些大事要闻中能够梳理出重要线索。用“起承转合”四个字可以大致粗描出其特征。“起”是亦喜亦忧的“异***突起”,且先按下不表;“承”为持续增长,可谓新常态;“转”指“转型”,仍是老话题;“合”指“融合”,已成新热点。

“承”:数字阅读持续增长,数字出版收入提高

2014年4月21日,中国新闻出版研究院公布了第11次全国国民阅读调查结果。其中,数字化阅读依然呈现持续增长态势。具体如下:2013年约44.4%的成年民众进行过网络***阅读,较2012年的32.6%上升了11.8个百分点;41.9%的民众进行过手机阅读,较2012 年的31.2%上升了10.7个百分点;5.8%的民众在电子阅读器上阅读,较2012年的4.6%上升了1.2个百分点。调查还显示,2013年,在我国接触过数字化阅读方式的民众中,有92.9%的读者表示阅读过电子书后就不会再购买该书的纸质版。值得注意的是,在接触过数字化阅读方式的民众中,有38.7%的读者表示能够接受付费***阅读,这一比例比2012年的40.1%下降了1.4 个百分点。《2014年中国数字阅读用户行为研究报告》于7月4日,该报告分析了中国数字阅读用户的选择偏好、使用行为、付费行为等。根据调研数据可以看到,用户经常使用新闻聚合类和***书平台类App,最常阅读的内容类型为新闻资讯和文学小说,而内容质量及性价比成为用户是否愿意付费的主要原因。这说明数字阅读存在巨大的潜力,就看那些数字阅读平台的功能和包装如何吸引眼球了。

2014年5月4日,“2014福布斯中国名人榜”,盛大文学白金作家唐家三少首度上榜,他也是唯一入选的中国网络作家。盛大文学董事长邱文友说,唐家三少在网络文学领域影响力的不断提升与盛大文学的3D全版权运营(原创小说、衍生版权、作家品牌三个维度)不无关系。看来,网络作家的“份量”越来越重,也越来越受欢迎。

9月26日由浙江省作家协会、中共宁波市委宣传部、宁波市文联、中共慈溪市委宣传部和慈溪市文联共同设立的首届华语网络文学双年奖在浙江慈溪启动。据了解,首届华语网络文学双年奖的评选范围是2013年1月1日至2014年12 月31日在中国大陆、港澳台地区及海外各地以汉语公开发表的网络文学作品,在5个月的时间里,出版人、网站、媒体人、评论家和作家5个界别向双年奖执委会推选100部作品,每个月20部。执委会组织了全国知名网络作家代表、资深网络文学编辑、知名高校教授和资深影评人对入选作品进行审读,评选出前30强作品。在复评环节,执委会还组织了全国知名作家、评论家、大型影视公司代表、大型网游公司代表和大型文学网站总编辑评出10部获奖作品。

2014年11月27日,百度文学成立会于北京王府井金茂万丽酒店隆重举行。本次大会以“跨界破局”为主题,是百度文学这一品牌在业内的第一次高调亮相,公布了包括“纵横中文网”“91熊猫看书”“百度书城”等子品牌在内的完整架构,并现场签约游戏、影视等多家合作伙伴。此外,华策影视、鲜果影业、千和影业、完美世界、巨人网络、天语尼比鲁手机等百度文学重要的泛娱乐合作伙伴都在会现场同百度文学战略签约,确定长期合作关系。刘心武、严歌苓两位分别发表了题为《不要对大头尖叫》及《小说家的电影人生》主题演讲,畅谈文学与影视。在蓬勃发展的数字出版创作大环境下,越来越多的优秀作者参与到网络文学的创作中,随着行业发展模式的日益成熟,网络文学必将推动数字出版行业步入更加平稳快速的发展轨道。

2014年7月15日的《2013―2014中国数字出版产业年度报告》显示,2013年我国数字出版产业整体收入规模为2540.35亿元,同比增长31.25%。占据前三的分别是互联网广告(1100亿元)、网络游戏(718.4 亿元)、手机出版(579.6 亿元)。

“转”:人才、产品、盈利模式的转型与技术升级

2014年可以说是数字出版转型年。数字出版人才问题得到高度重视,是思想转型的标志。科学管理是数字出版产业发展的重要保障,人才是科学管理的基础。出版界的数字出版人才缺乏的问题业界喊了多年,往年除了一些短训之外似乎没有什么好的解决方案。2014年7月17日,北京印刷学院数字出版与传媒研究院揭牌仪式在京举行。相关人士指出,北京印刷学院数字出版与传媒研究院的成立,对于充分发挥高校在数字出版中的作用,加快数字出版领域的学科建设、理论研究和人才队伍培养,具有十分重要的意义。

2014 年又被称为“数字***教育元年”,经过了前期的布局预热阶段,数字教育将迎来发展高峰。由于移动互联网的迅猛发展,数字教育也将向移动化、碎片化发展,移动互联网的知识学习、教育学习类App、微课堂等数字产品形式,MOOC、O2O 等数字教育模式,有望成为新生利润增长点,同时数字教育领域的投融资也将迎来高峰。

新兴媒体形态催生了出版内容新功能的丰富,带来了除基于互联网的各种电子***书、数字报刊、网游动漫等之外,还产生了各类基于以手机和各种移动终端为主体的资讯、社交类等数字产品,已经潜移默化地影响了每个人的日常生活。当前各家出版社已经意识到社交类平台对自身产品宣传的重要性,纷纷在微信平台上开设服务号,试***通过微信服务,分享出版社***书内容,培养客户群,进行适当***书营销。因此,很多阅读产品已经增加了微博、微信、微店以及评论、社交、推荐等功能,形成了功能组合,微社区、微互动发挥得淋漓尽致,逐渐将过去基于出版的纯阅读功能变成了现在基于各类社交的多功能媒体,已不再仅仅作为阅读产品存在。

另外,大数据应用影响内容生产方式、移动互联网数字产品实现全面突破、移动支付带动内容付费机制形成、内容呈现趋于多屏融合与互动。

“合”:多媒融合和跨界合作拓展服务

“转型升级”在过去的一年里,无论是***府主管部门的产业引导范围与力度,还是产业链建设的深度和广度,都取得了多项突破。随着传统新闻出版单位转型升级的深入,融合发展的步伐逐步加快。7月15日,2014中国数字出版年会在京开幕。本届年会以“融合、发展:互联网与新闻出版业的对话”为主题。国家新闻出版广电总局副局长孙寿山在年会上作了题为《加快融合发展步伐,推动数字出版产业迈上发展新台阶》的主旨报告。对于如何推动传统新闻出版单位与新兴媒体实现融合发展,进而带动数字出版产业迈上新的发展台阶,孙寿山认为应该从五个方面作出努力。一是持续推进新闻出版业转型升级,为融合发展创造条件,在***策、资金、项目上对转型升级示范单位给予引导、扶持、倾斜。二是持续注重内容建设,为融合发展夯实基础。在内容建设过程中确保导向,大力弘扬主旋律,传播正能量。三是加强技术应用驱动产业升级,为融合发展提供保障。充分利用云计算、大数据技术、语音识别和语音合成技术、MPR 技术等,充分利用移动互联网技术,实现内容与技术的有机结合,共同构成出版企业的核心竞争力。四是推动商业模式创新,为融合发展提供思路。一方面要寻求适合自身发展的数字出版道路,开展业务布局。另一方面要寻求其他可为企业带来赢利的有效途径,实现内容增值。五是推进产业协作,为加速融合发展提供有效途径。加强产业间跨领域、跨行业的深度合作,建立数字出版产业各环节良性的沟通协作机制。此外,传统出版企业要强化借力意识,与技术商、平台商、运营商深度合作,实现模式创新和产品升级。

在“融合发展”方面,2014年也有好多案例。比如,5月25日,中国出版集团公司与中国移动集团公司在中国移动手机阅读基地(杭州)签署战略合作协议,双方将在数字阅读内容形态创新、模式探索、运营推广等领域深入合作,共同推动数字阅读产业的发展繁荣。据了解,双方的战略合作涉及以下几个方面:一是深化内容合作,联合开展经典***书专项合作,策划优质、重磅新书首发,加强对手机***书、手机杂志、手机漫画、手机教育等精品内容的传播;二是联合模式创新,针对手机特点对优质内容进行数字化改编和定制,推动数字出版形态再造,探索“众筹”(crowdfunding)出版等新模式,并联合拓展行业应用等新领域;三是面向移动互联网联合开展运营推广,例如联合开展线上线下名家品牌活动,合作推广“和阅读榜中榜”,尝试探索实体书与电子书捆绑销售等O2O 新模式。

又如,2014年9 月11 日,京东与哈珀・柯林斯出版集团签订电子书合作合同,京东成为哈珀・柯林斯出版集团在中国大陆地区首家电子书合作商。此次合作,进一步丰富了京东***书在原版电子书领域的产品品类,为广大读者带来更多选择。此次合作中,最吸引哈珀・柯林斯出版集团的当属京东电子书的加密技术。目前,哈珀・柯林斯出版集团的近千种电子书已在京东上架。借此次合作,哈珀・柯林斯不仅扩展国际电子书销售渠道,更为旗下作者开启了新的市场。

再如,青岛出版社通过与海尔智能冰箱合作,将菜谱内容置入冰箱系统,并通过机身屏幕显示出来。跨界合作让出版业的内容资源有了更广阔的传播渠道,为出版行业的拓展服务提供了更多的解决方案。未来,跨界出版将不只限于阅读领域,而是会影响生活的方方面面,比如电子导航、物联网等技术的应用。与不同行业的跨界合作是对融合最好的解释,因为双方的目标都是为了服务用户、服务市场。此外,跨界合作意味着传统出版已逐渐摆脱传统的思维定式,不再将内容资源仅仅局限于纸质出版抑或是电子***书某一出版形式。

“数字技术带来了传播方式的***性变化,将彻底颠覆传统出版业态下的发展和营利模式。”中南出版传媒集团董事长龚曙光说,“在这种发展大趋势下,传统出版商走跨界融合之路也许没有绝对优势,但不走跨界融合之路绝对没有未来。”

“起”:数字出版正在异***突起

数字化转型论文篇9

【摘 要 题】信息资源建设

.

【关 键 词】本体论/数字***书馆/层次结构/信息资源

随着信息技术的发展和数字化时代的到来,数字***书馆应运而生。数字***书馆的核心是数字化信息资源的组织与管理,而目前已有的信息处理方法在对信息客体进行深层描述时存在一定的缺陷。本体论(ontology)从信息客体或信息对象出发,通过建立信息客体之间的概念联系和等级关系,将对信息客体的揭示深入到知识内涵的层次并实现对信息客体内在联系的推理。由于本体论为信息资源组织引入了新的方法和思想,它无疑会对数字***书馆建设产生积极的作用。

1 本体论的概念

本体论原本是哲学中的一个概念,是指从人类行为中抽象出来的现实本质。但信息处理领域中的本体论与哲学领域中的内涵不同,国外一些学者已从多种角度对其进行了描述,如:“本体论是一种概念化的关系明确的模式”;“本体论是解释概念潜在的含义的逻辑关系”;“本体论是可以在人和机器间进行交流的某一领域共同的概念表达”;“本体论是可以共享和再利用的概念化模式”。而Borst则将本体论定义为“共用概念的正规明确的具体的概念化模式”,其“概念化”指的是通过标识某一现象的相关概念而建立的这一现象的抽象模型,“明确”指的是所用的概念的类型和用法的限制有明确的定义,“正规”指的是本体论的实例可以实现机读,“共用”指的是本体论所捕捉的知识带有一般性,而不是某些个体所独有的。

从本体论这些定义可以看出,本体论这一信息处理模式在保持原有核心特征的基础上,本身在逐步发展和完善。简而言之,本体论是一个概念的集合,这些概念包括等级结构、概念间的关系、每个概念所具有的属性及进一步限制的定理。当使用本体论表示数字文献资源时,是在描述一个事物的两个方面:一是资源外在形式——题名、作者、出版者、文件格式、知识产权等,另一方面是资源内容——文献的主题。两个方面都可以使用本体论来建立等级关系的知识模型,在等级结构的知识模型中可以定义信息客体、信息客体的内容和相关的属性与关系。

2 文本文献本体论的构建

为数字***书馆信息资源构建本体论不是单一的一个层次,而是在传统***书馆的基础上,针对数字***书馆信息资源管理的不同发展阶段,形成一个多层次的体系,其中的第一层就是为文本文献构建本体论。

2.1 可行性分析

文本文献资源是传统***书馆馆藏的主体,随着***书馆数字化进程的深入,对揭示大量文本文献内在关系的需求更为紧迫,因而为文本文献构建本体论成为数字***书馆信息资源本体论构建的第一步。

构建本体论的核心是建立概念的等级结构及定义概念属性,从而利用逻辑推理来推导概念之间的关系。对于文本文献来说,构建本体论的实质就是建立文献之间的等级结构,并定义文献之间的关系。与其它类型的信息资源相比,文本文献本身就有较为规范和概念明确的特点,所以为文本文献信息建立等级结构和定义属性较为便利。因为文本文献的等级关系在MARC上有较好的体现,所以在MARC数据的基础上构建本体论具有较强的可行性和实用性,由此文本文献本体论的构建包括一个MARC记录的转化过程。构建本体论的最终目的是实现推理,利用文献的等级结构和定义的属性可以在转化后的MARC上实现推导文献间关系的目标。构建文本文献本体论的最后一步是将推理的结果生成知识库。

2.2 文献等级结构的建立

构建文本文献信息本体论的基础是文献等级结构的建立。文献的创造过程始于一种思想,即“构思”。这种“构思”一经抽象,则被称之为“表述”。当“表述”出版后,它就成为“版本”。“版本”的物理形式为“载体”;如果是数字化的,这种“载体”则称为“数字化形式”。“载体”的某一版本称为“实例”。

文献等级各层次之间的关系比其看上去要复杂,低层次对高层次而言是一种继承关系。“实例”是“载体”、“版本”等中的一种,因此,“实例”有一个统一题名,这一统一题名可以直接检索到而无需利用文献等级结构导航。在著录逻辑中,文献等级中的每一个概念被定义为“属于”关系,或是一种对上层概念的“延伸”关系。继承的值与“延伸”关系相关上位类的值“相同”。

2.3 MARC记录转入本体论

将MARC字段和值转化为标识的文本要借助4个控制文档,这组文档著录了MARC格式和它与本体论的关系。主控文档将选定MARC字段和编码扫描为一个或多个本体论概念。一些扫描过程视MARC值而定,依据不同情况将单一字段扫描为多个本体论概念。第二个控制文档对多个MARC字段扫描为同一个本体论概念的情况建立优先权。第三个控制文档依据MARC记录的类型和书目层次标识MARC字段内编码的位置。第四个控制文档包括每一个编码的信息,包括编码—值表的长度和位置。

2.4 知识库的生成

将MARC数据转为用本体论概念标识的文本后,依据本体论所规定的文献等级结构及定义的相关属性可以进行如下推理:

·用统一的标准对中间概念的多项进行合并。统一标准算法使用基数限定,这一基数限定是本体论定义的一部分。如果某项的类型属于另一项,且允许多重值,那么该项被合并。

·标识合并相同的构思。有相同统一题名、作者、序列号的构思被视为相同的构思。当缺少统一题名时,使用版本项的题名代替。

·如果文风和相关作者值相匹配,或者版本层的某种衍生关系可以识别的情况下,标识和合并有相同构思的表述。

·在出版者和出版日期相匹配,并且一项的出版形式值是另一项出版形式值的子集时,标识和合并有相同表述的版本项。同时还可在载体层某种衍生关系可以确定的情况下合并版本项。

·依据MARC记录描述的衍生关系建立与先前文献的关系。如果在文献族中未发现原作,则生成原作相关知识的本体论(包括在文献等级结构中衍生文献所在等级以上的全部层次和来自MARC记录的信息)。

最后将推理的结构进行归纳,将具有相同关系的文献合并,从而生成知识库。

3 XML中本体论的构建

数字***书馆管理的不仅是文本文献,还有多媒体信息,因此,为此类信息资源构建本体论就成为数字***书馆信息资源本体论构建的第二个层次。

3.1 可行性分析

由于MARC等处理手段著录多媒体信息的缺陷,数字***书馆必须采用能标识各类型信息资源的标准和技术。XML具有灵活性和可扩展性优势,突破了MARC的局限,可以描述各种类型的文献资源。使用者可利用XML中的DTD自行定义所需的标记语言及XML文件的结构。如果使用者就DTD达成一致,则文献可以用一致的方式创造、传递和翻译,同时保留传递者指明的语义。在XML的DTD中构建本体论可以实现在概念层整合各种类型信息资源,它将来自句法和表述层的信息提高到更为抽象的概念和关系层进行描述,满足了揭示多媒体信息内在关系的需求。

3.2 等级关系的建立

实现基于本体论的XML描述首先要定义描述客体之间的等级关系,这就需要建立等级关系模型。以一个由人和出版物概念等级结构组成的本体论关系模型为例,本体论在框架逻辑中描述概念,规定“人”是“客体”的一个子概念;“职员”和“学生”是“人”的子概念等等。概念“博士生”同时继承了“学生”和“研究者”的属性,相继承的属性被定义在本体论的第二部分,指的是概念之间的关系,在此通过相应类型的属性建立起概念之间的关系。本体论的第三部分是定理,使用这一定理可以在已有事实的基础上推断新知识。例如,假设研究者A和B合作,则可推断出B也是研究者,同时B也与A合作。因此,本体论可以推断不完整的知识。

3.3 本体论DTD的生成

因为继承关系是本体论的核心,而XML本身并不支持这种关系,所以这一关系模式需要借助其它方法才能在DT D中生成。使用XML的参数实体可以实现这一目标,参数实体定义了可以用于DTD的替换字符串,每当参数实体被参照时,这一参照则使用替换字符串来代替。DTDMAKER是一个在XML文献的DTD中构建本体论的有效工具,它将本体论的概念扫入DTD的元素类型中,即对每一个概念元素类型都做定义,这些元素类型的内容模型由表达概念属性的元素构成。本体论中的属性和XML的属性一样可以表述出来,也就是说本体论的属性可以被扫入相应的XML属性中。最后一步是将本体论属性元素内容模型的规范扫入DTD中。

4 知识管理中本体论的构建

数字***书馆的目标是在对各种文献信息进行组织和管理的基础上,最终实现对知识的管理。在知识管理的全过程中构建本体论,可以实现对知识本身的揭示,实现数字***书馆对信息资源最高层次的管理。

4.1 可行性分析

在知识管理的过程中构建本体论主要由4项工作构成:①建立等级结构;②知识描述;③本体论信息浏览;④在推理基础上提供知识的智能检索。这些内容容易与关系型数据库技术相混淆:本体论模型对应于数据模型,对知识的描述对应于知识库中的数据项,查找则对应于SQL。然而,这种本体论方法与集中的数据库技术有显著的不同,它捕捉的是分布的而不是集中的知识,知识可以直接在它的初始位置被查找(如HTML网页),而不是被分割到相应的数据库中才能查找。这种方法允许对知识进行推断,知识虽然没有明确表达出来,但却可以根据一般性的知识(包含在本体论内)进行推导。

知识管理过程中本体论的构建具有上述优势。在网络环境下借助相应的基于的本体论服务工具,使这一构建过程具有很强的可行性。

4.2 等级结构的建立

构建本体论的关键步骤是等级结构的建立,这一过程与2.2、3.2部分所述内容相似,因此这里省略。

4.3 知识描述

在分布式的网络环境下,需要管理的知识资源分布在网页中,可以在网页中添加本体论的标识语句,如在HTML中对被描述的信息客体添加本体论的onto语句。在标准的Web浏览器如Netscape或Explorer中,onto语句的添加并不影响HTML文件的视觉效果,这样做只是使得主题事物知识的智能Web查找可视化。同时,这可以直接使用(再利用)语句体中的文本知识,避免了知识标注者重复表示相同的信息。

4.4 本体论信息浏览

由于使用者在标注和查询的过程中使用了本体论标识语句,因此,在此阶段可提供便捷的信息浏览。本体论元数据表示的是概念的等级关系,这种等级关系至少容易满足用户的两种需求:①浏览某一类的周围类目,以便寻找最合适的形成某一提问的类,②浏览全部等级,以便快捷地完成由一个等级向另一个等级的导航。

4.5 智能知识检索

在网络环境下可以使用基于本体论的服务Ontobroker,它由3个部分组成:网络爬虫(Ontobroker)、推理引擎及查询界面。

首先,Ontocrawler通过标识的网页进行查找并收集标注的知识片断。其次,将知识片断转化为以Ontocrawler所使用的表述语言规范成的事实。不论是推理引擎还是查询用户都不需要了解因特网上事实表述的句法,只有标注者必须使用标注语言。

推理引擎收到用户的提问后,利用两个信息源来推导答案,即主题事物的本体论和Ontocrawler中的事实。推理引擎的基本推理机制类似于知识库中的智能推导系统。

5 结语

由于信息资源组织在数字***书馆中的重要作用,开发科学有效的信息处理工具已成为数字***书馆研究的一个重点。本体论的构建弥补了现有手段描述信息客体功能上的不足,它既从宏观上为信息资源的有效组织提供了指导思想,也从微观上构成了描述信息客体的标准和技术。本文对国外本体论的理论研究和实践应用进行了深入分析和系统整理,建立了构建数字***书馆信息资源本体论的3个层次体系,并在每个层次的具体操作中形成了从可行性分析到等级结构建立再到本体论生成的方法体系。

【参考文献】

1 Gruber,T.R.A translation approach to portable ontology specifications. Knowledge Acquisitions, 1993(5): 199-210

2 Uscbold, M. Ontology: principles, methods, and applications. Knowledge Engineering Review, 1996(11) :93-155

3 Farquhar A., Fikes, R. et al. The ontolingua server: a tool for collaborative ontology construction. International Journal of Hunmn-Computer Studies, 1997(46) :707-728

4 Michael, Erdmann. How to structure and access XML with ontologies. Data & Knowledge Engineering, 2001 (36):317-335

5  aifb. uni-karlsruhe, de/WBE/broker/

6 Birmingham,W. Building ontologies for the Internet: a midterm report. International Journal of Human-Computer Studies, 1999(5) :687-712

7 Guarino,N. Semantic matching: formal ontological distinctions for information organization, extraction, and integration. Computer Science, 1997(5): 139-170

8 Louise, C. Extracting focused knowledge from the semantic Web. International Journal of Human-Computer Studies, 2001 (54):155-184

9 O' Leary, D.E. Impediments in the use of explicit ontology for KBS development. International Journal of Human-Gomputer Studies, 1997(46) :327-337

数字化转型论文篇10

【关键词】高校***书馆;数字化

知识经济和信息社会的到来,极大地改变了社会的状态,推动着高等学校***书馆向数字化、网络化发展。在网络快速发展的环境下,如何更快、更好地建设数字化***书馆,这是高校***书馆界普遍遇到的重大课题,也是一大难题。本文以高校***书馆为依托,引进管理创新理论的思维,对高校***书馆数字化的现状进行剖析,结合我国高校***书馆目前的实际情况,对高校***书馆的数字化管理创新问题进行探讨,并提出合理化建议。

一、高校***书馆信息数字化的必要性

(一)由当前高校***书馆管理的现状看

1、首先,***书馆工作思想正在发生转换,从“重藏轻用”逐步转向“藏用并举”,从封闭性管理逐步转向信息化、网络化的开放式管理。

2、***书馆馆藏资源由现实馆藏向现实馆藏与虚拟馆藏并存转移。实现***书馆数字化,不仅可以让本馆馆藏可以提供给外界利用,也能充分利用外界丰富的馆藏,便人利己的事情何乐而不为?

3、在目前网络环境的影响下,***书馆的资料存储方式已经由单一的媒体转换为多种媒体,由纸质的媒体存储方式转变为多媒体、超媒体的形式。

4、新形势下***书馆服务方式的转变。目前数字化、网络化电子信息资源的开发利用正在迅速普及,一个新型服务系统运行发展机制正在被创造出。同时,读者对***书馆的服务需求发生了极大的变化,各高校***书馆改变服务方式、创建现代化***书馆以适应社会的需求已是当务之急。

(二)从目前大多数高校***书馆本身的管理存在的问题看

1、随着现代技术的发展,现状的文献信息已经呈现了多样化,而多数高校***书管馆藏仍局限在纸质载体的方面,因此很大程度上影响了读者对资源的利用。

2、新书的更新换代太慢,且需要投入的经费巨大,给***书馆的管理和发展带来巨大的压力。

3、***书馆收藏的印刷型资料过多,容易陈旧过时,且占地面积非常大。

4、传统的***书馆文献资源分散,不便于提供利用共享。

5、不同的高校在各个专业方面有不同的馆藏资源,分散着收藏不能互相利用,就是对资源造成了极大的浪费。实现数字化***书馆,可以有利于学生们找到更多的有关专业方面的书籍信息等。[1]

(三)从管理方式看

传统的***书馆管理方式非常不灵活,存在着很大的机构设置问题。造成了管理和服务上的不便,而且服务水平非常低。这种管理方式已经无法适应这个高速发展的网络时代的网络化和数字化了。因此,高校***书馆提高改善管理方式,改变***书馆的信息服务方式迫在眉睫。

综上而得,2l世纪的高校***书馆应该是馆藏多媒体化、管理手段计算机化、服务信息化和信息资源共享网络化的新型***书馆。传统的***书馆工作内容、服务方式以及社会环境都发生了极大变化,读者的需求深度不断增加,***书馆更必须跟上时代的脚步,抓住这个巨大的机遇,敢于接受挑战,勇于创新,打造新型的高校数字化***书馆。

二、高校***书馆信息数字化存在的问题

(一)经费的投入

高校***书馆数字化的建设是一项庞大而复杂的系统工程,硬件设备和软件资源的购置、网络布线工程、数字化资源的更新、馆藏文献的数字化转换等,都需要大量资金作为后盾。因此在建设过程中,经费的投入将是一笔非常大的开支。

然而,近年来,各类***书、期刊价格大幅度上涨,虽然进入“985工程”与“211工程”大学的数字***书馆的开发与建设有专项的拨款,但是,大量普通高校***书馆经费来源单一,主要依靠学校单一财***拨款。许多***书馆的经费在每年的纸质文献购置、业务培训、科研等方面都难有保障,更不用说花大量资金购买许多急需的数据库资源,经费短缺使数字***书馆建设步履维艰。存储设备严重不足、网络安全系统有待建设、机房条件急需改善、电子阅览室规模较小、信息资源不能满足师生需要等等都是因经费不足而困扰高校数字***书馆发展的问题。

(二)技术的挑战

数字***书馆是所面对的存储对象和技术领域远远超出了目前传统***书馆的范围,因而牵涉到大量的管理问题。

“中国数字***书馆示范工程”项目于1999年启动,示范工程的目标是以国家科技部支持的国家高性能环境为平台,研究数字***书馆关键技术,并以各级***书馆、博物馆、新闻出版社及其用户为应用服务对象,最终开发研制出一套数字***书馆示范应用系统。[2]

我国相关部门还应该在继续积极参与国家组织的数字***书馆项目的基础上,充分利用有利的信息基础设施和雄厚的各方技术人才,加快开发与应用的步伐,力争在较短的时间内研制出较多的具有自主知识产权的数字***书馆关键技术。

(三)人员素质

数字***书馆是为满足人们更有效地管理、利用信息与知识的要求应运而生的,在这样一个具有典型信息经济与知识经济时代特征的新兴领域,人才无疑是最重要的建设资源,是整个事业成败的关键。

从广大***书馆员的现状而言,能满足***书馆数字化、网络化要求的技术型人才也较匮乏;数字***书馆对人才的要求是全方位、多层次、高标准的,非技术型、半技术型人员基本达到饱和;学科背景单一、知识技能结构单一的馆员占大多数;开展高层次信息服务所需求的复合型人才无法得到及时补充。因此进一步研究合理、有效、多途径的、能够符合数字***书馆要求的人才培养机制,显得十分迫切。我国必须搞好数字***书馆的人力资源管理。

转载请注明出处学文网 » 数字化转型论文10篇

学习

跳蚤市场10篇

阅读(36)

本文为您介绍跳蚤市场10篇,内容包括跳蚤市场消息300字,跳蚤市场日记大全。六年级:高清菁

学习

教育咨询主管工作总结

阅读(30)

本文为您介绍教育咨询主管工作总结,内容包括教育咨询师总结怎么写,教育咨询师月总结计划。学业咨询工作服务的群体是“学业困窘生”,包括因学习成绩不良而留级、补考、不能毕业或失去学位的学生。学业困窘生在高校具有较大规模,负面影响较

学习

法律事务专业10篇

阅读(27)

本文为您介绍法律事务专业10篇,内容包括法律事务专业看什么书,法律事务专业怎么样。

学习

业务部门

阅读(25)

本文为您介绍业务部门,内容包括业务部门案例,业务部门总结全文。一、业绩财务评价的基本程序业绩财务评价系统的基本运行程序是一个循环的过程。一是公司的管理层必须制订明确的公司战略,有长远的战略目标;二是根据企业组织结构的特点来确

学习

血透室实习生工作总结

阅读(31)

本文为您介绍血透室实习生工作总结,内容包括血透室护士个人工作总结100字,血透室的实习感悟。力下,较好的完成了自己所承担的各项工作任务,现将工作总结如下:1明确血透室的岗位职责,工作流程,操作规范,并制订了透析紧急突发事件的处理预案,认真

学习

民事法律责任10篇

阅读(21)

本文为您介绍民事法律责任10篇,内容包括民事责任法律规则趋势,民事法律责任三大类。(一)关于自然人民事责任能力含义的不同界定1.不法行为能力说。持此学说的学者认为“然人对其实施的不法行为承担民韦责任的资格或能力、违约责任能力和

学习

法律文秘10篇

阅读(16)

本文为您介绍法律文秘10篇,内容包括法律文秘专业,法律文秘文案素材。培养目标:为社会,尤其是司法部门和企事业单位的工作一线输送掌握相当法律知识,兼备文秘业务能力的辅助型法律人才:包括法院、检察院书记员、律师助理、机关及企事业单位文

学习

数字化变电站10篇

阅读(16)

本文为您介绍数字化变电站10篇,内容包括智能化变电站简介范文,变电站综合自动化参考文献。2)配置采取固定的模式,灵活性低。在传统的变电站中,其二次设备多半是依赖足够多的电缆,再加以空触点的利用,以模拟信号为载体进行信息的交换,这样就造

学习

初级职称工作总结模板

阅读(22)

本文为您介绍初级职称工作总结模板,内容包括初级职称工作小结范文,初级职称主要工作业绩范文。二、研究教学规律,探索教育教学新途径,努力做到“学高为师”。我从事教育工作的座右铭是“脚踏实地,积极进取”。在教育理念中,我恪守“学高为师

学习

网络法律10篇

阅读(24)

本文为您介绍网络法律10篇,内容包括最新网络法律法规案例,网络言论法律新规。网络市场中的商标***策研究云模式下的著作权集体管理微博博文的著作权侵权问题研究网络安全立法的行***法治之维网络安全立法的经济法制度安排公知常识的概念

学习

土建预算论文10篇

阅读(20)

本文为您介绍土建预算论文10篇,内容包括土建高级职称论文范文,土建预算实训报告心得。现笔者结合多年的工作实践,浅谈建筑工程土建预算的审查技巧。一、重视搜集完备的依据性文件审查人员必须向有关部门和人员搜集完备的编制预算的依据文

学习

服装搭配培训总结

阅读(28)

本文为您介绍服装搭配培训总结,内容包括服装搭配培训总结,服装搭配师培训自学。服饰搭配师课时安排:白班或业余班滚动开课,可无限次免费复读服饰搭配的背后隐藏着系统严密的科学规律,它包括色彩与风格的和谐,而这种知识长期以来都不被人们所

学习

工程部每周工作计划

阅读(15)

本文为您介绍工程部每周工作计划,内容包括工程部工作计划范文,工程部个人周工作计划。核电站相对于其他常规能源电站,如水力电站、火力电站、风能电站、太阳能电站,核电站对于核安全性有着特殊的要求,因此对于电厂管理来说,需要不断的追求和

学习

幼儿园园长工作安排

阅读(22)

本文为您介绍幼儿园园长工作安排,内容包括幼儿园园长一周工作梳理,幼儿园执行园长工作有哪些。为了进一步加强对国庆节放假期间的幼儿园安全和稳定工作的领导,我园成立了安全工作领导小组,园长刘红为第一负责人。建立了由园长为组长,前、后

学习

数字化仪10篇

阅读(24)

本文为您介绍数字化仪10篇,内容包括数字化仪价格表,服装打版数字化仪。①汽车大型覆盖件的非接触扫描测量精确而快速配备有光学/激光式非接触扫描传感器的水平臂三坐标测量机实现了对汽车大型覆盖件的快速精密检测。德国ZEISS公司和瑞典

学习

工业工程管理论文

阅读(28)

本文为您介绍工业工程管理论文,内容包括工业工程与管理发表论文,工程管理介绍论文。二、我国企业工业工程的发展策略及趋势(一)工业工程的发展策略1.革新观念和认知。进一步加强对工业工程知识的理解与深入,需扩展渠道实现工业工程知识的传

学习

师范教育论文

阅读(23)

本文为您介绍师范教育论文,内容包括师范初等教育论文范文,师范学校论文题目大全。实施素质教育是社会发展的必然趋势,也是全国乃至全世界人民的期盼。因为在当今世界,时代不断向前发展,全球经济一体化,科学技术日新月异,知识经济突飞猛进,国家

学习

安全生产论文

阅读(39)

本文为您介绍安全生产论文,内容包括安全生产论文,安全生产方面的论文怎么写。通过向我校专业硕士、代课老师和教学管理人员发放调查问卷,通过整理和分析数据,总结出我校园艺产品安全生产课程教学中存在一些突出的问题,主要有如下几点。1.课

学习

公路工程概预算论文10篇

阅读(27)

本文为您介绍公路工程概预算论文10篇,内容包括关于公路工程造价的论文,公路工程预算实习报告6000字。将其看成专业核心课程。《公路工程施工组织与概预算》是一门实践性较强的课程,涉及基础知识、专业知识范围广,采用一体化教学,能够使繁琐

学习

企业信息化管理论文

阅读(20)

本文为您介绍企业信息化管理论文,内容包括企业的数字化管理论文,企业信息管理系统论文范文。企业管理信息化是当今大势所趋,国内外许多企业集团都纷纷争相上马,极力把这种先进的管理思想融入企业为其谋利。对于中小型企业来说,实施企业管理

学习

园林管理论文模板

阅读(35)

本文为您介绍园林管理论文模板,内容包括园林专业论文题目大全,如何写园林管理方案范文。2.2施工人员素质差、缺少科学施工意识园林建设的顺利进行,主要依赖于园林的施工管理,而施工人员是管理的主要参与者。现在我国园林施工人员的专业水

学习

工程造价预算论文10篇

阅读(35)

本文为您介绍工程造价预算论文10篇,内容包括工程造价论文4000字,工程造价全过程论文摘要怎么写。2.1法律法规不健全当前我国建筑工程项目造价预算的编制过程在很大程度上需要依赖于法律法规的参与,而对于我国目前现状来看,在法律法规上存在