数据理论论文第1篇
论文摘要:虽然知识管理主要是针对企业的一种新的管理思想,但通过对比分析,.可以发现教学活动和企业实施知识管理的目标有着很大程度的相似性,因此知识管理对于课程的教学,同样有着重要的思想价值和实践指导意义。本文着重探讨了如何将知识管理这一应用于企业中的管理思想运用到数据库这门课程的教学活动中来提高课程的教学质量,更好地实现教学目标。
一、前言
在知识经济的时代,知识就是力量,知识就是资本。有效的知识管理可以使组织中的成员拥有更多的能够帮助其解决实际问题的知识,使每个组织成员的能力都得到提高,从而提升整个组织的绩效,使一个组织能够不断增强自己的竞争能力,不断进步和成长。
我们的各项教学活动的基本目标是更有效地让学生深入理解和掌握相关课程的理论与方法,并能够综合运用掌握的知识来解决实际的问题,从而提高自身的能力和素质。这和企业实施知识管理的目标有着很大程度的相似性,因此,尽管知识管理主要是针对企业的一种新的管理思想,但我们认为,它对于学校课程的教学,同样有着重要的思想价值和实践指导意义。本文着重探讨了如何将知识管理这一应用于企业中的管理思想运用到数据库这门课程的教学活动中来提高课程的教学质量,更好地实现教学目标。
但是由教师和学生构成的教学组织和一般的企业组织在组织形式、运作方式、目标等方面都有较大的差异,所以我们首先分析了教学中应用和实施知识管理和一般的企业组织的知识管理有哪些类似的、可比的地方,又有哪些是教学活动所特有的。然后,根据数据库课程教学的特点确定如何借鉴企业中的知识管理来实施针对数据库课程教学活动中的知识管理。
二、教学与一般企业组织的知识管理比较
不管是企业中的员工还是在校的学生,他们的知识都是通过各种方式的学习获得的,知识管理是围绕知识学习活动的管理,包括知识获取、知识交流、知识应用和知识创新的管理。如果把教师和学生看作一个组织,这个组织和一般的企业组织在知识学习的组织形式、运作方式、目标等方面存在一些差异。
通过分析比较,我们可以得出教学中的知识管理的目标、内容和企业大体相似,企业的实践经验可以借鉴。但由于实施知识管理的环境不一样,教学中的知识管理和企业的知识管理所注重的问题还是存在差异,主要表现在:
·教学中涉及的知识主要是显性的,而企业更关注隐性知识的管理;
·教学中的知识主要来源于教师,因而教师如何有效地传授知识是很关键的,而企业中的核心知识分布在各种企业内部资料库、各个专家和技术骨干的头脑中,因而如何利用知识管理工具和手段有效地组织、管理和利用这些知识是企业所关注的;
·教学中要注重调动学生学习知识的积极主动性,而在企业则更注重如何激励员工参与知识共享与交流的积极性;
·教学中的知识是为将来作准备的,注重基本素质和学习能力的培养,而企业中知识很快就会被应用,创造价值,因而更注重知识的实用性和时效性;
·教学活动是有组织的有计划的,教学安排合理与否是影响教学效果的一个重要因素,而企业中的知识活动是应工作需要而随时发生的,因而需将知识管理融入业务流程。
三、知识管理在数据库课程教学活动中的应用
作为计算机类的有关信息处理的基础课,数据库是一门实践性很强的课程,强调知识的应用,而不仅是理论上的、定性的分析,要求学生最终能够根据具体的实际应用需求,综合运用数据库的有关理论、方法,提出一个较为合理的信息处理方案,并辅助开发成员建立一个完整的数据库应用系统。它和其他计算机类的课程,如操作系统、程序设计、数据结构等不同,它的专业覆盖范围比较广。在信息化进程不断加速、信息量急剧膨胀的情况下,无论哪一类专业都要面对数据分析和信息处理的问题,所以不仅是计算机专业的学生需要学习数据库的有关知识,其他专业,特别是管理类专业的学生也需要具备信息处理方面的基本知识和能力。和计算机专业的学生都是理科背景不同,这些专业的学生通常是文、理科兼收的,学生的个体差异比较大,思考问题的角度有可能是多方面的,彼此也很难说服对方,要促进他们的交流与合作,必须给他们一定的磨合的时间和机会。
通过前面的分析研究,我们认为企业知识管理的实践中得出的许多经验在教学中可以借鉴,但不能全部照搬,需要就教学的特点进行调整,我们主要从促教、促学、促交流三个方面,以我们连锁经营管理专业的数据库课程教学为背景进行知识管理在数据库课程教学中的应用研究。
(一)有效地向学生传授知识
教学的基本任务是向学生传授知识,教师担当专家的角色通过各项教学活动将自己的知识传授给学生,使学生掌握应该课程要求的知识,完成教学任务。教师能否有效地传授知识是决定教学质量的一个重要因素。要有效地向学生传授知识,我们认为可以从三个方面着手:
首先要了解学生目前的知识结构状况;然后对教学内容作精心安排;最后是建立教学方法知识库。
对于初次参加一门课程学习的学生来说,教师所传授的是新知识。根据知识管理理论,个体吸收新知识的能力是与其自身原有的知识水平密切相关的,一项新的知识能被吸收加入到个人的知识库中的必要条件是新的知识和其原有的知识之间要有关联。因此在向学生传授新知识之前需要了解学生目前的知识结构。在正式上课之前通过查看任课班级已经学习了哪些课程、学生中文/理科背景来进行初步的了解。在第一节课,通过课堂提问这一现场调查的方式进一步了解学生的知识结构。据此,在保证课程大纲要求的内容不变的情况下调整了原先的教学计划安排。
教师在教学过程中不断积累经验,这些教学经验是宝贵的资源,应该加以利用。我们可以参照企业建立企业知识库的方法建立教育教学方法知识库,由学校教学管理部门按课程收集、整理学生反映良好、教学效果明显的教师成功的教学方法、教学心得体会、教学案例、课堂教学组织、教案设计等等,建立教学知识资源网,供广大教师根据自己的需要进行研习。这种方法可以更大程度地发挥教学知识的效用,覆盖更多的教师,使他们受益,进而使学生受益,也使得学校教师的教育教学成果得以延续。这和精品课程的建设是不一样的。精品课程是从教师的角度来进行创新性的教学设计,其中不乏好的教学方法、教学案例,但这种设计、方法是否有效,未必均已得到证实。而进入教育教学方法知识库的教学方法已被证实是有效的、成功的。
(二)激发学生主动学习的积极性,促进学生的自主学习
和企业中员工主动地自主地学习知识不同,学生们学习知识很多是被动的,这主要是因为他们对知识所能发挥的效用不甚了解,只是为了考试、证书之类的,这不利于知识的真正吸收、能力的提高。要激发学生主动学习的积极性,促进学生自主地学习需要从三个方面着手:首先要将课程教学和学生的职业规划联系起来;其次作业设计要给学生一定自由发挥的空间;最后给学生更多展示自己学习成果的机会。
学习知识的动力来源于对知识所能发挥的效用的认识,而这和学生对未来的职业规划是密切相关的。因此,首先要了解学生对未来的期望,将课程学习和未来的职业规划联系在一起,使学生认识到课程中所学到的知识对他们将来的发展是有用的。在开学后的第一次课,除了通常的介绍课程主要的内容和教学目标、安排、考核等之外,我们一定要将课程和学生的专业背景、他们将来可能从事的职业联系起来,使他们认识到学习这门课程可能对自己将来的工作有所帮助。
学生在完成教师布置的作业的过程中,需要将自己在课堂上、课本、其他参考资料上获取的知识进行综合化,进行知识的应用与创新,这些是知识转化为处理问题的能力的重要途径。而在教学中,我们发现学生作业相互抄袭的现象比较普遍,经过对学生作业的调查,我们发现:学生认为对于那些比较“死”的作业,自己做一遍和抄一遍没有多大区别,做了也没什么成就感。而对于比较“活”的题目,由于答案的不确定性,学生之间并不能确定谁的答案就是绝对正确的,求解这样的题,不仅需要课本、课堂上的概念知识,还需要根据自己的需要去查找一些相关的资料,再融入每个人自己的一些想法和技巧,需要付出一定的努力才能完成。因而,学生在完成这样的作业后会有一种成就感,也不愿意把自己的成果让别人随便抄。因此,在教师设计作业的时候应尽量出一些比较“活”的题,给学生一些自由发挥的空间。
在教学中要调动学生学习的积极性,激励是一个重要手段。在企业中,员工掌握知识的多少决定其在企业中的工作地位和薪资收入,同时,赢得别人的认同和尊敬也是一个重要的激励因素。在教学中,我们很少能给学生物质上的激励,因此,精神上的激励应该成为主要的激励手段。在老师和学生面前展示自己学习研究的成果可以让学生颇有成就感,同时也可以赢得其他同学的认同,提高自己在学生中的声望。每次作业中,我们可以选取一部分学生,让他们以PPT报告的形式来展示自己的成果,接受其他同学的提问、建议和评判。对于作业完成得不好的学生,可以促进他们今后做出更大的努力来赢回自己的声望,对于作业完成比较好的学生,可以使他们获得更大的满足感和成就感,对今后的学习也是一种鼓励。
(三)促进知识的共享与交流
传统的教学是知识从教师向学生的单向流动,传授的主要是显性知识,知识的来源比较单一,教师与学生、学生与学生之间的互动很少,这不利于知识的交流与分享。要促进教学中的知识共享与交流,我们认为需要从两个方面着手:拓宽学习交流的渠道和建立有利于知识共享的学习组织。
在课堂上,我们还是应以教师讲授为主,但也应该留些时间让学生提问和讨论。讲完一段内容,应该稍作停留,看看学生有什么问题,请他们提出来,其他学生和教师都可以尝试着来回答或补充这些问题。课后,教师和学生之间的交流可以通过电话、电子邮件、MSN等进行,及时解答学生的一些疑问。同时,教师应该引导学生参与课堂以外的有关课程学习的交流,访问学习资源网站、参加一些网上论坛、学习社区。通过参与课外的学习交流,学生能接触到很多课堂上没有讲过的东西,从而能弥补仅靠教师传授的不足,培养学生自主学习的能力。建立课程网上学习社可以使学生与学生、学生与教师之间的交流更加集中、更加便捷,一些在课堂上没有讨论完的问题可以在课后、在网上得以继续。
在以知识管理为指导思想建立起学习组织时,教师应该有意识地加以引导以有利于知识的交流共享。比如在进行分组讨论和分组实验时,教师首先要与学生进行沟通,根据讨论主题和实验内容设计一些调查问卷,了解大家的学习状况和知识结构,对小组成员的结构进行调配,既要考虑成员之间的人际关系,又要考虑成员的知识结构配置,在保证成员之没有冲突、敌视的情况下,使同组成员之间的知识结构既不能相差太远。同时有要保持成员之间知识结构具有一定的差异性。其次,要定期举行集体的交流活动,主要目的是相互传递信息,交流对付学习中的难题、提高实验操作技巧的经验。对一些好的实验操作进行流程定制,在课堂上作为标杆演示。当学生由单纯的知识接受者变成知识的创造者和教育者时,他们的学习、创造与知识共享的积极性将被大大提高。学生间的交流与知识的流转将变得更为主动,学习效率提高,学习效果明显,改变了传统教学的定式思维,对培养学生的创新能力有很大帮助。
数据理论论文第2篇
1)我的***像处理学习用的是北京希望电子出版社出版的《逆向式PhotoshopCS2实战学习119例》中文版,拿到后学得相当快。2)对逆向式教学法的认识。所谓的逆向式教学法,即先指导学生实践,再引导学生在实践活动中总结出计算机理论知识。逆向式教学模式主要是相对于传统教学模式而言。
2逆向式教学具体的实施过程
2.1实例操作
首先,把要操作的文件“学校教职人员分配表.xls”拷贝到学生电脑上(内容见***1),让学生打开,看几秒钟。接着提出操作要求:“根据分类汇总,统计出各学部的教职员工总人数。”然后和学生一块操作,即老师操作一步,学生操作一步,步骤如下:第1步,选定数据清单中任意一个有数据的单元格。第2步,打开“数据”菜单中的“排序”命令,进入“排序”对话框。第3步,在“排序”对话框中,设置“主要关键字”为“学部”,选择升序或降序都可以,本次操作选择升序,其他取默认值。第4步,单击“排序”对话框中的“确定”按钮,对字段学部就进行了分类。第5步,打开数据菜单中的“分类汇总”命令,出现“分类汇总”对话框。第6步,设置“分类汇总”对话框中的参数。分类字段设置为“学部”,汇总方式设置为“求和”,选定汇总项设置为“教职员工人数”,其他项默认。第7步,单击“分类汇总”对话框中的“确定”按钮,就统计出了各学部的教职工总人数,完成了本次要求的操作。如***2。
2.2理论指导
Execl电子表格“数据”菜单中的“分类汇总”命令的意义是先分类后汇总。分类就是对分类项目(或分类的字段)进行排序,是升序还是降序视要求而定。这里没有特别的要求,可以用默认的“升序”来确定。汇总稍复杂,在“分类汇总”对话框中有3项要选择设置,第1是“分类字段(A)”,这一项一定要选择分类的字段,也就是刚排完序的字段“学部”。第2是“汇总方式(U)”,这一项中的汇总方式有“求和、计数、平均值、最大值、最小值等”,具体要按数据清单应用的要求来选择,本题选择“求和”。第3是“选定汇总项(D)”,这一项可以选多项的,这里本例的选择是“教职员工人数”。
2.3应用提示
我们在以后的工作和学习中会得到很多的数据,用表格来整理和分析数据是常用的方法。电子表格的应用方便了数据的统计、对比和汇总,对我们作出正确的判断和找出规律都有很大的帮助。因此,掌握“电子表格的数据管理功能”中的分类汇总等的操作是有用处的。
3实施后的效果
学生实践。学生老师共同操作后,接着给学生布置操作练习如下(如***3)(注:表中记录有删除,实际记录较多)。学生在做上面练习的时候基本不用辅导,个别除外,教学目标“掌握分类汇总的操作”顺利达到。
4教学的反思
数据理论论文第3篇
随着天文数据的日益增加,存储和管理天文数据变得非常重要,尤其在天文数据的归档和管理方面,占有举足轻重的地位。能够很好地管理海量的天文数据就相当于在后续的科学研究中成功了一大半。通过对天文数据管理方面知识的了解,经过一系列的研究与开发,最终开发了一个高效的天文数据自动入库管理工具AutoDB,旨在帮助天文学家提高工作效率,促进天文学研究的进展。
1.1AutoDB的设计思路与方法
在之前的裴彤等人的设计中,已经实现了天文数据的自动入库,该工具采用Python[11]语言编写,并且能够自动地添加pcode字段,建立HTM(HierarchicalTriangularMesh)[11]索引分区,便于以后的交叉认证工作。HTM是一种多层次的、递归的球面分割方法,可将天球分成多级的三角网络,每个网络都有一个pocde,利用HTM可以将一个大星表从逻辑上分割为多个小星表[11],HTM分级算法采用C语言编写,充分地利用了C语言的高性能和Python语言的高开发效率。然而该程序仅支持底层数据库为MySQL,且只支持CSV格式的文件,且文件中的数据不能为空,若为空则会抛出错误,在使用方面具有一定的局限性。其HTM分区是对ra和dec进行计算产生pcode值来实现天空分区,同时使用pcode_htmN数据列来存储这些值,然后对其进行btree索引,方便后续的高效查询。首先,其计算的算法必须跟随着后续数据的复杂性进行优化,其次,先计算在存储势必有I/0性能限制,最后使用btree一维索引间接性的对赤经ra和赤纬dec索引,无法利用天文数据的空间性,且若想实现一定半径内的查询需要非常复杂的SQL语句。为了解决这些问题,我们仔细地阅读了裴彤等人的论文和程序代码[12],在深入分析其原理的基础上,对自动入库管理工具进行了更加全面的完善和改进:(I)底层数据库同时支持MySQL和PostgreSQL;(II)针对PostgreSQL数据库,使用一种新类型Q3C索引,其直接与数据库进行交互,无其他I/0交互,直接对赤经ra和赤纬dec进行空间索引,并且提供简单的SQL语句来实现复杂的查询;(III)数据格式同时支持FITS格式和CSV格式;(IV)数据优化,若其中存在为空的数据项,数据项自动变为’9999’或者’NULL’,则入库时不会抛出错误。下面分别展开阐述。一、底层数据库架构工具的底层数据库是基于MySQL和PostgreSQL两种数据库开发的。这两种都是非常好的开源数据库,对于选择哪种数据库更好取决于哪种数据库更能满足用户的需求。之前采用的是MySQL数据库,然而由于数据量的增加,数据表格越来越庞大,一个表格甚至达到了几十亿行,对于表本身的容量远远地超过了物理内存的大小,甚至出现了连建索引也不能改善性能的情况,这样查询时间会将大大地延长,在此情况下非常有必要对数据进行分表管理,即将表拆分为一系列较小的、与之相关联的表来进行替代,通过对子表的数据查询,就相当于对整个表进行了查询操作。对基于MySQL数据库分表来说,取决于数据引擎(InnoDB),不支持哈希分区表,而PostgreSQL数据库支持临时表、常规表以及范围和列表类型的分区表。而且PostgreSQL的表分区是通过表继承和规则系统完成的,所以可以实现更复杂的分区方式。且在索引方面,PostgreSQL支持B-树、哈希、R-树和Gist索引,MySQL取决于数据引擎,大多数为B-Tree索引。由于天文数据具有空间属性,位置坐标为(赤经ra,赤纬dec),其索引会是一个二维的。建立一个高效的索引非常重要,使用第三方扩展库如Q3C索引即是采用的二维索引,又如使用PGSphere中的GIST索引,会使数据的查询更加高效。所以在当数据量非常大的时候,或者需要使用到第三方库时,对于空间点索引时,采用Postgresql比采用MySQL要方便得多。但若数据量不是很大,对于亿行级以下的数据量,不需要采用第三方库去支持创建索引的数据,则是采用MySQL比较好。同时MySQL的性能方面要比PostgreSQL较为高效。面对种种数据管理的需求,我们增加PostgreSQL作为该入库工具的底层数据库是必要的,天文工作者可以根据自己的需求存储到不同的数据库中。二、Q3C索引庞大的数据储存在数据库中,若想能够准确高效的使用这些数据,必须对其数据创建索引,索引不仅能够加快数据的查询速度,而且会使数据的管理变得简单容易,可以大副提高系统的性能。当然索引的创建也不是越多越好,因为索引过多会随着数据量的增加而加大数据库的负荷,就起不到提高系统的性能的作用,反而会降低性能,所以索引的使用要准确得当。在本系统中,由于我们是对天文数据进行入库管理,天文数据的复杂性、空间性决定了普通的一维索引并不能很好地解决天文数据的查询管理要求,所以我们是用了一个全新Q3C(QuadTreeCube)对天空分区索引,其能够很好地对天文数据进行二维的空间索引,Q3C索引方案为开源项目运用于数据库PostgreSQL中,大家在使用的同时也可以随时进行修改,非常适用于学术研究,由于直接运用于数据库,使用者不需要书写任何算法,相比于HTM,首先需要对天文数据进行分区计算pcode值,然而分区计算算法需要由使用者编写,这样会无形地增加风险,同时也带来了复杂化。Q3C的产生是专门针对天文数据的,其目的性非常明确。虽然普通的索引如btree也能够用于天文数据,但是如果需要进行锥形查询,在不使用Q3C索引的前提下,其查询SQL语句会非常复杂,并且查询速度非常慢,而且也只能运用于数据量较少的情况下,数据过多极有可能导致内存不足而出现程序卡死现象,然而上面的问题对于Q3C索引来说都不存在,所以这种基于四叉树的空间索引Q3C就显得非常实用了。Q3C索引不仅能够提供天文数据特有的查询,而且也提供交叉认证功能,这对以后的数据处理来说,很大程度地简化了工作量,同时又容易使用,而且不论是在查询方面,还是交叉认证方面,Q3C会提供的简单的SQL语句就能够执行处理工作,而HTM方面则需要从数据库中提取数据,然后利用算法进行处理,当数据量非常大的时候,程序的性能就会受到影响。三、支持的数据文件格式入库管理工具同时支持两种类型的数据格式文件:CSV(Comma-SeparatedValues)格式文件和FITS(FlexibleImageTransportSystem)格式文件。CSV文件由任意数目的记录组成,记录间以某种换行符分隔;每条记录由字段组成,字段间的分隔符是其它字符或字符串,最常见的是逗号或制表符。FITS格式是天文学界常用的数据格式,它专门为在不同平台之间交换数据而设计。1988年的国际天文学联合会IAU(InternationalAstronomicalUnion)大会指定IAU的FITS工作组全权负责此格式的修订。FITS文件由文件头和数据组成。在文件头中存储有对该文件的描述,如观测目标、源的位置、观测时间、曝光时间等信息,同时也可以在文件头中注明观测时的视场、精度等,便于后期的数据管理和分析之用。文件头部分每行占80个字符,并以END结尾。FITS文件的容量大小通常比相同数据量的CSV文件小,在本地存储中占用硬盘容量小,且天文数据文件采用FITS格式存储的文件占大多数。针对FITS格式文件数据,我们开发了一个分析FITS文件头文件的工具,用来得到头文件中表格数据中的列名和每个列对应的数据格式,方便天文学家在使用入库工具时编写readme文件。在输入不同格式文件时,工具会自动地判断文件的格式选择相应的程序实现自动入库。四、存储数据的优化庞大的天文数据中有时难免会存在的超过数据库中最大数据存储大小的数据或者小于数据库中支持的最小数据,不过在数据库中可以自己定义数据类型来支持导入的数据,但这样便失去兼容性了,使得不同数据库之间数据的交换和融合变得很困难,而且在对于文件中的数据项为空的时候,存储到数据库中会产生一些错误,所以在入库之前很有必要先对数据进行优化。因为不符合要求的数据非常少,而且改变其大小不会影响到后续的数据分析环节,故在入库前,在程序中把超出数据库最大支持数据的记录数和小于数据库最小支持数据的记录数更改为数据库所支持最大和最小的数据记录数,同时对于文件中为空的数据项,程序会根据数据类型的不同,自动的填充‘9999’或‘NULL’字样,方便数据的录入和后续的计算分析。
1.2AutoDB流程***
在存储FITS格式文件的数据时,我们还专门开发了一个分析FITS文件头文件的小工具,方便天文学家存储时选择自己想要存储的数据列。在使用过程中,天文学家也不需要编写任何的代码,同时该工具有很好的易用性。根据不同的格式文件,有着不同的入库流程,下面给出了文本CSV文件和FITS文件的入库流程,如***1所示。
1.3AutoDB系统环境支持
AutoDB采用Python语言编写,推荐使用Linux操作系统。由于Python是跨平台型语言,若需要在WINDOWS系统中使用也非难事,需要安装Python,一般的Linux发行版本都会自带Python程序,同时也需要下列数据库系统(异地或本地均可)和第三方库作为支持:1)PostgreSQL(9.0+):支持最新的SQL语法,更高的功能完整性。2)MySQL(5.1+):性能非常的高效。3)Q3C(QuadTreeCube):一种基于PostgreSQL数据库的新的天文数据的索引概念,提供海量天文数据的查询与融合。该工具中同时嵌入了一个很好的虚拟终端,用户可以根据虚拟终端的反馈,了解自己在使用过程中出现了哪些错误,从而纠正错误,使得程序完美地运行。
1.4AutoDB***形用户界面
AutoDB***形入库界面如2所示,用户可以选择入哪种数据库,入库的数据文件及数据的说明文件,创建HTM的级数,每次分次上传的记录数,赤经赤纬列要指出等。在这里,用户可以直接点击程序运行***形界面,也可以手动地在命令行中使用命令来运行***形界面,其***形界面和主程序是分开的,其协助用户按照各个参数,并收集起来,按照一定的规范得到收集的参数,供主程序使用。也就是说主程序不依赖于***形界面,用户也可以手动地编辑被指定的文件来运行主程序。FITS头文件分析工具会把FITS头中的数据输出到文件中,该文件名由用户定义,在FITSSOURCEFILE对应的一行中浏览添加FITS源文件,然后在FITSHEADFILE一行中输入想要创建FITS头文件名,界面如下***3所示。在使用入库工具时,用户需要编写readme文件供程序使用,其格式如下:第一行为各列列名(即数据库表中的列名字段,请参照MySQL/PostgreSQL对字段命名相关文档),以一个或者多个空行分隔;第二行与第一行相对应,为每列的数据类型(如:float、char、varchar、double、int,具体请参照MySQL/PostgreSQL数据类型相关文档[13]),同样是以一个或者多个空行分隔,内容中不能有引号,字段不能为空或NULL。同时在对FITS文件进行入库时,需要参照头分析工具得出的头文件以及格式转换文件编写readme文件。头文分析工具得到的头文件实例如***4所示,格式转换文件如***5所示。编写readme文件完毕后,即可使用自动入库工具进行数据的录入,数据库可以自己选择,数据库服务器可以是本地服务器或远程服务器。使用远程服务器时,应该保证远程服务器支持远程连接,否则将会报错。
2实验结果
2.1Q3C索引与非Q3C索引的查询性能比较
在使用索引的时候,我们最在意的是索引是否能够提高查询效率,对于具体选择哪种索引方式,要看哪种索引提高的性能更高些。为此我们做了如下的实验测试(在数据库命令行的形式下使用SQL语句进行查询的实验)。实验数据为Pan-STARRS数据,总共11,495,847个星表源数据。对比使用Q3C索引情况下和不使用Q3C索引(对ra与dec进行B-tree索引)的情况下,实现以赤经赤纬(5度,50度)为中心,查询半径在0.1度到0.9度变化范围内的锥形查询,比较随着提取结果源数目的增多上述两种方案的查询时间,其结果如***6和***7所示。我们从***7和***8中可以看出,随着查询半径的增大,符合查询条件的源数目也在不断增多,同时查询时间以近乎线性速度增长,说明查询元组数目越多,消耗的时间也就越多。还发现使用非Q3C索引的查询时间是使用Q3C索引时间的至少100多倍以上,可见Q3C索引方式的有效性。Q3C索引具有层次结构、平等区域、异维度分布等特性的天空分区方案,对天文数据的处理具有得天独厚的优势。特别是对于数据量大的情况下,我们非常有必要使用Q3C对数据索引,其表现不仅仅是数据查询速度的提高,对日后的交叉认证起到了打下了很好的基础。这也正是我们选择Q3C索引的原因。
2.2AutoDB工具的应用
AutoDB能够快速地将数据存储到相应的数据库中,上传数据的速度与本地机器硬件性能、数据库的配置以及数据库服务器的位置(本地或异地)、数据量的多少以及索引的复杂程度都有着直接或间接的关系。建议在使用过程中本地机器中不要运行太多的其他程序。我们使用的是SDSS部分数据进行的实验,总共有100,000,000行数据导入数据库中,测试平台使用的是两台计算机平台,一个是本地数据库平台和程序运行平台,另外一个是远程数据库运行平台,通过百兆以太网访问远程数据库平台。具体配置如表1所示。在实验过程中多次分别对本地和远程数据库进行了入库,在入库时将数据分割为100,000,00行,200,000,00行,400,000,00行,600,000,00行,800,000,00行,100,000,000行数据导入数据库中,得出实验结果,如表2所示。单从数据上传的速度来看,MySQL数据库的速度要优于PostgreSQL数据库。
3总结与展望
数据理论论文第4篇
业务模型设计依据管道SCADA系统维护流程,采用面向对象思想对系统业务模型进行描述,业务模型如***1。数据库设计根据客户方要求,数据库设计需要每个区域每种类型的数据分开存储,以防数据混乱,但基本就分为四类:字典数据库、静态数据数据库、子表数据库、测试相关人员数据库。
2系统实现
2.1数据录入
遵循“所见即所得”的思想,主要的录入界面与报告证书界面保持高度一致,这样每个页面就代表了一个报告,为了更方便用户使用,我选择了用树形结构的菜单。子表数据的录入使用了DatagridView控件。
2.2数据查询
本系统采取的措施为,将每个功能模块需要查询的属性列名存储在字典数据库中,当我们指定了某个功能模块后,就可以在数据库中查询需要被查询的属性列名。这样不仅有效的达到查询的目的,还使代码量减少。
2.3报告出具
2.3.1Word报告出具
由于word本身是一个实现了自动化的COM组件,所以我们可以用C#语言和其提供的结构来访问和操纵Word文档。具体实现步骤如下:(1)生成word程序对象。(2)指定word模板路径。(3)生成word文档对象并打开模板文档。(4)获取模板中的所有书签。(5)给所有书签赋值。(6)保存word文件。
2.3.2Excel报告的出具
Excel报告的出具有两种方案可以实现。一种是基于流和COM组件的操作,一种是只基于COM组件的操作。考虑到效率,我们选择后者,实现步骤如下:(1)获取到处的数据表。(2)将所有满足要求的数据以流的形式全写入一个excel中。(3)生成Excel程序对象。(4)定义一个新的工作簿。(5)打开模板工作簿(此模板可以说一个空的excel文档,不起到任何作用,只是提供了一个载体而已)。(6)得到一个sheet。(7)将数据分割为一个一个的报告,并循环填充表格的表头(可适当的增减行列,以达到需要的目的)。(8)另存为。(9)退出Excel,并且释放调用的COM资源。
3结束语
数据理论论文第5篇
关键词:RS485面向对象PID模糊控制
1前言
21世纪信息化的时代已经到来,以网络通讯和计算机技术为背景的建筑智能化正是顺应这一时代潮流的必然趋势。作为智能建筑3A系统之一的楼宇自动化系统(BAS)对大楼的水电暖通等机电设备进行集中的监控和管理已日益成为现代建筑中必不可少的配置。
下面就其中暖通空调系统的监控谈几点看法。
2RS485网络
中央空调系统管理复杂,运行工况多变,是建筑物能耗大户。为此,实施BA系统一般将空调系统作为监控的重点,往往投入60%以上的监控点和超过水电监控投资总和的投入。
但是不同厂商提供了不同功能的产品和系统,采用不同的通信协议,致使它们之间依靠网关和大量软件的互联成为高成本、低性能的解决方案。从资源的利用,系统的设计、调试、扩张、更新、维护等方面来看,都给业主带来不利。
因此,目前BAS发展的技术趋势是现场总线技术(FCS)。美国Echelon公司于1990年12月推出的Lonworks技术正是采用了FCS技术,这是一种开放系统的通用总线。它的技术核心是神经元芯片(NeuronChip)和LonTalk协议。但对于中小型的监控系统,全面采用Lonworks技术,并不具有技术优势和完善的工程实现。部分采用或支持现场总线技术的产品在目前大量的中小型系统中更具有应用性。
以控制网络而言,LonTalk总线在理论上可以组成任意拓扑结构的网络。这种布线设计的随意性,如果运用不当,在工程实践中仍然是有技术风险的,并可能造成系统投资的增加。所以,中小型工程推荐运用基于RS-485总线的控制网络。该技术抗噪声干扰性好,广泛应用于过程控制领域,技术成熟,实现成本也较低。
在使用RS-485接口的总线时,对于特定的传输线路,从发生器到负载,其数据信号传输所允许的最大电缆长度是数据信号速率的函数,这个长度数据主要是受信号失真及噪声等影响所限制,两者成反比。***一所示的最大电缆长度与信号速率的关系曲线是使用24AWG铜芯双绞电话电缆(线径为0.51mm),线间旁路电容为52.5PF/M,终端负载电阻为100欧时所得出。(曲线引自GB11014-89附录A)。由***中可知,当数据信号速率降低到90Kbit/S以下时,假定最大允许的信号损失为6dBV时,则电缆长度可达1200m。实际上,***中的曲线是很保守的,在实际使用时是完全可以取得比它大的电缆长度。
***一电缆长度与信号速率的关系曲线
对于总线上的连接点的问题,根据规定,每个标准RS-485接口的输入阻抗为≥12kΩ,相应的标准驱动节点数为32。为适应更多节点的通信场合,有些芯片的输入阻抗设计成1/2负载(≥24kΩ)、1/4负载(≥48kΩ)、甚至1/8负载(≥96kΩ),相应的节点数可增加到64、128和256。
下表为一些常见芯片的可连接节点数。
节点数
型号
32
SN75176,SN75276,SN75179,SN75180,MAX485,MAX488,MAX490
64
SN75LBC184
128
MAX487,MAX1487
256
MAX1482,MAX1483,MAX3080~MAX3089
这样RS-485接口在总线上允许连接多达256个收发器。即具有多站能力,便于我们方便的利用单一的RS-485接口方便地建立起连接若干个现场控制子系统的网络。
以暖通空调系统典型的温控来说,每个节点现场控制器,可挂接多片温度传感器,以实现多点温度监测,距离在20~50m。从监控范围和监控对象来说,足以满足一般中小型暖通空调监控系统的要求。对于更大范围的系统来说,也可通过在RS-485总线加装中继器来实现。
3系统软件
从系统软件的设计来看,由组态软件进行二次设计,一定程度上可以缩短开发周期。目前楼宇设备控制组态软件市场为JohnsonControl′s,Simens,Honeywell等几家公司所主宰。这些软件功能丰富,借助其完善的楼宇自控硬件设备,占有绝大部分的市场份额。但存在着硬件设备要求较高的问题,出于对内嵌的设备驱动程序(I/OServer),及被处理数据结构等原因的考虑,一般需要配用其专用的网络设备。而且它的一些核心技术封装在模块中,非厂家专业人员很难进行维护、调试。对于大量的中小型空调系统来说,其价格成本也较高。
所以借鉴组态软件面向对象的设计思想,以实际系统中与各硬件直接相关的各控制量为对象名,作为系统设计的核心。软件系统则以与控制量映射的对象名作为各种操作的对象,通过对对象名的属性和值进行定义、赋值来实现硬件系统的状态变化。
在此核心思想的基础上,以Windows为平台,VC++作为开发工具,建立①CobjectName(对象名信息类),包括AI型、AO型、DI型、DO型四类,每一个类中包括控制量的属性和相关信息;②CtreeView(树形显示类),帮助建立系统结构;③Ccomm(串行通信类),实现RS-485总线上多机系统之间的通信功能,包括创建、初始化、读写、关闭等操作;④CODBCRecord(数据记录类),实现重要运行参数的保存,及相关查询更新操作;⑤CalarmError(故障记录报警类),对参数值超过设定上下限的现场运行状况进行提示。
整个软件系统则分为三个功能模块:①设置模块,定义各硬件地址,IO口对象名等;②界面模块,建立人机对话界面;③后台模块,控制硬件采集、传输现场数据,及相关操作。
由于该软件系统基于面向对象的设计思想,使得它的稳定、高效、及维护、扩展等性能得到了保证。
4控制算法
对于中央空调监控系统来说,传统的控制器多为PID控制算法。即,以设定值w与实际
输出值y构成的控制偏差e(e=w-y)的比例,积分,微分通过线性组合构成控制量
式中:Kp是比例系数,Ti为积分时间,Td为微分时间。
在控制器中改写成差分形式,在采样时刻t=iT(T为采样周期)时:
采用增量形式:
这样只要保存近两个控制周期的输出值ui、ui-1,和近三个控制周期的偏差ei、ei-1、ei-2就可以了。
由于具有积分环节,PID控制器可消除稳态误差,在工作点附近有较好的稳态精度。但对于空调系统特有的大惯性、纯滞后、时变等特点,单纯的PID调节,会存在积分饱和现象,使系统超调较大,延长了过渡过程。而如果简单的采用高PID系数,虽然可以缩短过渡过程,但容易使控制失稳,而导致室温振荡。
所以,利用双回路控制,在较大偏差下利用模糊控制,屏蔽积分作用,实时整定PID系数,以改善系统动态性能,成为高精度空调控制系统的考虑。信号处理流程如***二所示。
首先,确定控制规则:
IF{ei}AND{éi}THEN{K}
其中{ei}、{éi}为误差e、误差变化率é的模糊变量集合,{K}为比例控制系数KP、积分控制系数KI、和微分控制系数KD的集合。
然后,建立模糊变量集合和模糊控制规则表,以明确输出的模糊量。
5结论
随着社会经济的发展,空调系统的舒适性和节能性对系统的控制提出了更高的要求。
计算机及网络技术的发展已经逐步要求或被要求进入暖通行业,对这方面内容的研究必将促进暖通行业新的发展。
参考文献
1王学慧微机模糊控制理论及其应用.北京:电子工业出版社,1987
2江亿暖通空调系统的计算机控制管理【J】,暖通空调,1997,3(4):6-7
3苏学花等基于RS-485的分布式监控系统的设计,计算机应用,2001年第8期
数据理论论文第6篇
1.1系统功能模块设计经过对福州外语外贸学院科研管理的需求调查分析,对取得的信息进行仔细整理可以发现,科研管理系统的主要任务可以划分为机构管理、科研人员管理、科研项目管理、科研成果管理、报表打印管理、系统管理6个部分,各部分之间并非各个***,而是相互联系。本研究正是据此设计,从而使本系统能够很好地完成这些功能。具体功能结构如***2所示。(1)机构管理:科研机构包括各学院、部处、机关单位等,所有的科研人员、成果、项目等都按照科研机构进行归口管理。提供各科研机构的增加、删除、修改与检索。(2)科研人员管理:主要对学校参与科研工作的人员基本信息进行管理,提供人员信息的增加、删除、修改与检索。为其他模块提供人员信息,是其他模块的基础。(3)科研成果管理:主要对科研论文、著作、成果等进行管理,提供成果信息的增加、删除、修改与检索。(4)科研项目管理:主要对已经立项后的项目进行管理,提供项目信息的增加、删除、修改与检索。可以对项目状态进行编辑。(5)报表打印管理:可以打印部门成果报表、个人成果报表、成果分类统计表、院部处教师科研分统计表、申报项目表、立项项目表等报表的打印。(6)系统管理:用于对登录用户信息、密码等进行维护。
1.2数据库设计数据库设计在软件开发过程中是一个很重要的环节,数据库是任何系统都不可避免的。本研究在设计数据库时尽量满足第三范式,减少数据冗余,尽量设计比较精简的数据库。(1)人员信息表:有机构、人员编号、姓名、出生日期、性别、职称、最后学历、最后学位、学科、研究方向等字段。(2)科研成果信息表:有机构、成果编号、成果名称、第一作者、成果来源、成果形式、出版单位、出版时间、刊号、关键字、成果字数等字段。(3)科研项目信息表:有机构、项目编号、项目名称、项目来源、批准号、负责人、立项时间、完成时间、项目状态、批准经费等字段。(4)管理员信息表:有用户名称、密码。管理员登录的时候要进行验证,表单获得的数据和数据库中该表的数据对比如果成功,则登录成功,否则,登录失败。对以上所有表的添加、删除、修改、读取等数据操作都设计相应的存储过程来实现。
2系统实现
2.1系统用户界面的设计用户界面设计的要求是:(1)简单清晰,一目了然,容易上手;(2)功能相似的页面,采用统一的布局;(3)方便操作,尽量减少数据录入量;(4)具有较好的录入容错功能。用户工作界面由三层组成:上方是***标栏;左下方为事务菜单;右下方为操作界面。页面主要采用webForm来进行设计。如校级管理员用户通过验证后的登入界面。
2.2数据库的实现本科研管理系统采用了三层结构的框架,将访问数据库的一些底层方法封装在DBUtility这个类库中,其中DbHelperSQL类和DbHelperSQLP类是连接数据库字符串和一些公用的方法,如简单的SQL语句,带参数的SQL语句,存储过程的操作等,DES-Encrypt类是数据库的安全性,加密解密等操作。PubConstant类是动态的配置数据库的连接字符串。
2.3配置web.config为了方便数据操作和维护,可以将一些数据库连接配置参数放在web.config文件中,代码如下。
2.4科研项目管理功能模块的实现高校科研项目管理主要针对已通过审核的项目提供管理功能,能提供项目的信息,对项目实现增加、修改、查找等功能。点击项目管理,可以出现项目一览和新增项目两个功能模块。这时候点击项目一览,可以出现项目的一些基本信息,并且可以对其进行增加、修改、查找等相关操作。系统管理员有最高权限,可以查找全校的申报项目,可以模糊查找,有修改、删除的权限,还可以导出所要的项目资料。以下是校级科研项目管理设计界面,如***4所示。
3结束语
数据理论论文第7篇
大数据管理与大数据应用都离不开大数据技术,但更离不开大数据人才。没有人才,再先进的设备只能是“豪华摆设”;没有人才,再先进的技术也只能是“纸上谈兵”。因此,推进大数据管理,除了需要培养一大批优秀的IT人才外,还迫切需要培养一大批大数据人才———数据管理师、数据分析师,造就一批数据科学家等高端人才。因为只有他们才能驾轻就熟处理海量的信息,并从中挖掘出“数据财富”。此外,面对全体员工传播大数据知识,普及大数据技术,培训大数据技能,奠定推进大数据管理的群众基础和技术基础,同样也是一项长期而艰巨的任务。
二、构筑大数据管理“一站式”工程,建设“大数据管理智库”新平台
1.加强内、外部数据的“一站式”管理。对企业来说,数据无处不在,无时不有,究其来源,无非企业内部和外部两个渠道。内部数据的活水源头是各单位、各部门、各专业的统计报表提供的数据;外部数据一方面是国家管理部门、行业管理部门、权威机构等的统计数据,另一方面是来自互联网、移动互联网、各种传感器等信息感知和采集终端采集的数据。这些数据,日积月累,最终“百川归海”,汇成大数据的海洋。大数据时代,企业通过建立“大数据管理智库”,打破渠道的边界,把不同来源的数据整合在一起,实施一站式管理,让数据时时刻刻为企业提供服务。2.注重数据挖掘环节的“一站式”管理。企业数据挖掘过程也是数据发现和梳理的过程,其有4个重要环节:采集、存储、分析、预测。企业建立了“大数据管理智库”,对这4个环节实施一站式管理,可以大大“提纯”数据价值。首先是尽可能采集异源甚至是异构的数据,去伪存真,多角度验证数据的全面性和可信性。其次是要用到冗余配置、分布化和云计算技术,分类、过滤和去重,减少存储量,同时加入便于检索的标签。第三是将高维数据降维后度量与处理,利用上下文关联进行语义分析,从大量动态而且可能是模棱两可的数据中综合信息,导出可理解的内容。第四是将数据分析后预测出的结论应用到企业中去。3.突出价值链上数据的“一站式”管理。企业价值链可以分为基本增值活动和辅增值活动两大部分。基本增值活动,即一般意义上的“生产经营环节”,如材料供应、成品开发、生产运行、成品储运、市场营销和售后服务。这些活动都与商品实体的加工流转直接相关;辅增值活动,包括组织建设、人事管理、技术开发和采购管理。价值链的每一个环节都有相伴而生的数据。过去这些数据处在分散状态。大数据时代,企业通过“大数据管理智库”平台,对这些数据实施一站式管理,有利于每一个环节的价值再创造和价值链的增值。
三、构筑大数据管理“一体化”工程,打造“大数据管理融合”新生态