城市地址编码

【摘 要】随着我国城市规模日益扩大,如何有效地组织和管理城市地址,使得通过地址名称快速地定位到地点显得越来越来重要,本文就城市地址编码技术进行讨论,主要包括:地址模型、地址标准化和地址编码。

【关键词】地址模型;地址标准化;地址编码

1 地址模型

根据我国城市地址的特点,由大范围渐渐精确到具体地点,所以我们将地址按层为单位,形成层级地址模型,由上而下划分为省、市、区、街道、门牌,这里的街道是指县级***府的派出机构街道办事处。层级地址模型分为地址的名称和地址后缀,例如“广东省”,“广东”是地址模型的名称,“省”是地址模型的后缀。

为了方便切分地址,我们约定使用‘/’来区分不同层,而且还新建了一个后缀表,用来辅佐建立地址模型。这样做的好处是,如果有后缀没有收录到后缀表中,我们也可以及时地将它们收录进去,只需要在后缀表里面添加一条记录即可。地址模型很容易扩充,而且程序并不会受到影响,不需要修改代码。

2 地址标准化

数据库建立后,就可以提供查找服务,但是用户输入查找的地址并不一定是结构完整的地址全称,如果将输入的地址不加处理就直接用于查找,结果可能不是我们想得到的。这里提到的处理,就是地址标准化。我们要将用户输入的地址标准化后,才进行查找,这样做可以提高查找的准确度和节省查找的时间,提高数据库的整体性能。

如果用户输入的地址缺少后缀,需要查找地址模型表,匹配名称,就可以自动添加省略的后缀。但是用户输入的地址往往会出现地址错乱,例如正常的输入是“广东省广州市”,而用户有可能写成“广州市广东省”,要标准化这种地址层次错乱的输入,就要用到地址词典,地址词典表的结构:CREATE TABLE dictionary(D_Id INT PRIMARY KEY,D_Pid INT,D_Compl et eNa me NVARCHAR(150) NOT NULL)。地址词典是在读入存放地址数据的excel表的时候,通过自学习不断完善的,通过D_Pid来标识它上一级的地址模型。所以即使用户输入的地址出现错乱,通过地址词典这种和上一级地址的联系,我们就可以将错乱的地址按照正确的顺序重新排好。在上面的例子中就是可以将用户输入的“广州市广东省”改正成“广东省广州市”。如果用户输入的地址出现跳层的情况,即例如,“广州市文明路”,这种情况就比前面的情况都要复杂,首先要在广州市前面补充“广东省”,通过地址词典可以实现,通过匹配“广州市”,就找到“广州市”的D_Pid,根据D_Pid就可以找出它对应的D_Comple teName,在这个例子就是“广东省”。还要在“广州市”和“文明路”之间插入“越秀区”,同样可以通过地址词典完成,“文明路”的D_Pid的D_Pid所对应的D_Complet eName等于“广州市”就找到越秀区的D_Id,进而就找到越秀区了,这样就可以把跳层的地址补充完整。

通过这几个例子的介绍,我们大概可以用这样的顺序来标准化用户输入的地址进行,流程***如***1所示,首先将缺少后缀的地址补充后缀,然后将错乱的地址重新排好,最后将被跳过的层重新补上,但是只能补充前面的层,不能够补充后面的层,经过一系列的处理后,就将用户输入的地址标准化了。

3 地址编码

地址编码就是给地址一个代码以区分不同地区,我们采取***治安管理局最新的编码标准,长度取30位。县级以上地区的编码由国家质监总局制定,参照《GBT2260-2007中华人民共和国行***区划代码》,当县级以上的行***区划出现变动和国家质监总局新的行***区划代码的时候,要及时地更新行***区划的代码。县级以下地区的编码按照《GBT 10114-2003 县级以下行***区划代码编制规则》来分配。县级以下的代码由两段共9位数字构成,第一段是县级以上行***区划,采用《GBT2260-2007中华人民共和国行***区划代码》中的六位数字代码,第二段采用系列顺序码,由三位数字构成,具体划分为:001—099表示街道的代码,100—199表示镇的代码,200—399表示乡的代码,400—599表示***企合一单位的代码。

当出现一个新地区的时候,这个地区的下一层地址要重新开始编码,不再从当前的代码开始编码。还要考虑如果插入数据的时候,由于种种原因插入导致失败,即已经分配了代码,但是并没有使用到,这样就要将代码恢复到没有分配之前即上次的代码,这样可以不浪费任何一个的代码,实现起来也很容易,因为编码是用整数来运算然后再转换成字符串类型,所以只要将代码整数的最后一位自减一次就可以。

4 结束语

本文粗略地分析了我国城市地址编码的技术,按照一定的标准给地址分配代码,然后将地址存储进数据库,另外数据库不能只管存储数据,还要考虑如何便于查找数据的问题,围绕这个问题,就出现了地址标准化的处理,标准化需要借助地址模型和地址词典,通过这两个表,可以将错乱不完整的地址处理成标准的地址,查找标准化后的地址可以大大提升系统的性能。

参考文献:

[1]王珊,萨师煊.数据库系统概论(第4版),高等教育出版社,2006.

[2]郭会,宋关福,马柳青,王少华.地理编码系统设计与实现.计算机工程,2009(01).

[3]万剑华,叶海波.浅谈城市地址编码数据库的建立.工程勘察,2009(11).

城市地址编码

转载请注明出处学文网 » 城市地址编码

学习

森林灭火方法多

阅读(20)

本文为您介绍森林灭火方法多,内容包括森林灭火的方法和技巧,森林灭火战术方法。近几年,国外在扑救森林火灾时,除人工扑打、洒水灭火、风力灭火外,还出现了人工降雨、化学药剂灭火、爆炸灭火等多种先进的灭火方法。

学习

我国电视纪录片解说词探析

阅读(17)

本文为您介绍我国电视纪录片解说词探析,内容包括美丽中国纪录片1-4集解说词,电视纪录片解说词写作探析。[摘要]我国电视纪录片已经有几十午的历史,早期受电影纪录片影响,虽然有一批精品,但其由于解说词统领全片,大大影响了质量。近20年来,我

学习

苏轼《定风波》赏析

阅读(36)

本文为您介绍苏轼《定风波》赏析,内容包括定风波苏轼原文朗诵,定风波苏轼原文书法。关键词:苏轼;定风波;人格特点;有差别境;无差别定

学习

民国第一间谍大案疑云

阅读(25)

本文为您介绍民国第一间谍大案疑云,内容包括民国奇案之间谍案,民国间谍案完整版。“帝国之花”与“才子高官”

学习

一言一行总关情

阅读(17)

本文为您介绍一言一行总关情,内容包括一言一行总关情下一句,一言一行总关情600字记叙文。《少年王冕》是苏教版小学语文第九册第七单元中的一篇人物故事。课文主要讲的是元朝著名画家诗人王冕小时候如何孝敬寡母、学画荷花的故事,表现了

学习

关于卫星电视接收天线

阅读(21)

本文为您介绍关于卫星电视接收天线,内容包括什么天线能接收卫星电视,电视卫星接收天线哪个好。卫星广播电视信号工作频率属于微波波段频率。微波波段的电磁波频率从1GHz开始,一直延伸到电磁波的光波波段,与地面广播电视VHF、UHF频段的电磁

学习

白蛇传

阅读(21)

本文为您介绍白蛇传,内容包括白蛇传全文完整版,白蛇传全文故事。开场:音乐《千年等一回》,白蛇、青蛇唱着出场。

学习

都市小说的伦理倾向

阅读(29)

这则小说读来愉悦有序,细腻的场景描写,隐秘的情感潮润,结成了一张温情脉脉的网,渐开渐合之际,许多绚丽的故事与人物被编织进来。

学习

中外建筑能耗比较

阅读(14)

本文为您介绍中外建筑能耗比较,内容包括中外建筑能耗巨大差别的原因,近零能耗建筑技术标准。摘要:根据相关数据显示,中国目前的能源消耗中,建筑能耗所占比例已经远远超过43%,而国外发达国家的建筑能耗一般占其全国总能耗的三分之一。而在新型城

学习

浅析老子的“无为”思想及其意义

阅读(26)

本文为您介绍浅析老子的“无为”思想及其意义,内容包括老子无为思想及当下的启示,老子的自然无为思想的精神实质。摘要:老子的哲学体系核心是“道”,具体言之就是“无为自化,清静自正”。我们通过对老子其人、其思想观点的阐述,结合时代背景

学习

我国矿产资源综合利用的问题与对策研究

阅读(14)

本文为您介绍我国矿产资源综合利用的问题与对策研究,内容包括宜昌宜美城市矿产资源循环利用,矿产资源利用中存在的问题及对策。摘要:矿产资源的综合利用是当今社会的一项十分重要的课题。本文在论述我国矿产资源的主要特点的基础上,分析了

学习

《儿子与情人》的心理因素解读

阅读(15)

本文为您介绍《儿子与情人》的心理因素解读,内容包括情人失去儿子的心理,儿子和妹妹的心理分析。《儿子与情人》是英国才子作家劳伦斯的一部自传体式小说,该小说通过对主人公保罗与其母亲莫雷尔夫人,以及女友克拉拉和米利安三人之间的感情

学习

钱小虎的文化情怀

阅读(21)

在商海如鱼得水的钱小虎,并不愿意让人们把自己看做“商人”,他说,商人逐利,无商不奸,他不是这样的人。他更乐意展示给世人的是他融化到骨子里的文化情怀。

学习

小学德育

阅读(28)

[摘要]小学是加强和改进未成年人的思想道德的前沿阵地,小学德育是社会主义精神文明建设的奠基工程,是在小学教育过程中为专门培养学生思想品德的教育活动。面对新形势,必须遵循儿童、青少年身心发展的规律和学生思想品德形成发展的规律。抓

学习

KKS编码的研究与应用

阅读(38)

本文为您介绍KKS编码的研究与应用,内容包括kks编码由哪个专业编写,kks编码由谁来编。摘要:电站KKS标识系统用于标识电厂、电厂各部分和设备组件。它可以按照电厂的任务、类型和位置标识任何类型的电厂,KKS编码的标识分为相关工艺标识、安