城市地址编码

点赞:4389 浏览:17501 近期更新时间:2024-02-08 作者:网友分享原创网站原创

【摘 要】随着我国城市规模日益扩大,如何有效地组织和管理城市地址,使得通过地址名称快速地定位到地点显得越来越来重要,本文就城市地址编码技术进行讨论,主要包括:地址模型、地址标准化和地址编码.

【关 键 词】地址模型;地址标准化;地址编码

1地址模型

根据我国城市地址的特点,由大范围渐渐精确到具体地点,所以我们将地址按层为单位,形成层级地址模型,由上而下划分为省、市、区、街道、门牌,这里的街道是指县级政府的派出机构街道办事处.层级地址模型分为地址的名称和地址后缀,例如“广东省”,“广东”是地址模型的名称,“省”是地址模型的后缀.

为了方便切分地址,我们约定使用‘/’来区分不同层,而且还新建了一个后缀表,用来辅佐建立地址模型.这样做的好处是,如果有后缀没有收录到后缀表中,我们也可以及时地将它们收录进去,只需要在后缀表里面添加一条记录即可.地址模型很容易扩充,而且程序并不会受到影响,不需要修改代码.

2地址标准化

数据库建立后,就可以提供查找怎么写作,但是用户输入查找的地址并不一定是结构完整的地址全称,如果将输入的地址不加处理就直接用于查找,结果可能不是我们想得到的.这里提到的处理,就是地址标准化.我们要将用户输入的地址标准化后,才进行查找,这样做可以提高查找的准确度和节省查找的时间,提高数据库的整体性能.

如果用户输入的地址缺少后缀,需要查找地址模型表,匹配名称,就可以自动添加省略的后缀.但是用户输入的地址往往会出现地址错乱,例如正常的输入是“广东省广州市”,而用户有可能写成“广州市广东省”,要标准化这种地址层次错乱的输入,就要用到地址词典,地址词典表的结构:CREATETABLEdictionary(D_IdINTPRIMARYKEY,D_PidINT,D_CompleteNameNVARCHAR(150)NOTNULL).地址词典是在读入存放地址数据的excel表的时候,通过自学习不断完善的,通过D_Pid来标识它上一级的地址模型.所以即使用户输入的地址出现错乱,通过地址词典这种和上一级地址的联系,我们就可以将错乱的地址按照正确的顺序重新排好.在上面的例子中就是可以将用户输入的“广州市广东省”改正成“广东省广州市”.如果用户输入的地址出现跳层的情况,即例如,“广州市文明路”,这种情况就比前面的情况都要复杂,首先要在广州市前面补充“广东省”,通过地址词典可以实现,通过匹配“广州市”,就找到“广州市”的D_Pid,根据D_Pid就可以找出它对应的D_CompleteName,在这个例子就是“广东省”.还要在“广州市”和“文明路”之间插入“越秀区”,同样可以通过地址词典完成,“文明路”的D_Pid的D_Pid所对应的D_CompleteName等于“广州市”就找到越秀区的D_Id,进而就找到越秀区了,这样就可以把跳层的地址补充完整.

城市地址编码参考属性评定
有关论文范文主题研究: 关于数据库的论文范文集 大学生适用: 电大毕业论文、在职研究生论文
相关参考文献下载数量: 90 写作解决问题: 毕业论文怎么写
毕业论文开题报告: 论文提纲、论文目录 职称论文适用: 刊物发表、职称评初级
所属大学生专业类别: 毕业论文怎么写 论文题目推荐度: 最新题目

通过这几个例子的介绍,我们大概可以用这样的顺序来标准化用户输入的地址进行,流程图如图1所示,首先将缺少后缀的地址补充后缀,然后将错乱的地址重新排好,最后将被跳过的层重新补上,但是只能补充前面的层,不能够补充后面的层,经过一系列的处理后,就将用户输入的地址标准化了.

3地址编码

地址编码就是给地址一个代码以区分不同地区,我们采取最新的编码标准,长度取30位.县级以上地区的编码由国家质监总局制定,参照《GBT2260-2007中华人民共和国行政区划代码》,当县级以上的行政区划出现变动和国家质监总局发布新的行政区划代码的时候,要及时地更新行政区划的代码.县级以下地区的编码按照《GBT10114-2003县级以下行政区划代码编制规则》来分配.县级以下的代码由两段共9位数字构成,第一段是县级以上行政区划,采用《GBT2260-2007中华人民共和国行政区划代码》中的六位数字代码,第二段采用系列顺序码,由三位数字构成,具体划分为:001—099表示街道的代码,100—199表示镇的代码,200—399表示乡的代码,400—599表示政企合一单位的代码.

当出现一个新地区的时候,这个地区的下一层地址要重新开始编码,不再从当前的代码开始编码.还要考虑如果插入数据的时候,由于种种原因插入导致失败,即已经分配了代码,但是并没有使用到,这样就要将代码恢复到没有分配之前即上次的代码,这样可以不浪费任何一个的代码,实现起来也很容易,因为编码是用整数来运算然后再转换成字符串类型,所以只要将代码整数的最后一位自减一次就可以.

4结束语

本文粗略地分析了我国城市地址编码的技术,按照一定的标准给地址分配代码,然后将地址存储进数据库,另外数据库不能只管存储数据,还要考虑如何便于查找数据的问题,围绕这个问题,就出现了地址标准化的处理,标准化需要借助地址模型和地址词典,通过这两个表,可以将错乱不完整的地址处理成标准的地址,查找标准化后的地址可以大大提升系统的性能.