香港电脑汉字楷体字形参考指引
(Version7)
(2001年5月11日)
主题内容:
1.1本指引的目的是提供一套适合香港使用的电脑用楷体汉字字形原则,供厂商参考.
1.2本指引适用於ISO/IEC10646国际标准中的基本多文种平面(BMP),A扩充集(ExtensionA)及《香港增补字符集》(HongKongSupplementaryCharacterSet)内的汉字,但不适用於ISO/IEC10646国际标准所包括的内地规范简化字及仅在日本,韩国,越南或新加坡使用的汉字.
本指引以国家语言文字工作委员会於一九九七年十二月一日发布的《信息处理用GB13000.1字符集汉字部件规范》(文件号:GF3001-1997)为基础,并参考《常用字字形表(二零零零年修订本)》(见下文2.2.1段)的字形规律,把组成本指引适用范围内所有汉字的部件一一列出(部件拆分原则见下文第4段),再列举合适的汉字作为例子,藉此阐明适合香港使用的字形原则.
有关论文范文主题研究: | 关于信息技术的论文范例 | 大学生适用: | 专升本毕业论文、高校毕业论文 |
---|---|---|---|
相关参考文献下载数量: | 93 | 写作解决问题: | 写作参考 |
毕业论文开题报告: | 论文模板、论文目录 | 职称论文适用: | 论文发表、职称评副高 |
所属大学生专业类别: | 写作参考 | 论文题目推荐度: | 免费选题 |
本指引只描述汉字部件的笔画结构,并不对汉字或其部件的大小和比例构成限制.
参考标准与文献
2.1标准
ISO/IEC10646-1:2000(E),InternationalStandard:InformationTechnology-UniversalMultiple-OctetCodedCharacterSet(UCS)-Part1:ArchitectureandBasicMultilingualPlane,ISO/IEC,2000
GB/T12200.2-94《汉语信息处理词汇02部分:汉语和汉字》,国家技术监督局,中国标准出版社,1994年12月7日
GB13000.1-93《信息技术通用多八位编码字符集(UCS),第一部分体系结构与基本多文种平面》,国家技术监督局,中国标准出版社,1993年12月24日
GB/T13443-92《信息交换用汉字128X128点阵楷体字模集及数据集》,国家技术监督局,中国标准出版社,1992年4月21日
GB12200.1-90《汉语信息处理词汇01部分:基本术语》,国家技术监督局,中国标准出版社,1990年2月1日
2.2文献
《常用字字形表(二零零零年修订本)》,李学铭主编,香港教育学院,2000年
TheUnicodeConsortium,TheUnicodeStandardVersion3.0,TheUnicodeInc.,2000
《语文建设通讯(香港)第63期.汉字笔画定量研究》,马显彬,﹐2000年4月
《常用国字标准字体笔顺手册》,台湾教育部,1999年11月
《香港增补字符集》,香港特别行政区政府,1999年9月28日
《国字标准字体宋体母稿-教育部字序》,台湾教育部,1998年2月
GF3001-1997《国家语言文字工作委员会语言文字规范信息处理用GB13000.1字符集汉字部件规范》,国家语言文字工作委员会,1997年12月1日
《现代汉字学纲要》,苏培成,北京大学出版社﹐1994年10月
《现代汉语通用字─笔顺规范》,国家语言文字工作委员会,语文出版社,1987年8月
《简化字总表(新版)》,中国文字改革委员会,1986
《汉语大字典》,汉语大字典编辑委员会,湖北辞书出版社和四川辞书出版社,1986年10月
《电脑用中文字型与字码对照表》,《技术通报C-26》,财团法人工业策进会,1984年5月
《康熙字典》,中华书局,1958年1月第一版
术语
3.1汉字Chinesecharacter/Hanzi(GB12200.1—90)
书写汉语的符号系统.除中国外,其他一些国家或民族也用汉字作为书写符号.
3.2简化字simplifiedChinesecharacter(GB12200.1—90)
特指内地於1986年公布的《简化字总表(新版)》(见上文第2.2.10段)所收纳的2235字.
UCS-2编码UCS-2code
ISO/IEC10646国际标准中以二字节定义的编码系统.UCS-2编码以十六进制表示.UCS-2编码与Unicode编码一致.
统一的中日韩文字UnifiedCJKIdeographs(ISO/IEC10646《信息技术通用多八位编码字符集》)
ISO/IEC10646国际标准包括的中国,日本,韩国及其他国家和地区经认同规则整合後所采纳的汉字的统称.
3.5原字集CJKIdeographSources(ISO/IEC10646AnnexS《信息技术通用多八位编码字符集》附件S)
ISO/IEC10646国际标准基本多文种平面内的中日韩文字是在整合中国,日本,韩国及其他国家和地区原有的电脑文字标准後得出的.这些原有的电脑文字标准或规范称为原字集.原字集的颁布国家和地区均有代号,其中G,H,J,K,S,T,V分别代表中国内地,香港,日本,韩国,新加坡,台湾和越南.
3.6认同规则UnificationProcedure(ISO/IEC10646AnnexS《信息技术通用多八位编码字符集》附件S)
指ISO/IEC10646国际标准使用的一套汉字统一整合规则.根据认同规则被认同的汉字不会分别编码,而在不违反认同规则的原则下,ISO/IEC10646国际标准不限制某一码位汉字的具体字形.
3.7原字集分别编码原则SourceSeparationRule(ISO/IEC10646AnnexS《信息技术通用多八位编码字符集》附件S)
凡在原字集中具有各自的代码的异体字,不受认同规则限制,在ISO/IEC10646国际标准中予以保留和分别编码,以保证ISO/IEC10646与原字集之间的对映关系不受影响.
非同源汉字non-cognatecharacters(ISO/IEC10646AnnexS《信息技术通用多八位编码字符集》附件S)
ISO/IEC10646国际标准中之术语.指字形近似但无字源关系或意义,用法不同的汉字,因此分别编码,例如:"士"和"土".有些国家和地区认为是相同的汉字,在其他国家和地区可能属於非同源汉字,例如:""(UCS-2编码为"6723")和""(UCS-2编码为"81A7").ISO/IEC10646国际标准把一些容易混淆的非同源汉字载列於附件S.
3.9楷体KaiTi(GB/T12200.2—94)
汉字主要印刷体之一.由手写的正规楷书发展而来.
3.10笔画stroke(GB/T12200.2—94)
构成楷书汉字字形的最小连笔单位.
3.11笔形strokefeature(GF3001-1997)
笔画的具体形状.楷书汉字的笔形依据笔势和走向可以分为数十种,其基本的类别为"一"(横),""(竖),""(撇),","(点)(包括""(捺))和""(折).
3.12笔顺strokeorder(GF3001-1997)
书写每个汉字时笔画的次序和方向.
3.13笔数strokecount(GB/T12200.2—94)
构成一个汉字或汉字部件的笔画数目.
3.14汉字部件Chinesecharacterponent(GB/T12200.2—94)
由笔画组成的具有组配汉字功能的构字单位.简称"部件".
例如:"木,心,口,也".汉字的偏旁部首是部件的一种.
3.15基础部件basicponent(GF3001-1997)
最小的不再拆分的部件称为"基础部件".基础部件处於汉字结构的最低层,又称末级部件.例如"男"中的"田","力".
3.16主形部件与变体部件principalponentandvariantponent
某些部件的形状会受到位置影响而变化.该等部件的原形称为主形部件,受到位置影响而出现的变体称为变体部件.例如:"又"(见於"设"字)与""(见於"灿"字)两者之中,"又"为主形部件,""为变体部件.主形部件具有代表和称说本组部件的作用.
3.17相关部件relatedponents
有字源关系的两个或多个部件,例如"手"和"".
3.18形似部件similarponents
形状相似,但无字源关系或主形与变体关系的两个或多个部件,例如:"士"和"土".
3.19部件拆分(GF3001-1997)ponentdeposition
将汉字拆分为部件称部件拆分.
3.20有理据拆分和无理据拆分etymology-baseddepositionandpromiseddeposition
根据汉字构成的结构理据所进行的部件拆分,称有理据拆分,当无法分析理据或理据与原始形成的字形不一致时,依照已定义之部件所进行的部件拆分,称无理据拆分.
部件拆分原则
本指引对适用范围内的汉字进行部件拆分.,拆分原则以《信息处理用GB13000.1字符集汉字部件规范》第5段《汉字基础部件表》使用规则所载的部件拆分原则为基础.具体的拆分原则如下:
4.1尽量延用《信息处理用GB13000.1字符集汉字部件规范》所载的部件.
4.2不违背形体的原则:
交重不拆,例如:"串"不会再拆分,"或"中的"戈"不会再拆分,
相离相接可拆,例如:"计"拆分成"言"和"十","页"拆分成""和"贝",
少数不影响结构和笔数的笔画搭挂,按相接处理,例如:"页"中的""和"贝"当作相接.
遵照结构规律的原则:
部件组成合乎汉字构件原理,进行有理据拆分,例如:计"拆分成"言"和"十".无法分析理据或与字形原始形成出现矛盾时,依形进行无理据拆分,例如:"丢"字原为""由""(撇)和"去"组成,而香港已习惯将撇变成横,且"王"与""已包括在《信息处理用GB13000.1字符集汉字部件规范》内,因此"丢"以无理据拆分成"王"与"".
在进行多部件的有理据拆分时,依汉字组合层次进行,例如:"蓓"的第一次拆分为""和"倍","倍"再拆分为""和"",""再拆分为"立"和"口".
合理控制下限的原则:
两个以上的相离或相接部分,若其中一个无构成其他字的能力,则不再拆分,例如:""不会再拆成""和"",因""不独立构字.
两个相离的对称部分,不独立构字,不再拆分,例如:"".
依笔形区分部件的原则:
主形部件和变体部件分别列出.
属於不同源的部件,笔形完全相同的,当作同一部件.
部件的大小和笔画的绝对长短粗细不作为区分部件的标准,例如:""部件作独体汉字""用和作部件时(如"匹"),"一"(横)长短的写法习惯会有所不同.
(3)综合衡量的原则:以上原则无法兼顾时,权衡利弊,综合处理.
5.《香港电脑汉字楷体字形基础部件表》
本表列载的基础部件合共621个,是对本指引适用范围内的汉字进行拆分的结果.
5.1部件排列方式
部件按笔画数从少到多顺序排列.
笔画数相同,则按起笔"横竖撇点折"顺序排列.
5.2栏目说明
5.2.1序号:列出部件的排列顺序号.
5.2.2部件:列出部件的基本形状和出处代码.
出处表示由该部件组成的汉字是否出现在以下四种参考文献中.出处代码以四个数字(ABCD)组成:
A:"大五码"(见2.2.12)
B:《康熙字典》
C:《汉语大字典》
D:《香港增补字符集》5.2.3笔画数:列出部件的实际书写笔画数目.
5.2.4例字:列出包含该部件的汉字楷体字形作为示例.
例字後面有"等"者,表示没有穷举,还有其他例字.
例字後面没有"等"者,表示已经穷举.
每个例字之下方均列出其UCS-2编码.有"*"者表示该字收录於《常用字字形表(二零零零年修订本)》.
UCS-2编码下方标明该例字的出处,代码与5.2.2段所述者相同.
5.2.5附注:与部件相关的补充说明.例如标示主形部件,变体部件,相关部件和形似部件的序号,按原字集分别编码原则而分别编码的汉字,以及非同源汉字.
5.2.6GB组号和GB序号:如部件原来载列於《信息处理用GB13000.1字符集汉字部件规范》,该规范编予该部件的组号和序号也一并列出,以便检索.由於《信息处理用GB13000.1字符集汉字部件规范》不是字形规范,而且内地的书写习惯与香港不尽相同,因此该规范所列的部件形状可能与本指引所列的对等部件形状略有不同.
本指引建议厂商参照ISO/IEC10646标准中G列字形制造此类汉字.
台湾工业标准"大五码"之正式文献
认同规则原文见ISO/IEC10646AnnexS(Informative)ProcedurefortheUnificationandArrangementofCJKIdeographs.
由於本指引的适用范围不包括ISO/IEC10646国际标准中的内地规范简化字及仅在日本,韩国,越南,新加坡使用的汉字,因此拆分出来的部件不包括这批汉字独有的部件.
May11,2001DocumentNo.:DN46
1