Ja编程的中文处理问题

点赞:12468 浏览:55233 近期更新时间:2024-04-04 作者:网友分享原创网站原创

摘 要 :本文提出了Ja程序设计中遇到的中文问题,阐述分析了Ja编程中有关中文信息处理的问题,针对不同具体头问题提出不同解决方法,有效解决了Ja编程开发中几种经常遇到的中文问题.

关 键 词 :JaUnicode 中文处理 汉字编码 方法

1.引言

Ja编程语言具有面向对象,可跨平台运行和分布应用等特点,因此使得Ja语言成为现代编程语言中最具生命力的计算机语言.在使用Ja技术进行程序设计、软件开发中,经常会遇到中文问题,即应该显示中文的时候.却出现莫名其妙的乱码.其主要表现在:中文文本文件的读写内容不一致,Ja程序与数据库之间不能处理中文,Web应用中不能处理中文等方面.特别是在读取数据库中的中文信息时,问题特别明显.Ja中文处理问题一直困扰着很多初学者,如果了解了Ja系统的中文问题原理,我们就可以对中文问题能够采取根本的解决之道.


2.Ja中文问题的由来

在计算机中一切处理程序最初都是以单字节编码为准进行处理.随后,微软提出了Unicode编码Ja语言即采用了此种编码,其内部一律用Unicode来表示字符.Unicode是用两个字节表示一个字符的符编码方案,其兼容英文字符和其它国家的双字节字符编码,而我们中文通常使用的字符编码是一种双字节字符集(DBCS),如:GB2312、GBK、GB此类编码,它与Unicode编码机制有很大的差别.Ja的内核和class文件是基于unicode的,这使Ja程序具有良好的跨平台性,但也带来了一些中文乱码问题的麻烦.原因主要有两方面,Ja和JSP文件本身编译时产生的乱码问题和Ja程序于其他媒介交互产生的乱码问题.也就是说,因为怎么写作器使用的编码方式不同和浏览器对不同的字符显示结果不同而导致的.Ja中文信息处理之所以存在问题,其根本原因是由于被操作的中文字符编码格式与目标编码格式不一致所造成.

3.2 表单提交中文时出现乱码(分get和post两种处理)

主要是由于浏览器默认使用UTF-8编码方式来发送请求,而UTF- 8和GB2312编码方式表示字符时不一样,这样就出现了不能识别字符.问题出在 QueryString 的解析,以前在 Tomcat 4.x 时代,无论 submit 时采用 GET or POST,Tomcat server 对 parameters 的处理都采用相同的编码,但在 Tomcat 5.x 版,不知何故,却将 QueryString 的解析独立出来,目前确认,Form 的 Method 采用 GET 及直接将参数写在 URL 上的中文,上传到 Tomcat时,无论如何转码,都会变成乱码,那怕你事先作过 URLEncode 也一样.

Ja编程的中文处理问题参考属性评定
有关论文范文主题研究: 关于中文的论文范文集 大学生适用: 函授论文、在职论文
相关参考文献下载数量: 33 写作解决问题: 如何怎么撰写
毕业论文开题报告: 论文提纲、论文总结 职称论文适用: 期刊目录、高级职称
所属大学生专业类别: 如何怎么撰写 论文题目推荐度: 免费选题

4.结语

从以上几种解决方法我们不难看出,Ja中文信息处理之所以存在问题,其根本原因是由于被操作的中文字符编码格式与目标编码格式不一致所造成.有这些问题,其实都是发生在字符的读入、输出过程.因此,只要我们把握住这一环节,就可以更好的发现、分析、处理和预防Ja编程中所存在的中文问题.