JSP技巧：从原理上解决Tomcat中文问题

2020-02-05 13:47:51

字体：大中小

来源：转载

供稿：网友

　　很多开源软件都有国际化和本地化的问题，其实国际化本没有那么复杂，只是总有些公司希望通过拒绝国际标准来提高市场占有率，所以也就渐渐导致了现在的情况。很多开源软件首要支持的便是utf编码，然后才是其他编码。(by gashero)当然也有些不着调的软件首选的是iso-8859-1编码，甚至是ascii编码。好了，下面先讲讲编码，因为tomcat也是一种不着调的软件。

　　常见的中文编码有gb2312、gbk、gb18030等等，当然没有包括繁体中文，这些编码都是表示编码，而并非是显示编码。现在越来越多的软件，在其核心使用的显示编码或者说处理编码，是unicode编码。unicode编码使用2字节表示了世界上几乎所有的文字符号，作软件的内部国际化处理再适合不过了。

　　只是有些龌龊公司，为了商业目的，对内核的unicode编码api全部屏蔽，对外只提供本地化编码。(by gashero)比如m$公司在中文软件上就主推gbk编码。

　　还有一个问题就是用c/c++编写的很老的软件，字符串结束标志是'/0'，而使用unicode的话，会无故的截断一些字符串。所以utf-8就应运而生了，这种变长编码既可以减小字符串的体积，也可以防止阶段而传输unicode编码。

　　至于传统的英文编码，最常见的就是两种。一是ascii，这种字符集高位为0，用7位表示数据。另一种是iso-8859-1，每个字符1字节，用8位表示一个字符。

　　tomcat的内置编码就是使用了iso-8859-1。这也是本文最关键的一句，各种技巧的根本。

　　由此可知由网页所提交的数据就需要从iso-8859-1解码，如下是获得提交参数number的例子。

　　string number=new string(request.getparameter("number").getbytes("iso-8859-1"),"utf-8");

　　这句就成功的实现了从iso-8859-1向utf-8编码的转换。

　　有经验的读者应该遇到过通过＜jsp:param＞标签传递网页间参数时出错的问题。(by gashero)接收到的字符串只要是无论如何都是一堆问号。其实这也是tomcat内部编码所导致的。如果可以顺应tomcat的内部编码就可以传递中文字符串了。

　　比如一个页面间的内部重定向:

　　＜?xml:namespace prefix = jsp /＞＜jsp:forward page="index.jsp"＞

　　＜jsp:param name="name" value="＜%=new string(" % 中文参数?.getbytes(?utf-8?),?iso-8859-1?)＞" />

　　＜/jsp:forward＞

　　而在目的页面接收参数的时候也需要再次从iso-8859-1编码转换到utf-8编码。这样就实现了在页面之间传递中文参数。

上一篇：在jsp环境中配置使用FCKEditor

下一篇：JSP高访问量下的计数程序

学习交流

关于网站项目计划书的写法

关于网站项目计划书的写法...

热门图片

猜你喜欢的新闻

猜你喜欢的关注