谷晶:Tomcat的中文乱码的经典解决方案

来源:百度文库 编辑:九乡新闻网 时间:2024/04/29 20:32:07

(转贴注:原来要用filter还有这么多的问题。要分别对待GET和POST方法。GET要在Connector里设好了URIEncoding(不是URLEncoding),今天被搞死了。。)

引言:

近期在做我们学校(华中科技大学)的注册中心的信息速递系统中又遇到了久违中文乱码的问题。由于注册中心的HUB系统需要团队开发完成,这导致中文 乱码问题尤为突出。万般无奈之下,硬下头皮寻根究底的找出问题的真正原因。皇天不负有心人,在查阅了N多资料和做了无数次试验之后,终于找到了个人认为较 为简单和经典的解决方案。

适用环境:

采用Tomcat 4.x或Tomcat 5.x,应用中出现中文乱码现象,且找不到统一的解决方案。

主要现象:

在应用中采用GET方式或POST方式时会出现中文乱码现象,而且针对这两种方式不能使用唯一的解决方案。一般您可能会使用以下的几种方案:

A.request.setCharacterEncoding(”gb2312″);

B.type = new String(type.getBytes(”ISO8859-1″), “GB2312″);

C.在Tomcat的配置文件Server.xml中的Connector标签中加入“URIEncoding=UTF-8”属性;

D.conf\web.xml 指定多个Encoding参数;

E.编写一个filter,处理Post提交的编码问题;

但有时候您可能会发现,这样做会让问题更糟糕。

问题分析:

要解决中文乱码的问题,首先要了解Tomcat在背后的处理机制,在查阅了许多资料以及许多前辈们写的文章并做了无数次试验之后,我找到了导致Tomcat中出现中文乱码的主要原因,即Tomcat对GET和POST两种方式的处理方法:在Tomcat 4.x时,采用的是GET和POST两种方式使用相同的字符集,也就是UTF-8。但在Tomcat 5.x下,GET和POST方式采用了不同的字符集。

解决方案:

首先我想申明,我所给出的只是解决方案的一种,并不代表我给出的方案能解决大家所遇到的所有问题,但是有一点是肯定的,大家在同一个系统中必须使用相同的解决方案,如果可以最好统一您应用中各个组件包括数据库、JDK、WEB服务器等等的字符编码方案。

而我所采用的是下面的这种方案(只针对Tomcat):

Tomcat 4.x

1.页面编码采用“charset=gb2312”;

2.接收参数使用“request.setCharacterEncoding(”gb2312″);”;

3.如果需要在转换编码,如“type = new String(type.getBytes(”ISO8859-1″), “GB2312″);”;

Tomcat 5.x

1.在配置文件Server.xml的Connector标签中加入“useBodyEncodingForURI=”true””,这个属性主要 是让Tomcat 5.x在GET和POST方式使用相同的字符集。如果这样做仍不能解决问题,您可以尝试再加入另一个属性“URIEncoding=UTF-8”;

2.其他处理同Tomcat 4.x

以上方法可做参考,如果您有其他好的方法或觉得本文中有任何问题或遗漏欢迎批评斧正。