为什么会有乱码
产生乱码的原因一句话就能说明白:
编码和解码使用的字符集不同。
比如说在后端把字符串 "你好,世界" 按照 UTF-8 进行编码,但是前端却按照 GB2312 进行解码,那自然会产生乱码。
解决 response 中的乱码
因为目前大部分浏览器都是采用 UTF-8 编码的,所以向浏览器输出中文字符,只需在 doGet 方法中指定 Content-Type:text/html;charset=utf-8。
response.setContentType("text/html;charset=utf-8");
解决 request 中的乱码
GET
获取 HTTP 请求中的中文参数时可能会有乱码,所以先将字符串变回字节数组,然后再按照 UTF-8 进行编码。假设 HTTP 请求中带了一个 username 的参数,那么就需要在 doGet 方法中进行如下处理
String username = request.getParameter("username");
// Tomcat 默认的编码方式是 ISO8859-1
username = new String(username.getBytes("iso8859-1"),"utf-8");
问题是,在实际的应用场景中 HTTP 请求携带的参数可能有多个,所以就不能只针对某个参数进行修改。解决的方案是使用装饰器模式,写一个 HttpServletRequest 的装饰器类,经过装饰的 request 对请求中的任何参数都能进行编码的处理。
// 装饰器类,用来设置 GET 请求的编码
public class EncodingRequest extends HttpServletRequestWrapper{
private HttpServletRequest request; // 真正的 request 对象
public EncodingRequest(HttpServletRequest request) {
super(request);
this.request = request;
}
@Override
public String getParameter(String name) { // 覆写 getParameter 方法,将所有参数的编码设置为 UTF-8
String value = request.getParameter(name);
try {
value = new String(value.getBytes("iso-8859-1"),"utf-8");
} catch (UnsupportedEncodingException e) {
throw new RuntimeException(e);
}
return value;
}
}
然后用一个 Filter 对所有的请求进行编码的处理,然后再把处理过后的 request 对象传递给 Servlet:
@WebFilter("/*")
public class EncodingFilter implements Filter {
public void destroy() {}
public void doFilter(ServletRequest request, ServletResponse response, FilterChain chain)
throws IOException, ServletException {
HttpServletRequest req = (HttpServletRequest) request;
if (req.getMethod().equals("GET")) { // 处理 GET 请求的编码
EncodingRequest encodingReq = new EncodingRequest(req);
// 注意这里传递的是 EncodingRequest 对象
chain.doFilter(encodingReq, response);
}
if (req.getMethod().equals("POST")) { // 处理 POST 请求的编码
request.setCharacterEncoding("utf-8");
chain.doFilter(request, response);
}
}
public void init(FilterConfig fConfig) throws ServletException {}
}
POST
因为大多数情况下我们在 doPost 方法内都会调用 doGet 方法,因此按照上面的做法就能解决 POST 请求中的中文乱码问题。如果使用 Spring 进行开发,那么有 POST 请求乱码的专门解决方案。在 web.xml 中添加如下配置:
<!-- POST 乱码过滤器 -->
<filter>
<filter-name>CharacterEncodingFilter</filter-name>
<filter-class>org.springframework.web.filter.CharacterEncodingFilter</filter-class>
<init-param>
<param-name>encoding</param-name>
<param-value>UTF-8</param-value>
</init-param>
</filter>
<filter-mapping>
<filter-name>CharacterEncodingFilter</filter-name>
<url-pattern>/*</url-pattern>
</filter-mapping>
这样就可以解决 POST 的乱码问题了。