Servlet是SUN指定的Java服务器端编程规范,用以处理来自客户端的请求,处理并做出响应的一套基础API。Servlet是运行在 Servlet容器中的Java小程序,容器运行在服务器端,服务器侦听特定端口的请求,并解析请求地址,将请求对象送给容器中的Servlet来执行,这个原理非常简单,平时我们多以在浏览器中输入URL地址,提交表单方式来实现,现在我们用Java语言来模拟常用的GET和POST请求,来更底层的看看Servlet,这就是C/S模型了,其实Java Web不拘泥于B/S模型,想做C/S程序也是可以的。
要模拟请求这就用到了Java网络编程中的一些知识,创建一个URL对象,获得URL连接对象,设置请求参数;有了连接还要处理和传递信息,那么还需要 I/O方面的知识;GET/POST是HTTP协议中定义的方法,那么我们还应该了解HTTP协议请求报文的相关内容,这里不细说它们,只根据代码实例来看看基本原理。
创建一个Client类,定义两个基本方法。
/** * 用于模拟HTTP请求中GET/POST方式 * * @author Sarin * */ public class Client { /** * 发送GET请求 * * @param url * 目的地址 * @param parameters * 请求参数,Map类型。 * @return 远程响应结果 */ public static String sendGet(String url, Map<String, String> parameters) { } /** * 发送POST请求 * * @param url * 目的地址 * @param parameters * 请求参数,Map类型。 * @return 远程响应结果 */ public static String sendPost(String url, Map<String, String> parameters) { } /** * 主函数,测试请求 * * @param args */ public static void main(String[] args) { } }
下面,我们来实现这两个方法,先看看GET,比较简单:
/** * 发送GET请求 * * @param url * 目的地址 * @param parameters * 请求参数,Map类型。 * @return 远程响应结果 */ public static String sendGet(String url, Map<String, String> parameters) { String result = "";// 返回的结果 BufferedReader in = null;// 读取响应输入流 StringBuffer sb = new StringBuffer();// 存储参数 String params = "";// 编码之后的参数 try { // 编码请求参数 if (parameters.size() == 1) { for (String name : parameters.keySet()) { sb.append(name).append("=").append( java.net.URLEncoder.encode(parameters.get(name), "UTF-8")); } params = sb.toString(); } else { for (String name : parameters.keySet()) { sb.append(name).append("=").append( java.net.URLEncoder.encode(parameters.get(name), "UTF-8")).append("&"); } String temp_params = sb.toString(); params = temp_params.substring(0, temp_params.length() - 1); } String full_url = url + "?" + params; System.out.println(full_url); // 创建URL对象 java.net.URL connURL = new java.net.URL(full_url); // 打开URL连接 java.net.HttpURLConnection httpConn = (java.net.HttpURLConnection) connURL .openConnection(); // 设置通用属性 httpConn.setRequestProperty("Accept", "*/*"); httpConn.setRequestProperty("Connection", "Keep-Alive"); httpConn.setRequestProperty("User-Agent", "Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1)"); // 建立实际的连接 httpConn.connect(); // 响应头部获取 Map<String, List<String>> headers = httpConn.getHeaderFields(); // 遍历所有的响应头字段 for (String key : headers.keySet()) { System.out.println(key + " : " + headers.get(key)); } // 定义BufferedReader输入流来读取URL的响应,并设置编码方式 in = new BufferedReader(new InputStreamReader(httpConn .getInputStream(), "UTF-8")); String line; // 读取返回的内容 while ((line = in.readLine()) != null) { result += line; } } catch (Exception e) { e.printStackTrace(); } finally { try { if (in != null) { in.close(); } } catch (IOException ex) { ex.printStackTrace(); } } return result; }
注释都很详细了,只是要说一点,GET方式提交的参数是绑定在URL中的,所以这部分要单独处理,进行转码,参数是Map类型,那么我们遍历这个Map获取参数,并拼装成?,&的格式就行了。
下面来看POST,这个复杂一点:
/** * 发送POST请求 * * @param url * 目的地址 * @param parameters * 请求参数,Map类型。 * @return 远程响应结果 */ public static String sendPost(String url, Map<String, String> parameters) { String result = "";// 返回的结果 BufferedReader in = null;// 读取响应输入流 PrintWriter out = null; StringBuffer sb = new StringBuffer();// 处理请求参数 String params = "";// 编码之后的参数 try { // 编码请求参数 if (parameters.size() == 1) { for (String name : parameters.keySet()) { sb.append(name).append("=").append( java.net.URLEncoder.encode(parameters.get(name), "UTF-8")); } params = sb.toString(); } else { for (String name : parameters.keySet()) { sb.append(name).append("=").append( java.net.URLEncoder.encode(parameters.get(name), "UTF-8")).append("&"); } String temp_params = sb.toString(); params = temp_params.substring(0, temp_params.length() - 1); } // 创建URL对象 java.net.URL connURL = new java.net.URL(url); // 打开URL连接 java.net.HttpURLConnection httpConn = (java.net.HttpURLConnection) connURL .openConnection(); // 设置通用属性 httpConn.setRequestProperty("Accept", "*/*"); httpConn.setRequestProperty("Connection", "Keep-Alive"); httpConn.setRequestProperty("User-Agent", "Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1)"); // 设置POST方式 httpConn.setDoInput(true); httpConn.setDoOutput(true); // 获取HttpURLConnection对象对应的输出流 out = new PrintWriter(httpConn.getOutputStream()); // 发送请求参数 out.write(params); // flush输出流的缓冲 out.flush(); // 定义BufferedReader输入流来读取URL的响应,设置编码方式 in = new BufferedReader(new InputStreamReader(httpConn .getInputStream(), "UTF-8")); String line; // 读取返回的内容 while ((line = in.readLine()) != null) { result += line; } } catch (Exception e) { e.printStackTrace(); } finally { try { if (out != null) { out.close(); } if (in != null) { in.close(); } } catch (IOException ex) { ex.printStackTrace(); } } return result; }
这中间就是设置POST方式时要开启两个选项,不能忘了。而且POST方式提交参数,参数是在请求体中发送的,就是和GET的区别。模拟好了两个方法,下面我们来写Servlet,这就很简单了,我们使用Servlet 3:
package servlet; import java.io.IOException; import java.io.PrintWriter; import javax.servlet.ServletException; import javax.servlet.annotation.WebServlet; import javax.servlet.http.HttpServlet; import javax.servlet.http.HttpServletRequest; import javax.servlet.http.HttpServletResponse; @WebServlet(name = "HelloWorld", urlPatterns = { "/HelloWorld" }) public class HelloWorld extends HttpServlet { @Override protected void doGet(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException { request.setCharacterEncoding("UTF-8"); response.setCharacterEncoding("UTF-8"); PrintWriter out = response.getWriter(); response.setContentType("text/html;charset=UTF-8"); String name = request.getParameter("name"); out.println("Hello " + name); out.println("This is the output from doGet method!"); } @Override protected void doPost(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException { request.setCharacterEncoding("UTF-8"); response.setCharacterEncoding("UTF-8"); PrintWriter out = response.getWriter(); response.setContentType("text/html;charset=UTF-8"); String name = request.getParameter("name"); out.println("Hello " + name); out.println("This is the output from doPost method!"); } }
下面就是测试了,用GET方式测试时,参数是英文没有问题,可是出现中文时,也转码了,但没有配置的Tomcat依然读取的是乱码,不要忘了配置Tomcat的server.xml:
<Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" URIEncoding="UTF-8"/>
加一个URIEncodeing选项就可以了,这样走GET请求编码就正常了,这也是Ajax走GET提交时不设置依然是中文乱码的一个原因,这一般情况想不到。
好了,我们来测试GET请求,写主函数:
/** * 主函数,测试请求 * * @param args */ public static void main(String[] args) { Map<String, String> parameters = new HashMap<String, String>(); parameters.put("name", "sarin"); String result = sendGet("http://localhost:8080/servlets/HelloWorld", parameters); System.out.println(result); }
在控制台,我们就得到了如下的输出:
http://localhost:8080/servlets/HelloWorld?name=sarin null : [HTTP/1.1 200 OK] Date : [Sun, 29 Aug 2010 02:31:26 GMT] Content-Length : [54] Content-Type : [text/html;charset=UTF-8] Server : [Apache-Coyote/1.1] Hello sarinThis is the output from doGet method!
因为我们打印了还原出的参数形式,这里没有用中文,所以看不出编码效果,中文效果大家可以自行测试。
POST方式就是修改主函数中调用的方法,这里不再测试了。
至此我们已经可以脱离浏览器进行GET/POST请求了,基本上网络传输的方式我们都可以来看看服务器返回的原始数据了,设置好URL和所需参数,直接运行就行了。
Servlet的原理很简单,这是比较直观的实现,要比直接上来就BS清楚很多。
下面看个小实例,就是CET查分。对于CET不说什么了,相信大多数人都经历过,而查分网站也是非常…不说了,一个CET批量查分器的实现,就是发送 POST请求,看看它网站的源码,Ajax而已。那么我们用上面的POST方法来模拟请求,批量获取数据,要注意大多数网站是防止来自外部的请求的,很简单,设置referer就可以了,这里不贴源码了,大家自己去写,我们来看一下:
文本系探索实践,欢迎交流,希望对使用者有用。
声明:请不要乱拍图片中的内容,仅作说明,别无他用。如果对图片中内容产生了一些想法,那么我们一起好好学习就行了。