第一次做项目需要生成静态页面,网上很多大牛对将网页生成静态页面有很多异议。说一下我的看法。
不外乎有以下因素: 1、从页面加载时间来看:静态页面不需要与数据库建立连接,尤其是访问数据量较大的页面,这种页面大多要查很多结果集,因此建立连接次数就增多了,时间不可观,而静态页面则省去了这些时间。 2、从便于搜索引擎抓取的角度来讲:搜索引擎更喜欢静态的网页,静态网页与动态网页相比,搜索引擎更喜欢静的,更便于抓取,搜索引擎SEO排名更容易提高,一些大门户站页面大多都采用静态或伪静态网页来显示,更便于搜索引擎抓取与排名。 3、从安全性来看:静态网页不宜遭到黑客攻击,因为黑客不知道你的网站的后台、网站采用程序、数据库的地址。 4、从稳定性来看:哪天数据库服务器挂了,动态网页就拜拜了!而要运行一个静态网页的发布服务器,相信大家都知道配置不是太高也行的吧?呵呵。
因此,我认为,生成静态页面具有可行性。
那么怎么把动态网页的代码生成静态网页呢?又存在哪呢?原理其实很简单。 1、利用Freemark模板生成静态页面,网上搜一下大把大把的代码随你挑,我就不在这里啰嗦了。 我很讨厌这种方式,因为对于一个数据量较大的页面来讲工作量太大,要写模板,语法又比较怪异,不流行! 2、也是我偶尔想起来的。用Java中URLConnection抓取某个URL网页源码(这是原理核心)生成html文件,就是这么简单!就是这么Easy!
代码奉上!
1)、以下是捕捉网页源码程序:
- import java.io.BufferedReader;
- import java.io.File;
- import java.io.IOException;
- import java.io.InputStreamReader;
- import java.net.MalformedURLException;
- import java.net.URL;
- import java.net.URLConnection;
- import java.util.regex.Matcher;
- import java.util.regex.Pattern;
- import org.apache.commons.io.FileUtils;
- import org.apache.commons.lang.StringUtils;
- /**
- * @author Xing,XiuDong
- */
- public class HTMLGenerator {
- public static final String generate(final String url) {
- if (StringUtils.isBlank(url)) {
- return null;
- }
- Pattern pattern = Pattern.compile("(http://|https://){1}[//w//.//-/:]+");
- Matcher matcher = pattern.matcher(url);
- if (!matcher.find()) {
- return null;
- }
- StringBuffer sb = new StringBuffer();
- try {
- URL _url = new URL(url);
- URLConnection urlConnection = _url.openConnection();
- BufferedReader in = new BufferedReader(new InputStreamReader(urlConnection.getInputStream()));
- String inputLine;
- while ((inputLine = in.readLine()) != null) {
- sb.append(inputLine);
- }
- } catch (MalformedURLException e) {
- e.printStackTrace();
- } catch (IOException e) {
- e.printStackTrace();
- }
- return sb.toString();
- }
- /**
- * Test Code
- * Target : http://www.google.cn/
- */
- public static void main(String[] args) throws IOException {
- String src = HTMLGenerator.generate("http://www.google.cn/");
- File file = new File("C:" + File.separator + "index.html");
- FileUtils.writeStringToFile(file, src, "UTF-8");
- }
- }
2)、将源码写入Html文件,这个需要根据用户的需求了,我根据我项目中遇到的情况写了以下代码:(附测试程序:http://www.google.cn/)
- /**
- * generite html source code
- *
- * @author Xing,XiuDong
- * @date 2009.06.22
- * @param request
- * @param url
- * @param toWebRoot
- * @param encoding
- * @throws IOException
- */
- public void genHtml(HttpServletRequest request, String url, boolean toWebRoot, String encoding) throws IOException {
- if (null == url) {
- url = request.getRequestURL().toString();
- }
- String contextPath = request.getContextPath();
- String seq = StringUtils.substring(String.valueOf(new Date().getTime()), -6);
- String ctxPath = super.getServlet().getServletContext().getRealPath(File.separator);
- if (!ctxPath.endsWith(File.separator)) {
- ctxPath += File.separator;
- }
- String filePath = StringUtils.substringAfter(url, contextPath);
- filePath = filePath.replaceAll("//.(do|jsp|html|shtml)$", ".html");
- String savePath = "";
- String autoCreatedDateDir = "";
- if (!toWebRoot) {
- savePath = StringUtils.join(new String[] { "files", "history", "" }, File.separator);
- String[] folderPatterns = new String[] { "yyyy", "MM", "dd", "" };
- autoCreatedDateDir = DateFormatUtils.format(new Date(), StringUtils.join(folderPatterns, File.separator));
- filePath = StringUtils.substringBefore(filePath, ".html") + "-" + seq + ".html";
- }
- File file = new File(ctxPath + savePath + autoCreatedDateDir + filePath);
- FileUtils.writeStringToFile(file, HTMLGenerator.generate(url), encoding);
- }
文章出处:http://blog.csdn.net/xxd851116/archive/2009/06/24/4293239.aspx