一个简单的java网络爬虫(spider)Java认证考试:2012年JAVA考试:公共基础-百考试题网

一个简单的java网络爬虫(spider)Java认证考试

文章作者 100test 发表时间 2010:01:01 15:50:42
来源 100Test.Com百考试题网

　　一个简单的java网络爬虫,由于时间原因,没有进一步解释.

　　需要的htmlparser.jar包到官方网上去下.

　　---------------Spider.java---------------------------

　　import java.io.BufferedReader. import java.io.InputStreamReader. import java.net.URL. import java.net.URLConnection. import java.util.ArrayList. import java.util.HashMap. import java.util.Iterator. import java.util.List. import org.htmlparser.RemarkNode. import org.htmlparser.StringNode. import org.htmlparser.Node. import org.htmlparser.tags.*. import org.htmlparser.Parser. import org.htmlparser.filters.StringFilter. import org.htmlparser.util.NodeIterator. import org.htmlparser.util.NodeList. import org.htmlparser.util.ParserException. import java.util.Queue. import java.util.LinkedList.

　　public class Spider implements Runnable {

　　boolean search_key_words = false.

　　int count = 0.

　　int limitsite = 10.

　　int countsite = 1.

　　String keyword = "中国".//搜索关键字

　　Parser parser = new Parser().

　　// List linklist = new ArrayList().

　　String startsite = "".//搜索的其实站点

　　SearchResultBean srb.//保存搜索结果

　　List resultlist = new ArrayList().//搜索到关键字链接列表

　　List searchedsite = new ArrayList().//已经被搜索站点列表

　　Queue linklist = new LinkedList().//需解析的链接列表

　　HashMap

相关文章

课程介绍(1)SL110初级Java语言编程Java认证考试
 JAVA实现支持视频点播WEB服务器Java认证考试
 谈谈JAVA程序的反编译Java认证考试
 Java中静态变量的适用场景Java认证考试
 一个简单的java网络爬虫(spider)Java认证考试
 通过HttpClient获取响应内容字符集Java认证考试
 Java应用中使用ProxoolJava认证考试
 Java向线程传递数据的三种方法Java认证考试
 Java按字节长度截取字符串Java认证考试
 澳大利亚华人论坛
 考好网
 日本华人论坛
 华人移民留学论坛
 英国华人论坛