ECM
ECM
总版主
总版主
  • 社区居民
  • 忠实会员
  • 原创写手
阅读:758回复:0

使用Jsoup抓取网站数据的基本操作流程

楼主#
更多 发布于:2016-01-02 12:16
1.导入jsoup-1.6.1.jar;
2.
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;


public static void main(String[] args){
        String url = "http://www.baidu.com";
        try {
             //获取目标链接的Document
             Document doc = Jsoup.connect(url).get();
             //获取所有input标签
             Elements els = doc.getElementsByTag("input");
             System.out.println("\n\n\n"+els+"\n");
             //遍历所获得的input标签
             for (Element e : els) {
                  System.out.println(e.nodeName()+":\t"+e.val());
             }
        } catch (IOException e) {          
            e.printStackTrace();
        }
}


下面绿色字体是程序运行结果:
<input type="text" name="wd" id="kw" maxlength="100" class="s_ipt" />
<input type="hidden" name="rsv_bp" value="0" />
<input type="hidden" name="rsv_spt" value="3" />
<input type="submit" value="百度一下" id="su" class="s_btn" onmousedown="this.className='s_btn s_btn_h'" onmouseout="this.className='s_btn'" />


input:    
input:    0
input:    3
input:    百度一下

 

 

 

 

 

 

 

异常中心网是一家专门收集整理程序员编程过程中遇到的常见异常(exception)以及各种异常问答中心的网站。异常中心网旨在,减少程序员在编码遇到异常,处理各种异常时间和痛苦,让程序员能更愉快的、快速的定位异常并查找对应的异常解决方案。异常中心网诚心打造最完美的编程社区为程序员用户服务,努力成为最好的程序员乐园程序员社区程序异常中心程序bug中心异常问答中心

 

喜欢0 评分0
游客

返回顶部