-
Notifications
You must be signed in to change notification settings - Fork 69
Abola Lee edited this page Jan 20, 2016
·
1 revision
公開於 JCConf 2015 TW 高效率資料爬蟲組合包 投影片 http://www.slideshare.net/ssuser438746/jcconf-2015-tw
<dependency>
<groupId>com.github.abola</groupId>
<artifactId>crawler</artifactId>
<version>0.9.2</version>
</dependency>
// 指定 URI format 來源
String api = "https://raw.githubusercontent.com/abola/CrawlerPack/master/test.json";
// 依資料格式,轉化為 Jsoup 物件
Document jsoup = CrawlerPack.getFromJson(api);
// 使用 CSS selector 來取用資料
jsoup.select("results name").get(0).text() ;
- 在 http/https 中支援 cookie
- 增加授權,使用Apache 2.0 公開授權
- 專案已上傳至公開的 Maven Repository 現在可以直接透過pom.xml使用爬蟲包
- 修正 https PKIX 驗證無法通過的問題