@shjanken
2018-09-17T05:40:48.000000Z
字数 941
阅读 731
java clojure 笔记
使用 dom method 的方式就类似 js 原生方法的方式
File input = new File("/tmp/input.html");Document doc = Jsoup.parse(input, "UTF-8", "http://example.com/");Element content = doc.getElementById("content");Elements links = content.getElementsByTag("a");for (Element link : links) {String linkHref = link.attr("href");String linkText = link.text();}
使用 getElementById 和 getElementByTag 来获取元素(和 js 中的同名方法一样, getElementsByTag 返回的是多个对象)
之后可以使用 attr() 和 text() 方法来获取属性和内容
在 clojure 里面, 使用的话就是 p, a 这样的字面量
使用 Element.select(String selector) 和 Elements.select(String selector) 方法来查找元素
File input = new File("/tmp/input.html");Document doc = Jsoup.parse(input, "UTF-8", "http://example.com/");Elements links = doc.select("a[href]"); // a with hrefElements pngs = doc.select("img[src$=.png]");// img with src ending .pngElement masthead = doc.select("div.masthead").first();// div with class=mastheadElements resultLinks = doc.select("h3.r > a"); // direct a after h3
可以使用正则, 比如
- [attr^=value]
- [attr~=regex]
