ブログのフィードをパースして、記事HTMLをパースしてあれやこれやしたいときに便利に使えそうなプログラムです。
preg_matchとかで自分で頑張ってもいいとは思いますが、こういうの使ったほうが早いしね。
ダウンロードはこちら。
●要素へのアクセス
// Create DOM from URL or file
$html = file_get_html('http://www.google.com/');
// Find all images●タグを抜き取ったプレーンテキスト
foreach($html->find('img') as $element) {
echo $element->src;
}
// Find all links
foreach($html->find('a') as $element) {
echo $element->href;
}
// Dump contents (without tags) from HTML●要素(属性)の書き換え
echo file_get_html('http://www.google.com/')->plaintext;
// Create DOM from string
$html = str_get_html('<div id="hello">Hello</div><div id="world">World</div>');
$html->find('div', 1)->class = 'bar';
$html->find('div[id=hello]', 0)->innertext = 'foo';
echo $html; // Output: <div id="hello">foo</div><div class="bar" id="world">World</div>
正規表現と一緒に使えば便利そう。
もっと細かい使い方はこちら。
0 件のコメント:
コメントを投稿