PLANETARIUM: PHP Simple HTML DOM Parser [PHP]

「PHP Simple HTML DOM Parser」というHTMLのパーサーを使ってみました。
ブログのフィードをパースして、記事HTMLをパースしてあれやこれやしたいときに便利に使えそうなプログラムです。
preg_matchとかで自分で頑張ってもいいとは思いますが、こういうの使ったほうが早いしね。
ダウンロードはこちら。

●要素へのアクセス

// Create DOM from URL or file

$html = file_get_html('http://www.google.com/');

// Find all images

foreach($html->find('img') as $element) {

       echo $element->src;

}

// Find all links

foreach($html->find('a') as $element) {

       echo $element->href;

}

●タグを抜き取ったプレーンテキスト

// Dump contents (without tags) from HTML

echo file_get_html('http://www.google.com/')->plaintext;

●要素（属性）の書き換え

// Create DOM from string

$html = str_get_html('<div id="hello">Hello</div><div id="world">World</div>');

$html->find('div', 1)->class = 'bar';

$html->find('div[id=hello]', 0)->innertext = 'foo';

echo $html; // Output: <div id="hello">foo</div><div class="bar" id="world">World</div>

正規表現と一緒に使えば便利そう。
もっと細かい使い方はこちら。