HTMLのパースについての忘却録

さて今日rubyを入れて初めて触るので忘却録として保存します。

今回はとあることをするためにAPIの作成に伴いパースを行いたいと思います。

rubyのhpricotという素晴らしい外部ライブラリを用います。
どう考えてもC#PHPで書くより圧倒的に楽でした(今までrubyをdisってきてごめんなさい>< )
このruby初心者でもこんなに簡単に読めるのはヤバイw

ということでコード

require 'hpricot'
require 'open-uri'

doc = Hpricot( open("http://www.yahoo.co.jp/").read )

(doc/"div#navi").each do |link|
  puts "#{link.inner_html} -> #{link[:href]}"

#puts doc.search("hoge").length
end

上のコードは今なにも出力されないはず(そのようにしたので)

リファレンス http://route477.net/rubyscraping/?Hpricot