代々木で働く超新米エンジニアの足跡

代々木で働くエンジニアです。超新米です。

スクレイピング文字化け

スクレイピング文字化け修正

require 'open-uri'
require 'nokogiri'

uri = "http://www…"
page = URI.parse(uri).read
charset = page.charset
if charset == "iso-8859-1"
  charset = page.scan(/charset="?([^\s"]*)/i).first.join
end

document = Nokogiri::HTML(page, uri, charset)

引用:http://qiita.com/foloinfo/items/435f0409a6e33929ef3c