代々木で働く超新米エンジニアの足跡

代々木で働くエンジニアです。超新米です。

ギリシャ文字のスクレイピング

ギリシャ文字(特殊な文字)をスクレイピング

スクレイピングをしていたら”Ⅱ”が取得できなかったのでとまった
解決方法

doc = Nokogiri::HTML(page, ur, "CP932")

エンコードをCP932で指定したらできた

参考:CP932など特殊な文字を含むHTMLをスクレイピングする - すぎゃーんメモ