次のページもスクレイピング sleep children 画像の個数
次のページもスクレイピング
#省略 loop do #省略 unless doc.css('秘密').empty? url = doc.css('秘密').attribute('href').value p "----------" sleep(10) else break end end
loop とunlessのブロックをくっつけて次のページまでスクレイピングできた
参考:Ruby - 各種ブログサービスの過去記事を全て取得する - Qiita
- sleep
sleep(n)でn秒止まる
- 画像の数を数える
row.push(node.css("なぞなぞ>img").length)
- 最初の要素を取り出す
row.push(node.css("なぞなぞ").children.first)
要素の検証ができない・・・時
無理やりやる方法がある