読者です 読者をやめる 読者になる 読者になる

代々木で働く超新米エンジニアの足跡

代々木で働くエンジニアです。超新米です。

次のページもスクレイピング sleep children 画像の個数

次のページもスクレイピング

#省略 
loop do
#省略  
 unless doc.css('秘密').empty?
    url = doc.css('秘密').attribute('href').value
     p "----------"
     sleep(10)
  else
    break
  end
end

loop とunlessのブロックをくっつけて次のページまでスクレイピングできた

参考:Ruby - 各種ブログサービスの過去記事を全て取得する - Qiita

  • sleep

sleep(n)でn秒止まる

  • 画像の数を数える
row.push(node.css("なぞなぞ>img").length)
  • 最初の要素を取り出す
row.push(node.css("なぞなぞ").children.first)

要素の検証ができない・・・時

 無理やりやる方法がある