Rubyでスクレーピングをしよう

*WiFi

  • ・SSID: 
  • hubtokyo-guest
  • ・Password:
  • !HubbersTokyo!

*事前準備

  • IAM User Name: ruby_scraping
  • Password: justdoit1115 
  • IAM User Name: xhackline
  • Password: xhackjustdoit

*Rubyとは?

  • まつもとゆきひろさんという日本人によって開発されたプログラミング言語。
  • Rubyの基本解説
  • irbでrubyを試してみよう
  • 標準出力
  • 四則演算
  • 変数関数(メソッド)

テキストエディタを使ってみよう

UNIXコマンド

*HTMLとは?

  • HyperText Markup Languageの略
  • Webページを作成するために開発されたマークアップ言語
  • インターネットで公開されているWebページのほとんどはHTMLで作成されている
リンク
<a href="http://google.com">リンク</a>
画像
<img src="https://i.imgur.com/f1A5phR.jpg">
色を付ける
<style>
p {background-color:#ff0000;}
</style>

*スクレーピングとは?

  • HTMLの情報を収集・抽出すること
  • WEBスクレーピングとも言われる

各種HTMLパーサーのパフォーマンス比較


XPATH記法のまとめ