エクセルで超簡単にウェブスクレイピングする方法を紹介します
WEBから情報をエクセルに移したい時はありませんか?
WEB上で表になっているデーターであれば、簡単にWEBからエクセルに移し替えることが出来ます。WebのデータであればGoogle Spread Sheetでもうまく取得できると思いますが、今回は仕事で使う事が最も多いであろうエクセルに焦点を絞ってお伝えしたいと思います。
ウェブスクレイピング(Web scraping)
簡単に言うと、ウェブサイトから情報を抽出する技術のことです。
Webスクレイピングとは、WebサイトからWebページのHTMLデータを収集して、特定のデータを抽出、整形し直すことである。
Webスクレイピングを行うことで、Webページを対象として、あたかもWeb APIを利用しているかのようにデータを効率的に取得・収集することが可能になる。用途の例としては、部分的にコンテンツを取り出して携帯電話向けのコンテンツを生成したり、小見出しの一覧を生成したり、といった使い方がある。Webスクレイピングは様々な手段で実現可能であるが、PHPやPerlといったスクリプト言語を使用して行われることが多い。
なお、「スクレイピング」(scraping)とは元々「削る」や「こすり落とす」といった意味の英語である。
データの一覧はWEBで見れますが、情報を自分で加工するのはエクセルの方が簡単に出来るので、ウェブの情報をエクセルに移すニーズは仕事をしていても結構な頻度で遭遇します。
実践ウェブスクレイピング
それではやってみましょう。超簡単です。
①取得したい、ウェブ上の表データをブラウザ上に表示します。
(今回はYahoo Financeの株式値上がり情報を使います。)
※ブラウザはインターネットの情報を見るために使うソフトウェアです。ChromeとかIEとかですね。
②エクセル上に転記したい情報をブラウザ上から選択
ブラウザ上の必要なデータを選択(左クリックしながら欲しい情報にカーソルをあわせる)し、コピーする。
③エクセルに貼り付け!
エクセルに張り付けると上のようになります。加工し放題!
スクレイピング完了です。このデータを色々とエクセルで加工すれば良いです。
超簡単。エクセルってすごいですよね。更に定期的に取得することも出来てしまいます。
Webクエリ活用
定期的にエクセルに情報変更を反映したいのであれば、Webクエリを活用しましょう。
データタブから左上のWebクエリを選択します。
取得したい情報のあるURLを「新しいWebクエリ」のURLにインプット。
データの範囲を指定すると、エクセルにデータがインプットされます。
また、Webクエリで作業を行った場合には、「接続を更新」でいつでも新しいデータを取得する事が出来ます。
まとめ
ウェブに表形式で存在しているデータは数多くありますが、このようなデータは簡単にエクセルに移し替えることが出来ます。ブラウザから直接コピー&ペーストする方法とWebクエリを活用する方法です。
情報が日々更新される場合においては、Webクエリの活用がオススメです。