スクレイピング
ここ最近、スクレイピングという言葉を良く目にするようになってきた。
そこで、スクレイピングとは何なのかということを勉強したので、その結果をまとめる。
概要
正確には頭にウェブという言葉が付いて、ウェブスクレイピングという。
ウェブスクレイピングは様々なウェブページから特定のデータを収集し、そのデータを扱い易いように整形する技術。
ウェブスクレイピングを使用しているもの
主に検索エンジン等のウェブクローラに使用される。
問題点
- ウェブスクレイピングのやり方によっては、対象のウェブページに対してアクセスを複数回行う可能性がある。そのため、大量のアクセスによりウェブサーバの負荷を増大させる可能性がある。
- ウェブスクレイピングされた情報では、広告等が除去されるため、その広告によって収入を得ているウェブページ所有者は、広告による収入が減少することになる。
- ウェブスクレイピングしたデータを公開すると著作権の問題絡みでゴタゴタする可能性がある。
Raspberry Pi2 Model B ボード&ケースセット (Standard, Clear)
- 出版社/メーカー: TechShare
- メディア: エレクトロニクス
- この商品を含むブログ (3件) を見る