スクレイピング
Webスクレイピング超入門シリーズ④の題材は「そのサイトってスクレイピングしていいんだっけ」です。 過去3回ではスプレッドシートやGASを使ってお手軽にWebサイトのデータを自動取得する方法を紹介しました。 Webページデータ取得: 初心者向けWebスクレイピ…
Webスクレイピング超入門① で紹介した IMPORTXML 関数でXPathを開発者ツールによって自動取得する方法がありました。 codelife.cafe ただ、この方法にはいくつかの欠点があります。 HTML構造の変更に弱く n 番目の tr などの指定では上に一つ tr が追加され…
前回、内閣府の提供する祝日一覧CSVデータ(国民の祝日について - 内閣府)を =IMPORTDATA("https://www8.cao.go.jp/chosei/shukujitsu/syukujitsu.csv") で読み込もうとしましたが文字化けしてしまって使い物になりませんでした。 codelife.cafe 今回はGAS…
Webページデータ取得: 初心者向けWebスクレイピング手法