【スプレッドシート】IMPORTXML関数でHPから情報抽出

この記事では、HPから情報抽出する関数について、
説明しています。
.
「IMPORTXML関数」は
スクレイピングにとても役立つ関数なので
ぜひ、参考にしてくださいね。
※スクレイピングの詳細はコチラ！

この関数はGoogleスプレッドシート限定です。

うーん、Webサイト上のデータを

リストにしていきたいけど大変だ…。

もしかして、コピペしてない？？

うん、してる。

でも、量も多いし、漏れもありそうで不安。

実は、データを簡単に取得できる

関数があるよ！

え、何それ

知りたい！

「IMPORTXML関数」って言うんだけど

プログラミング技術がなくても

スクレイピングできちゃうよ！

※スクレイピングの詳細はコチラ！

IMPORTXML関数まとめはコチラ！

【IMPORTXML関数とは】

▶︎IMPORTXML関数

この関数を使用すると、WEB上の情報を取得して
スプレッドシートに表示することができます。

具体的には、指定したURLからXMLデータを抽出し、
データの要素や属性を指定して取得することが可能です。

=IMPORTXML（”WebサイトのURL”,”XPath”）

url：取得したいデータが存在するウェブページのURLを指定します。
XPath：取得したいデータの場所をXPathクエリで指定します。

▶︎XPathの取得

ここではGoogle Chromeでの

取得方法を説明します。

例）Web記事の目次を取得する

１：「検証」を選択

取得したい情報を右クリックし
「検証」を選択します。

２：取得したい情報を選択する

構文にカーソルを合わせると
下記のように取得できる情報に色がつくので
より細かく取得したい情報を選択します。

構文にカーソルを合わせると

場所に応じて色がつく

３：「Copy XPath」を選択

取得したい構文（情報）を
右クリック→「Copy」→「Copy XPath」選択します。

4：スプレッドシート等に貼る

Xpathがクリップボードにコピーされた状態なので
上書きされる前にスプレッドシート等に貼っておきます。

※３でコピーされたXPath ↓↓

ここまで読んだけど、難しそう…と思ったら
代行に頼むのも１つの手段！

▶︎IMPORTXML関数の使い方

=IMPORTXML（”WebサイトのURL”,”Xpath”）

例）Web記事の目次を取得する

URLを取得する

スプレッドシートに貼っておきます。

XPathを取得する

取得方法の詳細はコチラ▶︎▶︎▶︎XPathの取得

こちらもスプレッドシートに貼っておきます。

関数を組む

URLを入力して

XPathを入力すると

エラーが出てしまいました…

XPath内では「 “（ダブルクォーテーション）」を
「 ‘（シングルクォーテーション）」に置き換えが必要です。

シングルクォーテーションに置き換えると

情報が取得できました！

▶︎IMPORTXML関数の注意点

取得するデータが存在しない場合や、ウェブページの構造が変更された場合はエラーが表示されます。
.
取得したデータは静的なものであり、自動的に更新されないため、定期的に関数を再計算して最新のデータを取得する必要があります。
.
ウェブページの読み込みに時間がかかる場合や、取得するデータの量が多い場合は処理時間が長くなる可能性があります。

IMPORTXML関数について、簡単に紹介しましたが
いかがだったでしょうか？？
もし、難しそう…大変そう…と感じた方は
私たちで代行することもできます！
問い合わせはコチラ

【IMPORTXML関数の使用用途】

IMPORTXML関数は、Googleスプレッドシート上で
ウェブページから情報を取得するための便利な機能です。

▶︎記事等からタイトルや本文を取得する

特定のウェブサイトのURLと適切なXPathクエリを指定することで、
記事のタイトルや本文などのテキストデータをスプレッドシートに取り込むことができます。

これにより、ウェブ上の記事を集約して分析や比較を行ったり、
特定のキーワードが含まれる記事を抽出するなどの作業が容易になります。

▶︎外部APIからデータを取得する

IMPORTXML関数は、XML形式のデータだけでなく、
ウェブサービスのAPIからJSON形式のデータを取得することも可能です。

APIエンドポイントのURLを指定し、必要なデータを適切に解析することで、
リアルタイムの情報や外部データをスプレッドシートに統合することができます。

▶︎株価や為替レートの自動取得

株価や為替レートなどの金融データは、ウェブ上で提供されていることが一般的です。

IMPORTXML関数を使用して、金融関連のウェブサイトから必要なデータを抽出し、
スプレッドシート上でリアルタイムに表示・更新することができます。
これにより、投資や予算管理などの金融関連の作業を効率化することができます。

▶︎商品価格の比較やモニタリング

オンラインショッピングサイトなどから商品の価格情報を取得し、
スプレッドシート上で比較やモニタリングを行うことができます。

価格変動を把握したり、最安値や最高値を自動的に更新したりすることで、
効果的な商品の選定や購買計画の立案が可能となります。

【IMPORTXML関数の使い方の例】

関数の使い方を私たちのHP（https://sky-system-partners.com/）
を例に説明していきます！

▶︎例1：ウェブページのタイトルを取得する

=IMPORTXML(“https://example.com”, “//title”)
この例では、指定したURLのウェブページのタイトル要素のテキストを取得します。

=IMPORTXML(“https://sky-system-partners.com/”, “//title”)

タイトル取得できました！

▶︎例2：画像のURLを取得する

=IMPORTXML(“https://example.com”, “//img/@src”)
この例では、指定したURLのウェブページ内の全ての
img要素のsrc属性の値（画像のURL）を取得します。

=IMPORTXML(“https://sky-system-partners.com/”, “//img/@src”)

ページ内の画像URLが取得できました！

【Pythonを使ったスクレイピングとの違い】

この章では、Pythonを使ったスクレイピングと
IMPORTXML関数の違いについて説明します。