Bye Bye Moore

PoCソルジャーな零細事業主が作業メモを残すブログ

IMPORTHTML関数を使って、WEB上の表やリストからデータをインポートする

Google Docsに実装されているIMPORTHTML関数はWEB上の表やリストからデータをインポートする超絶便利関数です

実際の使い方

=IMPORTHTML(URL, クエリ, 番号)

です。URLには、プロトコルを含める……とあるので、もしかするとMQTTやらCoAPみたいなものに対応する日が来るかもしれませんね。胸熱。

利用上の注意

  • 展開先にほかのデータがあると展開がされないので注意してください。
  • 旧バージョンではシートにつき50回までの制限があります

表からデータをとる

たとえば、Wikipediaにあるインドの人口に関する記事のうち、「州毎の人口動態」からデータを引っ張りたい場合を考えます。
当該情報は、HTMLページのうち上から4番目の

タグであることが確認できるため

=IMPORTHTML("http://en.wikipedia.org/wiki/Demographics_of_India","table",4)

とします。初回読み出しの際は若干のロード時間を経た上で

Rank	State / Union Territory	Type	Population	%[24]	Area (km²)[25]	Density (per km²)	Males	Females	Sex Ratio[26]	Literacy	Rural Population[27]	Urban Population[27]
1	Uttar Pradesh	State	199,812,341	16.5	240,928	828	104,480,510	95,331,831	912	67.68	131,658,339	34,539,582
2	Maharashtra	State	121,455,333	9.28	307,713	365	58,243,056	54,131,277	929	82.34	55,777,647	41,100,980
3	Bihar	State	103,804,637	8.6	94,163	1,102	54,278,157	49,821,295	918	61.8	74,316,709	8,681,800
...

と、目当ての数値が入力されます。

リストからデータをとる

同様に、リストからもゲットできます。
インドに売れる売れないと話題になっている救難飛行艇「US-2」の性能緒言は

=IMPORTHTML("http://ja.wikipedia.org/wiki/US-2_(%E8%88%AA%E7%A9%BA%E6%A9%9F)","list",9)

からゲットできます。

乗員 - 11名
全長 - 33.25m
全幅 - 33.15m
全高 - 10.06m
最大離着陸重量 - 47.7t
最大離着水重量 - 43.0t
エンジン - ロールスロイス AE2100J ターボプロップ×4
出力 - 4,591shp×4
境界層制御 - LHTEC T800を使用
最大速度 - 315kt(約580km/h)
巡航速度 - 260kt(約470km/h)
航続距離 - 4,700km(約2,500海里)
巡航高度 - 20,000ft(約6,100m)以上
実用上昇限度 - 30,000ft(約9,150m)以上(未公表)
離水滑走距離 - 280m(43t時)
着水滑走距離 - 310m(43t時)

参考もと

補足

IMPORTXML - Docs editors Help
よりXMLCSV、HTMLの他のタグを扱いたい場合はIMPORTXML関数があります。
記事化しました