どのグラフを使えばいいかを1枚の画像にまとめてみた…の図を日本語化してみた - 適宜覚書-Fragments

どのグラフを使えばいいかを1枚の画像にまとめてみた…の図を日本語化してみた

      2017/03/03

皆大好き自分も大好きな二十歳街道まっしぐらにはネタ帳という記事が定期的に挙がります。自分も普段記事にするネタをあれこれ自力で探している訳ですが、カメきちさんのネタ放出はかなり美味しい。という訳で有り難くご相伴に預り、 【ネタ帳】bitlyで短縮されたURLから動画だけを抜き取ったサイト「bitly.tv」 + 25記事*二十歳街道まっしぐらより拝借。

元々の絵は当然英語(YjWta.jpg (1024×767))なんだけど、ちょいと単語が分かりにくいので自分なりに妥当な用語をあてて日本語化してみました。

f:id:dacs:20091226203311j:image

とってもひどい所感

まあ、普通にグラフ作ってるだけなら棒グラフ、線グラフと円グラフがあれば足りると思います。組成分析のためにウオーターフォール使うあたりになるとパレート分析やマトリクス分析に手が出始めて多分こういった図にまとめると言うのは厳しいかと(^^;;

後ですね、散布図が右にも左にもある訳です。データ要素の相関性と分布って同義だと思うのですが、どうなんでしょう?自分には区別する意味がよく分かっていません。元も子もない言い方をすると最初の四分岐が明確なMECE(Mutually Exclusive collectively Exhaustive)の関係かといえば、漏れあり重なりあり。ただ、こういった絵があるとなんとなくこれがいいなあくらいには思えるのかもしれません。

追記(情報多謝)

ijustiHijustiH分布と関係性(相関)は違うよ。分布は一次元が基本。沢山の次元を取れるよ。相関は二つの側面の似通り方。回帰で論じたりもするよ。統計の教科書に書いてあるよ。2009/12/27

はてなブックマーク - 羊マーク

なるほど。ここで言うところの分布はヒストグラムにあるような一次元的なデータ出現頻度の明確化。軸を複数取って次元を増やした場合もその延長上にある。一方、相関性は二種の要因をプロットした場合の関係性を表現するもので回帰係数推定等で判断を加えるもの。同じツールを使っていたとしても別物であるとのこと。納得しました。有難うございます。

この件を見直すに当たり以下を参照しました。

同じ関係性を見るにあたっても

散布図は系列数が複数あるデータで、項目間あるいは指標間の関係性を見る場合に使います。両者に相関関係が認められる場合は、回帰線を引くことで、予測モデルを作ることができます。そのためデータを蓄積することで、予測の精度を高めることにつながります。

一方、プロットされた各データの特徴やポジショニングを確認するために散布図を利用することもできます。この場合は予測モデルではないので、回帰線や回帰式を作る意味はなく、狙い通りの結果になっているのか、他と相対的に位置づけがおかしくないかなどをチェックするツールとして使うことが多くなります。

分布図とバブルチャートの正しい使い方とは?(第7回) | Web担当者Forum

このように使い方が分かれると言うのが勉強になりました。教科書を探して読まないと下手なことは書けませんね(^^;;

complex_catcomplex_cat一昔前のマック版Systatだとメニューから弄っているだけで,分かりやすく実習できた。2009/12/27

はてなブックマーク - complex_catのブックマーク

おお?なんか良さそうなソフトなので調べてみました。HULINKS | SYSTAT 13…じ、\155,400。いいお値段過ぎです><。学生さんでしたら、英語版で学習用に無償でHULINKS | MYSTAT - 学生用フリー統計解析ツールが配布されています。

mrknmrkn円グラフは全体とその中の一つを比較する際に使うなら良いけど、複数の対象を比較する際には使うべきでないって明記して欲しい。そして、Excel じゃなくて GNU R を使おう。2009/12/28

はてなブックマーク - mrknのブックマーク

ご指摘有難うございます。そうですねえ。複数の対象を比較する際には使うべきでない。同感です。ただ円グラフ(パイチャート)については意見がかなり分かれるところですよね。極端な話をすると円グラフの使用自体望ましくない(2007-03-17 - シャイな計算機科学者の独り言)と言う意見もあれば、マーケティングにおいて複数要素比較に有用(合計に占める各部分の割合を比較する円グラフ - トレーニング - Microsoft Office Online)という意見や比較数が少なければ有用という意見(円グラフの使い分けを論理的に考える(第3回) | Web担当者Forum )もあります。

実際のパイやらケーキやら分けた時を想像して頂くと良いのですが、5分割くらい目分量でしたとき、本当に同じ大きさなのか、或いはどれが大きいのか小さいのか分かるかと言えば難しいですよね。15%と17%の数字なしに並べてパッと判別つく訳無いんです。でも、元も子もない話で恐縮ですがここらへんそういう使い方が良いと思う人がいる限りは一朝一夕にはどうにもならないとも思います。

GNU Rは、R - 統計解析とグラフィックスの環境またはリンク集 - RjpWikiあたりから情報収集すると良さそうですね。

関連情報

レポート・プレゼンに強くなるグラフの表現術 (講談社現代新書)

レポート・プレゼンに強くなるグラフの表現術 (講談社現代新書)

グラフで9割だまされる 情報リテラシーを鍛える84のプレゼン

グラフで9割だまされる 情報リテラシーを鍛える84のプレゼン

データ分析 はじめの一歩 (ブル?バックス)

データ分析 はじめの一歩 (ブル?バックス)

質的データ分析法―原理・方法・実践

質的データ分析法―原理・方法・実践

適宜覚書-Fragmentsは、筆者が興味をもった様々な情報やネタを筆者が忘れても後で思い出せるよう覚書として公開するBlogです。Google Chrome拡張、Facebook、Google、Twitter、Windows、各種Webアプリなどを扱うことが多いです。この覚書が、もし何かお役立ちになれば幸いです。

 - 覚書 , ,