本稿は,Rによる多変量解析の体験学習用教材です. ビッグデータという言葉に象徴されるように,データからの知識抽出技術が注目を集めています.本書はこの技術の基礎の基礎である多変量解析技術を解説します.理論だけでなく,Rを使って実際にデータ処理を体験できるようにしています.また,単なるRのノウハウ書としないために,理論展開に沿ってデータ解析を段階を踏んで体験できるように工夫しています.
Rによる多変量解析の解説書は,あまた出版されています.例えば,回帰分析はlm()関数を使えば簡単に実行できます.多くの本がこのlm()関数の使い方を解説しています.本書の特徴は,lm()関数の背景にある基礎理論を解説し,その展開に沿ってRによる演習を段階的に組んでいる点にあります. 本書の読者に期待する前提知識は微分,ベクトル・行列の基礎(ベクトルの内積,行列のかけ算,転置,逆行列,固有値など)です.ベクトル・行列の微分が出てきますが,ハードルはそれほど高くないと思いますので,恐れることなく挑戦してください. 本書ではR 3.0.2 for Windowsを用います.このソフトウェアはhttp://cran.r-project.org/より無料でダウンロード・インストールすることができます.Windows版を前提にスクリプトの解説をしていますが,MacでRを使う場合でも,データファイル(csv ファイル)の読み込み時のフォルダ指定以外は,スクリプトを変更することなく実行できます.本稿の内容は以下の通りです.
(1) 回帰分析
(2) 主成分分析 (3) 判別分析 (4) 因子分析 (5) コレスポンデンス分析 (6) テンソル主成分分析いずれもRを用いて,体験しながら学習ができます.また,Rのスクリプトは本Webページからダウンロードできます.
なお,本稿の(1)〜(4)の内容をまとめて「多変量解析の基礎 I (回帰分析)」,「多変量解析の基礎 U (主成分分析)」,「多変量解析の基礎 V (判別分析)」,「多変量解析の基礎 W(因子分析)」 と題してアマゾンよりkindle版として出版しています.
本稿に対してご質問,ご意見などありましたら下記宛てメールをお送りください.
古橋 武
名古屋大学大学院工学研究科
情報・通信工学専攻
Email: furuhashi at nuee.nagoya-u.ac.jp