多変量解析: SPdat/Win

ファイル名:SPdat_Win.EXE (862KB)
作成者:高井徹雄
作成日: 99.10.10
開発言語:Delphi 5
動作環境:Windows95/98/NT4.0/2000

解説
99.09.09  高井徹雄

社会科学で使う多変量解析法
 科学は、研究対象がもつ法則性を見出して行く営み。自然科学の分野では、実験を適切に計画し、コントロール された環境下で行い、得られたデータを分析することで法則性を検証する、という手法がとられる。一方、経営学 など社会科学と呼ばれる分野では、扱う対象が複雑過ぎて、十分にコントロールされた環境下での実験を行うこと は難しいのだが・・・。それでも、「科学」を標榜する以上、何らかの社会的法則性の存在を主張するためには、 少なくとも各種統計調査やアンケート調査データの分析に基づく裏付けが要求される(これがない主張は、「科学」 でなく「評論」と呼ばれる)。

 調査データそのものは、数値の一覧表やアンケート票の束に過ぎない。そこに含まれるのは、複数の変数(測定 項目)に関する、数値ないしはYes-Noなど名義尺度データの並び(Sequence)。このデータ全体から、それが示す 「意味」を洞察し汲み取ってやる必要がある。その目的のために開発された統計的手法が、多変量解析法と呼ばれ る一連の手法群である。分析の目的に応じて、100を越すとも言われる、豊富なバリエーションが用意されてい る。

Pascal版 SPDATの話
 私、駒大に赴任した10数年前から、経営学部でゼミを開く者として、卒論指導の際に多変量解析法の必要性を 痛感していた。しかし、この時点では、多変量解析のパッケージソフトと言えば、SASやSPSSなど汎用機上 のものが中心。それらが徐々にPCへ移植され始めてはいたが、当時フルセットで購入するには100万円近くと、 べらぼうに高価。学生さん達に自由に使ってもらうために、必要数電算教場に導入することもままならない状況。

 そこで、自分で作るしかない・・・と考えるようになったのが8、9年前。当時のPCは、まだWindows以前、 MS-DOS環境下で使う計算機だった。開発には、教育用に使っていて慣れ親しんでいた、ボーランド社のTurbo Pascalを用いた。DOS上の環境ということで、一度に確保できるメモリが最大64KBという制約に苦労させられ たが、大規模データに関しては処理を分割、途中の計算結果をファイルに吐き出す方法をとった。手法は、回帰分 析・主成分分析・判別分析と、数量化I・III類のみに限定されていたが、何とか1000変数×サンプル数無制限 まで対応できるプログラムを完成、SPDAT=Statistical Package & Data Analysis Toolと名付けた。 SPDATには、グラフィック命令を駆使して、分析結果のグラフ表示はもちろん、GUIにも凝ったつもりだし、 EXCELライクな行列形式のデータ編集機能も作りこんだ。我ながらよくできたソフトだと自負していた。

 しかし、仕事の合間に少しずつ作っていったこともあり、開発に1年以上もかかって、出来上がったのは7年前 のこと。やっと、ゼミ生の卒論などにも使ってもらえるようになったのだが・・・。既に、世の中は、DOSから Windows環境への移行を始めていたのだった。
 そして個人的には、6年前に大病をしたこともあって・・・、あのSPDAT は、もはや事実上存在しないPC 9801のDOS上でしか動作しないプログラムと化し、放置されたままになっていた。

SPDATの移植、SPdat/Winへ
 今回、夏休みの期間を利用して、SPDATのWindows環境への移植作業を始めた。今日、Cプログラマーに Visual C++ があるように、PascalプログラマーにはDelphiという優れた開発環境がある。Pascalで書い たSPDATの移植には、このDelphiを用いるのがもっとも自然。GUI部は別として、計算処理のルーチンは ほとんどそのまま使えるからだ。しかも64KBの壁も取り払われ、最大2GBの仮想メモリを利用することで、 アルゴリズムも単純なものが使える。大筋については、思ったより短期間で移植は完了しそうである。

 ちょうど7年前くらいから、Visual Stat(Statistica)など、PC用に開発された質の高いソフトも、やっと 出始めたが・・・、それでも30万円近くしていて。現在でも、まだ20万円位しているようだ。使い勝手の良 い、WIndows上の統計パッケージをフリーウエアないしは安価なシェアウエアとして提供する意義は、まだ十分あ ると考えている。


実行方法
 SPdat_Win.EXEは、Windows95/NT4.0上で実行可能な形式にコンパイルしてあります。 
HDD上に適当なフォルダを作成し、SPdat_Win.EXEをコピーします。これを、エクスプローラでダブルクリックすれば実行できます。 よく使うようなら、右クリックしてからショートカットを作成、これをデスクトップやタスクバーの上に置いておく といいでしょう。

ユーザ名・パスワードの指定
初回起動時に1回だけ、ユーザ名・パスワード入力画面が表示されます。ここで、次のように指定をすると、使えるようになります。
ユーザ名 : Trial
  パスワード: 2001331
なお、試用期限を過ぎてから起動した場合も、この入力画面が表示されますが、同じ指定をしても使えるようにはなりません。システムの時計を戻しても同様です。

起動時画面
 電卓:でんた君、行列電卓:マトリ君のすべての機能も含んでいて、どの状態からでも選択できる。
CSV形式ファイルを介して、MS-EXCELなど表計算ソフトとのデータ交換もでき、連携利用を可能にした。
初期画面
  多変量解析 SPdat/Win
 スタートフォームから、SPdat/Win フォームを呼び出します。データ行列に関する基本統計量の計算、 標準化、分散・相関行列などの基礎的分析。回帰分析・主成分分析・判別分析、数量化I・III類が使えます (10/10時点で)。数量化II類も近々。

 下図は、10変数×100サンプルのテストデータで、重回帰分析を行い、散布図を表示したところ。
重回帰分析
下図は、上と同じデータ行列 X を内的変数として、主成分分析を行なったところ。
主成分分析


質的データを0-1変数行列 X に表現、数量化III類を適応。サンプル・スコア第1・2次元による布置図。
数量化III類


なお、csv形式データにより、MS-EXCELとデータの交換も可能にしました。
EXCELデータの扱い


配布方法

'99.10.10より、下記サイトより試用版配布開始。
T.Takai Seminar ソフト工房

なお、現在配布中のもの、試用期限は'2001年3月まで。
ユーザ名: Trial 
  パスワード:20011231
でお使いください。