因子分析における探索の意味と方法 - kansai...

20
因子分析における探索の意味と方法 Implications and M ethodologies of Exploration on Factor Analysis Kazuaki SHIM IZU Abstract The methodology of exploratory factor analysis has contributed for searching the dimensionality and for constructing the scales representing the structure of dimensions in the fields of psychological research. This paper discussed the issues on the model errors in the common factor analysis model for exploratory purposes according to M acCallum & Tucker (1991). Demonstrating the differences between principal factor solution and maximum likelihood solution for the six variables data, the procedures for exploratoryfactor analysis werealso discussed.Insisting on theutilityofthegraphical user interface for the determination of the numbers of factor by Scree and Strata Graph and the oblique factor rotation for simple structure on the reference structure matrix byRotolopt method,an oblique system of factor vectors and referenceaxis vectors weredeveloped using thematrix notation. Keywords: factor analysis, exploratory purpose, sampling error, model error, initial factor matrix estimation method, improper solution, communality, oblique factor rotation, Promax, Rotoplot, reference structure, factor pattern 探索的因子分析の方法論は、心理学研究分野において、次元の探求と次元の構造を反映する尺度の構成に 貢献してきた。本稿では、M acCallum & Tucker(1991)に従って、探索目的の共通因子分析モデルにお けるモデル誤差の問題を議論した。6変数データの主因子法の解と最尤法の解との違いを示しながら、探索 的因子分析の手順についても議論した。Screeと Strata Graph による因子の数の決定、そして、Rotoplot 法による準拠構造行列についての単純構造への斜交因子回転でのグラフィカルなユーザー・インタフェー スの有用性を強調しながら、因子軸ベクトルと準拠軸ベクトルの斜交の体系を行列表記で展開した。 キーワード:因子分析、探索目的、標本誤差、モデル誤差、初期因子行列の推定方法、不適解、共通性、斜 交因子回転、Promax、Rotoplot、準拠構造、因子パターン 本稿は平成 14年度関西大学学部共同研究の成果の一部である。 1 関西大学『社会学部紀要』第 34巻第2号,2003,pp.1-36 ISSN 0287-6817

Upload: others

Post on 01-Feb-2021

3 views

Category:

Documents


0 download

TRANSCRIPT

  • 因子分析における探索の意味と方法

    清 水 和 秋

    Implications and Methodologies of Exploration

    on Factor Analysis

    Kazuaki SHIMIZU

    Abstract

    The methodology of exploratory factor analysis has contributed for searching the dimensionality

    and for constructing the scales representing the structure of dimensions in the fields of psychological

    research. This paper discussed the issues on the model errors in the common factor analysis model

    for exploratory purposes according to MacCallum& Tucker(1991). Demonstrating the differences

    between principal factor solution and maximum likelihood solution for the six variables data, the

    procedures for exploratory factor analysis were also discussed.Insisting on the utility of the graphical

    user interface for the determination of the numbers of factor by Scree and Strata Graph and the

    oblique factor rotation for simple structure on the reference structure matrix by Rotolopt method,an

    oblique system of factor vectors and reference axis vectors were developed using the matrix notation.

    Keywords:factor analysis,exploratory purpose, sampling error,model error, initial factor matrix

    estimation method,improper solution,communality,oblique factor rotation,Promax,Rotoplot,

    reference structure,factor pattern

    抄 録

    探索的因子分析の方法論は、心理学研究分野において、次元の探求と次元の構造を反映する尺度の構成に

    貢献してきた。本稿では、MacCallum&Tucker(1991)に従って、探索目的の共通因子分析モデルにお

    けるモデル誤差の問題を議論した。6変数データの主因子法の解と最尤法の解との違いを示しながら、探索

    的因子分析の手順についても議論した。Screeと Strata Graphによる因子の数の決定、そして、Rotoplot

    法による準拠構造行列についての単純構造への斜交因子回転でのグラフィカルなユーザー・インタフェー

    スの有用性を強調しながら、因子軸ベクトルと準拠軸ベクトルの斜交の体系を行列表記で展開した。

    キーワード:因子分析、探索目的、標本誤差、モデル誤差、初期因子行列の推定方法、不適解、共通性、斜

    交因子回転、Promax、Rotoplot、準拠構造、因子パターン

    本稿は平成14年度関西大学学部共同研究の成果の一部である。

    ― ―1

    関西大学『社会学部紀要』第34巻第2号,2003,pp.1-36 ISSN 0287-6817

  • 1.はじめに

    心理学での尺度の構成では、伝統的には内的整合性の原理による項目分析がおこなわれ

    てきた。尺度に含まれる項目間の整合性を尺度と項目との相関から検討するこの方法では、

    構成された尺度がどこに向いているか、その方向を明らかにすることはできない。構成し

    た尺度のベクトルの方向を因子分析で得た因子軸に整合的な方向で項目分析をおこなうこ

    とを提案しているのが、因子的真実性の原理(Cattell& Tsujioka(1964)、辻岡(1964)、

    辻岡・清水(1975b)など)である。因子分析そしてその応用では、次元数とこの次元を構

    成している因子軸の方向を探索し、これを検証していく方向での研究が必要なわけであり、

    辻岡を中心とする共同研究(辻岡ほか、1975a,1975b,1977)では、因子分析的な枠組で

    のモデルの構成を研究目的とすることを明示するために、確認的という用語を使用してき

    た。

    辻岡・清水・柴田(1979)そして清水・辻岡(1981)でも、探索的な方法論において、

    確認的という用語を使用していた。この用語の使用は、共分散構造分析による検証的なモ

    デルと解析方法論(たとえば、清水(1989)など)から見ると、誤解を与えるものである

    かもしれない。というのは、これらの研究においてFactormaxあるいは交叉相面的因子分

    析法と呼んだ方法は、Procrustes法の発展系として最小2乗法の論理をベースとして展開

    されたものであり、対象となる標本ごとに共通性を推定していることを前提とするもので

    あったからである。これらの方法論で展開した内容の多くは、そして、方法論を追求した

    ときの問題意識もあわせて、共分散構造と平均構造とについてのStructure Equation

    Modeling(以下 SEM と略す。)において、実現されてきている(たとえば、狩野・三浦

    (2002)、清水(1999、2001)、豊田(1998a,1998b)など)。

    SEM による仮説検証的方法論が最尤法をベースとして簡便に利用することができるよ

    うになってきた。探索的な方法がまったく不要となったわけではない。仮説を作り上げる

    までの過程では、そして、尺度を構成する次元の不変性の検証に入る前の段階での探索の

    重要性は何ら変わらない。SPSSのWindows版は、探索的な因子分析を普及させた。しか

    しながら、デフォルト因子分析というニックネームが与えられるほどに、探索の手順に誤

    りが多いことも現実である(柳井、2000)。そこで、本稿では、探索的因子分析の本質的な

    意味を問い直しながら、70年代半ばにおいて、辻岡を中心として展開されてきた斜交因子

    分析を強調した因子分析の考え方とCattell研究室での因子分析の実際を再現するコンピ

    関西大学『社会学部紀要』第34巻第2号

    ― ―2

  • ュータ・プログラムの意義を再検討してみることにしたい。

    2.因子分析における共通空間の探索とは

    Nesselroade&Baltes(1984)は、心理学の因子分析法を中心とする研究方法論につい

    て、それらの「目的」と「方法」とにおいて、探索的なものと仮説検証的なものとを分け

    て、伝統的な因子分析から共分散構造分析への方法論の発展を整理している。「方法」とし

    ての探索的なものを統一的に説明するならば、最小2乗法をベースとしているということ

    ができよう。清水(1989)でも、彼らの議論を紹介しながら、共分散構造分析の統合的な

    モデルと検証的因子分析に関する議論をおこなったように、検証的な方法は、母数の推定

    についての統計的な検定の論理を組み込むものであった(たとえば、狩野・三浦(2002)、

    豊田(1998b)など)。

    探索的な方法論は、そして、1つの標本からのデータを解析の対象とする。伝統的な多

    変量解析では、基本的には、対象となる標本の中で標準化した変数間において、問題の追

    求をおこなってきた。観測変数間の関係や観測変数に与える重み(偏回帰係数)を当該デ

    ータにおいて計算する多変量解析モデルは、変数間の関係についての記述的な段階にある

    ものともいえよう。交叉妥当化による重みが他の集団においても転移可能なものであるか

    どうかの検討でも、観測した変数そのものに重みはかけられることになるからである。

    因子分析法は、多変量解析の手法の中ではユニークな特徴を持つ。その特徴は、心理学

    の古典的テスト理論での真の得点に相当する因子という潜在変数を理論的に定義している

    ところにあり、重み(因子パターン)は観測変数ではなく因子得点という潜在変数にかけ

    られる。潜在変数は、そして、観測の誤差分散や観測変数の特殊な分散とは独立した共通

    因子空間においてモデル化されているのである。すなわち、因子分析法は、分析対象の標

    本を越えてより一般化の可能性を、因子得点に求めようとしたモデルであるともいえよう。

    2.1.共通因子分析モデル

    2.1.1.確率変数による因子分析モデルの表現

    ここでは、議論の準備として、因子分析のモデルを確率変数として表現してみることに

    する。まず、 個の観測変数についての得点のランダム列ベクトルを とし、この観測得

    点がある母集団からランダムに抽出された標本の得点とし、各観測変数はこの標本におい

    て独立した分布に従うと考えることにする。変量モデルとしての共通因子分析モデル

    因子分析における探索の意味と方法(清水)

    ― ―3

  • (Joreskog & Sorbon(1979)や豊田(1998b)そして柳井・繁桝・前川・市川(1990)

    なども参照)は、伝統的な因子分析の枠組みにおいて、

    = + (1)

    と表すことができる。ここで、因子数を とすると、 ( × )次は、因子パターン行列

    であり、 ( )次は因子得点の列ベクトルである。 ( × )次は、独自性を対角項に持

    つ対角行列であり、 ( )次は、独自性得点の列ベクトルである。そして、この と は

    ともに確率変数である。伝統的な因子分析モデルでは、母集団においては、これらの確率

    変数の期待値はゼロであと仮定する。本稿でも、これらの確率変数の期待値は、モデルに

    は組み込まずに議論を進めることにする。これらの因子得点と独自性得点とについて

    ( ′)= (2)

    ( ′)= (3)

    ( ′)= , ( ′)= ′ (4)

    と仮定する。ここで、(2)式の ( × )次は、因子得点間の分散・共分散行列である。

    × 次は、単位行列であり、この(3)式は、独自因子得点が直交していることを意味し

    ている。(4)式では、因子得点と独自性得点とが無相関であると仮定している。

    共通因子分析モデルの(1)式は、以上の関係から、

    = (5)

    とも表すことができる。ただし、 ′=[ ′ ′]、 =[ ]である。ここで、この の

    共分散行列は、

    ( ′)= ′ ′

    =( ′)

    ( ′)

    ( ′)

    ( ′)

    =′

    (6)

    と表すことができる。次に、観測変数の共分散行列を とするとこれは、

    = ( ′)

    = ( ′) ′

    =[ ]′ ′

    = ′+ (7)

    ― ―4

    関西大学『社会学部紀要』第34巻第2号

  • となる。なお、確率変数モデルでは、因子の分散の大きさは、1ではない。探索的な因子

    分析で最尤法を使用する場合には、識別性を確保するために、因子の分散を1とし、因子

    間を直交として解を推定することになる。

    因子分析のモデル表記では、このように、数理統計学の立場からは、確率変数による方

    法を採用するようになってきている。構造方程式モデリング(SEM)あるいは共分散構造

    分析との議論の整合性を保持するには、あるいは最尤法による因子分析をモデルとして定

    義するには、確率変数をもちいるべきではある。

    2.1.2.標準得点行列での因子分析モデルの表現

    探索的な方法の特徴の1つとして、当該標本内での標準化をあげた。ここでは、因子分

    析モデルを標準得点から表記してみることによって、探索的な方法の限界を追求してみる

    ことにする。(1)式と同様に、ある標本の 人の被験者について、 変数の観測をおこなっ

    たものとする。そして、 個の次元として因子を特定することがきたとすると、標準得点行

    列 ( × )は、次のような因子分析モデルとして表すことができる。

    = ′+ (1′)

    ここで、 は( × )次の因子得点行列であり、 は( × )次の因子パターン行

    列(直交因子の場合には因子解と呼ぶこともある。)である。この共通因子空間とは独立し

    た独自性に関するものが、( × )次の独自性得点行列 と独自性を対角項にもつ( ×

    )次の対角行列 である。このように、伝統的な探索的因子分析に関するモデルの定義

    や展開では、Thurstone(1947)以来の標準得点行列からのモデルの表現形式が、代表的な

    因子分析のテキスト(たとえば、Harman(1967)、Gorsuch(1983)や芝(1979)など)

    では、使われることが多かった。

    伝統的な因子分析モデルでの(7)式は、 を( × )次の変数間の相関行列とすると、

    次のように展開することができる。

    =1

    = ′+ (7′)

    なお、 は( × )次の因子間相関行列であり、因子得点行列と独自性得点行列につい

    ては、(2)式から(4)式で表したそれぞれの定義と同じものとする。

    ― ―5

    因子分析における探索の意味と方法(清水)

  • 2.1.3.共通因子空間における因子軸の変換(因子軸の回転)

    (7)式や(7′)式は、斜交の因子体系でモデルを表した。探索的な因子分析では、主因子法

    で計算されたあるいは最尤法で推定された初期の因子解を、解釈可能な単純構造を求めて

    回転することになる。ここでは、単純構造の意味は、後ほどとして、因子行列の回転につ

    いて簡単に整理してみることにする。

    まず、 を( × )次の主因子解あるいは最尤解の因子行列とする。この初期の因子

    解をVarimax法などの直交軸回転で得られた因子行列を とする。この直交因子行列へ

    の因子軸の変換行列を とすると、

    = (8)

    と表すことができる。なお、直交の変換行列 ( × )次の積は、いずれからかけても単

    位行列となる。

    ′= ′= (9)

    次に、これをさらに斜交回転した因子パターン行列を とする。そして、斜交の変換

    行列を とすると、

    = ( ′) (10)

    と定義することができる。この変換行列を掛け合わせると(7′)式の関係からも明らかなよ

    うに、因子間相関行列となる。すなわち、

    ′ = (11)

    である。

    以上の関係を相関行列から再度整理してみると次のようにあらわすことができる。

    = ′+

    = ′+

    = ′+ (12)

    この式が意味するところは、観測変数の 次元空間が、共通因子の空間と独自性の空間

    の直和としてモデル化されている、ということである。そして、主因子法あるいは最尤法

    によって推定された初期の因子解が、共通因子空間を決定しており、因子軸の回転によっ

    てこの大きさがかわることはない、ということである。なお、最尤法による探索的因子分

    析でも、観測変数の相関行列を対象とする場合には、(7′)式のように標準得点形式で因子の

    体系を記述することになる。

    ― ―6

    関西大学『社会学部紀要』第34巻第2号

  • 2.2.測変数の空間と共通性空間そして独自性

    探索的因子分析では、観測変数の分散は1.0である。標本内で変数ごとに標準化したこ

    の分散は、共通性と独自性のそれぞれの分散の和として表現されてきた。ここでは、変数

    の分散とその内容に着目してみることにする。

    観測に際しての誤差( )の大きさは、変数によって異なる。そして、因子分析モデルで

    は、観測変数に内包されている特殊分散( )の大きさも変数によって違うと仮定してきた

    (たとえば、Spearman(1904)やThurstone(1947)そしてLord&Novick(1968)な

    ど)。共通因子空間における観測変数の共通性の大きさも、従って、変数によって異なるこ

    とになる。変数 について、これらの関係を示してみると次のように書くことができる。

    =1-

    =1-( + ) (13)

    ここでは、観測変数 個のすべてをイメージした図として、これらの関係を説明してみ

    ることにする。まず、観測変数の分散の大きさは1であったので、全体として 次元の空

    間を構成していると考えてみることにする。原点から各変数のベクトルが同じ長さ1.0で、

    次元空間に展開しているものと想定してみることにする。

    (7)式のように、分散・共分散を対象とした場合には、観測変数のベクトルの長さはそれ

    ぞれ違うと考えなければならい。標本内で全変数を標準化することは、非常に特殊な操作

    であるともいえよう。一般的には、 個の変数間の分散の大きさも、変数によって異なると

    仮定することの方が自然であろう。伝統的な探索的因子分析のモデルは、この意味では、

    図1 変数の空間と共通性の空間の模式図

    注: 個の変数ベクトルがこの 次元空間の大きさ(外周)をきめている。この図では各変数を標準化したものとして同じ長さで表している。内部の線は、各変数の共通性をつないだものである。この線の内部が共通因子空間となる。

    ― ―7

    因子分析における探索の意味と方法(清水)

  • 特殊な仮定をしているわけである。

    次に、 個の変数について、各ベクトルを共通性と独自性とにわけて、これらの大きさを

    書き込んでみることにする。すると共通因子空間は、図1に示したように、各変数の共通

    性を結んだ線の内部となる。なお、 次元空間とこの線との間が、独自性の大きさを表して

    いる。観測変数のベクトルを結んだ領域を全分散とすると、因子寄与率として取り上げら

    れることのある共通因子の分散は共通性の線内に相当すると考えることができる。

    図1は、変数によって構成される共通性と独自性の空間をイメージしたものであった。

    因子分析では、回転の説明などで、共通因子によって構成される 次元の空間を図式的に

    表現する形式を採用している。共通因子の空間は、図1の共通性の線内の別な表現系でも

    あり、この空間において因子軸の回転がおこなわれるわけである。

    2.2.1.共通性の特定について

    Spearman(1904)が、古典的テスト理論と共通因子分析との基礎を確立してから1世紀

    近い時間が経過しているにもかかわらず、観測変数の分散を、共通性分散と独自性分散と

    に、あるいは真の得点の分散と測定の誤差分散とに区分けすることは、理論的にも経験的

    に困難なところが残っている(McDonald、1985)。図1の共通性と独自性との境界を確定

    する方法論は、複数標本の同時分析からの因子的不変性の追求にあるのではないかと考え

    ている(清水(1996、1997)など)。

    ここで、(1)式の確率変数モデルで考えてみると、まず、変数の分散の大きさは、サンプ

    リングでの影響を受ける。この結果は、(7)式からも明らかなように、因子の分散や共分散

    そして独自性にも影響を及ぼす。これに対して、理論的な因子パターンは、複数の集団間

    でも、同一の値を持つ可能性がある。MacCallum,Roznowski,Mar& Reith(1994)は、

    因子分析モデルにおける線形結合を定義する重みは、モデルに従えば、すべての個人に対

    してまったく同一であり、これらの重みは、所与の標本におけるのと同様に、母集団にお

    ける個人を特徴づけるものであり、そのためサンプリングの影響を受けない可能性がある、

    と論じている。そして、因子間の分散と共分散には、対象である特定集団の特徴が反映す

    るのではないだろうか(Meredith(1964)など)としている。

    ここでは、不適解との関係において2つのケースを紹介して、この問題をさらに追求し

    てみることにする。なお、不適解の問題については、狩野(1996)が、発生原因を標本変

    動、識別性、因子モデルの不適合、そして、不明(はずれ値など)として整理し、原因の

    特定と対処方法を詳しく展開している。ここでは、多標本同時分析法を因子的不変性の検

    ― ―8

    関西大学『社会学部紀要』第34巻第2号

  • 証において体験したことに限定する。

    まず、清水(1996)では、WAIS-R(8尺度)の標準化9標本データの解析において、

    非常に興味深い現象に遭遇した。簡単に要約すると、この9つの標本の同時因子分析にお

    いて、個々の標本の自由度を大きくする因子的不変性の仮説モデル(布置不変性モデル:

    集団間でまったく同一として固定したのは、因子パターンのゼロ要素だけである。因子パ

    ターンで高い値を期待する要素、因子の分散・共分散、独自性は集団ごとに自由推定とし

    た。)では、ある1つの集団の解だけが不適解となった。9つの集団で推定する因子パター

    ン、独自性、因子の分散・共分散の各値がまったく同一となるように拘束した因子的不変

    性の仮説モデル(厳格な因子的不変性モデル)では、この9つの集団に不変な2因子解を

    推定することができた。すなわち、集団の個別性を許容した場合に不適解となった集団か

    らも適切な解を推定することができたわけである。

    次に、2つの集団(男子中学生と女子中学生)を対象とした「状態―特性不安尺度」の

    縦断的データの解析(清水、1997)においても、WAIS-Rでの解析と同じような傾向の結

    果を得ている。この不安尺度の解析では、不適解に遭遇することはなかったが、男子生徒

    で、布置不変性のモデルの独自性の値がゼロに近い値となった。この独自性は、男女間で

    の推定パラメータを同一とする拘束を強めると、他の変数の値に近く、モデルからみて解

    釈可能な値となった。

    ここで紹介した2つの解析事例が教えてくれることは、1つの集団では、不適解あるい

    はそれに近い状態となっても、もし、いくつかの集団が因子の構造を共有しているならば、

    集団間の拘束をかけることによって、潜在している共通因子に近似した適切な解を得るこ

    とができるのではないだろうか、ということである。逆にいえば、1つだけの標本に因子

    分析法を適用しても、母集団において潜在的に存在している共通因子の構造を抽出するこ

    とが、困難であるかもしれないわけである。

    厳格な因子的不変性(Meredith、1993)を複数集団にわたって推定することができれば、

    この因子パターンと因子間相関(分散・共分散)から、(7)式右辺の第1項を確定すること

    ができことになる。このように、検証的な方法論は、確率変数によるモデルでの複数標本

    の同時分析をベースとすべきではないだろうか。これに対して、(1′)式あるいは(7′)式の1

    つの標本内での標準化したデータを前提とする方法論は、共通因子の可能性を提案する段

    階にとどまらざるを得ないのではないかと考えている。

    ― ―9

    因子分析における探索の意味と方法(清水)

  • 2.2.2.推定方法による因子解の違いの存在

    上でも紹介したような、解の推定が困難な事態に遭遇することもある。特に、最尤法は、

    多変量正規性からの乖離に敏感なところがあり、また、変数間に内在する因子の構成が不

    適切な場合など、不適解に遭遇することにもなる(詳しくは、狩野(1996)など)。Haywood

    Caseとも呼ばれる共通性が1を越えるような不適解の現象は、最尤法以外の方法でも共通

    性の推定過程に、遭遇することが報告されている(たとえば、Harman(1967)など)。

    不適解は、あくまでも特殊なものである。しかし、ある集団のデータに探索的因子分析

    法を適用した時に不適解とならなければ、そのことが、標本に内在する共通因子空間を解

    析者が手に入れることができたことの保証を与えてくれるのであろうか。

    因子分析の代表的なテキストで紹介されているように、探索的な因子分析では、因子解

    の推定方法(たとえば、最尤法、主因子法、残差最小化法、イメージ因子解法、正準因子

    解法、アルファ因子解法、一般化最小2乗法、セントロイド法など)によって、得られる

    因子解の値が異なることは周知の事実である。このことが意味することについて、Mac-

    Callum&Tucker(1991)は、1つの標本についての探索的因子分析の実際の解析場面で

    は、抽象的なモデルのパラメータを推定しているのではなく、特定の具体的モデルが、研

    究者が選んだ因子分析の方法によって部分的にではあるが定義される、ということである

    と指摘している。そして、具体的モデルは、母集団において正確に保持されているもので

    はないために、異なる因子分析の諸方法は、同じパラメータを推定するわけではなく、推

    定する方法に内在する特徴を反映している、とも論じている。

    このように、個別に観測された(あるいは推定された)因子パターンは、先にもWAIS

    の例(清水、1996)で紹介したように、母集団からの複数の標本間で一定である、という

    ことを意味しているわけではない。推定方法による違いに加えて、因子パターンは、標本

    によっても、異なることになる。

    2.2.3.因子分析モデルで表現できないもの

    因子解の推定の差違の原因について、MacCallum&Tucker(1991)に従って、この観

    測変数において、共通因子分析モデルを とし、そしてこのモデルで記述することのでき

    ない変数を とした表現を採用して、検討してみることにする。

    = +

    = + + (14)

    ここで、この は、 次の確率変数ベクトルとし、彼らは、推定を左右する要因となる

    ― ―10

    関西大学『社会学部紀要』第34巻第2号

  • ものと想定している。そして、彼らは、モデル誤差(model error)と標本誤差(sampling

    error)とに区分けすることで、誤差の発生原因の解明を目指そうとしている。ここでは、

    彼らの展開をさらにフォローしてみることにする。

    (14)式の定義の下で、観測変数の共分散行列は

    = + + + (15)

    と表すことができる。この式の右辺の についての共分散行列は、モデル誤差に相当する

    と考えることができる。そこで、このモデル化されない変数の関係する共分散行列を取り

    出して、

    = + + (16)

    と表すと、観測変数の共分散行列は、この(14)式の定義の下では、

    = +

    = Φ ′+ + (17)

    となる。このように、母集団の分散・共分散行列についても、確率変数によるモデルの展

    開によって、モデルで説明できな分散の議論が可能となる。

    次に、 人からなる標本を母集団から適切に抽出したとして、この標本の分散・共分散

    行列において、議論を展開してみることにする。ここで得た標本共分散行列を と表す。

    そして、理想的な測定がおこなわれたことを想定して、この が、母集団の因子分析モ

    デルの構造を完全に持っていると仮定すると、この標本の因子得点と独自性得点の共分散

    行列は、(6)式のように

    =′

    (18)

    と表すことができる。この結果、この標本の共分散行列 は、

    = ′+ (19)

    となるといえよう。ここでの展開は、あくまでも標本が母集団の構造によって完全に説明

    できる、という仮想的なものであった。

    探索的な段階の因子分析でも、理想に近いデータについては、(19)式の因子の構造を得

    ることはできる。しかしながら、現実の探索的な因子解の推定は、モデル化されない変数

    による(16)式で示した分散行列を混在させながらおこなわれると考えるべきであろう。

    ここでは、MacCallum&Tucker(1991)に戻って、標本において、モデル化されない

    変数の分散・共分散を追求してみることにする。まず、(6)式の展開から、この標本におけ

    ― ―11

    因子分析における探索の意味と方法(清水)

  • る因子得点と独自性得点の共分散 を次のように表してみることにする。

    = (20)

    ここでは、標本の因子得点と独自性得点は、それぞれ添字 と とで表示した。なお、

    との表記は、標本の共分散行列であることを明示するためである。

    次に、ここでは、(14)式の だけに焦点を当て、この標本の共分散行列を と表す。

    この行列は、(18)式と(7)式から

    = ′+ + ′+ (21)

    と展開することができる。

    探索的な因子分析では、独自性得点間には、無相関を仮定してきた。不適解の現象(狩

    野、1996)においても、SEM での実際の解析(たとえば、清水(1997)など)においても、

    この仮定を弛めて、独自性間に共分散をおくことが自然であろうとの報告もある。標本に

    おいて、モデルでの(3)式や(4)式の仮定が、完全に満たされたと仮定するならば、

    = ′+ (22)

    とおくことができる。この は、標本における因子得点間の分散・共分散行列であり、

    (7)式のモデルで仮定した を得ているわけではないことを、指摘しておきたい。

    (21)式と(22)との間で、説明されなかったものを、解の推定における適合がうまくいか

    なかったものも含めて、総合的に と表してみると、

    = ′+ + (23)

    と書くことができる。この式は、母集団モデルでは、実は、(14)式の に相当している。

    そこで、さらに、モデル化されなかった変数 を加えて、標本共分散行列で(15)式を表し

    てみると

    = + + + (24)

    このように表すことができる。ここで、この式で(16)式に相当するものを とすると、

    標本の分散共分散行列は、

    =( ′+ + )+ (25)

    と表すことができる。以上では、MacCallum& Tucker(1991,pp.502-505)の展開を行

    列の表記を多少変えて紹介した。

    不適解などの現象に遭遇しなければ、一般的に、SPSSなどの統計解析のソフトウェア

    で、解を「計算」することができる。十分に大きな標本で、構造の明確な測定をおこなう

    ことができれば、 や の全要素をほとんどゼロとした解を得ることができる。現実に

    ― ―12

    関西大学『社会学部紀要』第34巻第2号

  • は、しかしながら、(25)式のように、各項を独立させて取り扱うことはできず、これらの

    要素が (因子パターン行列)の推定に、全体として、本質的な姿を覆い隠すように関係

    しているといわざるを得ないわけである。この や は、母集団において起きるのと同

    じような標本におけるモデル誤差ということができよう。

    MacCallum&Tucker(1991)は、次の3種類の解の推定に影響を与える要因を整理し

    ている。ここでは、これまでの議論を整理しながら、解の本質的な姿を覆い隠す要因を簡

    単に解説してみることにする。

    a.共通因子共分散における標本の可変性:Meredith(1964)が明らかにしているよう

    に因子間共分散は、標本によって異なることを仮定する方が自然である。すなわち、

    因子パターン は、同一であるとの仮定に比べて、 は標本によって、違う可能性

    がある。誤差の平均も含めた不変性のレベル(Meredith、1993)によって、標本間の

    違いの所在を明らかにすることができる。探索段階で得られた因子の分散・共分散(あ

    るいは因子間相関)から、一般化した結論を導き出すことは危険であるといえよう。

    b.独自因子の非ゼロ共分散から起きる標本での誤差( がゼロとはならないことによ

    る誤差):SEM では、独自因子間に共分散をおくことをモデル化することができる。

    探索的因子分析では、独自因子の共分散が非ゼロであるとの仮定をモデル化すること

    は困難であるために、場合によっては、解の推定にこの影響が混入することになる。

    この要因は、探索的因子分析の段階では、最も見えにくいものである。

    c.標本において共通因子と観測変数を標準化することによる誤差:6つのテスト得点

    間の相関行列から因子分析法を創造したSpearman(1904)のモデルは(1′)式の形式で

    あった。項目得点の形式や項目数が同じ数の尺度得点の形式では、分散の大きさには

    それほど違いはないと仮定できるかもしれない。観測変数の分散が同じであれば、標

    準化の影響は、少ないといえよう。一般的には、観測変数の分散は、変数によっても、

    そして標本によっても、異なると考えるべきである。その意味では、(1)式あるいは(7)

    式のモデルの方が、変数を標準化した形式の(1′)式や(7′)式よりは、本質的な問題の追

    求には、特に複数集団の比 研究には、適しているといえよう。

    1つの標本からの探索的因子分析の限界は、このように明らかである。一般化が可能な

    因子の構造を明らかにするには、結論は、複数標本の同時分析であると考えている。検証

    的な因子分析であるこの複数標本の同時分析をおこなうには、変数について、標本につい

    ― ―13

    因子分析における探索の意味と方法(清水)

  • ての知識の蓄積が必要である。因子分析にかける変数が適切なものであるのかどうか、あ

    る意味での仮説を手探りで進めることが、検証的な因子分析に向けての準備的な段階の研

    究ではないだろうか。

    2.2.4.因子解の推定について

    標本の共分散行列を対象として母集団におけるモデル構造を、推定する方法ことについ

    て、Cudeck & Henly(1991)を参考にしながら、さらに議論をしてみることにする。ま

    ず、母集団の共分散行列を、ここでは、 として表す。そして母集団のモデル構造による

    共分散行列を (γ)と表す。次に標本の共分散行列を とし、この標本から母集団のモデ

    ル構造への近似として得られる推定解からの共分散行列を (γ)と表すことにする。

    母集団からの十分に大きな標本であることを前提として、 の推定値として が得ら

    れているとする。最尤法では、

    [ , (γ)]=log (γ)-log + ( (γ) )- (26)

    この関数を最小化することによって、解すなわち (γ)のγ( 個のパラメータからなると

    仮定しておく)を推定しようとしているわけである。なお、このパラメータ内容としては、

    たとえば、共通因子分析であれば、このモデルを構成している各種行列((7)式参照)のゼ

    ロでない全要素が、これに当たる。この式の を変数の数とすると、 と との関係にお

    いて識別性を確保する必要があるが、ここでは、識別できるモデルを対象としていると仮

    定することにする(識別性に関しては、柳井他(1990)など参照)。最尤法以外の推定方法

    でも、基本的には、 と (γ)との間での最小化基準の定式化とその解法のアルゴリズム

    の内容よって、いくつかの種類がある。ここで問題としたいことは、このようなアルゴリ

    ズムではなく、ある種の基準の下で、この2つの共分散行列の間で展開される最小化の中

    身のことであり、逆に言えば、2つの行列間での食い違いあるいは相違(discrepancy)の

    内容なのである。

    最小化基準の式やアルゴリズムによる推定の違いには触れないとして、ここではまず、

    Cudeck & Henly(1991)に従って、上の式を次のように表す。

    = [ , (γ)] (27)

    そして、この相違関数(discrepancy function)を標本相違(sample discrepancy)と呼

    ぶことにする。この形式で、彼らは、次の3種類の相違を定義している。まず、全体相違

    (overall discrepancy)は、

    = [ , (γ)] (28)

    ― ―14

    関西大学『社会学部紀要』第34巻第2号

  • として、母集団共分散行列と標本共分散から推定された解による共分散行列との非類似性

    の程度を表す関数である。この関数の意味は、標本共分散行列を対象として実際には推定

    がおこなわれるが、この推定結果を本来の対象である母集団共分散行列に当てはめてみる

    ことを想定しているわけである。この関数の大きさには、モデル構造の適切性が反映され

    ることになる。すなわち、母集団において、母集団のモデル構造による共分散行列 (γ)

    が、母共分散行列 に近似しているかどうかということ、そして次に、この母モデル構造

    による (γ)に推定がどの程度うまくおこなわれているかどうかということが、関係して

    いるわけである。

    この前者の母集団におけるモデル構造の近似の程度は、

    φ= [ , (γ)] (29)

    として表すことができる。これはモデル構造の近似を原因とする相違(discrepancy due to

    approximation)であり、母集団共分散行列に内在しないモデル構造を想定したならば、こ

    の相違関数が大きな値となることは容易に想像できる。すなわち、モデル構造の適切性の

    程度を、この関数は表してくれるといえるわけである。モデルの適切性とは、本質的には、

    この式からも明らかなように、標本とは独立している、と考えることができる。

    後者の推定の程度については

    = [ (γ), (γ)] (30)

    と表すことができる。これは、推定による相違(discrepancy due to estimation)であり、

    標本において、モデル構造をどの程度まで再現することができたのか、ということを表し

    ているといえる。

    もちろん、実際の解析では、 や (γ)のような母集団情報は得られないわけである。

    推定に内在する本質的な問題を、すなわち、モデルと推定との相違の詳細な内容を検討す

    るのには、有効な議論であると考えて、このように紹介したわけである。

    探索的因子分析としての記述モデルにおいて、主因子法で因子解を推定する場合には、

    伝統的には、母集団を想定することはなかった。しかしながら、このような探索的な因子

    分析においても、潜在している共通因子の構造は、標本にではなく、母集団において仮定

    しているわけであって、この構造を何らかの因子分解の方法で推定しようとしているわけ

    である。 (γ)は、あくまでも (γ)にかわりうる可能性があるものとして推定されるも

    のに過ぎない。この (γ)には、そして、分析対象の当該標本の何らかの性質が直接的に

    影響を与えることは、先のMacCallum&Tucker(1991)らの議論においてもあきらかで

    ある。

    ― ―15

    因子分析における探索の意味と方法(清水)

  • 一般的なSEM では、モデル構造としての (γ)が不明ななかで、 の最小化のアルゴ

    リズムによる解析を進行させることになる。このため、仮説としてのモデルを、この文脈

    でいえば として解を推定し、この適合度を各種の指標において評価することになる。満

    足できる水準の適合度を示す解を得るまで、γにおける指定をある意味では探索的に繰り

    返すことになる。共通因子分析モデルは、一見すると確定した (γ)のモデル構造のよう

    に見えるかもしれない。しかしながら、この(7)式の右辺はあくまでも、モデルの全体とし

    ての関係を定義しているに過ぎない。なぜなら、各行列の要素が確定しているわけではな

    いからである。

    探索的な因子分析法においても、独自性間に独立を仮定し、因子間の共分散にも独立を

    仮定し、共通因子と独自性との間にも独立を仮定することによって、回転前の因子解を推

    定している。先に議論したように、 (γ)において、独自性間に共分散があったとしても、

    これを推定することはできない。一方、共通因子分析モデルを構成している各行列の制約

    を付けるSEM では、識別性が保証される範囲において、無限のモデル構造を、同値モデル

    も含めて、 (γ)として想定することが可能である。これは、あくまでも可能性であって、

    実際には、先行研究から引き出すことのできる仮説的なモデルから試行錯誤がはじまるわ

    けであって、この仮説的モデルと極端に異なる解を採択することは、ないといえよう。し

    かしながら、 (γ)と (γ)との関係すなわち の最小化の結果は、 としてしか、ここ

    で見てきたように、現実には評価することができないわけである。

    (γ)は、このようにあくまでも、仮説的モデルの背後においてこの存在を仮定せざる

    を得ないものなのである。このため、 (γ)が適切なものであるかどうかを評価するには、

    において、 の推定値として が得られているものと仮定して、SEM では、当てはま

    りのよさを指標化することがおこなわれてきたわけである。

    ここで紹介した議論は、Cudeck & Browne(1983)による1標本の交差妥当性指標

    (cross-validity index)に関する議論から引き出されたものである。これをベースとして、

    Cudeck & Henly(1991)は、シミュレーションによって、ここで紹介してきた相違関数

    の振る舞いを検討し、モデルの複雑性と標本の大きさとの関係についての結論を下してい

    る。すなわち、標本の数が大きくないときには、相対的に単純なモデルしか正確に推定す

    ることができないというのである。そして、複雑な過程の記述が重要である時には、かな

    りの大きな標本が必要であるとしている。

    このような標本数と交差妥当性指標との関係を、上で紹介した相違関数との関係におい

    て、さらに検討を加えたMacCallum et al.(1994)は、興味深い検討をおこなっているの

    ― ―16

    関西大学『社会学部紀要』第34巻第2号

  • で、ここでさらに紹介してみることにする。彼らは、Cudeck & Henly(1991)が提示し

    た交差妥当性に関する結論ついて、2つの標本をペアにした組み合わせの一方に対して部

    分的な固定推定を指定して推定する方法論において、検討している。明確な結果とはいえ

    ないが、彼らは、モデルにおける部分的な固定によって、相対的に少ない標本でも、複雑

    なモデルを評価することが可能であることを、実際の大標本からランダムに取り出したデ

    ータから明らかにしている。

    この彼らの研究の意義は、2つの標本の共分散行列を、たとえば、 と とすると、こ

    の2つのについて推定するモデル構造 (γ)と (γ)にある種の拘束をかけることで、

    この2つの標本の源にあるに (γ)迫ることができる可能性を示唆したところにある。1

    標本の交差妥当性指標の性質を、相違関数の観点から評価しようとした彼らの試みは、複

    数標本の同時分析の方法論においてもっと興味ある結論を引きだす可能性を持っているの

    ではないかと考えている。

    このようにCudeck & Henly(1991)やMacCallum et al.(1994)などの数理的な展

    開を紹介したのは、モデルと推定との違いを厳格に認識するためのベースとなると考えた

    からである。データをある種のアルゴリズムの下で解析した結果から得られる推定値は、

    けっして (γ)ではないのである。繰り返しになるが、母集団モデル構造との推定による

    相違、そして母集団モデル構造での共分散の母共分散への近似の相違、これらが全体的な

    相違として存在していることを意識しなければならないということである。われわれが、

    実際の解析において手に入れることのできるのは、あくまでも、このような相違を潜在的

    に含む推定値すなわち (γ)なのである。

    伝統的な因子分析で採用されてきた主因子法もまた、ここでいう (γ)を算出している

    に過ぎないのである。最小化基準を具体化したアルゴリズムの性質は、さらに (γ)の内

    容の相違の源泉となるわけである。いずれの推定アルゴリズムが良いかという問題は本稿

    の守備範囲を越える課題であるのでここでは追求しないことにする。

    3.因子解推定の例―最尤法、主因子法、SEMによる比較

    これまでに説明したことを、1つの解析例を取り上げて検討してみることにする。牛尾

    (1999)は、大学生活における適応に関する40項目(4件法)を180人の大学生(1年と

    2年の男子62名、女子118名)を対象として調査している。彼の研究では、2回の縦断的

    な調査をおこなっているが、ここでは、第1回目の調査から6項目だけを取り出して、探

    ― ―17

    因子分析における探索の意味と方法(清水)

  • 索による解の推定の例としてみることにする。

    表1は、この6項目の基本的統計量である。対象の学生が1・2年生であり、友人関係

    には積極的なようである。そして、将来展望に関する項目では、項目4と6は中間的な反

    応となり分布も広いが、項目5の分布の偏りは大きい。次の表2は。これらの項目間の相

    関行列である。

    3.1.探索的因子分析での解の推定

    この6変数について、探索的な因子分析をSPSS Ver.11でおこなってみた。分析として

    は、最初に、2因子で、最尤法での因子解の推

    定を試みたところ、不適解となった。項目6の

    共通性が1を越えたようである。次に、同様に

    2因子で、主因子法(繰り返しによる共通性の

    推定)により因子解を算出し、Promax回転

    (Varimax回転後に適用)をおこなった。表3

    が、因子パターン行列と因子間相関行列である。

    なお、この主因子解での共通性の推定では、27

    回の繰り返しが必要であり、デフォルトの25回

    表3 因子パターン、因子間相関そして共通性

    因子1 因子2 共通性

    項目1 0.722 0.027 0.521

    項目2 0.810 -0.032 0.659

    項目3 -0.557 0.055 0.315

    項目4 0.007 -0.737 0.543

    項目5 -0.132 0.378 0.164

    項目6 0.054 0.872 0.760

    因子1 1.000 -0.038

    因子2 -0.038 1.000

    注:SPSSによる探索的因子分析結果

    表1 大学生の適応に関する6項目の基本的統計量

    質問項目 平均値 標準偏差 歪 度 尖 度

    項目1 友達と一緒にいるときが多い。 3.117 0.854 -0.771 0.011

    項目2 友達とよく遊びに行く。 2.928 0.846 -0.310 -0.665

    項目3 友達とあまり連絡を取り合っていない。 1.950 0.892 0.528 -0.663

    項目4 大学卒業後の夢を持っている。 2.667 1.068 -0.136 -1.242

    項目5 将来のことを考えようとは思わない。 1.439 0.644 1.307 1.094

    項目6 特に興味を感じている職業はない。 1.944 1.001 0.619 -0.860

    表2 6項目の相関行列

    項目1 項目2 項目3 項目4 項目5 項目6

    項目1 1.000 0.576 -0.403 0.025 -0.124 0.066

    項目2 0.576 1.000 -0.464 0.047 -0.136 -0.011

    項目3 -0.403 -0.464 1.000 -0.041 0.058 0.072

    項目4 0.025 0.047 -0.041 1.000 -0.290 -0.639

    項目5 -0.124 -0.136 0.058 -0.290 1.000 0.324

    項目6 0.066 -0.011 0.072 -0.639 0.324 1.000

    ― ―18

    関西大学『社会学部紀要』第34巻第2号

  • では収束しなかった。

    この探索的な解析段階では、最尤法では不適解となり、主因子法でも共通性の推定がそ

    れほどスムーズに進んだわけではない。因子の構造に何らかの問題のあることも予想され

    るが、表3を見ると、因子の構造としては、単純な構造となっている。なお、牛尾(1999)

    は、40変数から7因子を抽出している。その際に、彼は、ここで示したような最尤法と主

    因子法とを比 し、最尤法で不適解に遭遇したことを報告している。

    3.2.SEMによる因子の検証

    ここでは、180名のデータを1つの標本として、Amos 4により、単純な2因子の構造の

    解を最尤法で推定してみることにした。モデルと推定結果は、図2のようになった。なお、

    項目2と項目6については、1で固定して推定をおこなっている。この解を標準化(各因

    子の因子得点の標準偏差を1と)したものが表4である。

    SEM での2因子解の推定の適合度は、図2に提示したように、非常によいものとなって

    いる。主因子解によって推定した表3とこの表4とを比 すると、ゼロ固定した部分を除

    くと非常によく似た解となっていることが分かる。因子間相関もまたほとんど同じ値とな

    った。なお、1つの標本での因子分析モデルの適合度の検討は、Joreskog(1969)は、

    図2 Amosでの2因子モデルの推定結果

    表4 因子パターン、因子間相関

    因子1 因子2

    項目1 0.701

    項目2 0.816

    項目3 -0.570

    項目4 -0.763

    項目5 0.385

    項目6 0.838

    因子1 1.000 -0.024

    因子2 -0.024 1.000

    注:Amosによる SEM での標準化解空欄の因子パターンはゼロ固定

    ― ―19

    因子分析における探索の意味と方法(清水)

  • confirmatory factor analysisとよんでいる(Mulaik(1972)や清水(1994)など参照)。

    探索的因子分析モデルでの最尤法による解は不適解となった。表1にあるような正規性

    からの乖離が原因となって探索的な最尤推定がうまくいかなかったのではない。狩野

    (1996)が指摘するように変数に内在する因子についてのモデルを適切に表現すると

    SEM での最尤推定でも適合度の非常に高い解を推定することができたわけである。

    最尤法による探索的因子分析の初期の因子解を推定するモデルは、識別性を確保するこ

    ともあり、分散を1とする直交の因子という制約をおく。そして、因子パターンについて

    は制約をおかずに全要素を推定する。対象となる標本において、図2のように、 (γ)に

    適切な推定値を求めることが可能であったとしても、探索的な因子分析での初期の解を最

    尤法で推定するモデルでは別なパラメータを設定している、というようにも考えることが

    できよう。ここで紹介したような例のように、場合によっては、不適切なパラメータ設定

    ともなりかねない探索的な因子解の推定方法が使用されてきたのは、因子分析結果の解釈

    の対象は、斜交の回転解であり、この斜交回転のための初期の因子解と共通性を推定する

    手順とは、分けて取り扱ってきた伝統に起因するのではないだろうか。

    図2の解は、解釈の可能な解を、仮説パターンとして、直接的に推定したものである。

    ここでは、解析例を示すために、牛尾(1999)の結果から変数を選び出しており、非常に

    特殊な状況を人工的に構成してみたわけである。一般的な探索的な目的での研究では、こ

    の例のような仮説パターンを設定することが困難であるといえよう。探索とは、このよう

    な仮説的なパターンを探すことであるからである。

    最尤法は不適解に遭遇することが他の方法に比べて多いようである。狩野(1996)が整

    理しているように、最尤法による探索的因子分析での不適解の現象は、標本変動や因子モ

    デルの不適合など複数の要因が絡み合いながら引き起こしている。最尤法による探索的な

    因子分析を否定するつもりはない。Kaiser(1976)のように、数理統計学的方法としての

    最尤法を否定することが本稿で意図していることではない。適切な最尤解を探索的な因子

    分析において求めた経験もある(Shimizu et al.(1988)など)。測定あるいは調査での管

    理を十全におこない、十分に大きな標本で、そして、対象となる変数の質と構造とが良好

    であるならば、基本的には、どの方法で初期の因子解の推定も、ほぼ同じ結果を提供して

    くれることは指摘しておきたい。

    ― ―20

    関西大学『社会学部紀要』第34巻第2号