因子分析法:指研究從變量群中提取共性因子的統計技術-中文百科頻道

基本介紹

主成分分析主要是一種探索性的技術，在分析者進行多元數據分析之前，用他來分析數據，讓自己對數據有一個大緻的了解，這是非常有必要的。主成分分析一般很少單獨使用：a、了解數據。（screeningthedata），b、和clusteranalysis（聚類分析）一起使用，c、和判别分析一起使用，比如當變量很多，個案數不多，直接使用判别分析可能無解，這時候可以使用主成分對變量簡化（reducedimensionality），d、在多元回歸中，主成分分析可以幫助判斷是否存在共線性（條件指數），還可以用來處理共線性。

1、因子分析中是把變量表示成各因子的線性組合，而主成分分析中則是把主成分表示成各變量的線性組合。

2、主成分分析的重點在于解釋各變量的總方差，而因子分析則把重點放在解釋各變量之間的協方差。

3、主成分分析中不需要有假設（assumptions），因子分析則需要一些假設。因子分析的假設包括：各個共同因子之間不相關，特殊因子（specificfactor）之間也不相關，共同因子和特殊因子之間也不相關。

4、主成分分析中，當給定的協方差矩陣或者相關矩陣的特征值是唯一的時候，主成分一般是獨特的；而因子分析中因子不是獨特的，可以旋轉得到不同的因子。

5、在因子分析中，因子個數需要分析者指定（spss根據一定的條件自動設定，隻要是特征值大于1的因子進入分析），而指定的因子數量不同而結果不同。在主成分分析中，成分的數量是一定的，一般有幾個變量就有幾個主成分。和主成分分析相比，由于因子分析可以使用旋轉技術幫助解釋因子，在解釋方面更加有優勢。

大緻說來，當需要尋找潛在的因子，并對這些因子進行解釋的時候，更加傾向于使用因子分析，并且借助旋轉技術幫助更好解釋。而如果想把現有的變量變成少數幾個新的變量（新的變量幾乎帶有原來所有變量的信息）來進入後續的分析，則可以使用主成分分析。當然，這種情況也可以使用因子得分做到。所以這種區分不是絕對的。

在算法上，主成分分析和因子分析很類似，不過在因子分析中所采用的協方差矩陣的對角元素不再是變量的方差，而是和變量對應的共同度（變量方差中被各因子所解釋的部分）。

聚類分析是直接比較各事物之間的性質，将性質相近的歸為一類，将性質差别較大的歸入不同的類的分析技術。

在市場研究領域，聚類分析主要應用方面是幫助我們尋找目标消費群體，運用這項研究技術，我們可以劃分出産品的細分市場，并且可以描述出各細分市場的人群特征，以便于客戶可以有針對性的對目标消費群體施加影響，合理地開展工作。

判别分析（DiscriminatoryAnalysis）的任務是根據已掌握的1批分類明确的樣品，建立較好的判别函數，使産生錯判的事例最少，進而對給定的1個新樣品，判斷它來自哪個總體。根據資料的性質，分為定性資料的判别分析和定量資料的判别分析；采用不同的判别準則，又有費歇、貝葉斯、距離等判别方法。

費歇（FISHER）判别思想是投影，使多維問題簡化為一維問題來處理。選擇一個适當的投影軸，使所有的樣品點都投影到這個軸上得到一個投影值。對這個投影軸的方向的要求是：使每一類内的投影值所形成的類内離差盡可能小，而不同類間的投影值所形成的類間離差盡可能大。貝葉斯（BAYES）判别思想是根據先驗概率求出後驗概率，并依據後驗概率分布作出統計推斷。所謂先驗概率，就是用概率來描述人們事先對所研究的對象的認識的程度；所謂後驗概率，就是根據具體資料、先驗概率、特定的判别規則所計算出來的概率。它是對先驗概率修正後的結果。

距離判别思想是根據各樣品與各母體之間的距離遠近作出判别。即根據資料建立關于各母體的距離判别函數式，将各樣品數據逐一代入計算，得出各樣品與各母體之間的距離值，判樣品屬于距離值最小的那個母體。在讨論因子分析模型之前，先回顧下概率論中的一些知識，就是如何求出多元高斯分布的條件分布和邊緣分布。

對應分析

對應分析是一種用來研究變量與變量之間聯系緊密程度的研究技術。運用這種研究技術，我們可以獲取有關消費者對産品品牌定位方面的圖形，從而幫助您及時調整營銷策略，以便使産品品牌在消費者中能樹立起正确的形象。

這種研究技術還可以用于檢驗廣告或市場推廣活動的效果，我們可以通過對比廣告播出前或市場推廣活動前與廣告播出後或市場推廣活動後消費者對産品的不同認知圖來看出廣告或市場推廣活動是否成功的向消費者傳達了需要傳達的信息。

典型相關分析是分析兩組随機變量間線性密切程度的統計方法，是兩變量間線性相關分析的拓廣。各組随機變量中既可有定量随機變量，也可有定性随機變量（分析時須F6說明為定性變量）。本法還可以用于分析高維列聯表各邊際變量的線性關系。

注意

1．嚴格地說，一個典型相關系數描述的隻是一對典型變量之間的相關，而不是兩個變量組之間的相關。而各對典型變量之間構成的多維典型相關才共同揭示了兩個觀測變量組之間的相關形式。

2．典型相關模型的基本假設和數據要求

要求兩組變量之間為線性關系，即每對典型變量之間為線性關系；

每個典型變量與本組所有觀測變量的關系也是線性關系。如果不是線性關系，可先線性化：如經濟水平和收入水平與其他一些社會發展水之間并不是線性關系，可先取對數。即log經濟水平，log收入水平。

3．典型相關模型的基本假設和數據要求

所有觀測變量為定量數據。同時也可将定性數據按照一定形式設為虛拟變量後，再放入典型相關模型中進行分析。

多維尺度分析（Multi-dimensionAnalysis)是市場研究的一種有力手段，它可以通過低維空間（通常是二維空間）展示多個研究對象（比如品牌）之間的聯系，利用平面距離來反映研究對象之間的相似程度。由于多維尺度分析法通常是基于研究對象之間的相似性（距離）的，隻要獲得了兩個研究對象之間的距離矩陣，我們就可以通過相應統計軟件做出他們的相似性知覺圖。

在實際應用中，距離矩陣的獲得主要有兩種方法：一種是采用直接的相似性評價，先将所有評價對象進行兩兩組合，然後要求被訪者所有的這些組合間進行直接相似性評價，這種方法我們稱之為直接評價法；另一種為間接評價法，由研究人員根據事先經驗，找出影響人們評價研究對象相似性的主要屬性，然後對每個研究對象，讓被訪者對這些屬性進行逐一評價，最後将所有屬性作為多維空間的坐标，通過距離變換計算對象之間的距離。

多維尺度分析的主要思路是利用對被訪者對研究對象的分組，來反映被訪者對研究對象相似性的感知，這種方法具有一定直觀合理性。同時該方法實施方便，調查中被訪者負擔較小，很容易得到理解接受。當然，該方法的不足之處是犧牲了個體距離矩陣，由于每個被訪者個體的距離矩陣隻包含1與0兩種取值，相對較為粗糙，個體距離矩陣的分析顯得比較勉強。但這一點是完全可以接受的，因為對大多數研究而言，我們并不需要知道每一個體的空間知覺圖。

多元統計分析是統計學中内容十分豐富、應用範圍極為廣泛的一個分支。在自然科學和社會科學的許多學科中，研究者都有可能需要分析處理有多個變量的數據的問題。能否從表面上看起來雜亂無章的數據中發現和提煉出規律性的結論，不僅對所研究的專業領域要有很好的訓練，而且要掌握必要的統計分析工具。對實際領域中的研究者和高等院校的研究生來說，要學習掌握多元統計分析的各種模型和方法，手頭有一本好的、有長久價值的參考書是非常必要的。

這樣一本書應該滿足以下條件：首先，它應該是“淺入深出”的，也就是說，既可供初學者入門，又能使有較深基礎的人受益。其次，它應該是既側重于應用，又兼顧必要的推理論證，使學習者既能學到“如何”做，而且在一定程度上了解“為什麼”這樣做。最後，它應該是内涵豐富、全面的，不僅要基本包括各種在實際中常用的多元統計分析方法，而且還要對現代統計學的最新思想和進展有所介紹、交代。

主成分分析通過線性組合将原變量綜合成幾個主成分，用較少的綜合指标來代替原來較多的指标（變量）。在多變量分析中，某些變量間往往存在相關性。是什麼原因使變量間有關聯呢？是否存在不能直接觀測到的、但影響可觀測變量變化的公共因子？因子分析法（FactorAnalysis）就是尋找這些公共因子的模型分析方法，它是在主成分的基礎上構築若幹意義較為明确的公因子，以它們為框架分解原變量，以此考察原變量間的聯系與區别。

例如，随着年齡的增長，兒童的身高、體重會随着變化，具有一定的相關性，身高和體重之間為何會有相關性呢？因為存在着一個同時支配或影響着身高與體重的生長因子。那麼，我們能否通過對多個變量的相關系數矩陣的研究，找出同時影響或支配所有變量的共性因子呢？因子分析就是從大量的數據中“由表及裡”、“去粗取精”，尋找影響或支配變量的多變量統計方法。

可以說，因子分析是主成分分析的推廣，也是一種把多個變量化為少數幾個綜合變量的多變量分析方法，其目的是用有限個不可觀測的隐變量來解釋原始變量之間的相關關系。

因子分析主要用于：1、減少分析變量個數；2、通過對變量間相關關系探測，将原始變量進行分類。即将相關性高的變量分為一組，用共性因子代替該組變量。