Analiza czynnikowa – metoda statystyczna, której celem jest opisanie zależności między zaobserwowanymi, skorelowanymi zmiennymi przy pomocy możliwie mniejszej liczby zmiennych nieobserwowanych nazywanych czynnikami bądź faktorami, które są wzajemnie nieskorelowane. Prekursorem analizy czynnikowej był Charles Spearman. Jedną z kluczowych postaci, które przyczyniły się do powstania tej procedury, był Henry Felix Kaiser.
Zmienne obserwowane są następnie modelowane jako suma odpowiednich kombinacji liniowych nowych zmiennych nieobserwowanych oraz błędu pomiaru (zob. biały szum).
Analiza czynnikowa jest powszechnie używana w biologii, psychologii (przy analizie struktury zjawisk badanych przez narzędzia kwestionariuszowe), marketingu, teorii decyzji oraz innych dziedzinach wiedzy.
Model statystyczny
Niech dany będzie zbiór zaobserwowanych zmiennych losowych o średnich odpowiednio. Załóżmy, że dla pewnych (nieznanych) stałych oraz zmiennych (tzw. czynników czy faktorów), gdzie i mamy związek
przy czym zmienne są interpretowane jako błędy będące zmiennymi o zerowej wartości oczekiwanej i skończonej wariancji. Powyższy związek można zapisać macierzowo jako
Mając obserwacji, powyżej jest macierzą jest macierzą natomiast jest macierzą Każda kolumna macierzy i oznacza wartości odpowiadające obserwacjom natomiast macierz nie zależy od obserwacji.
Ponadto, o macierzy losowej zakłada się, że:
- jest ona niezależna od
- jest macierzą identyczności, co oznacza, że faktory są parami nieskorelowane.
Celem analizy czynnikowej jest wyznaczanie par macierzy i które spełniają powyższe równania i warunki.
Oznaczając
można zapisać:
bądź równoważnie
Niejednoznaczność rozwiązań
Dla każdej macierzy ortogonalnej stopnia kładąc oraz tak zdefiniowane macierze spełniają powyższe warunki, o ile tylko i je spełniają, tzn. zbiór rozwiązań problemu jest niejednoznaczny oraz niezmienniczy ze względu na przekształcenia ortogonalne.
Podejścia
W analizie czynnikowej istnieją dwa podejścia:
- eksploracyjna analiza czynnikowa (EFA, od ang. exploratory factor analysis) – czynniki są początkowo nieznane i zostają wyodrębnione dzięki analizie wartości zmiennych losowych,
- konfirmacyjna analiza czynnikowa (CFA, od ang. confirmatory factor analysis) – zakładamy istnienie pewnego określonego zbioru czynników i dzięki analizie wartości zmiennych losowych badamy zasadność naszego przypuszczenia i estymujemy parametry naszego modelu (modelowanie równań strukturalnych).
Jest wiele metod analizy czynnikowej, jednak najbardziej popularne są dwie:
- analiza głównych składowych (PCA, od ang. principal component analysis),
- analiza czynników głównych (PFA, od ang. principal factor analysis).
Niezależnie od metody, rozpoczynamy od budowy macierzy korelacji i sprawdzenia, czy możliwe jest zastosowanie analizy czynnikowej.
Bibliografia
- Harry H. Harman, Modern Factor Analysis. 3rd Edition, The University of Chicago Press, Chicago 1976.