Die Methode der Hauptkomponenten basiert auf VersuchenErklären Sie die maximale Varianz in einem bestimmten Satz von Variablen und konzentriert sich auf die Elemente in der Korrelationsmatrix entlang der Diagonalen. Es gibt eine andere Methode, die auf einer Faktorenanalyse beruht, die darauf abzielt, die Korrelationsmatrix unter Verwendung einer bestimmten Anzahl von Faktoren (weniger als eine gegebene Anzahl von Variablen) zu approximieren, aber die Annäherungsmethoden unterscheiden sich wesentlich von der ersten vorgeschlagenen Methode.

Die Methode der Faktorenanalyse erlaubt uns also, die Korrelation zwischen den Variablen selbst zu erklären und orientiert sich an den Elementen einer Korrelationsmatrix, die außerhalb ihrer Diagonalen liegen.

Basierend auf der praktischen Anwendung werden wir es versuchenum die Notwendigkeit zu verstehen, diese oder jene Methode anzuwenden. Die Faktoranalyse wird verwendet, wenn ein Interesse des Forschers an der Untersuchung der Beziehung zwischen Variablen besteht, die Methode der Hauptkomponenten verwendet wird, wenn die Dimensionalität der Daten reduziert werden soll, und in geringerem Maße eine Interpretation dieser Daten erforderlich ist.

Basierend auf der Praxis können wir diese Methoden sehenDie Faktorenanalyse verwendet eine ziemlich große Anzahl von Beobachtungen. Gleichzeitig muss diese Menge um eine Größenordnung höher sein als die Anzahl der erkannten Faktoren.

Die Methode der Hauptkomponenten ist sehr beliebtin der Marktforschung, da es bei Vorliegen multicolinearer Ausgangsdaten verwendet werden kann. Im Verlauf einer solchen Marktforschung enthalten die Fragebögen ähnliche Fragen, und die erhaltenen Antworten entsprechen den Prinzipien der Multikollinearität.

Die Methode der Hauptkomponenten ist zweckmäßigBetrachten Sie in der Gesamtheit der Indikatoren, die für den Forscher ein Bezugspunkt mit einer vorläufigen Wahl der Anzahl der Komponenten oder Faktoren sein sollte. Die wichtigsten davon sind die Eigenwerte, die die Varianz der Variablen ausdrücken, erklärt durch diesen Faktor. Es gibt auch eine wichtige empirische Regel, die sehr nützlich ist, um die Anzahl der Faktoren zu schätzen (es müssen so viele Faktoren vorhanden sein, wie Eigenwerte über eins sind). Es ist möglich, diese Regel etwas einfacher zu erklären - die Eigenwerte drücken den Bruchteil der normalisierten Varianzen von Variablen aus, die durch den Faktor erklärt werden, und im Falle der Überschreitung müssen sie diese Varianzen ausdrücken, die in mehr als einer Variablen enthalten sind.

Es ist notwendig, diese Regel noch einmal zu klären"Individuelle Eigenwerte" ist eine empirische, und die Frage nach der Notwendigkeit ihrer Anwendung kann nur vom Forscher selbst gelöst werden. Zum Beispiel hat ein Eigenwert einen Wert kleiner als eins, aber es erklärt die Verteilung, die zwischen den Variablen verteilt wird. Für einen Marketingspezialisten ist es sehr wichtig, dass die identifizierten Faktoren bei der Segmentierung eine sinnvolle Bedeutung haben. Und jene Faktoren, die ihre eigenen Zahlen über der Einheit enthalten, aber keine sinnvolle Interpretation haben, werden nicht berücksichtigt. Und die Situation kann ganz im Gegenteil entstehen.

Ein weiteres wichtiges Thema im Zusammenhang mit dem praktischendie Anwendung von Methoden der Faktoranalyse - die Frage der Rotation. Solche Rotationsvarianten können in Betracht gezogen werden. Am beliebtesten ist die Varimax-Methode. Es basiert auf dem Erreichen der maximalen Varianz der Variablen für jeden einzelnen Faktor. Diese Methode hilft, eine Rotation zu finden, in der einige Variablen hohe Werte annehmen, während andere für jeden einzelnen Faktor ausreichend niedrig sind.

Eine andere Methode der Rotation ist Quartax, es hilft, eine bestimmte Wendung zu finden, in der Faktoren für jede einzelne Variable sowohl niedrige als auch hohe Lasten haben.

Die Methode der Rotation von Äquimax ist ein Kompromiss zwischen den zwei oben diskutierten Methoden.

Alle diese Verfahren beziehen sich auf orthogonale mit zueinander senkrechten Achsen, bei Verwendung besteht ein Mangel an Korrelation zwischen einzelnen Faktoren.