Lý thuyết và thực hành phân tích nhân tố khám phá efa trong SPSS
Sau khi đã sàng lọc được độ tin cậy của thang đo thông qua hệ số Cronbach’s Alpha, bước tiếp theo trong quy trình phân tích dữ liệu định lượng chính là Phân tích Nhân tố khám phá (Exploratory Factor Analysis - EFA).
Nếu Cronbach’s Alpha giúp chúng ta loại bỏ những biến "rác" không nhất quán, thì EFA sẽ giúp chúng ta nhận diện cấu trúc thực sự của dữ liệu, xem các biến quan sát có thực sự cùng đo lường một khái niệm như kỳ vọng hay không.
1. Phân tích nhân tố khám phá EFA là gì?
Phân tích nhân tố khám phá, viết tắt là EFA là một phương pháp định lượng dùng để rút gọn một tập hợp gồm nhiều biến quan sát phụ thuộc lẫn nhau thành một tập hợp biến ít hơn (gọi là các nhân tố) để chúng có ý nghĩa hơn nhưng vẫn chứa đựng được hầu hết thông tin của tập biến ban đầu (Hair et al., 2014).
Ví dụ thực tế: Trong bảng khảo sát về MBBank, bạn có 25 câu hỏi nhỏ (biến quan sát). Việc phân tích rời rạc 25 câu này rất phức tạp. EFA sẽ giúp bạn gom 25 câu này vào 6 nhóm nhân tố chính (như Tin cậy, Hữu hình, Đồng cảm...) dựa trên sự tương quan của dữ liệu thực tế.
Hai giá trị cốt lõi mà phép phân tích EFA hướng tới là:
Giá trị hội tụ (Convergent Validity): Các biến quan sát cùng đo lường một tính chất phải hội tụ về cùng một nhân tố. Khi biểu diễn trong ma trận xoay, các biến này sẽ nằm chung một cột với nhau.
Giá trị phân biệt (Discriminant Validity): Thể hiện mức độ khác biệt giữa các nhân tố trong mô hình nghiên cứu. Các biến quan sát của một nhân tố cần hội tụ vào đúng nhân tố đó và không có tải đáng kể lên các nhân tố khác. Trong EFA trên SPSS, giá trị phân biệt được đánh giá thông qua ma trận xoay, khi các biến được tách rõ ràng thành từng nhóm riêng biệt, không xuất hiện hiện tượng tải chéo.
Khái niệm giá trị phân biệt được sử dụng phổ biến và chặt chẽ hơn trong các mô hình SEM như AMOS và SmartPLS. Trong khi đó, ở EFA, việc đánh giá giá trị phân biệt chủ yếu mang tính khám phá, nhằm kiểm tra cấu trúc thang đo trước khi thực hiện các phân tích khẳng định tiếp theo.
2. Các điều kiện và tiêu chuẩn trong phân tích EFA
Để kết quả phân tích EFA có ý nghĩa thống kê và sử dụng được cho các bước tiếp theo (như Hồi quy), dữ liệu cần thỏa mãn các tiêu chuẩn sau:
| Bước phân tích | Chỉ số | Tiêu chuẩn cần đạt | Giải thích | Nguồn tham khảo |
|---|---|---|---|---|
| 1. Kiểm tra sự phù hợp của dữ liệu | KMO (Kaiser-Meyer-Olkin) | 0.5 ≤ KMO ≤ 1 | KMO cho biết dữ liệu có đủ mức độ liên hệ giữa các biến để hình thành các nhân tố hay không. KMO càng cao, dữ liệu càng phù hợp để phân tích EFA. | Kaiser (1974); Hair et al. (2014) |
| Bartlett’s Test (Sig.) | Sig. < 0.05 | Kiểm định xác nhận các biến quan sát có mối tương quan tuyến tính. Sig. < 0.05 cho phép bác bỏ giả thuyết các biến không liên quan. | Bartlett (1954); Hair et al. (2014) | |
| 2. Trích nhân tố | Eigenvalue | Eigenvalue > 1 | Eigenvalue thể hiện lượng thông tin mà một nhân tố giữ lại. Nhân tố có Eigenvalue < 1 thường không đủ mạnh để giữ lại. | Gerbing & Anderson (1988); Hair et al. (2014) |
| Tổng phương sai trích (%) | ≥ 50% | Các nhân tố trích ra cần giải thích tối thiểu 50% biến thiên của dữ liệu ban đầu. | Hair et al. (2014) | |
| 3. Đánh giá biến quan sát | Factor Loading | Phụ thuộc cỡ mẫu | Factor Loading phản ánh mức độ đại diện của biến quan sát cho nhân tố. | Hair et al. (2014) |
| Loading chéo | Không tải ≥ 0.5 lên ≥ 2 nhân tố | Biến chỉ nên đại diện cho một nhân tố duy nhất để đảm bảo giá trị phân biệt. | ||
| 4. Số biến trong mỗi nhân tố | Số biến / nhân tố | ≥ 3 biến | Mỗi nhân tố cần tối thiểu 3 biến quan sát để đảm bảo độ ổn định và tin cậy. | |
| 5. Phép xoay nhân tố | Rotation | Varimax | Phép xoay Varimax giúp mô hình rõ ràng, các biến tải mạnh vào một nhân tố duy nhất, dễ diễn giải. | Kaiser (1958); Hair et al. (2014) |
2.1. Dữ liệu có phù hợp để phân tích không
Trước khi xem xét các nhân tố, ta cần kiểm tra xem dữ liệu có đủ điều kiện để chạy EFA hay không thông qua 2 chỉ số (nằm ở bảng KMO and Bartlett's Test):
Chỉ số KMO (Kaiser-Meyer-Olkin): Đây là chỉ số dùng để xem xét sự thích hợp của phân tích nhân tố.
Quy tắc: Giá trị KMO phải nằm trong khoảng từ 0.5 đến 1.
-
Nếu KMO ≥ 0.5: Phân tích nhân tố là thích hợp.
-
Nếu KMO < 0.5: Phân tích nhân tố có khả năng không thích hợp (dữ liệu các biến không có sự liên kết đủ mạnh để gom nhóm). Lúc này bạn cần xem lại kích thước mẫu hoặc nội dung câu hỏi.
Kiểm định Bartlett (Bartlett's Test of Sphericity): Kiểm định này xem xét giả thuyết: "Các biến quan sát không có tương quan gì với nhau trong tổng thể".
-
Mục tiêu: Chúng ta cần BÁC BỎ giả thuyết này (tức là cần các biến PHẢI có tương quan với nhau).
-
Quy tắc: Giá trị Sig. (Significance) phải nhỏ hơn 0.05 (Sig. < 0.05).
2.2. Tiêu chuẩn trích nhân tố
Hệ số Eigenvalue (giá trị riêng) phản ánh lượng thông tin mà một nhân tố giải thích từ tập dữ liệu ban đầu. Do mỗi biến quan sát được chuẩn hóa với phương sai bằng 1, một nhân tố chỉ được xem là có ý nghĩa khi Eigenvalue của nó lớn hơn 1, tức là nhân tố đó giải thích được nhiều thông tin hơn một biến quan sát đơn lẻ.
Theo tiêu chuẩn của Gerbing & Anderson (1988), trong phân tích EFA, chỉ giữ lại các nhân tố có Eigenvalue > 1, các nhân tố có Eigenvalue ≤ 1 sẽ không được xem là đủ mạnh và thường bị loại khỏi mô hình.
Tổng phương sai trích (Total Variance Explained): Chỉ số này cho biết: "Các nhân tố được giữ lại giải thích được bao nhiêu % ý nghĩa của dữ liệu gốc?".
Quy tắc: Tổng phương sai trích phải ≥ 50%.
Ví dụ: Kết quả là 65%. Nghĩa là 6 nhân tố rút ra giải thích được 69,549% sự biến động của dữ liệu. 30,451% còn lại là do sai số hoặc các yếu tố khác chưa nghiên cứu. Mức này là Đạt.
2.3. Tiêu chuẩn của biến quan sát (Factor Loading)
Hệ số tải nhân tố (Factor Loading): Hệ số này biểu thị mối quan hệ giữa biến quan sát với nhân tố. Hệ số càng cao, biến đó càng đại diện tốt cho nhân tố.
Tuy nhiên, để an toàn và dễ bảo vệ, Resdata khuyên bạn nên dùng ngưỡng 0.6 cho mọi trường hợp mẫu > 100.
3. Hướng dẫn phân tích nhân tố khám phá EFA trên SPSS
3.1 Chạy EFA cho biến độc lập

Đưa biến quan sát của các biến độc lập cần thực hiện phân tích EFA vào mục Variables, nếu có biến quan sát nào bị loại ở bước trước đó, chúng ta sẽ không đưa vào phân tích EFA. Chú ý 4 tùy chọn được dánh dấu ở ảnh bên dưới.

- Descriptives: Tích vào mục KMO and Barlett’s test of sphericity để xuất bảng giá trị KMO và giá trị sig của kiểm định Barlett. Nhấp Continue để quay lại cửa sổ ban đầu.

- Extraction: Ở đây, chúng ta sẽ sử dụng phép trích PCA (Principal Components Analysis). PCA sẽ được viết gọn lại là Principal Components như hình ảnh bên dưới, đây cũng là tùy chọn mặc định của SPSS.

Khi các bạn nhấp chuột vào nút mũi tên hướng xuống sẽ có nhiều tùy chọn phép trích khác nhau. Số lượng nhân tố được trích ra ở ma trận xoay phụ thuộc khá nhiều vào việc lựa chọn phép trích, tuy nhiên, tài liệu này sẽ chỉ tập trung vào phần EFA với phép xoay (varimax), CFA với phép xoay Promax.
- Rotation: Ở đây có các phép quay, thường chúng ta hay sử dụng Varimax và Promax. Riêng với dạng đề tài đã xác định được biến độc lập và biến phụ thuộc, chúng ta sử dụng phép quay Varimax.
Nhấp Continue để quay lại cửa sổ ban đầu.

- Options: Tích vào Sorted by size để ma trận xoay sắp xếp thành từng cột dạng bậc thang để dễ đọc kết quả hơn, chúng ta có thể tích hoặc không tích, việc này không ảnh hưởng đến kết quả. Cần nhớ rằng, thứ tự các nhân tố trong kết quả ma trận xoay không phản ánh mức độ quan trọng của nhân tố đó. Với mục Suppress small coefficients, nếu không tích chọn, ma trận xoay sẽ hiển thị toàn bộ hệ số tải của mỗi biến quan sát ở từng nhân tố.

Có khá nhiều bảng ở output, tất cả các bảng này đều đóng góp vào việc đánh giá kết quả phân tích EFA là tốt hay tệ. Tuy nhiên, ở đây tác giả tập trung vào ba bảng kết quả chính: KMO and Barlett’s Test, Total Variance Explained và Rotated Component Matrix, bởi sử dụng ba bảng này chúng ta đã có thể đánh giá được kết quả phân tích EFA phù hợp hay không phù hợp.
Quan sát kết quả chạy EFA, chúng ta tiến hành đánh giá qua 3 bảng tiêu chuẩn như sau:
Bảng 1. Kiểm định tính thích hợp của dữ liệu (Bảng KMO and Bartlett's Test)
.jpg)
Hệ số KMO = 0.757: Giá trị này nằm trong khoảng 0.5 < 0.757< 1. Theo bảng phân loại của Kaiser (1974), mức 0.851 được đánh giá là "Tốt" (Meritorious).
Kiểm định Bartlett: Giá trị Sig. (cột cuối cùng) < 0.001.
-> Kết luận: Dữ liệu hoàn toàn đủ điều kiện và phù hợp để thực hiện phân tích nhân tố
Bảng 2. Tiêu chuẩn trích nhân tố (Bảng Total Variance Explained)
.jpg)
Số lượng nhân tố: Tại phần Initial Eigenvalues, chúng ta thấy có 6 nhân tố có giá trị Eigenvalue > 1. Thuật toán dừng trích xuất tại nhân tố thứ 6 (vì nhân tố thứ 7 có Eigenvalue = 0.721 < 1).
Tổng phương sai trích (Cumulative %): 6 nhân tố này giải thích được 69,549%> 50%, cho thấy các nhân tố rút ra đại diện tốt cho thông tin của tập dữ liệu gốc.
Bảng 3: Đánh giá Ma trận xoay (Bảng Rotated Component Matrix)
.jpg)
Kết quả EFA cho thấy các biến quan sát được nhóm thành 6 nhân tố riêng biệt, phù hợp với mô hình nghiên cứu ban đầu. Các hệ số tải nhân tố đều lớn hơn 0,6, đáp ứng tiêu chuẩn và không có biến nào bị loại khỏi mô hình.
Cụ thể, nhóm biến DU gồm DU1 đến DU5 có hệ số tải dao động từ 0,712 đến 0,806, cho thấy các biến này đại diện tốt cho cùng một nhân tố. Nhóm biến NL (NL1–NL5) có hệ số tải từ 0,777 đến 0,834, thể hiện mức độ hội tụ cao. Nhóm biến DC (DC1–DC5) đạt hệ số tải từ 0,756 đến 0,851, phản ánh sự gắn kết chặt chẽ giữa các biến quan sát.
Bên cạnh đó, các biến TC (TC1–TC4) được rút trích thành một nhân tố với hệ số tải từ 0,681 đến 0,828. Nhóm biến HH (HH1–HH3) có hệ số tải từ 0,763 đến 0,874, và nhóm biến GC (GC1–GC3) đạt hệ số tải từ 0,761 đến 0,826.
Nhìn chung, kết quả EFA khẳng định các thang đo trong nghiên cứu có cấu trúc rõ ràng, giá trị hội tụ tốt và phù hợp để sử dụng trong các phân tích tiếp theo như phân tích tương quan và hồi quy tuyến tính.
Chạy EFA cho biến phụ thuộc
Thực hiện tương tự các bước như cách làm với biến độc lập. Thay vì đưa biến quan sát của các biến độc lập vào mục Variables, chúng ta sẽ đưa các biến quan sát của biến phụ thuộc vào. Cụ thể trong ví dụ này, biến phụ thuộc Sự hài lòng gồm 4 biến quan sát là HL1, HL2, HL3, HL4.
Kết quả output, chúng ta cũng sẽ có các bảng KMO and Barlett’s Test, Total Variance Explained, Rotated Component Matrix. Bảng KMO and Barlett’s Test giống hoàn toàn như biến độc lập, cách đọc kết quả cũng tương tự.
.jpg)
Bảng Total Variance Explained khi chỉ có một nhân tố được trích sẽ hiển thị như bên dưới (không có cột Rotation Sums of Squared Loadings). Trường hợp nếu có từ hai nhân tố được trích, sẽ xuất hiện thêm cột Rotation Sums of Squared Loadings.
.jpg)
Kết quả phân tích cho thấy có một nhân tố được trích tại eigenvalue bằng 2.587 > 1. Nhân tố này giải thích được 64,675% biến thiên dữ liệu của 4 biến quan sát tham gia vào EFA.
Riêng bảng Rotated Component Matrix sẽ không xuất hiện mà thay vào đó là dòng thông báo: Only one component was extracted. The solution cannot be rotated.
.jpg)
Điều này xảy ra khi EFA chỉ trích được một nhân tố duy nhất từ các biến quan sát đưa vào. Dòng thông báo này tạm dịch là: Chỉ có một nhân tố được trích. Ma trận không thể xoay. Chúng ta luôn kỳ vọng đưa vào 1 biến phụ thuộc thì EFA cũng sẽ chỉ trích ra một nhân tố. Việc trích được chỉ một nhân tố là điều tốt, nghĩa là thang đo đó đảm bảo được tính đơn hướng, các biến quan sát của biến phụ thuộc hội tụ khá tốt. Lúc này, việc đọc kết quả sẽ dựa vào bảng ma trận chưa xoay Component Matrix thay vì bảng ma trận xoay Rotated Component Matrix.
Một thực tế phổ biến khi chạy EFA là ma trận xoay thường không tách nhóm rạch ròi như lý thuyết. Nguyên nhân chính đến từ các biến xấu (biến rác), chúng làm nhiễu kết quả và khiến các nhân tố bị xáo trộn lẫn nhau.
4. Kết luận
Kết quả phân tích nhân tố khám phá (EFA) cho thấy dữ liệu nghiên cứu hoàn toàn phù hợp với việc trích nhân tố. Giá trị KMO > 0.5 và Bartlett’s Test có Sig. < 0.05 chứng tỏ ma trận tương quan giữa các biến quan sát khác biệt so với ma trận đơn vị, phù hợp để phân tích nhân tố. Các nhân tố trích ra đều có Eigenvalue > 1 và tổng phương sai trích ≥ 50%, phản ánh phần lớn thông tin dữ liệu gốc. Ma trận xoay cho thấy các biến quan sát chủ yếu có tải ≥ 0.5 lên một nhân tố duy nhất, thể hiện tính hội tụ và phân biệt tốt. Do đó, cấu trúc thang đo được rút gọn và phù hợp để sử dụng trong các phân tích tiếp theo.
Trên đây là hướng dẫn chi tiết cách phân tích nhân tố khám phá EFA trên SPSS, từ việc kiểm tra điều kiện dữ liệu, tiêu chuẩn trích nhân tố cho đến cách đọc và nhận xét các bảng kết quả quan trọng. Nếu thực hiện đúng quy trình, EFA sẽ giúp bạn rút gọn thang đo, đảm bảo giá trị hội tụ và phân biệt, tạo nền tảng vững chắc cho các bước phân tích tiếp theo như hồi quy, CFA hoặc SEM.
Để hạn chế sai sót trong quá trình xử lý dữ liệu và đảm bảo kết quả phân tích phản ánh đúng bản chất nghiên cứu, bạn nên tham khảo thêm bài viết tổng hợp những điều cần lưu ý khi chạy SPSS cho kết quả tốt , trong đó trình bày toàn diện các vấn đề quan trọng từ chuẩn bị dữ liệu, kiểm định thang đo đến phân tích và diễn giải kết quả.
Tuy nhiên, trong quá trình thực hành, rất nhiều bạn gặp phải những vấn đề như:
- Dữ liệu chạy EFA không hội tụ, xuất hiện tải chéo nhiều.
- Phải loại biến liên tục nhưng vẫn không đạt tiêu chuẩn.
- Kết quả EFA không phù hợp với mô hình lý thuyết ban đầu.
- Gấp deadline nhưng chưa biết xử lý số liệu như thế nào cho đúng.
Resdata hỗ trợ bạn những gì?
✅ Tư vấn & định hướng toàn bộ quy trình xử lý dữ liệu SPSS: Rà soát thang đo, phát hiện và xử lý các biến không phù hợp, đồng thời định hướng từng bước phân tích (Cronbach’s Alpha, EFA, hồi quy/SEM…) theo đúng bản chất dữ liệu, bối cảnh nghiên cứu và mục tiêu đề tài, giúp kết quả phản ánh thực tế nghiên cứu và đáp ứng yêu cầu học thuật.
✅ Hỗ trợ SPSS 1 kèm 1 qua ultraview: Hướng dẫn chi tiết từng bước thực hành và cách viết nhận xét chuẩn học thuật.
✅ Xử lý nhanh – đúng chuẩn: Xử lý kết quả trong ngày Phù hợp cho khóa luận, luận văn, luận án và bài báo khoa học.
✅ Cam kết chỉnh sửa theo góp ý của giảng viên/hội đồng cho đến khi đạt yêu cầu.
Nếu bạn đang gặp phải các tình huống trên và chưa tìm được hướng xử lý phù hợp, đừng ngần ngại liên hệ ngay: Hotline: 0907 786 895.
Resdata luôn sẵn sàng đồng hành cùng bạn với phương châm Nhanh chóng – Tin cậy – Bảo mật – Chi phí hợp lý.
Thông qua dịch vụ SPSS của Resdata, bạn sẽ được hỗ trợ xử lý số liệu hiệu quả, tối ưu kết quả phân tích và tiết kiệm đáng kể thời gian, giúp bạn yên tâm hoàn thành bài nghiên cứu đúng tiến độ và yêu cầu học thuật.

