Hướng dẫn thực hành Hồi quy Tuyến tính Đa biến trong SPSS

Trong các nghiên cứu định lượng hiện nay, phân tích hồi quy (Regression Analysis) là một trong những kỹ thuật thống kê được sử dụng phổ biến nhất để khám phá và kiểm định mối quan hệ giữa các biến trong mô hình nghiên cứu. Đặc biệt, với sự hỗ trợ của phần mềm SPSS, việc xây dựng, kiểm định và diễn giải mô hình hồi quy trở nên trực quan và dễ tiếp cận hơn ngay cả với người mới bắt đầu.

Nội dung dưới đây sẽ giúp bạn hiểu đúng bản chất của phân tích hồi quy, vai trò của biến phụ thuộc – biến độc lập, cũng như cách tiếp cận khoa học trong việc xây dựng mô hình nghiên cứu dựa trên cơ sở lý thuyết và các nghiên cứu trước, làm nền tảng cho các bước phân tích hồi quy thực hành trên SPSS ở những phần tiếp theo.

 1. Phân tích hồi quy (Regression Analysis) là gì

Phân tích hồi quy là một phương pháp thống kê dùng để kiểm định mối quan hệ nhân quả giữa một biến phụ thuộc (Dependent Variable) và một hoặc nhiều biến độc lập (Independent Variable). Trong nghiên cứu định lượng, mục tiêu cốt lõi của hồi quy là xác định mức độ tác động và dự báo giá trị của biến mục tiêu dựa trên các biến dự báo trong mô hình.

  • Biến phụ thuộc (Y): Là biến chịu tác động, đại diện cho kết quả mà người nghiên cứu muốn giải thích hoặc dự báo thường gắn với tên đề tài nghiên cứu.
  • Biến độc lập (X): Là các yếu tố dự báo, được giả định là nguyên nhân gây ra sự thay đổi của biến phụ thuộc.

Thông qua việc xây dựng mô hình toán học dưới dạng phương trình hồi quy, nhà nghiên cứu có thể định lượng một cách cụ thể mức độ và chiều hướng tác động của các biến độc lập đến biến phụ thuộc. Cụ thể, mô hình hồi quy giúp xác định khi một yếu tố thay đổi 1 đơn vị thì biến phụ thuộc sẽ thay đổi bao nhiêu đơn vị và theo hướng nào, trong điều kiện các yếu tố khác được giữ không đổi.

Trong thực tế nghiên cứu, việc đề xuất mô hình hồi quy không chỉ dựa trên dữ liệu mà cần có nền tảng lý thuyết vững chắc. Do đó, trước khi xây dựng mô hình, người nghiên cứu cần nghiên cứu các học thuyết kinh tế và mô hình lý thuyết có liên quan đến chủ đề nghiên cứu, chẳng hạn như các học thuyết về hành vi, thu nhập, sản xuất, tiêu dùng hoặc ra quyết định. Các học thuyết này đóng vai trò định hướng trong việc xác định mối quan hệ nhân – quả giữa các biến, đồng thời giúp mô hình nghiên cứu có cơ sở khoa học rõ ràng.

Bên cạnh đó, người nghiên cứu thường tiến hành lược khảo các tài liệu, bài báo khoa học và các nghiên cứu thực nghiệm trước đây để kế thừa các biến đã được kiểm định, từ đó xây dựng mô hình nghiên cứu đề xuất phù hợp với mục tiêu và bối cảnh nghiên cứu cụ thể. Đồng thời, việc lược khảo tài liệu còn giúp người nghiên cứu xác định các khoảng trống nghiên cứu, từ đó có thể điều chỉnh, kết hợp hoặc bổ sung các biến mới, cũng như thay đổi cách tiếp cận mô hình để gia tăng tính mới và tính đóng góp của đề tài. Đây là yếu tố quan trọng giúp nghiên cứu được đánh giá cao về mặt học thuật, đặc biệt trong các luận văn, luận án hoặc bài báo khoa học.

Sau khi hoàn thiện mô hình đề xuất, phân tích hồi quy trên phần mềm SPSS sẽ được sử dụng để kiểm định mức độ phù hợp của mô hình, đánh giá ý nghĩa thống kê của các biến độc lập và xác định phương trình hồi quy cuối cùng làm cơ sở cho việc diễn giải và thảo luận kết quả nghiên cứu.

2. Hướng dẫn thực hành Hồi quy tuyến tính đa biến trên SPSS

Dưới đây là các bước thao tác trên bộ dữ liệu Đánh giá mức độ hài lòng khi sử dụng dịch vụ Internet Banking MBBank:

Thực hiện phân tích hồi quy tuyến tính bội để đánh giá sự tác động của các biến độc lập này lên biến phụ thuộc. Chúng ta vào Analyze > Regression > Linear…

Đưa biến phụ thuộc vào ô Dependent, các biến độc lập vào ô Independents.

Sau đó vào mục Statistics, tích chọn các mục như trong ảnh và chọn Continue.

Vào mục Plots, tích chọn vào Histogram và Normal probability plot, kéo biến ZRESID thả vào ô Y, kéo biến ZPRED thả vào ô X như hình bên dưới. Tiếp tục chọn Continue.

Các mục còn lại chúng ta sẽ để mặc định. Quay lại giao diện ban đầu, mục Method là các phương pháp đưa biến vào, tùy vào dạng nghiên cứu mà chúng ta sẽ chọn Enter hoặc Stepwise. Tính chất đề tài thực hành là nghiên cứu khẳng định, do vậy mình sẽ chọn phương pháp Enter đưa biến vào một lượt. Tiếp tục nhấp vào OK

SPSS sẽ xuất ra rất nhiều bảng, chúng ta sẽ tập trung vào các bảng ANOVA, Model Summary, Coefficients và ba biểu đồ Histogram, Normal P-P Plot, Scatter Plot.

3. Hướng dẫn đọc kết quả mô hình hồi quy

BẢNG TỔNG HỢP HƯỚNG DẪN ĐỌC KẾT QUẢ MÔ HÌNH HỒI QUY TUYẾN TÍNH TRÊN SPSS

Bảng kết quả trong SPSS Chỉ số cần đọc Ý nghĩa & cách diễn giải đúng Ngưỡng / Quy tắc sử dụng Lưu ý khi nhận xét
Model Summary R Square (R²) Tỷ lệ % biến thiên của biến phụ thuộc được giải thích bởi các biến độc lập R² càng cao → mô hình giải thích càng tốt Không dùng R² để so sánh mô hình có số biến khác nhau
Adjusted R Square R² đã hiệu chỉnh theo cỡ mẫu và số biến Ưu tiên dùng khi nhận xét mô hình Khuyến nghị sử dụng khi viết luận văn
Durbin–Watson Kiểm tra hiện tượng tự tương quan của phần dư 1.5 < DW < 2.5 Ngoài khoảng → vi phạm giả định
ANOVA F Kiểm định sự phù hợp tổng thể của mô hình F càng lớn → mô hình càng phù hợp Không đọc F nếu Sig. (ANOVA) không đạt
Sig. (ANOVA) Kiểm định mô hình hồi quy có ý nghĩa thống kê hay không Sig. < 0.05 ≥ 0.05 → dừng phân tích
Coefficients Sig. (t-test) Kiểm định ý nghĩa thống kê của từng biến độc lập Sig. < 0.05 Sig. > 0.05 không bắt buộc phải loại biến
B (chưa chuẩn hóa) Dùng để viết phương trình hồi quy và dự báo giá trị Y Áp dụng khi viết phương trình hồi quy Không dùng để so sánh mức độ ảnh hưởng
Beta (chuẩn hóa) So sánh mức độ tác động tương đối giữa các biến độc lập So sánh |Beta| Beta lớn → tác động mạnh
VIF Kiểm tra hiện tượng đa cộng tuyến VIF < 2 tốt; < 5 chấp nhận; < 10 tạm chấp nhận ≥ 10 → đa cộng tuyến nghiêm trọng

3.1 Bảng Model Summary

Sau khi biết mô hình phù hợp, ta cần biết các biến độc lập giải thích được bao nhiêu phần trăm sự biến thiên của biến phụ thuộc. Ta sử dụng hệ số xác định R2.

Kết quả:

  • Hệ số Rhiệu chỉnh (Adjusted R Square) = 0.618.

    • Ý nghĩa: 6 biến độc lập đưa vào mô hình (GC, TC, ĐU, ĐC, NL, HH) giải thích được 61,8% sự thay đổi của biến phụ thuộc (Sự hài lòng - HL).

    • Còn lại 38,2% sự biến thiên của HL là do các yếu tố khác ngoài mô hình và sai số ngẫu nhiên.

  • Chỉ số Durbin-Watson = 1.814.

    • Giá trị này nằm trong khoảng an toàn 1.5 < DW < 2.5. Không xảy ra hiện tượng tự tương quan chuỗi bậc nhất trong mô hình (theo Yahua Qiao, 2011).

3.2 Bảng ANOVA

Bước đầu tiên, chúng ta cần xác định xem mô hình hồi quy tuyến tính được xây dựng có phù hợp với tập dữ liệu nghiên cứu hay không. Chúng ta sử dụng kiểm định F trong bảng ANOVA với cặp giả thuyết:

  • H0: R2 = 0 (Mô hình hồi quy không phù hợp).

  • H0: R2  ≠ 0 (Mô hình hồi quy phù hợp).

Kết quả:

  • Giá trị thống kê F = 51,946.

  • Giá trị Sig. < 0.001.

  • Vì Sig. < 0.05, ta bác bỏ giả thuyết H0 và chấp nhận H1. Mô hình hồi quy tuyến tính là phù hợp với dữ liệu và có thể sử dụng được. Các biến độc lập có khả năng giải thích cho biến phụ thuộc.

3.3 Bảng Coefficients và phương trình hồi quy tuyến tính đa biến

Bảng Coefficients trong kết quả hồi quy tuyến tính đa biến của SPSS được sử dụng để đánh giá mức độ đóng góp của từng biến độc lập vào mô hình, thông qua kiểm định t (Student), đồng thời cung cấp các hệ số hồi quy phục vụ cho việc diễn giải và xây dựng phương trình hồi quy.

3.3.1 Kiểm định ý nghĩa hệ số hồi quy 

Tại bảng Coefficients, SPSS thực hiện kiểm định t cho từng hệ số hồi quy riêng lẻ với giả thuyết:

  • H₀: Hệ số hồi quy của biến độc lập bằng 0 (biến không có tác động đến biến phụ thuộc).

  • H₁: Hệ số hồi quy của biến độc lập khác 0 (biến có tác động đến biến phụ thuộc).

Việc ra quyết định dựa trên giá trị Sig. (p-value):

  • Nếu Sig. < 0.05, bác bỏ H₀ → biến độc lập có tác động có ý nghĩa thống kê.

  • Nếu Sig. > 0.05, chấp nhận H₀ → biến độc lập không có ý nghĩa thống kê trong mô hình.

3.3.2 Phân tích kết quả bảng Coefficients

Quan sát cột Sig. trong bảng Coefficients của ví dụ nghiên cứu cho thấy:

  • Biến Hữu hình (HH) có giá trị Sig. = 0.219 > 0.05, do đó không có ý nghĩa thống kê trong mô hình hồi quy. Nói cách khác, biến Hữu hình không có sự tác động đến biến phụ thuộc Sự hài lòng của khách hàng (HL) trong tổng thể nghiên cứu.

  • Các biến còn lại gồm Tin cậy (TC), Đáp ứng (ĐU), Đồng cảm (ĐC), Năng lực (NL) và Giá cả (GC) đều có giá trị Sig. nhỏ hơn 0.05 (thậm chí nhỏ hơn 0.01). Điều này cho thấy các biến này đều có tác động có ý nghĩa thống kê đến sự hài lòng của khách hàng.

Các hệ số hồi quy của các biến TC, ĐU, ĐC, NL và GC đều mang dấu dương, phản ánh các yếu tố này tác động thuận chiều đến sự hài lòng của khách hàng.

3.3.3 Ý nghĩa của hệ số B và hệ số Beta

Trong bảng Coefficients, SPSS cung cấp hai loại hệ số hồi quy với chức năng khác nhau:

  • Hệ số hồi quy chưa chuẩn hóa (Unstandardized Coefficients – B):
    Được sử dụng để xây dựng phương trình hồi quy và dự báo giá trị cụ thể của biến phụ thuộc.

  • Hệ số hồi quy chuẩn hóa (Standardized Coefficients – Beta):
    Được sử dụng để so sánh mức độ ảnh hưởng tương đối giữa các biến độc lập, do các biến đã được chuẩn hóa về cùng một đơn vị đo lường.

Dựa trên giá trị tuyệt đối của hệ số Beta, có thể xếp hạng mức độ ảnh hưởng của các yếu tố trong mô hình. Trong ví dụ này, các biến Tin cậy (TC) và Năng lực (NL) là những yếu tố có mức độ ảnh hưởng tương đối mạnh hơn đến sự hài lòng của khách hàng so với các biến còn lại.

3.3.4 Kết luận các giả thuyết nghiên cứu

Nội dung giả thuyết Hệ số hồi quy chuẩn hóa (Beta) Giá trị Sig. Kết luận Mức độ ảnh hưởng
H1: Sự tin cậy (TC) tác động cùng chiều (+) đến Sự hài lòng (HL) 0,423 0,000 Chấp nhận giả thuyết H1 1
H2: Khả năng đáp ứng (DU) tác động cùng chiều (+) đến Sự hài lòng (HL) 0,243 0,000 Chấp nhận giả thuyết H2 3
H3: Phương tiện hữu hình (HH) tác động cùng chiều (+) đến Sự hài lòng (HL) 0,070 0,219 Bác bỏ giả thuyết H3
H4: Sự đồng cảm (DC) tác động cùng chiều (+) đến Sự hài lòng (HL) 0,147 0,005 Chấp nhận giả thuyết H4 5
H5: Năng lực phục vụ (NL) tác động cùng chiều (+) đến Sự hài lòng (HL) 0,276 0,000 Chấp nhận giả thuyết H5 2
H6: Giá cả dịch vụ (GC) tác động cùng chiều (+) đến Sự hài lòng (HL) 0,197 0,000 Chấp nhận giả thuyết H6 4

Kết quả hồi quy cho thấy chấp nhận các giả thuyết H1, H2, H4, H5 và H6 do các nhân tố tương ứng có ý nghĩa thống kê (Sig. < 0,05); bác bỏ giả thuyết H3 vì nhân tố Phương tiện hữu hình không đạt ý nghĩa thống kê (Sig. > 0,05).

Kết quả phân tích hồi quy cho thấy các nhân tố trong mô hình có mức độ ảnh hưởng khác nhau đến Sự hài lòng. Trong đó, Sự tin cậy (TC) là yếu tố có tác động mạnh nhất đến Sự hài lòng của khách hàng (β = 0,423; Sig. = 0,000), xếp thứ nhất. Tiếp theo là Năng lực phục vụ (NL) (β = 0,276; Sig. = 0,000) và Khả năng đáp ứng (DU) (β = 0,243; Sig. = 0,000), lần lượt xếp thứ 2 và thứ 3. Giá cả dịch vụ (GC) có mức độ ảnh hưởng trung bình (β = 0,197; Sig. = 0,000), xếp thứ 4, trong khi Sự đồng cảm (DC) có tác động yếu hơn (β = 0,147; Sig. = 0,005), xếp thứ 5. Riêng Phương tiện hữu hình (HH) có hệ số Beta thấp nhất (β = 0,070; Sig. = 0,219) và không có ý nghĩa thống kê, cho thấy yếu tố này chưa ảnh hưởng rõ rệt đến Sự hài lòng trong mô hình nghiên cứu.

3.3.5 Đánh giá hiện tượng đa cộng tuyến

Hiện tượng đa cộng tuyến được đánh giá thông qua hệ số phóng đại phương sai (VIF). Kết quả cho thấy hệ số VIF của các biến độc lập dao động từ 1.198 đến 1.590, tất cả đều nhỏ hơn 2.

Do đó, có thể kết luận rằng mô hình hồi quy không vi phạm giả định đa cộng tuyến, và các ước lượng hồi quy là đáng tin cậy.

3.3.6 Xây dựng phương trình hồi quy tuyến tính đa biến

Căn cứ vào bảng Coefficients trong kết quả phân tích hồi quy tuyến tính đa biến trên SPSS, phương trình hồi quy được xác định như sau:

HL = −1,285+ 0,434×TC +0,335×DU + 0,135×DC +0,228×NL +0,157×GC +ε

Trong đó:

  • Y: Biến phụ thuộc

  • TC: Tin cậy

  • DU: Đáp ứng

  • HH: Hữu hình

  • DC: Đồng cảm

  • NL: Năng lực

  • GC: Giá cả

  • –1,285: Hệ số hằng số (Constant)

  • ε: Sai số ngẫu nhiên

Khi các yếu tố Tin cậy, Đáp ứng, Đồng cảm, Năng lực và Giá cả tăng lên thì sự hài lòng của khách hàng cũng tăng tương ứng, trong khi yếu tố Hữu hình không chứng minh được vai trò tác động trong mô hình nghiên cứu.

Khi trình bày phương trình hồi quy tuyến tính đa biến trong SPSS, cần lưu ý:

  • Hằng số (constant) chỉ nên đưa vào khi sig của hằng số có ý nghĩa thống kê.
  • Chỉ đưa vào phương trình hồi quy các biến độc lập có ý nghĩa thống kê; các biến không có ý nghĩa không cần loại lại để chạy lần hai và không trình bày trong phương trình cuối cùng.
  • Hệ số hồi quy mang dấu âm hoặc dương phải được giữ nguyên theo kết quả ước lượng để phản ánh đúng chiều tác động.
  • Các biến như giá cả, chi phí, rủi ro thường có xu hướng tác động ngược chiều, tuy nhiên dấu của hệ số phụ thuộc vào cách xây dựng câu hỏi và định hướng thang đo trong bảng khảo sát.
  • Luôn bổ sung sai số ngẫu nhiên (ε) ở cuối phương trình hồi quy.
  • Hệ số hồi quy chuẩn hóa (Beta) được xác định trên cơ sở các biến đã được chuẩn hóa về cùng thang đo với giá trị trung bình bằng 0 và độ lệch chuẩn bằng 1. Do các biến không còn giữ đơn vị đo lường ban đầu, hệ số Beta không phản ánh mức độ thay đổi tuyệt đối của biến phụ thuộc khi biến độc lập thay đổi một đơn vị, mà chỉ thể hiện mức độ ảnh hưởng tương đối giữa các biến độc lập trong cùng một mô hình hồi quy. Vì vậy, hệ số Beta chủ yếu được sử dụng để so sánh mức độ tác động của các biến độc lập, trong khi việc xây dựng phương trình hồi quy và dự báo kết quả cần dựa trên các hệ số hồi quy chưa chuẩn hóa (B) (Hoàng Trọng & Chu Nguyễn Mộng Ngọc, 2008; Hair et al., 2019).

4. Đánh giá biểu định hồi quy qua biểu đồ

4.1 Biểu đồ tần số phần dư chuẩn hóa Histogram

Phần dư có thể không tuân theo phân phối chuẩn vì những lý do như: sử dụng sai mô hình, phương sai không phải là hằng số, số lượng các phần dư không đủ nhiều để phân tích... Vì vậy, chúng ta cần thực hiện nhiều cách khảo sát khác nhau. Một cách khảo sát đơn giản nhất là xây dựng biểu đồ tần số của các phần dư Histogram ngay dưới đây. Một cách khác nữa là căn cứ vào biểu đồ P-P Plot ở mục sau.

 

Trên biểu đồ Histogram, đường cong phân phối chuẩn (màu đen) được vẽ chồng lên các cột tần suất của phần dư. Quan sát hình ảnh thực tế, ta thấy hình dạng của các cột tần suất khá tương đồng với đường cong chuẩn hình chuông úp ngược. Giá trị trung bình (Mean) của phần dư xấp xỉ bằng 0 (Mean = -9.70E-16) và độ lệch chuẩn (Std. Dev.) là 0.985 (gần bằng 1). Điều này cho thấy phần dư có phân phối xấp xỉ chuẩn.

4.2 Biểu đồ phần dư chuẩn hóa Normal P-P Plot

Ngoài cách kiểm tra bằng biểu đồ Histogram, thì P-P Plot cũng là một dạng biểu đồ được sử dụng phổ biến giúp nhận diện sự vi phạm giả định phần dư chuẩn hóa.

Đối với biểu đồ Normal P-P Plot, nếu các điểm dữ liệu trong phân phối của phần dư bám sát vào đường chéo, phần dư càng có phân phối chuẩn. Nếu các điểm dữ liệu phân bố xa đường chéo, phân phối càng “ít chuẩn”.

4.3 Biểu đồ Scatter Plot kiểm tra giả định liên hệ tuyến tính

Một giả định trong hồi quy là phải có mối liên hệ tuyến tính giữa biến phụ thuộc với các biến độc lập. Biểu đồ phân tán Scatter Plot giữa các phần dư chuẩn hóa và giá trị dự đoán chuẩn hóa giúp chúng ta dò tìm xem dữ liệu hiện tại có vi phạm giả định liên hệ tuyến tính hay không. 

 

Chúng ta quan sát sự phân bố của các điểm phần dư dọc theo trục hoành (giá trị dự đoán). Các điểm dữ liệu phân tán khá đều đặn trong khoảng từ -2 đến +2, không có hiện tượng "loa kèn" (tức là độ tản mát tăng dần hoặc giảm dần theo chiều ngang). Sự phân bố đồng đều này cho thấy phương sai của phần dư là đồng nhất.

 Qua quá trình kiểm định các giả định bằng biểu đồ trực quan, chúng ta có thể kết luận rằng mô hình hồi quy tuyến tính đã xây dựng là phù hợp, tin cậy và không vi phạm các giả định quan trọng của phương pháp OLS. Kết quả ước lượng các hệ số hồi quy ở phần trước hoàn toàn có giá trị sử dụng cho việc dự báo và ra quyết định.

Để hạn chế sai sót trong quá trình xử lý dữ liệu và đảm bảo kết quả phân tích phản ánh đúng bản chất nghiên cứu, bạn nên tham khảo thêm bài viết tổng hợp những điều cần lưu ý khi chạy SPSS cho kết quả tốt , trong đó trình bày toàn diện các vấn đề quan trọng từ chuẩn bị dữ liệu, kiểm định thang đo đến phân tích và diễn giải kết quả.

------------------------

Resdata hỗ trợ bạn những gì?

 ✅ Tư vấn & định hướng toàn bộ quy trình xử lý dữ liệu SPSS: Rà soát thang đo, phát hiện và xử lý các biến không phù hợp, đồng thời định hướng từng bước phân tích (Cronbach’s Alpha, EFA, hồi quy/SEM…) theo đúng bản chất dữ liệu, bối cảnh nghiên cứu và mục tiêu đề tài, giúp kết quả phản ánh thực tế nghiên cứu và đáp ứng yêu cầu học thuật.

✅ Hỗ trợ SPSS 1 kèm 1 qua ultraview: Hướng dẫn chi tiết từng bước thực hành và cách viết nhận xét chuẩn học thuật.

✅ Xử lý nhanh – đúng chuẩn: Xử lý kết quả trong ngày. Phù hợp cho khóa luận, luận văn, luận án và bài báo khoa học.

✅ Cam kết chỉnh sửa theo góp ý của giảng viên/hội đồng cho đến khi đạt yêu cầu.

Nếu bạn đang gặp phải các tình huống trên và chưa tìm được hướng xử lý phù hợp, đừng ngần ngại liên hệ ngay: Hotline: 0907 786 895.

Resdata luôn sẵn sàng đồng hành cùng bạn với phương châm: Nhanh chóng – Tin cậy – Bảo mật – Chi phí hợp lý.

 

BÀI LIÊN QUAN

Những điều cần lưu ý khi chạy SPSS cho kết quả tốt

Cách cài đặt SPSS 26 & 27 cho sinh viên: Hướng dẫn chi tiết

8 Bước hướng dẫn thực hành hồi quy đa biến trên Spss

Hướng dẫn thực hành đọc kết quả Cronbachs Alpha

Copyright © DỊCH VỤ KHẢO SÁT NGHIÊN CỨU THỊ TRƯỜNG VÀ XỬ LÝ SỐ LIỆU RESDATA

Gửi email Hỗ trợ Zalo