Phân tích EFA, CFA và SEM với R

Phân tích EFA, CFA và SEM với R

Lê Văn Tuấn

Đại học Thương mại

Tóm tắt. Bài viết giới thiệu các phương pháp phân tích EFA, CFA và mô hình SEM. Các câu lệnh trên phần mềm R được trình bày đầy đủ nhằm cung cấp cho bạn đọc công cụ để thực hiện các phân tích/ mô hình này. Bộ dữ liệu được sử dụng trong chạy mô hình là bộ dữ liệu khảo sát thực tế để nghiên cứu về lòng trung thành của nhân viên.

Phiên bản: 9/2021

1. Mở đầu

a) Phân tích EFA

Trong thống kê đa biến, phân tích nhân tố khám phá (Exploratory Factor Analysis – EFA) là một phương pháp thống kê được sử dụng để khám phá cấu trúc cơ bản của một tập hợp các biến tương đối lớn. EFA là một kỹ thuật trong phân tích nhân tố (Factor Analysis) có mục tiêu bao quát là xác định các mối quan hệ cơ bản giữa các biến được đo lường. Nó thường được các nhà nghiên cứu sử dụng khi phát triển thang đo (thang đo là tập hợp các câu hỏi được sử dụng để đo lường một chủ đề nghiên cứu cụ thể) và dùng để xác định một tập hợp các cấu trúc tiềm ẩn bên dưới một loạt các biến được đo lường. Nó nên được sử dụng khi nhà nghiên cứu không có giả thuyết tiên nghiệm về các nhân tố hoặc mô hình của các biến được đo lường. Thông thường, các nhà nghiên cứu sẽ có một số lượng lớn các biến được đo lường, được giả định là có liên quan đến một số lượng nhỏ hơn các nhân tố “không được quan sát”. Các nhà nghiên cứu phải xem xét cẩn thận số lượng các biến được đo lường để đưa vào phân tích. Các thủ tục EFA chính xác hơn khi mỗi nhân tố được đại diện bởi nhiều biến đo lường trong phân tích.

EFA dựa trên mô hình nhân tố chung. Trong mô hình này, các biến biểu hiện được biểu thị dưới dạng một hàm của các nhân tố chung, nhân tố duy nhất và sai số đo lường. Mỗi nhân tố duy nhất chỉ ảnh hưởng đến một biến biểu hiện và không giải thích mối tương quan giữa các biến biểu hiện. Các nhân chung ảnh hưởng đến nhiều hơn một biến biểu hiện và các hệ số tải nhân tố (Factor Loading) là các thước đo mức độ ảnh hưởng của một nhân tố chung đến một biến biểu hiện. Đối với quy trình EFA, chúng ta quan tâm nhiều hơn đến việc xác định các nhân tố chung và các biến biểu hiện liên quan.

b) Phân tích CFA

Trong thống kê, phân tích nhân tố khẳng định (Confirmatory Factor Analysis – CFA) là một dạng phân tích nhân tố đặc biệt. Nó được sử dụng để kiểm tra xem các thước đo của một cấu trúc có phù hợp với sự hiểu biết của nhà nghiên cứu về bản chất của cấu trúc (hoặc nhân tố) đó hay không. Như vậy, mục tiêu của CFA là kiểm tra xem dữ liệu có phù hợp với mô hình đo lường giả định hay không. Mô hình giả thuyết này dựa trên lý thuyết và/hoặc nghiên cứu phân tích trước đó.

Trong phân tích nhân tố khẳng định, nhà nghiên cứu trước tiên phát triển một giả thuyết về những nhân tố mà họ tin rằng đang làm cơ sở cho các biện pháp được sử dụng và có thể áp đặt các ràng buộc đối với mô hình dựa trên các giả thuyết tiên nghiệm này. Bằng cách áp đặt những ràng buộc này, nhà nghiên cứu đang buộc mô hình phải phù hợp với lý thuyết của họ.

Cả EFA và CFA đều được sử dụng để hiểu phương sai chung của các biến đo lường được cho là do một nhân tố hoặc cấu trúc tiềm ẩn. Tuy nhiên, bất chấp sự tương đồng này, EFA và CFA là những phân tích khác biệt về mặt thống kê và khái niệm. Mục tiêu của EFA là xác định các nhân tố dựa trên dữ liệu và tối đa hóa lượng phương sai được giải thích. Nhà nghiên cứu không bắt buộc phải có bất kỳ giả thuyết cụ thể nào về việc có bao nhiêu nhân sẽ xuất hiện, và những nhân tố này sẽ bao gồm những mục hoặc biến nào. Nếu các giả thuyết này tồn tại, chúng không được đưa vào và không ảnh hưởng đến kết quả của các phân tích thống kê. Ngược lại, CFA đánh giá các giả thuyết tiên nghiệm và phần lớn được thúc đẩy bởi lý thuyết. Các phân tích CFA yêu cầu nhà nghiên cứu đưa ra giả thuyết trước về số lượng các nhân tố, liệu các nhân tố này có tương quan hay không và các mục/thước đo nào ảnh hưởng đến và phản ánh các nhân tố nào. Như vậy, trái ngược với EFA, trong đó tất cả các tải đều có thể thay đổi tự do, CFA cho phép giới hạn rõ ràng của một số tải nhất định bằng 0.

c) Mô hình SEM

Mô hình phương trình cấu trúc SEM (Structural Equation Modelling) là một kỹ thuật mô hình thống kê rất tổng quát. Sự quan tâm trong SEM thường là vào các kiến trúc lý thuyết (các khái niệm lý thuyết), được trình bày bởi các nhân tố ngầm (các khái niệm tiềm ẩn). Các quan hệ giữa các kiến trúc lý thuyết được trình bày bởi các hệ số hồi quy hay hệ số đường dẫn giữa các nhân tố. SEM ám chỉ một cấu trúc của các hiệp tương quan (covariances_hiệp phương sai) giữa các biến được quan sát, các quan hệ này cho ra một tên khác là mô hình hóa cấu trúc hiệp tương quan (covariance structure modeling_mô hình cấu trúc hiệp phương sai). Tuy nhiên, mô hình có thể được mở rộng thêm bao gồm trung bình của các biến quan sát được hoặc các nhân tố trong mô hình, làm cho tên mô hình hóa cấu trúc hiệp tương quan ít chính xác. Nhiều nhà nghiên cứu chỉ đơn giản nghĩ mô hình loại này là các mô hình LISREL (LInear Structural RELations (các quan hệ cấu trúc tuyến tính)), điều này cũng ít chính xác. Các mô hình phương trình cấu trúc ngày nay không nhất thiết phải tuyến tính, và khả năng mở rộng của SEM xa hơn phương trình LISREL ban đầu.

SEM liên quan đến việc xây dựng một mô hình, một biểu diễn mang tính thông tin của một số hiện tượng lý thuyết hoặc quan sát được. Trong mô hình này, các khía cạnh khác nhau của một hiện tượng được giả thiết có liên quan với nhau theo một cấu trúc. Cấu trúc này là một hệ phương trình, nhưng nó thường được thiết kế trên giấy hoặc sử dụng máy tính với các mũi tên và ký hiệu. Cấu trúc này ngụ ý các mối quan hệ thống kê và thường là nhân quả giữa các biến, các sai số và có thể bao gồm nhiều phương trình.

Mô hình SEM bao gồm nhiều kỹ thuật thống kê khác nhau như phân tích đường dẫn (Path Analysis), phân tích nhân tố khẳng định (Confirmatory Factor Analysis), mô hình nhân quả với các biến tiềm ẩn (Causal modeling with Latent variable, và cũng thường gọi là SEM), và thậm chí cả phân tích phương sai (Analysis of Variance), mô hình hồi quy tuyến tính bội (Multiple Linear Regression).

2. Đọc dữ liệu

3. Phân tích EFA với R

4. Phân tích CFA với R

5. Mô hình SEM với R

download bài viết đầy đủ:

link download dữ liệu: Khao sat nhan vien.csv (dropbox.com)

2 bình luận

  1. […] Phân tích EFA, CFA và SEM với R […]

Bình luận về bài viết này