Mô hình Bayesian VAR

Mô hình Bayesian VAR

(Tác giả: Minh Anh – Nguồn: kinhteking.wordpress.com)

Đây là một bài giới thiệu rất rất rất ngắn về mô hình BVAR, xem như là khai vị và “kích não” cho bạn nào thích tò mò. Đây là con đường “lắm gai” đấy, nhưng có thể sẽ là “heroin” gây nghiện với một số đồng chí 🙂

Mô hình VAR là một mô hình phổ biến trong phân tích chuỗi thời gian. Các chủ đề liên quan đến đến mô hình VAR gồm có: mô hình giản lược (reduced form VAR), xác định mô hình cấu trúc (structural VAR) từ mô hình giản lược, hàm phản ứng, phân tích phương sai…
Ví dụ một mô hình VAR với p=4 độ trễ VAR(4) với 3 biến nội sinh Y_{1}, Y_{2}, Y_{3} có dạng như sau:

Y_{t}=c+ B_{1}Y_{t-1}+ B_{2}Y_{t-2}+ B_{3}Y_{t-3} +B_{4}Y_{t-4} +v_{t}
trong đó Y_{t}=(Y_{1t},Y_{2t},Y_{3t})'

Thông thường, việc ước lượng mô hình VAR đòi hỏi phải ước lượng khá nhiều tham số. Ví dụ như một mô hình VAR 3 biến – lạm phát, sản lượng, và lãi suất – và bốn mức trễ (lag=4) như thường được sử dụng với số liệu theo quý. Mô hình này gồm có 42 tham số cần phải ước lượng: 1*3 hằng số (intercepts), 12*3 tham số của biến trễ, và 3 tham số của phương sai. Nếu có 80 số liệu theo quý (20 năm), thì việc ước lượng mô hình VAR như vậy thường có tính chính xác không cao (vì mức độ tự do- degrees of freedom- bị hạn chế), và hệ quả là các các dự báo thường đó độ lệch chuẩn lớn (biên dự báo rộng).

Do vậy, các nhà kinh tế lượng Bayesian đã đề xuất việc kết hợp thông tin tiền định –prior information (dựa vào các lý thuyết kinh tế hay các kết quả nghiên cứu từ các quốc gia khác) vào việc ước lượng các mô hình VAR. Cách tiếp cận lồng ghép này còn được gọi là BVAR. Nếu hiểu nôm na là thế này: cái “anh” dữ liệu không đủ thông tin để đạt được các ước lượng ý nghĩa thì mình kết hợp thêm cái thông tin có được từ “chị” lý thuyết (hay là chị thực nghiệm, chị kinh nghiệm, gì gì đấy) vào, để có thể có được những ước lượng ý nghĩa, và qua đó nâng cao khả năng dự báo các biến vĩ mô.

Để sử dụng BVAR, nhà nghiên cứu đưa các thông tin tiền định liên quan đến các tham số của mô hình (hằng số, tham số của biến trễ, hay phương sai của biến nhiễu). Một vài dạng thông tin tiền định phổ biến như:

1)Thông tin tiền định Minnesota (vì nguồn gốc của thông tin này là từ Fed Minnesota): dựa trên giả thuyết rằng các biến nội sinh trong mô hình VAR có dạng bước tự do (random walk process) hoặc theo dạng AR (1).

2)Thông tin tiền định Normal Inverse Wishart prior: có 2 dạng

* Thông tin tiền đinh ghép đôi tự nhiên (natural conjugate prior) -các thông số của mô hình VAR có phân phối tiền nghiệm là phân phối chuẩn, và ma trận hiện phương sai (variance-covariance matrix) có phân phối Inverse Wishart.

* Thông tin tiền định independent Normal inverse Wishart prior: Ví dụ như khi muốn xem xét tham số trễ của một biến nội sinh khác với tham số trễ của các biến khác (ví dụ như giới hạn liên quan đến giả định tính trung tính của tiền: money neutrality)

3)Thông tin tiền định trạng thái cân bằng (Steady State priors) và một số thông tin tiền định khác

Trên đây chỉ là một vài giới thiệu để “khêu gợi”” trí tò mò của các bạn. Để học BVAR các bạn có thể tham khảo các tài liệu sau:

1)Tài liệu khóa học (slides và MATLAB codes) về kinh tế lượng của GS. Gary Koop.
Link: https://sites.google.com/site/garykoop/teaching/sgpe-bayesian-econometrics

2)BEAR Toolbox 3.0 (sử dụng với MATLAB): được phát triển bởi Alistair Dieppe, Romain Legrand, và Björn van Roye – nhóm nghiên cứu Ngân hàng Trung Ương châu Âu

3)MSBVAR(Sử dụng với R): của hai nhà nghiên cứu Patrick Brandt và W. Ryan Davis


Xem thêm: Kiểm soát thông tin tiền định trong mô hình BVAR

Bạn đọc Yi có hỏi rằng: “”Hiện trong function “szbvar” và “msbvar” của R package này em thấy tác giả đã mặc định thông số lambda để fit model, rồi từ đó chạy ra dự báo. Em có thắc mắc nhỏ là có function nào chọn ra được các thông số này để tối thiểu hóa được sai số dự báo không ạ”

Đây là một câu hỏi hay và quan trọng ở khía cạnh ứng dụng. Mục đích của lambda chính là kiểm soát vai trò của thông tin tiền định.

+ Nếu thông tin tiền định quá chặt (tight prior) – nghĩa là phụ thuộc nhiều vào thông tin tiền định, thì kết quả hậu nghiệm sẽ không khác mấy so với thông tin tiền định. Đây chính là điểm thường bị chỉ trích của tiếp cận Bayesian, vì người nghiên cứu có thể sử dụng thông tin tiền định để “lái” kết quả. Do vậy, trong trường hợp này, thông tin từ data không có nhiều ảnh hưởng đến kết quả.
+ Ngược lại, nếu thông tin tiền định quá lỏng, thì nó sẽ không có ích và kết quả sẽ chủ yếu phụ thuộc vào data.

Do vậy, giá trị của lambda nên nằm giữa hai thái cực này. Việc xác định những giá trị này là một câu hỏi không phải dễ trả lời. Một vài nghiên cứu hướng dẫn về việc xây dựng thông tin tiền nghiệm trong một số trường hợp. Ví dụ như , nghiên cứu của De Mol và công sự (2008, JoE) “Forecasting using a large number of predictors: Is Bayesian shrinkage a valid alternative to principal components?“ (Link WP: https://www.ecb.europa.eu/pub/pdf/scpwps/ecbwp700.pdf?ffd9f4561990919f315127a2eee70375).

Tuy nhiên, phần lớn các nghiên cứu dựa trên đề xuất của Canova (Chương 10, 2007) “Methods for Applied Macroeconomic Research“ với Minnesota prior. Giáo sư Fabio chia sẻ chương này ở trên website cá nhân: http://apps.eui.eu/Personal/Canova/Articles/ch10.pdf (Đoạn cuối Trang 358) (Chú ý là ký hiệu GS Fabio dùng là phi). Các giá trị này có thể sử dụng như benchmark hoặc là điểm bắt đầu cho những nghiên cứu sâu hơn.

Như đã đề cập trong bài trước về việc sử dụng BVAR, nếu bạn nào đã quen dùng R, thì có thể sử dụng MSBVAR package (Liên quan đến câu hỏi trên: Giá trị của thông số lambda trong MSBVAR được quyết định bởi người sử dụng). Tuy nhiên, với các bạn mới bắt đầu, thì có lẽ sử dụng toolbox BEAR (MATLAB) sẽ dễ dàng hơn (xem hướng dẫn sử dụng ở đây).

———————–&&&———————–

Mô hình GAS

Mô hình GAS (Generalized Autoregressive Score)

(Nguồn: http://www.gasmodel.com)

Mô hình Điểm tự hồi quy tổng quát hóa [Generalized Autoregressive Score (GAS)] – còn có tên gọi khác là mô hình Điểm có điều kiện động [Dynamic Conditional Score (DCS)] hay Score Driven (SD) model, hoặc Dynamic Score (DySco) model – ra đời năm 2008. Mô hình này cung cấp một khung tổng quát để mô hình hóa các đại lượng biến thiên theo thời gian qua mô hình tham số [trường hợp riêng của mô hình GAS là mô hình Beta-t-(E)GARCH].  Các đặc điểm chính:

  • Dễ ước lượng & suy diễn: likelihood có dạng đóng (closed form)
  • Tổng quát hóa: tất cả các trường hợp có tham số thay đổi theo thời gian.

Nordpool Electricity Prices

GAS estimated volatility paths for Nordpool electricity prices based on the Student’s t distribution and the Gaussian distribution. The Gaussian GAS volatility model coincides with the familiar GARCH model

Mô hình này được áp dụng thành công trong nhiều lĩnh vực như mô hình hóa rủi ro tín dụng & phá sản, mô hình hóa sự tương quan và độ biến động của cổ phiếu, mô hình hóa các cấu trúc phụ thuộc biến đổi theo thời gian, mô hình hóa CDS spread; các vấn đề liên quan tới sự ổn định tài chính & rủi ro hệ thống, mô hình hóa dữ liệu tần suất cao, …

Xem các thông tin về mô hình này [bài báo, câu lệnh (R, Matlab, Ox)] trên trang: http://www.gasmodel.com


Xem thêm: https://insightr.wordpress.com/2017/06/07/non-gaussian-time-series-lets-handle-it-with-score-driven-models/

—————-&&&—————-

Chocolate và giải Nobel

Chocolate

(Tác giả: Lê Hồng Giang – Nguồn: kinhtetaichinh.blogspot.com)

Trong dịp Easter vừa rồi Felix Salmon tweet đồ thị sau về mối quan hệ giữa số lượng tiêu thụ chocolate bình quân đầu người của một quốc gia với số giải Nobel (trong 10 triệu dân) mà quốc gia đó đạt được:



Thoạt nhìn tôi nghĩ đây là một đồ thị marketing của các hãng sản xuất chocolate đang tồn hàng Easter, nhưng hóa ra theo Business Insider đây là kết quả của một bài nghiên cứu nghiêm túc đăng trên tạp chí New England Journal of Medicine, có lẽ là một trong những tạp chí hàng đầu về y khoa trên thế giới. Business Insider còn tìm được link của bản pdf miễn phí của bài nghiên cứu này và tôi không thể không đọc thử xem tác giả đã làm thế nào.

Hóa ra bài nghiên cứu vô cùng đơn giản. Tác giả download số liệuNobel laureates per capita từ Wikipedia (bao gồm cả giải Nobel hòa bình) và số liệu chocolate consumption per capita từ website của một số công ty sản xuất chocolate rồi chạy linear regression. Kết quả là correlation của hai biến số này rất cao (có thể thấy qua đồ thị trên) và highly significant. Tác giả cho rằng (dù rào trước đón sau rất nhiều) ăn nhiều chocolate sẽ làm tăng cognitive function vì chocolate có chứa nhiều chất flavonoids, do vậy làm tăng khả năng được giải Nobel.

Bất kỳ ai đã từng học qua một khóa econometrics sẽ thấy nghiên cứu này có nhiều vấn đề. Thứ nhất như chính tác giả đã thừa nhận correlation không phải causation, nhiều khả năng số giải Nobel và lượng chocolate consumption đều cùng do một yếu tố thứ ba quyết định, dễ thấy nhất là kinh tế (vd GDP per capita). Những yếu tố khác có thể ảnh hưởng lên số Nobel prize đáng ra tác giả phải control có thể là tỷ lệ đầu tư cho giáo dục, nghiên cứu, số lượng sinh viên đại học trên 1000 dân, số lượng bài báo khoa học hoặc patent, số lượng tiêu thụ các thực phẩm khác có hàm lượng flavonoids cao…

Thứ hai số lượng giải Nobel và chocolate consumption chắc chắn thay đổi theo thời gian. Ví dụ cụ thể là Thụy điển vài thập kỷ gần đây được rất ít giải Nobel so với khi giải này mới được thành lập. Bởi vậy sử dụng số liệu giải Nobel trong toàn bộ lịch sử (stock variable) so sánh với số lượng consumption của một năm (flow variable) đòi hỏi phải có một assumption là stock variable phân bổ đều theo thời gian còn flow variable không thay đổi, khó có thể đúng trên thực tế. Một người có cognitive function tốt (nên có khả năng được giải Nobel cao hơn) phải ăn nhiều chocolate lúc nhỏ, khi đi học, lúc làm nghiên cứu hay khi nào?

Thứ ba nếu ăn chocolate làm tăng cognitive ability thì một số kiểm chứng đơn giản hơn có thể thực hiện như chạy regression giữa lượng chocolate consumption với kết quả PISA, sẽ chính xác hơn so với số giải Nobel. Ngoài ra thay vì nghiên cứu “macro” như vậy tác giả có thể tiến hành nghiên cứu “micro”, nghĩa là so sánh số lượng tiêu thụ chocolate của từng cá nhân được giải Nobel (hoặc những người có thành tực khoa học cao như các giáo sư đại học) so với mức tiêu thụ trung bình. Tất nhiên làm nghiên cứu micro như vậy sẽ tốn kém và mất thời gian hơn so với việc download data từ Internet và chạy linear regression, nhưng một bài báo trên NEJE phải như vậy mới xứng đáng chứ. Hay tạp chí này không thực sự tốt như tôi tưởng?

————————————————————

Chocolate, xương, và giải Nobel

(Tác giả: Nguyễn Văn Tuấn – Nguồn: tuanvannguyen.blogspot.com)

Chocolate. Đại đa số dân thành thị và một số dân nông thôn đều biết, và thích chocolate. Nhưng cũng như bất cứ thực phẩm nào, chocolate cũng có lợi và có hại nếu ăn quá nhiều. Nhiều nghiên cứu y khoa cho thấy chocolate có lợi cho tim mạch, nhưng hình như không có lợi cho xương. Mấy tuần trước đây có một nghiên cứu làm ngỡ ngàng mọi người: chocolate có liên quan đến giải Nobel!


Khoảng 4 năm trước, đồng nghiệp Western Australia của tôi công bố một nghiên cứu cho thấy phụ nữ cao tuổi ăn nhiều chocolate có mật độ xương thấp [1]. Họ tính toán rằng những người ăn chocolate mỗi tuần ít nhất 1 lần có mật độ xương thấp hơn (khoảng 3%) so với những người ăn chocolate dưới 1 lần / tuần. Mật độ xương thấp hơn cũng có nghĩa là có nguy cơ gãy xương cao hơn. Chính vì thế mà nghiên cứu này làm dư luận xôn xao. Vừa xôn xao quan tâm, nhưng cũng vừa cười. Mật độ xương thấp hơn có 3% thì chẳng có ý nghĩa lâm sàng gì. Tôi nghĩ nếu tôi là người ăn chocolate mỗi tuần 1 lần thì tôi thấy vẫn chưa có lí do gì ngưng ăn loại kẹo đầy quyến rũ này.

Nhưng có lẽ ngạc nhiên hơn là mối liên hệ giữa chocolate và giải Nobel! Khó tin, nhưng có thật. Đó là công trình phân tích của bác sĩ Messerli (Đại học Columbia) đăng trên New England Journal of Medicine, một tập san được xem là kinh thánh y khoa [2]Trong bài này, ông thu thập dữ liệu về lượng chocolate tiêu thụ trong những quốc gia có người đoạt giải Nobel, và số giải Nobel cho từng quốc gia. Vì có sự khác biệt về dân số nên ông phải điều chỉnh cho dân số. Cách điều chỉnh của rất đơn giản:

  • ông tính toán lượng tiêu thụ chocolate trên mỗi người dân mỗi năm (tính bằng kg), gọi chỉ số này là X;
  • sau đó, ông tính số giải Nobel trên 10 triệu dân, gọi chỉ số này là Y;
  • sau cùng, ông tính hệ số tương quan (coefficient of correlation) giữa X và Y.

Biểu đồ sau đây cho thấy một xu hướng chung là những nước nào ăn nhiều (hay chính xác hơn là tiêu thụ nhiều) chocolate là những nước có nhiều giải Nobel. Chẳng hạn như Thuỵ Sĩ, nước tiêu thụ nhiều chocolate (khoảng 13 kg/người/năm) là nước có nhiều giải Nobel trên đầu người. China là nước ít tiêu thụ chocolate cũng là nước có ít giải Nobel nhất (thật ra, China chỉ có 1 giải duy nhất năm nay về văn học, nhưng cũng là giải thưởng mang tính chính trị, không thuyết phục). Hệ số tương quan giữa lượng tiêu thụ chocolate và số giải Nobel là 0.79, với trị số P < 0.0001, tức …. rất có ý nghĩa thống kê!

https://i0.wp.com/wmbriggs.com/blog/wp-content/uploads/2012/10/chocolate.nejm_.jpg

Biếu đồ mô tả mối liên quan giữa lượng chocolate tiêu thụ trên đầu người (trục hoành) và số giải Nobel tính trên 10 triệu dân (trục tung). Hệ số tương quan là 0.79.

Tại sao nước ăn nhiều chocolate lại là những nước đoạt nhiều giải Nobel? Bác sĩ Messerli lí giải rằng chocolate (hay những thực phẩm trong nhóm flavanol, có trong coca, trà, rượu đỏ, v.v.) có hiệu quả giảm huyết áp, tăng cường trí lực. Những chứng cứ trên được rút ra từ những nghiên cứu trên chuột. Tác giả đặt giả thuyết rằng ăn chocolate chẳng những tăng cường trí lực cho một cá nhân, mà còn cho cả cộng đồng. Do đó, kết quả phân tích này có vẻ phù hợp với giả thuyết của tác giả.

Thoạt đầu, đọc qua bài này tôi nghĩ tác giả muốn đùa. Đùa một cách … khoa học. Nhưng hình như không phải vậy, vì tác giả tỏ ra rất nghiêm túc trong diễn giải kết quả phân tích. Một giải thích khả dĩ khác có thể là liên quan nghịch đảo (reverse association). Hiện tượng liên quan nghịch đảo có nghĩa là người có trí lực tốt biết được hiệu quả tốt của kẹo chocolate nên họ ăn nhiều chocolate (chứ không phải ăn nhiều chocolate dẫn đến trí lực cao). Cũng có thể mối liên hệ giữa chocolate và giải Nobel là do trình độ phát triển kĩ nghệ và kinh tế, vì những nước phát triển ở phương Tây thường tiêu thụ nhiều chocolate hơn các nước nghèo hơn ở châu Á. Nhưng giả thuyết về trình độ phát triển kĩ nghệ không giải thích tại sao các nước như Mĩ cũng phát triển cao, nhưng giải Nobel trên đầu dân thì thấp hơn các nước như Thuỵ Sĩ, Đan Mạch, Na Uy, Anh, Đức, Thuỵ Điển.

Dù tác giả không đùa, nhưng tôi nghĩ tác giả muốn giễu cợt tập san New England Journal of Medicine. Nếu xem phân tích của tác giả là một “nghiên cứu” thì theo y học thực chứng, nghiên cứu này có giá trị rất thấp. Thấp là vì mối liên hệ giữa chocolate và giải Nobel thuộc loại ecologic association, với đơn vị phân tích là bình quân của một quốc gia, chứ không phải cá nhân. Chỉ khi nào tác giả “chứng minh” được những cá nhân đoạt giải Nobel ăn nhiều chocolate hơn những cá nhân không có giải Nobel thì kết quả mới có giá trị cao hơn.

Khi tính hệ số tương quan từ số quân bình thì lúc nào cũng có kết quả cao (như trường hợp này là 0.79), bởi vì cách tính này không xem xét đến những dao động trong mỗi quốc gia (within-country variation). Cái “nguỵ biện” hay fallacy của tác giả là ở chỗ này. Vì đơn vị là quốc gia, chứ không phải cá nhân, nên rất khó diễn giải kết quả này. Nếu theo cách suy luận của tác giả, tôi nghĩ cũng có thể nói rằng có mối liên quan giữa màu tóc và giải Nobel, giữa ăn thịt đỏ và giải Nobel (vì những nước giàu thường ăn thịt đỏ hơn là ăn rau quả như Á châu). Tác giả xem xét tất cả các yếu tố để giải thích cho mối liên quan, nhưng ông quên một lí do khác: ecologic fallacy! Có lẽ ecologic fallacy có thể dịch là ngụy biện quần thể.

Nếu có một bài mua vui cũng được một vài trống canh thì đây [2] chính là bài đó. Không ngờ kinh thánh y khoa mà cũng có cách mua vui hay như thế.

Tham khảo:

1. Hodgson JM, et al. Chocolate consumption and bone density in older women. Am J Clin Nutr 2008; 87:175-80.
2. Messerli FH. Chocolate consumption, cognitive function, and Nobel laureates. N Engl J Med 2012. Doi: 10.1056/NEJMMon1211064.

——————–&&——————–

Nghiên cứu lạm phát tại Việt Nam theo phương pháp SVAR

Nghiên cứu lạm phát  tại Việt Nam theo phương pháp SVAR

(Tác giả: Nguyễn Thị Liên Hoa &Trần Đặng Dũng – Nguồn: http://vjol.info.vn)

[Trích]

Bài viết này nghiên cứu về các yếu tố nào đã, đang và sẽ ảnh hưởng đến lạm phát tại VN, đồng thời chạy mô hình định lượng SVAR để kiểm định mức độ ảnh hưởng đến lạm phát của tổng yếu tố. Đây là phương pháp mới và hiệu quả được áp dụng ở nhiều quốc gia hiện nay trong việc phân tích chính sách vĩ mô. Bài nghiên cứu đi sâu vào giải quyết các vấn đề sau: (1) Các yếu tố tác động đến lạm phát ở VN; (2) Ảnh hưởng của cú sốc trong chính sách đến lạm phát? (3) Thời gian để lạm phát phản ứng lại một chính sách mới; và (4) Tác động ngược trở lại của một cú sốc trong lạm phát đến các yếu tố
khác.

1. Tổng quan
Dựa theo những lý thuyết đã có về lạm phát, các nghiên cứu về lạm phát ở VN gần đây đã kết hợp nhiều nhân tố từ cả phía chi phí đẩy và phía cầu kéo của lạm phát nhằm giải thích những biến động của lạm phát. Tuy nhiên, do thiếu số liệu hoặc do chủ ý của các tác giả,phần lớn các nghiên cứu đều bỏ qua các yếu tố thuộc phía cung và tập trung chủ yếu vào các nhân tố thuộc phía cầu. Nhân tố cung duy nhất được xem xét là các cú sốc từ quốc tế (giá của dầu và trong một vài trường hợp giá của gạo).
Tóm lại, những nghiên cứu gần đây về lạm phát ở VN xoay quanh các nhân tố: CPI, cung tiền, lãi suất, tỷ giá, sản lượng, giá dầu và giá gạo thế giới và hầu hết các nghiên cứu đều sử dụng mô hình VAR hoặc VECM. Trong nghiên cứu này tác giả sẽ cân nhắc việc đưa thêm các biến thuộc phía cung và sử dụng số liệu cập nhật đến tháng 6 năm 2011,qua đó xem xét các vấn đề mới để cung cấp bức tranh toàn diện hơn, mới mẻ hơn về lạm phát ở VN.Để xây dựng được mô hình SVAR thực nghiệm, chúng ta cần phải giải quyết hai nội dung: (1) Lựa chọn các biến trong mô hình; và (2) Thiết lập các hạn chế của mô hình để đưa ra ma trận cấu trúc.

Xem thêm

[1] EXCHANGE RATE PASS-THROUGH AND ITS IMPLICATIONS FOR INFLATION IN VIETNAM

[2] Nominal Rigidities And The Real Effects Of Monetary Policy In A Structural VAR Model

[3] The Impact of Real Exchange Rate on Output and Inflation in Vietnam: A VAR  Approach

[4] Các nhân tố vĩ mô quyết định lạm phát ở Việt Nam giai đoạn 2000-2010: Các bằng chứng và thảo luận

[5] Xác định các nhân tố quyết định lạm phát ở Việt Nam

[6] Cơ chế truyền dẫn tiền tệ dưới góc độ phân tích định lượng

[7] Sử dụng mô hình kinh tế lượng dự báo ngắn hạn – bài học từ Ngân hàng Trung ương Canada

[8] Ứng dụng mô hình SVAR trong việc xác định hiệu ứng của chính sách tiền tệ và dự báo lạm phát ở Việt Nam

[9] ỨNG DỤNG MÔ HÌNH SVAR TRONG PHÂN TÍCH HIỆU ỨNG CHUYỂN CỦA TỶ GIÁ HỐI ĐOÁI Ở VIỆT NAM

[10] ỨNG DỤNG MÔ HÌNH SVAR NGHIÊN CỨU KÊNH TRUYỀN DẦN TIỄN TỆ VÀ GỢI Ý CHÍNH SÁCH TIỄN TỆ Ở VIỆT NAM

——————&&——————

Data interpolation

Data interpolation

(Tác giả: Lê Hồng Giang – Nguồn: kinhtetaichinh.blogspot.com)

[Trích]

Nội suy số liệu là gì? VD: chuyển đổi số liệu GDP quí (hoặc một chuỗi macro nào đó) thành số theo tháng. Hầu hết các bạn có nhu cầu này đều muốn ước lượng (estimate) một mô hình kinh tế lượng (chuỗi thời gian) nào đó nhưng chuỗi GDP quí quá ngắn nên muốn sử dụng chuỗi theo tháng để tăng số  quan sát. Đa số các chuyên gia kinh tế lượng sẽ cho rằng không nên làm như vậy ngay cả khi có số liệu GDP tháng. Có rất nhiều lý do để không nên chuyển từ mô hình quí sang tháng nhưng hai lý do chính là noise vs signal và structural rigidity.

—————&&————

Lập mô hình phương trình cấu trúc SEM

Lập mô hình phương trình cấu trúc SEM

(Tác giả: Nguyễn Quỳnh Anh – Nguồn: mba-15.com)

Phần này tóm tắt ngắn gọn và không thiên về đặc tính kỹ thuật của các vấn đề căn bản có liên quan trong SEM, bao gồm các vấn đề ước lượng, thích hợp mô hình, và các giả thiết thống kê.


SEM (Structural Equation Modeling) là một kỹ thuật mô hình thống kê rất tổng quát, được sử dụng rộng rãi trong khoa học nghiên cứu hành vi. Nó có thể được xem là sự kết hợp của phân tích nhân tố và hồi quy hay phân tích đường dẫn. Sự quan tâm trong SEM thường là vào các kiến trúc lý thuyết, được trình bày bởi các nhân tố ngầm. Các quan hệ giữa các kiến trúc lý thuyết được trình bày bởi các hệ số hồi quy hay hệ số đường dẫn giữa các nhân tố. SEM ám chỉ 1 cấu trúc của các hiệp tương quan (covariances) giữa các biến được quan sát, các quan hệ này cho ra một tên khác là mô hình hóa cấu trúc hiệp tương quan (covariance structure modeling). Tuy nhiên, mô hình có thể được mở rộng thêm bao gồm trung bình của các biến quan sát được hoặc các nhân tố trong mô hình, làm cho tên mô hình hóa cấu trúc hiệp tương quan ít chính xác. Nhiều nhà nghiên cứu chỉ đơn giản nghĩ mô hình loại này là “các mô hình Lisrel,” điều này cũng ít chính xác. LISREL là chữ viết tắt của Linear Structural RELations (các quan hệ cấu trúc tuyến tính), và tên này được Jưreskog sử dụng cho một trong những chương trình SEM đầu tiên thông dụng nhất. Các mô hình phương trình cấu trúc ngày nay không nhất thiết phải tuyến tính, và khả năng mở rộng của SEM xa hơn phương trình Lisrel ban đầu. Ví dụ, Browne (1993) thảo luận khả năng làm thích hợp các đường cong phi tuyến.
SEM cung cấp một khung thuận tiện và rất tổng quát cho các phân tích thống kê bao gồm các thủ tục đa biến truyền thống, ví dụ các trường hợp đặc biệt là phân tích nhân tố, phân tích hồi quy, phân tích phân biệt, và tương quan canonical. SEM thường được minh họa bằng biểu đồ đường dẫn. Phương trình thống kê này thường được trình bày trong một hệ phương trình ma trận. Trong đầu thập niên 70, khi kỹ thuật này được giới thiệu lần đầu trong nghiên cứu xã hội và nghiên cứu hành vi, phần mềm thường yêu cầu cài đặt chỉ rõ mô hình theo điều kiện của những ma trận này. Do đó, các nhà nghiên cứu đã phải lọc việc trình bày ma trận từ biểu đồ đường dẫn, và cung cấp phần mềm với 1 chuỗi ma trận cho các tập hợp tham số khác nhau, như là hệ số nhân tố và các hệ số hồi quy. Các phần mềm được phát triển gần đây cho phép các nhà nghiên cứu chỉ định trực tiếp mô hình như là 1 biểu đồ đường dẫn. Việc này hiệu quả với các vấn đề đơn giản, nhưng có thể gây mệt mỏi đối với các mô hình có tính phức tạp hơn. Vì lý do này, phần mềm SEM hiện tại cũng vẫn hỗ trợ các đặc tính kỹ thuật của mô hình loại câu lệnh-hay ma trận.
Path analysis (phân tích đường xu hướng) là kỹ thuật thống kê dùng để kiểm tra quan hệ nhân quả giữa hai hay nhiều biến. Dựa trên hệ thống phương trình tuyến tính.
Path analysis là thành phần phụ của SEM, một thủ tục đa biến mà theo định nghĩa của Ullman (1996), “cho phép kiểm tra một tập quan hệ giữa một hay nhiều biến độc lập, hoặc là liên tục hoặc là rời rạc, và một hay nhiều biến phụ thuộc, hoặc là liên tục hoặc là rời rạc.” SEM liên quan đến các biến đo lường được (measured variable) và các biến ngầm (latent variable). Một measured variable là một biến có thể được quan sát trực tiếp và được đo lường. Biến đo lường được cũng được biết đến như biến quan sát được (observed variable), biến chỉ báo hay biến biểu thị (indicator or manifest variables). Một latent variable là một biến không thể được quan sát trực tiếp và phải được suy ra từ measured variable. Latent variables được ám chỉ bởi hiệp tương quan (covariances) giữa hai hay nhiều measured variables. Chúng cũng được biết đến như là các nhân tố (nghĩa là, phân tích nhân tố), các biến kiến trúc hay các biến không quan sát được (constructs or unobserved variables). SEM là sự kết hợp giữa hồi quy đa biến và phân tích nhân tố. Path analysis chỉ liên quan đến các biến đo lường (measured variables).

CÁC THÀNH PHẦN CỦA SEM
Có hai thành phần: mô hình đo lường (measurement model) và mô hình cấu trúc (structural model).
+ Measurement model: liên quan đến quan hệ giữa measured variables và latent variables.
+ Structural model: chỉ liên quan đến các quan hệ giữa các latent variables mà thôi.
Ký hiệu trong SEM:
–       Các biến đo lường được: hình chữ nhật hay vuông
–       Các biến ngầm: elíp hay hình tròn
–      Các khoản sai số: (“nhiễu” của các biến ngầm) được đưa vào biểu đồ SEM, đại diện bởi “E’s” cho các biến đo lường và “D’s” cho các biến ngầm. Các khoản sai số đại diện phương sai phần dư trong các biến không được tính cho các đường dẫn (pathways) được giả thiết trong mô hình.
Tham số của SEM:
–        Là các biến, hệ số hồi quy và hiệp tương quan giữa các biến.
–       Phương sai có thể được chỉ ra bằng mũi tên hai đầu kết thúc tại cùng một biến, hoặc đơn giản hơn, ký hiệu bằng số trong hộp vẽ biến hay cung tròn.
–       Các hệ số hồi quy được trình bày dọc theo mũi tên một chiều chỉ ra đường dẫn được giả thiết giữa hai biến (có trọng số được áp dụng cho các biến trong các phương trình hồi quy tuyến tính)
–       Hiệp phương sai được kết hợp với các mũi tên vòng cung hai đầu giữa hai biến hoặc các sai số và biểu thị vô hướng (no directionality). Data cho SEM là các phương sai mẫu và hiệp phương sai mẫu lấy từ tổng thể (ký hiệu S, phương sai mẫu quan sát được và ma trận hiệp phương sai).

KIẾN TRÚC SEM
Mục tiêu trong việc xây dựng 1 biểu đồ xu hướng (path diagram) hay mô hình phương trình cấu trúc, là tìm một mô hình đủ thích hợp với dữ liệu (S) để phục vụ như là 1 đại diện có ích của độ tin cậy và giải thích chi tiết dữ liệu.
Có 5 bước trong kiến trúc SEM:
1.   Chỉ định mô hình (Model Specification)
2.   Nhận dạng mô hình (Model Identification)
3.   Ước lượng mô hình (Model Estimation)
4.   Đánh giá độ thích hợp của mô hình (Assesing Fit of the Model)
5.   Hiệu chỉnh mô hình (Model Modification)

Chỉ định mô hình (Model Specification)
Là việc chính thức bắt đầu một mô hình. Trong bước này, các tham số được xác định là cố định hay tự do. Tham số cố định (fixed parameters) không được ước lượng từ dữ liệu và được gán một cách tiêu biểu bằng 0 (chỉ ra không có quan hệ giữa các biến). Các đường dẫn của các tham số cố định được gắn nhãn số (trừ khi được gán giá trị là 0, trong trường hợp này không có đường dẫn nào được vẽ) trong biểu đồ SEM. Tham số tự do (Free parameters) được ước lượng từ dữ liệu quan sát và được người điều tra tin rằng nó khác 0. Việc xác định tham số nào là cố định hay tự do trong SEM là rất quan trọng vì nó xác định tham số nào sẽ được sử dụng để so sánh biểu đồ giả thuyết với ma trận hiệp phương sai và phương sai tổng thể mẫu trong việc kiểm tra tính thích hợp của mô hình (bước 4). Việc chọn tham số nào là cố định và tham số nào là tự do tùy thuộc vào người nghiên cứu. Sự lựa chọn này trình bày một giả thuyết tiền đề về đường xu hướng trong hệ thống là quan trọng trong thế hệ của cấu trúc liên quan của hệ thống được quan sát (ví dụ, phương sai mẫu được quan sát và ma trận hiệp phương sai).

Nhận dạng mô hình (Model Identification)
Việc nhận dạng quan tâm đến việc có hay không giá trị duy nhất cho mỗi và mọi tham số tự do có thể thu thập được từ dữ liệu quan sát. Nó phụ thuộc vào việc lựa chọn mô hình và đặc tính kỹ thuật của các tham số cố định, ràng buộc và tự do. Một tham số bị ràng buộc khi nó trong một tập hợp với các tham số khác. Các mô hình cần phải được nhận dạng hoàn chỉnh để có thể ước lượng được (bước 3) và để kiểm định giả thuyết về quan hệ giữa các biến.
Có các dạng mô hình có cấu trúc là 
just-identified, overidentified, hay underidentified.
+ Just-identified model: trong đó tương ứng 1-1 giữa data và các tham số cấu trúc. Nghĩa là, số phương sai dữ liệu và số hiệp phương sai bằng với số tham số được ước lượng. Tuy nhiên, mặc dầu khả năng của mô hình là đạt được một giải pháp duy nhất cho tất cả các tham số, just-identified model không có sự quan tâm của khoa học gia vì bởi nó không có độ tự do và do đó không thể bị loại bỏ.
+ Overidentified model: là mô hình trong đó số tham số có thể ước lượng được thì nhỏ hơn số điểm dữ liệu (data points) (nghĩa là, phương sai, hiệp tương quan của các biến quan sát được). Tình trạng này tạo kết quả ra độ tự do dương cho phép loại bỏ mô hình, do đó được sử dụng một cách khoa học hơn. Mục đích của SEM là chỉ ra một mô hình như vậy đáp ứng các tiêu chuẩn của 
overidentification.
+ Underidentified model: là mô hình trong đó số tham số được ước lượng vượt quá số phương sai và hiệp tương quan. Như vậy, mô hình bao gồm thông tin không ý nghĩa (từ dữ liệu đầu vào) cho việc đạt được 1 giải pháp xác định về ước lượng tham số; nghĩa là, vô số các giải pháp là khả dĩ cho 1 underidentified model.


Ước luợng mô hình (Model Estimation)
Trong bước này, các giá trị khởi đầu  của tham số tự do được chọn để sinh ra 1 ma trận hiệp tương quan tổng thể được ước lượng (estimated population covariance matrix), S(q), từ mô hình. Các giá trị khởi đầu có thể được chọn bởi người nghiên cứu từ thông tin ban đầu, bởi các chương trình máy tính được sử dụng để xây dựng SEM, hay từ phân tích hồi quy đa biến. Mục tiêu của ước lượng là để sinh ra một S(q) hội tụ trên ma trận hiệp tương quan tổng thể quan sát được, S, với ma trận phần dư (residual matrix) (khác biệt giữa S(q) và S) trở nên tối thiểu. Nhiều phương pháp có thể được sử dụng để sinh ra S(q). Việc chọn các phương pháp được hướng dẫn bằng đặc tính của data bao gồm kích thước và phân phối mẫu. Hầu hết các tiến trình được sử dụng là lặp. Hình thức tổng quát của hàm tối thiểu là:
Q = (s –  s(q))’W(s – s(q))
Trong đó:
s = vector bao gồm phương sai và hiệp phương sai của các biến quan sát được.
s(q) = vector bao gồm các phương sai corresponding và hiệp phương sai như được dự đoán bởi mô hình.
W = ma trận trọng số
(một vài tác giả xem Q như là F)
Ma trận trọng số, W, trong hàm trên, phù hợp với phương pháp ước lượng được chọn. W được chọn để tối thiểu Q, và Q(N-1) cho việc thích hợp hàm, trong hầu hết các trường hợp một thống kê phân phối X2. Kết quả thực hiện của X2 bị ảnh hưởng bởi kích thước mẫu, sai số phân phối, nhân tố phân phối, và giả thiết rằng các nhân tố và sai số là độc lập (Ullman 1996). Một vài phương pháp ước luợng được sử dụng thông dụng nhất là:
Generalized Least squares (GLS)
FGLS = ½ tr[([S – S(q)]W-1)2
]
Trong đó:
tr =  toán tử theo dõi (trace operator), cộng các yếu tố trên đường chéo chính của ma trận
W-1 = ma trận trọng số tối ưu, phải được chọn bởi nhà nghiên cứu (chọn lựa thông thường nhất là S-1)
Maximum Likelihood (ML)
FML = log|S| – log|S| + tr(SS-1
) – p
Trong trường hợp này, S-1 và p = số lượng biến được đo lường

Asymptotically Distribution Free (ADF) Estimator (Hàm ước lượng tự do phân phối tiệm cận)
FADF = [S – s(q)]’W-1[S – s(q
)]
W, trong hàm này, bao gồm các yếu tố xem xét trong kurtosis.
Ullman (1996) và Hoyle (1995) thảo luận về các thuận lợi và giới hạn của các hàm ước lượng trên đây.
ML và GLS hữu ích cho dữ liệu phân phối chuẩn khi các nhân tố và sai số là độc lập, ADF hữu ích cho các dữ liệu không phân phối chuẩn, nhưng chỉ có giá trị khi kích thước mẫu lớn hơn 2.500. Ullman chỉ ra hàm ước lượng tốt nhất cho dữ liệu không phân phối chuẩn và/hoặc phụ thuộc giữa các nhân tố và sai số là Scaled ML. Bất kể hàm nào được chọn, kết quả mong đợi của tiến trình ước lượng là đạt được một hàm thích hợp gần đến 0. Một hàm thích hợp với số điểm là 0 chỉ ra rằng ma trận hiệp phương sai được ước lượng của mô hình và ma trận hiệp phương sai mẫu nguyên thủy là tương đương.

Đánh giá độ thích hợp của mô hình (Assesing Fit of the Model)
Như đã phân tích, giá trị hàm thích hợp gần đến 0 được mong đợi cho độ thích  hợp mô hình. Tuy nhiên, nói chung, nếu tỷ số giữa X2 và bậc tự do nhỏ hơn 3, mô hình là thích hợp tốt (Ullman 1996).
Để có độ tin cậy trong kiểm định độ thích hợp mô hình, kích thước mẫu từ 100 đến 200 được yêu cầu (Hoyle 1995).
Ullman (1996) thảo luận sự đa dạng của các hàm thích hợp phân phối không-X2, mà ông ta gọi là “các chỉ số thích hợp so sánh (comparative fit indices.)” Hoyle (1995) đề cập đến điều này như “các chỉ số thích hợp phụ thuộc (adjunct fit indices).” Một cách căn bản, những phương pháp này so sánh độ thích hợp của một mô hình độc lập (một mô hình khẳng định không có quan hệ giữa các biến) để thích hợp mô hình được ước lượng. Kết quả của việc so sánh này thì thường là một số giữa 0 và 1, với 0.90 hoặc lớn hơn được chấp nhận như là các giá trị chỉ ra độ thích hợp. Cả Hoyle và Ullman đề nghị sử dụng nhiều chỉ số khi xác định các độ thích hợp mô hình.

Hiệu chỉnh mô hình (Model Modification)
Nếu ma trận phương sai/hiệp phương sai được ước lượng bằng mô hình không mô phỏng một cách thích hợp ma trận phương sai/hiệp phương sai mẫu, các giả thuyết có thể được hiệu chỉnh và mô hình được kiểm định lại. Để điều chỉnh 1 mô hình, các đường dẫn mới được vẽ thêm hay các đường dẫn cũ được bỏ đi. Nói cách khác, các tham số được thay đổi từ cố định tới tự do hoặc từ tự do đến cố định. Điều quan trọng để nhớ là khi trong các thủ tục thống kê khác, là việc hiệu chỉnh mô hình sau việc kiểm định lần đầu làm gia tăng cơ hội của vấp phải sai lầm loại I.
Các thủ tục thông thường được sử dụng cho việc hiệu chỉnh mô hình là Lagrange Multiplier Index (LM) và Kiểm  định Wald. Cả hai loại kiểm định này báo cáo các thay đổi trong giá trị X2 khi các đường dẫn được điều chỉnh.
LM yêu cầu dù có hay không việc gia tăng các tham số tự do gia tăng sự thích hợp của mô hình. Kiểm định Wald yêu cầu có hay không việc xóa bỏ các tham số tự do gia tăng sự thích hợp mô hình.
Để điều chỉnh tỷ lệ sai lầm loại 1 gia tăng, Ullman (1996) yêu cầu sử dụng một giá trị xác suất thấp (p<0.01) khi tăng thêm hay bỏ các tham số. Ullman cũng yêu cầu so sánh giá trị chéo (cross-validation) với các mẫu khác. Vì trật tự của các tham số tự do có thể ảnh hưởng đến việc lựa chọn của các tham số khác, LM nên được áp dụng trước kiểm định Wald (nghĩa là, cộng thêm vào tất cả các tham số trước khi bắt đầu xóa chúng) (MacCullum 1986, đã trích dẫn của Ullman 1996).


Trình bày mô hình cuối cùng (Final Presentation of Model)
Khi mô hình đã đạt được độ thích hợp chấp nhận được, các ước lượng riêng biệt về các tham số tự do được đánh giá. Các tham số tự do được so sánh với giá trị rỗng (null value), sử dụng thống kê phân phối z. Thống kê z đạt được bằng cách chia tham số ước lượng cho sai số chuẩn của ước lượng đó. Tỷ lệ của kiểm định này phải vượt +/-1.96 để quan hệ trở nên có ý nghĩa. Sau khi các quan hệ riêng biệt trong mô hình được đánh giá, các ước lượng tham số được chuẩn hóa cho việc trình bày mô hình cuố cùng. Khi các ước lượng tham số được chuẩn hóa, chúng có thể được giải thích tham chiếu với các tham số  khác trong mô hình và cường độ của đường xu hướng có liên quan trong mô hình có thể được so sánh.


Ghi chú: Hướng dẫn thực hành mô hình SEM trên phần mềm R

————-&&————-

Đo lường mức độ trung thành của khách hàng đối với dịch vụ thông tin di động-Nghiên cứu tại thị trường TP.HCM

Đo lường mức độ trung thành của khách hàng đối với dịch vụ thông tin di động-Nghiên cứu tại thị trường TP.HCM

(Tác giả: Phạm Đức Kỳ, Bùi Nguyên Hùng – Nguồn: http://www.mbavn.org)

 

I. GIỚI THIỆU MÔ HÌNH NGHIÊN CỨU

Bài viết “Nghiên cứu mô hình sự trung thành của khách hàng trong lĩnh vực thông tin di động tại Việt Nam”, Tạp chí BCVT&CNTT Kỳ 1 tháng 2/2007, đã phân tích các mô hình nghiên cứu sự trung thành của khách hàng trong lĩnh vực dịch vụ thông tin di động (TTDĐ) của một số nước trên thế giới và đề xuất mô hình lý thuyết áp dụng cho nghiên cứu tại thị trường TTDĐ Việt Nam [10]. Bài viết này sẽ trình bày kết quả nghiên cứu thực nghiệm tại thị trường TP. Hồ Chí Minh từ 01/2006 đến 05/2006 nhằm kiểm nghiệm mô hình lý thuyết đề xuất [10] và cung cấp một thang đo sự trung thành của khách hàng trong lĩnh vực dịch vụ TTDĐ tại Việt Nam. Về mặt thực tiễn kết quả nghiên cứu cung cấp thông tin giúp cho việc hoạch định chính sách sử dụng hiệu quả nguồn tài nguyên viễn thông đồng thời giúp các nhà cung cấp dịch vụ TTDĐ xây dựng chiến lược tiếp thị phòng thủ hiệu quả theo định hướng khách hàng. 
Mô hình nghiên cứu sử dụng thang đo 05 thành phần chất lượng dịch vụ trong lĩnh vực TTDĐ, kết hợp các mô hình nghiên cứu gần đây có xét thêm yếu tố “Rào cản chuyển mạng”, được nhiều tổ chức và cá nhân trên thế giới tiến hành, lựa chọn các nhân tố phù hợp với thị trường TTDĐ tại Việt Nam [10].
Trong mô hình này, chất lượng dịch vụ gồm 05 thành phần: Chất lượng cuộc gọi, Cấu trúc giá cước, Dịch vụ gia tăng, Sự thuận tiện và Dịch vụ khách hàng. Rào cản chuyển mạng gồm 03 thành phần: Chi phí chuyển mạng (tổn thất phát sinh khi chuyển mạng, chi phí thích nghi mạng mới, chi phí gia nhập mạng mới); Sự hấp dẫn của mạng khác, và Quan hệ khách hàng.


II. PHƯƠNG PHÁP NGHIÊN CỨU
Xác định các biến đo lường: nghiên cứu định tính nhằm xác định các nhân tố và các thuộc tính đo lường. Hơn 800 giao dịch viên các cửa hàng, đại lý Bưu điện tỉnh thành phía Nam đã được lấy ý kiến thăm dò trong khoảng thời gian từ 01/2006 đến 02/2006, sơ bộ hình thành thang đo ban đầu [10]. Tiếp theo tiến hành phỏng vấn 150 khách hàng để kiểm định độ tin cậy thang đo. Sau khi hiệu chỉnh một số biến, thang đo cuối cùng được sử dụng cho phỏng vấn chính thức.
Mẫu và thông tin mẫu: khảo sát định lượng thực hiện tại khu vực TP.HCM từ tháng 03/2006 đến 05/2006, đối tượng chọn mẫu là khách hàng các mạng di động MobiFone, VinaPhone, S-Fone và Viettel, sử dụng dịch vụ 6 tháng trở lên, tiến hành phỏng vấn khách hàng tại các khu vực Quận, Huyện theo tỷ lệ dân cư hợp lý. Phương pháp lấy mẫu phi xác suất có phân tổ[14] theo giới tính (nam-58%, nữ-42%), 5 nhóm độ tuổi (18-24, 25-34, 35-44, 45-54, 55-64), thị phần thuê bao các mạng (Mobifone-52.8%, VinaPhone-21%, S-Fone 5.9%, Viettel-20.3%), trong mỗi mạng lại chia theo tỷ lệ thuê bao trả trước và thuê bao trả sau (MobiFone-70/30, VinaPhone-80/20, S-Fone-60/40, Viettel-65/35). Mô hình đo lường gồm 52 biến quan sát, theo quy tắc tối thiểu là5 x 3 = 15 mẫu cho một biến đo lường (Bentle & Chou, 1987)do đó số mẫu tính toán ban đầu là: 52 x 15 = 780, sau khi phát hành 1.170 mẫu, kết quả thu được 917 mẫu hợp lệ.
Thu thập và phân tích dữ liệu: Mô hình lý thuyết nghiên cứu được xây dựng dựa trên nền tảng lý thuyết mô hình mạng SEM (Structural Equation Modeling) [1,3,6] và kỹ thuật xử lý dữ liệu bằng phần mềm SPSS 13.0 [4] kết hợp phần mềm AMOS 6.0 (Analysis Of Moment Structures) [5], tiến hành kiểm định thông qua các bước: (1) đánh giá sơ bộ thang đo và độ tin cậy của biến đo lường bằng hệ số Cronbach Alpha và độ giá trị (factor loading) bằng phân tích nhân tố khám phá EFA (Exploratory Factor Analysis), (2) tiếp theo sử dụng kỹ thuật phân tích nhân tố khẳng định CFA (Confirmation Factor Analysis) để kiểm nghiệm chặt chẽ hơn về tính đơn nguyên, độ tin cậy tổng hợp, độ giá trị (hội tụ, phân biệt) của các khái niệm, kiểm định các giả thuyết mô hình cấu trúc và độ phù hợp tổng thể mô hình. Tiếp theo thực hiện phân tích ANOVA (Analysis Of Variance) một chiều giữa các nhóm khách hàng khác nhau với các thành phần của mô hình cấu trúc đã được kiểm định nhằm tìm ra sự khác biệt có ý nghĩa của một vài nhóm khách hàng cụ thể.


III. KẾT QUẢ NGHIÊN CỨU
3.1. Kết quả thống kê mô tả 
Dữ liệu phân tích dùng cỡ mẫu N= 917, với thang Likert 5 khoảng cách cho kết quả các giá trị Skewness và Kurtosis các biến đo lường phân bố trong khoảng [-1, +1] nên phân bố gần chuẩn và phương pháp ước lượng ML (Maximum Likelihood) được chấp nhận sử dụng [8]. Với thang đo Likert 5 khoảng (từ 1: rất không đồng ý đến 5: rất đồng ý), giá trị trung bình (mean) của các biến đo chất lượng dịch vụ có sự khác biệt khá cao (mean=2.82 ->3.64), đặc biệt khách hàng chưa hài lòng về giá cước (mean=2.84); Tổng đài hỗ trợ (mean=2.82); Mạng hay bị nghẽn, rớt mạch (mean=3.1), Giải quyết khiếu nại kéo dài và chưa thỏa đáng (mean=3.11). Ngoài ra, các biến đo “Vùng phủ sóng” và “Tổng đài hỗ trợ” có độ lệch chuẩn khá cao (1.056 và 1.149) và kết quả phân tích ANOVA xác nhận có sự khác biệt trong nhận thức giữa khách hàng của các mạng di động khác nhau đối với 02 biến đo này. Các biến đo Rào cản cũng được đánh giá sai biệt nhiều (mean=2.75->3.76), trong đó biến đo “Bất tiện khi đổi số điện thoại” đánh giá khá cao (mean=3.76) chứng tỏ khách hàng rất ngại chuyển đổi vì sợ bị gián đoạn thông tin liên lạc. Ngược lại, biến “Quan hệ khách hàng” (mean=3.01) và “Sự quan tâm của nhà cung cấp” (mean=2.75) được giá thấp cho thấy nhà cung cấp chưa chú trọng công tác chăm sóc khách hàng. Đối với “Sự hấp dẫn của mạng khác” về chất lượng (mean=3.55), Giá cước rẻ (mean=3.64) và Danh tiếng/Hình ảnh (mean=3.41) được khách hàng đánh giá cao. Khách hàng đánh giá Sự thỏa mãn hơi thấp (mean=3.1) trong khi Sự trung thành lại được đánh giá khá cao (mean=3.64)
3.2 Đánh giá sơ bộ thang đo: 
Tổ hợp thang đo Chất lượng-Rào cản chuyển mạng bao gồm thang đo “Chất lượng dịch vụ” với 05 thành phần và 31 biến đo lường ; thang đo “Rào cản chuyển mạng” với 03 thành phần và 21 biến đo lường. Kết quả phân tích độ tin cậy thang đo đã loại 02 biến (vì có tương quan biến tổng nhỏ hơn 0.3) còn lại 50 biến đưa vào phân tích EFA, các thành phần thang đo sau khi loại biến đều có các hệ số Cronbach Alpha > 0.6 đạt yêu cầu.
3.3. Phân tích nhân tố khám phá (EFA) 
Sử dụng phân tích nhân tố bằng SPSS 13.0 cho kết quả EFA như sau: thành phần Dịch vụ gia tăng và thành phần Quan hệ khách hàng có hệ số tải (Factor Loading) nhỏ hơn 0.5 nên bị loại. Thang đo Chất lượng dịch vụ còn lại 04 thành phần là: Chất lượng cuộc gọi, Cấu trúc giá cước, Dịch vụ khách hàng và Sự thuận tiện. Thang đo Rào cản chuyển mạng còn lại 02 thành phần là: Chi phí thích nghi, Sự hấp dẫn của mạng khác.

3.4. Phân tích nhân tố khẳng định (CFA): Kết quả sử dụng phần mềm AMOS 6.0 để tiến hành phân tích CFA các thang đo khái niệm, kiểm nghiệm độ phù hợp của mô hình lý thuyết và kiểm định các giả thuyết như sau:
Kiểm nghiệm mô hình tổ hợp thang đo Chất lượng –Rào cản 
a) Kết quả phân tích nhân tố khẳng định (CFA): Các hệ số tải từ các biến quan sát lên các khái niệm thành phần đều đạt yêu cầu ( >.5). Vì vậy ta có thể kết luận các biến quan sát dùng để đo lường các thành phần của tổ hợp thang đo Chất lượng dịch vụ – Rào cản chuyển mạng đạt được giá trị hội tụ[8].
b) Các chỉ số độ phù hợp mô hình sau khi điều chỉnh đạt yêu cầu (Bảng 1). Như vậy 04 thành phần của Chất lượng dịch vụ và 02 thành phần của Rào cản chuyển mạng đạt được tính đơn nguyên[8].
Bảng 1: So sánh độ phù hợp của mô hình trước và sau khi hiệu chỉnh

Các chỉ số đánh giá

Mô hình ban đầu

Mô hình hiệu chỉnh

χ 2 (df)
χ 2/ df
p
GFI
AGFI
TLI
CFI
RMSEA
747.871 (155)
4.82
.000
.921
.893
.879
.901
.065
423.269 (152)
2.78
.000
.956
.939
.943
.955
.044
Ghi chú: các chỉ số cơ bản để đánh giá mô hình gồm: Fmin = χ 2/ df: Chi-square/bậc tự do; GFI: Goodness-of-Fit Index; AGFI: Adjusted GFI; TLI: Tucker-Lewis Coefficient; CFI: Comparative Fit Index; RMSEA: Root Mean Square Error of Approximation.
Mô hình có các chỉ số χ 2/ df < 3 ; GFI, AGFI, TLI, CFI >.9 và RMSEA <.06 được xem là mô hình phù hợp với dữ liệu thị trường)[1,3,5].
c) Hệ số tương quan của các khái niệm thành phần đều < 1 và có ý nghĩa (p<.05) , do đó các khái niệm này đạt độ giá trị phân biệt[8].

Kiểm nghiệm mô hình thang đo Thoả mãn và Trung thành
Thang đo mức độ thoả mãn của khách hàng là thang đo đơn hướng, được đo lường bằng 02 biến quan sát. Mô hình thang đo này được kiểm định bằng CFA và kết quả cho thấy mô hình này phù hợp với bộ dữ liệu khảo sát thị trường (χ2 = 0, χ 2/ df = 0 p = .000; Các chỉ số AGFI = 1, GFI = 1, TLI= 1 , CFI = 1 và RMSEA = .000). Thang đo này có hệ số tin cậy tổng hợp là .794 và phương sai trích được là 82.9%. Các hệ số tải của thang đo này đều khá cao (nhỏ nhất là Q9b = .80). Vì vậy, thang đo mức độ thoả mãn của khách hàng đạt được giá trị hội tụ và tính đơn nguyên[8].
Tương tự thang đo mức độ trung thành của khách hàng được đo bằng 03 biến quan sát. Kết quả kiểm định mô hình ban đầu cho thấy mô hình phù hợp tốt với dữ liệu thị trường (χ 2 = 2.688, χ2/df = 1.34, p = .261; Các chỉ số GFI = .998 , TLI = .998, CFI = .99 và RMSEA = .019). Thang đo có hệ số tin cậy tổng hợp là .755 và phương sai trích được là 67.5%. Các trọng số thang đo đều chấp nhận được (nhỏ nhất là Q11b = .61) . Vậy thang đo mức độ trung thành của khách hàng cũng đạt được giá trị hội tụ và tính đơn nguyên [8].


Kiểm nghiệm độ phù hợp của mô hình lý thuyết bằng SEM:
Kết quả kiểm định CFA bằng phần mềm AMOS thực hiện theo nguyên tắc điều chỉnh các quan hệ có MI > 4 (MI-Indice Modification, là hệ số điều chỉnh ứng với sự thay đổi của χ 2 trên một bậc tự do) nhưng sự điều chỉnh này phải đảm bảo phù hợp về mặt cơ sở lý thuyết và bao hàm ý nghĩa về mặt thực tiễnSau khi thực hiện điều chỉnh, kết quả CFA cho thấy các chỉ số đánh giá độ phù hợp của mô hình lý thuyết đều được cải thiện đáng kể như hình 1 ( χ2/df = 2.37; GFI=.94; TLI=.94; CFI=.95; RMSEA = .039). Vì vậy mô hình này phù hợp với dữ liệu thị trường. Hơn nữa các hệ số hồi quy giữa khái niệm Sự thỏa mãn và Sự trung thành, các hệ số hồi quy giữa Sự thỏa mãn , Sự trung thành với các thành phần của chúng là Chất lượng dịch vụ và Rào cản chuyển đổi đều nhỏ hơn 1 và khác 0 một cách có ý nghĩa về mặt thống kê (Hình 1). Vì vậy, có thể kết luận là các thành phần đo lường Sự thỏa mãn, Rào cản và Sự trung thành với các thành phần của chúng đạt được giá trị phân biệt[8].


Hình 1: Kết quả kiểm định mô hình lý thuyết

 

Kiểm nghiệm ước lượng mô hình bằng phân tích BOOSTRAP
Để đánh giá tính bền vững của mô hình lý thuyết, phương pháp phân tích Boostrap được sử dụng. Đây là phương pháp lấy mẫu lặp lại có thay thế từ mẫu ban đầu (N=917), trong đó mẫu ban đầu đóng vai trò đám đông (Schumacker& Lomax, 1996). Số lần lấy mẫu lặp lại trong nghiên cứu được chọn là B = 1.500 lần, kết quả ước lượng với B lần từ N mẫu được tính trung bình và giá trị này có xu hướng gần với ước lượng của tổng thể. Kết quả độ chệnh của ước lượng (bias) và sai lệch chuẩn của nó có giá trị nhỏ và ổn định cho phép kết luận rằng các ước lượng ML áp dụng trong mô hình là tin cậy và được dùng cho các kiểm định giả thuyết tiếp theo.


3.5 Kiểm định mô hình hồi quy cấu trúc
Kiểm định giả thuyết tương quan
Kết quả kiểm định mô hình lý thuyết (Hình 2) cho thấy giữa các khái niệm (thành phần) có quan hệ (tương quan) với nhau một cách ý nghĩa nhưng vẫn đạt độ giá trị phân biệt, nghĩa là Chất lượng cuộc gọi, Cấu trúc giá cước, Dịch vụ khách hàng và Sự thuận tiện là các thành phần tạo nên CHẤT LƯỢNG DỊCH VỤ và Chi phí thích nghi, Sự hấp dẫn của mạng khác là các thành phần tạo nên RÀO CẢN CHUYỂN MẠNG.
Kiểm định giả thuyết quan hệ nhân quả



Hình 2: Kết quả kiểm định mô hình cấu trúc

 

Nhận xét: Từ kết quả kiểm định giả thuyết của mô hình cấu trúc (hình 2) cho thấy
– Các thành phần Chất lượng dịch vụ có tác động tích cực (trực tiếp) lên Sự thỏa mãn và tích cực (gián tiếp) lên Sự trung thành là: Chất lượng cuộc gọi (.40), Giá cước(.23) và Dịch vụ khách hàng (.11),
– Sự thuận tiện và Chi phí thích nghi tác động tích cực (trực tiếp) lên Sự trung thành và Rào cản.
– Sự hấp dẫn của mạng khác có tác động tiêu cực (trực tiếp) làm giảm đồng thời cả Sự thỏa mãn, Sự trung thành và Rào cản,
– Sự trung thành được giải thích bởi sự thoả mãn (.66) và Rào cản (.17) tương ứng với 79% và 21%.

3.6. Đánh giá sự khác biệt có ý nghĩa giữa các nhóm khách hàng (Bảng 2)
Bảng 2: Kết quả phân tích ANOVA giữa các nhóm khách hàng

YẾU TỐ

ĐÁNH GIÁ CAO/RẺ

ĐÁNH GIÁ THẤP/ĐẮT

CHẤT LƯỢNG
CUỘC GỌI

– Vinaphone, MobiFone
– Nhân viên, học sinh-sinh viên

– Viettel Mobile
– Nhà quản lý

GIÁ CƯỚC

– Nam, Lớn tuổi, Học vấn thấp,Vị trí xã hội thấp.
– Viettel Mobile
– Thuê bao trả trước

 Nữ, Trẻ tuổi, Học vấn cao, Vị trí xã hội cao.
– MobiFone, VinaPhone
– Thuê bao trả sau

DỊCH VỤ KHÁCH HÀNG

– Lớn tuổi

 Trẻ tuổi

THUẬN TIỆN

– Thuê bao trả trước

– Thuê bao trả sau

CHI PHÍ
THÍCH NGHI

– VinaPhone
– Thuê bao trả sau

 MobiFone
– Thuê bao trả trước

THỎA MÃN

– MobiFone

– VinaPhone

TRUNG THÀNH

– VinaPhone
– Thời gian sử dụng dịch vụ dài

 MobiFone
– Thời gian sử dụng dịch vụ ngắn.

IV. KẾT LUẬN

4.1. Kết quả nghiên cứu
Đóng góp của nghiên cứu này là xây dựng mô hình lý thuyết, kiểm định các giả thuyết và cung cấp một thang đo mới trong lĩnh vực TTDĐ tại Việt Nam, lượng hoá cường độ tác động của các yếu tố thành phần, trong đó đáng chú ý là: thành phần Chất lượng dịch vụ vẫn đóng vai trò quan trọng (0.4) so với Giá cước (0.23) và Dịch vụ khách hàng (0.11); Sự thuận tiện tác động trực tiếp lên Sự trung thành mà không thông qua sự thoả mãn, Sự hấp dẫn của mạng khác có tác động tiêu cực đến cả sự thoả mãn và sự trung thành của khách hàng mạng hiện tại; tác động của nhân tố Sự thoả mãn chiếm 79% so với Rào cản chuyển mạng chiếm 21% lên Sự trung thành. Kết quả nghiên cứu cũng phù hợp với một số nghiên cứu tại các thị trường Đài Loan[13] và Hàn Quốc[7]. Kết quả phân tích ANOVA được tổng kết tại Bảng 2 còn cung cấp một số thông tin hữu ích cho các nhà quản lý trong xây dựng chiến lược theo phân khúc thị trường.

4.2. Hàm ý đối nhà quản trị dịch vụ
Kết quả nghiên cứu cho thấy: để tăng cường sự trung thành của khách hàng thì tăng sự thỏa mãn của họ đối với chất lượng dịch vụ là chưa đủ mà còn phải tăng rào cản chuyển mạng để giữ khách hàng bằng cách tăng rào cản nội sinh (chi phí thích nghi) và giảm ảnh hưởng của thành phần ngoại sinh (sự hấp dẫn của mạng khác). Về nguyên tắc, doanh nghiệp (DN) cần phối hợp thực hiện các giải pháp theo như mô hình cấu trúc (Hình 2). Đây chính là các đặc tính thứ hai của mô hình Kano[2] mà các nhà quản trị cần quan tâm.
Một kết quả đáng được lưu ý nữa là: khách hàng VinaPhone mặc dù có mức độ thỏa mãn thấp nhưng lại có mức độ trung thành khá cao. Điều này được giải thích bằng: a) “Chi phí thích nghi” được khách hàng đánh giá cao từ kết quả thống kê mô tả và từ phân tích ANOVA; b) “Sự thuận tiện” do đang được thừa hưởng kênh bán hàng và chăm sóc khách hàng tại các Bưu điện tỉnh, thành (BĐTT). Chi phí thích nghi và Sự thuận tiện được đánh giá cao chính là nguyên nhân làm tăng Sự trung thành. Mặc dù yếu tố Chi phí thích nghi hiện đang được đánh giá cao (khách hàng ngại chuyển sang mạng khác) nhưng yếu tố này sẽ bị suy giảm rất nhiều trong tương lai khi Bộ BCVT cho phép các mạng liên kết cơ sở dữ liệu chung và khách hàng chuyển mạng được giữ nguyên số điện thoại. Còn Sự thuận tiện cũng sẽ bị hạn chế khi VinaPhone tiến hành cổ phần hoá không còn dựa vào kênh phân phối của các BĐTT như hiện nay. Do vậy, Vinaphone cần chủ động xây dựng rào cản mang tính tính cực và bền vững hơn. Ngược lại, Sự hấp dẫn của mạng khác có tác động tiêu cực làm giảm cả Sự thoả mãn và Sự trung thành. Cho nên, để làm giảm hiệu ứng Sự hấp dẫn của mạng khác, các DN cần nỗ lực thực hiện giải pháp tạo lợi thế cạnh tranh như sau:

4.3. Hàm ý đối với việc hoạch định chính sách

Từ kết quả nghiên cứu, có một số đề xuất đối với việc hoạch định chính sách:
a) Kiến nghị chính phủ rút ngắn thời gian khấu hao thiết bị để phù hợp với chu kỳ công nghệ và xu hướng giảm suất đầu tư; hỗ trợ các DN viễn thông tháo gỡ khó khăn về thủ tục đầu tư và triển khai dự án như hiện nay.
b) Có mức phạt hành chính đối với DN chỉ tập trung phát triển thuê bao bằng giảm giá/khuyến mãi mà không đảm bảo chất lượng dịch vụ và công khai kết quả thanh tra chất lượng dịch vụ của các nhà cung cấp trên các phương tiện thông tin đại chúng.
c) Giám sát quy trình quản lý chất lượng dịch vụ theo Quyết định 33/2006/QĐ-BBCVT của Bộ BCVT đối với chỉ tiêu chất lượng đăng ký của các nhà cung cấp dịch vụ TTDĐ bảo vệ lợi ích cho người tiêu dùng, đảm bảo thị trường phát triển bền vững, 
d) Khuyến khích các nhà cung cấp dịch vụ sử dụng chung hạ tầng mạng và cơ sở dữ liệu khách hàng như kinh nghiệm tại một số nước trên thế giới và khu vực (Hàn Quốc, Đài Loan) nhằm tiết kiệm tài nguyên viễn thông, giảm tỷ lệ khách hàng chuyển mạng, giảm lãng phí đầu tư và tăng sức mạnh cho toàn ngành trước khi mở cửa thị trường để hội nhập.

TÀI LIỆU THAM KHẢO
[1]. Bollen, K.A (1989), Structural Equation with Latent Variables, New York: John Wiley & Sons.
[2]. Bùi Nguyên Hùng, Nguyễn Thúy Quỳnh Loan (2004), Quản lý chất lượng, NXB Đại học Quốc gia TP.HCM,
[3]. Hair et al (2000), Applied Multivariate Statistics, Week 11, chap 11.
[4]. Hoàng Trọng (2005), Phân tích dữ liệu nghiên cứu với SPSS, NXB thống kê.
[5]. James L. Arbuckle(2005), Amos 6.0 User’s Guide, Copyright © 1995–2005 by Amos Development Corporation, http://amosdevelopment.com
[6]. J.J. Hox (2003), An Introduction to Structural Equation Modeling, Family Science Review, 11, 354-373.
[7]. M-K. Kim et al., (2004), The effects of customer satisfaction and switching barrier on customer loyalty in Korean mobile telecommunication services, Telecommunications Policy 28, (145-159)
[8]. Nguyễn Đình Thọ và các thành viên (2003), Đo lường chất lượng dịch vụ vui chơi giải trí ngoài trời TP.HCM, Đề tài nghiên cứu khoa học, mã số CS2003-19
[9]. Ofir Turel & Alexander Serenko (2004), User Satisfaction with Mobile Services in Canada, Proceedings of the Third International Conference on Mobile Business,
[10]. Phạm Đức Kỳ, Bùi Nguyên Hùng, Nghiên cứu mô hình sự trung thành của khách hàng trong lĩnh vực dịch vụ TTDĐ tại Việt Nam”, Tạp chí BCVT&CNTT, 02/2007
[11]. Rich Zimmerman & Olga Dekhtyar (2004), AMOS-Analysis of Moment Structures, University of Kentucky.
[12]. Scott MacLean, Kevin Gray (1998), Structural Equation Modeling in Marketing Research, Jounal of the Australian Market Research Society.
[13]. Shih-Ping JENG (2003), Customer Loyalty in Competitive Market: Alternative Attractiveness, Switching Cost, and Satisfaction Effects, Fu Jen Catholic University
[14]. Trần Xuân Kiêm, Nguyễn Văn Thi (2004), Nghiên cứu tiếp thị, NXB Thống kê.

—————–&&—————–