Giới thiệu Phương pháp phân tích bao dữ liệu (DEA) & Hướng dẫn thực hành DEA trên Excel

Giới thiệu Phương pháp phân tích bao dữ liệu (DEA)

(Tác giả: Ngô Đăng Thành – Nguồn: sabapsau.wordpress.com)

Tổng quan

DEA ra đời từ năm 1978 sau “sáng kiến” của Charnes, Cooper và Rhodes (CCR) [1], tuy nhiên nó lại có xuất phát điểm từ trước đó hơn 20 năm. Năm 1957, Farrell [2] đưa ra ý tưởng áp dụng đường giới hạn khả năng sản xuất (Production Possibility Frontier – PPF) làm tiêu chí đánh giá hiệu quả (tương đối) giữa các công ty trong cùng một ngành; theo đó các công ty đạt đến mức giới hạn sẽ được coi là hiệu quả (hơn) và các công ty không đạt đến đường PPF sẽ bị coi là kém hiệu quả (hơn các công ty kia). Phương pháp CCR (1978) sau đó áp dụng bài toán tối ưu hóa tuyến tính phi tham số (non-parametric linear optimization) để xây dựng đường PPF dựa trên số liệu đã biết về một nhóm các công ty nhất định (decision making unit – DMU) và tính toán điểm hiệu quả cho các công ty đó. Đến năm 1984, Banker, Charnes, và Cooper (BCC) [3] cải tiến mô hình trên bằng cách đưa yếu tố lợi tức nhờ quy mô (returns to scale) vào tính toán, mang lại cái nhìn cụ thể hơn về tính hiệu quả của các DMU được phân tích. Từ đó đến nay, mô hình CCR và (chủ yếu là) BCC được áp dụng và phát triển một cách phổ biến trong phân tích hiệu quả (efficiency/performance) trong nhiều lĩnh vực khác nhau: ngân hàng, bảo hiểm, giáo dục, y tế,…

Nguyên tắc tính toán và so sánh hiệu quả của các DMU

Hiệu quả, hiệu suất, năng suất, hay một số thứ hầm bà lằng tương tự như thế, được sử dụng để tính toán/so sánh đầu ra (outputs) thu được tương ứng với đầu vào (inputs) cho trước. Ví dụ như năng suất lao động có thể được tính bằng số sản phẩm/số lao động; tỉ suất lợi tức đo bằng lợi nhuận/vốn; v.v…

Tuy nhiên, trên thực tế một doanh nghiệp hay đơn vị sản xuất (DMU) thường sử dụng một tổ hợp các yếu tố đầu vào để thu được một loạt các yếu tố đầu ra (mô hình đa biến – multi-variables) và do đó, việc đánh giá hiệu quả của DMU đó thường phải dựa trên nhiều chỉ số hiệu quả khác nhau (đánh giá tổng hợp). Bởi vì các chỉ số hiệu quả này được xây dựng dựa trên nhiều yếu tố khác nhau về bản chất, thước đo (ví dụ như vốn và diện tích nhà xưởng), nên để đánh giá tổng hợp cho từng DMU và so sánh giữa các DMU đòi hỏi phải quy về cùng một thước đo là tiền tệ (quy ra thóc). Khó khăn ở đây là rất khó để xác định giá cả của TẤT CẢ các yếu tố đầu vào và đầu ra cần thiết để tính toán, và đặc biệt, với các yếu tố phản ánh chất lượng (qualitative variables) thì hầu như không thể xác định được giá cả. Vì vậy, cần phải xây dựng một mô hình xác định hiệu quả (tổng hợp) mà không liên quan đến yếu tố giá cả.

Hiệu quả tổng hợp áp dụng cho nhiều biến được tính toán dựa trên hiệu quả riêng lẻ (1 input & 1 output) như sau:

Hiệu quả riêng lẻ: EF = Output/Input

Hiệu quả tổng hợp: EFF = Total Outputs/Total Inputs

Nếu giả thiết một DMU sử dụng m yếu tố đầu vào x để sản xuất n yếu tố đầu ra y với cách thức phối hợp các đầu vào và đầu ra nhất định theo hai bộ trọng số tương ứng vu (u và v chính là tập hợp giá cả của các biến đầu vào và đầu ra, giả thiết là ta có đủ thông tin về giá), thì EFF có thể được tính như  sau:

EFF = (v1*x1 + v2*x2 + … + vm*xm)/(u1*y1 + u2*y2 + … + un*yn)

hay EFF = Σ vixiujyj, i=1…m, j=1…n

Lưu ý: EFF tính được theo công thức trên là hiệu quả (tuyệt đối) của các DMU.

Áp dụng công thức trên ta có thể lần lượt tính toán hiệu quả của từng DMU (trên lí thuyết, mỗi DMU sẽ khác nhau về x và y; còn u, v, mn là giống nhau – thế mới so sánh được với nhau). Trong trường hợp không xác định được giá cả, có thể giả thiết rằng 1 biến đầu vào xi hoặc 1 biến đầu ra yj sẽ được gán cho 1 trọng số vi hoặc uj dựa theo mức độ quan trọng của biến đầu vào (đầu ra) đó đối với DMU đó (thực tế đây cũng là 1 dạng thể hiện thông tin của giá cả). Tuy nhiên, đến đây nảy sinh một vấn đề là mỗi DMU sẽ có đánh giá khác nhau về tầm quan trọng của từng biến đầu vào và đầu ra, do đó mỗi DMU bây giờ sẽ khác nhau cả về u, v, x, y. Bài toán trở nên phức tạp hơn và cần có sự can thiệp của phương pháp DEA.

Tính EFF theo phương pháp DEA

Đến đây, lại phải nói qua về đường bao (biên) sản xuất – Production frontier (PF). Khái niệm này xuất phát từ khái niệm Đường giới hạn khả năng sản xuất (Production Possibilities Frontier – PPF*) khi cho rằng PPF là tập hợp của các điểm sản lượng (tiềm năng) TỐI ĐA mà một nền kinh tế có thể đạt được với một (số) đầu vào cho trước. Khi áp dụng vào tính toán hiệu quả của 1 ngành (hay nhóm DMU cần nghiên cứu) thì tập hợp tất cả các điểm HIỆU QUẢ tối đa sẽ tạo nên đường PF. Theo đó, các DMU nằm trên đường PF này sẽ có hiệu quả là 100%, các DMU khác sẽ có hiệu quả nhỏ hơn 100%. Đây là hiệu quả tương đối giữa các DMU với nhau, khác với hiệu quả tuyệt đối được xác định theo công thức ở phần 2. Tuy nhiên, công thức này cũng là cơ sở để xây dựng đường PF theo nguyên lý sau:

1. Vì PF là tập hợp của các điểm hiệu quả tối đa của các DMU, nên việc cần làm là phải xác định các hiệu quả tối đa này.

2. Công thức tính EFF ở phần trên cho thấy mỗi DMU sẽ có 1 bộ trọng số u,v tối ưu nhất để tối đa hóa điểm hiệu quả của mình, bây giờ việc cần làm là tìm ra (các) bộ trọng số u,v tối ưu cho các DMU. Điều này có thể thực hiện được bằng cách (lần lượt) giải bài toán tối ưu hóa (optimization) cho từng DMU theo công thức:

Max EFF (theo u,v)

trong điều kiện

EFF = Σ vixiujyj, i=1…m, j=1…n

EFF <= 1 cho tất cả các DMU (kể cả DMU đang được xem xét).

3. Làm lần lượt như vậy với các DMU khác để tìm ra bộ trọng số tối ưu cũng như điểm hiệu quả tối đa cho từng DMU.

Với phương pháp tính toán như vậy, đường PF tìm được sẽ là đường hiệu quả tối ưu thực tế (best practical frontier) được xây dựng dựa trên số liệu đã có (gọi là thực tế vì nó là hàm optimization hoàn toàn có thể đạt được bằng cách thay đổi bộ trọng số u,v; khác với hàm hồi quy chỉ là dự tính – estimated). Đường PF này sẽ tạo thành 1 đường bao (biên) tối ưu, bên trong nó chính là các điểm thực tế (observed). Do vậy, phương pháp trên còn được gọi là phương pháp phân tích bao dữ liệu (Data Envelopment Analysis – DEA).

Ứng dụng của phương pháp phân tích bao dữ liệu DEA

1. DEA áp dụng được cả với các biến định tính (qualitative), do đó nó thường được ứng dụng để phân tích hiệu quả của các DMU hoạt động trong lĩnh vực xã hội như giáo dục, y tế, bảo hiểm,… và tất nhiên là cả trong lĩnh vực kinh tế như ngân hàng, chứng khoán, sản xuất kinh doanh.

2. Vì DEA được xây dựng dựa trên các điểm thực tế (observed data) nên nó có thể được áp dụng với các mẫu nghiên cứu (sample size) nhỏ, khác với phương pháp phân tích hồi quy thường yêu cầu cỡ mẫu lớn. Do vậy DEA thường được sử dụng để phân tích chuyên sâu theo khu vực, địa phương (region), chẳng hạn như phân tích hiệu quả của các nền kinh tế trong ASEAN, các phòng ban trong 1 doanh nghiệp, các ngân hàng lớn (không phải chi nhánh) trên địa bàn Hà Nội,…

3. Tuy nhiên, hạn chế của phương pháp này (so với phương pháp hồi quy) là nó không tính toán đến yếu tố sai số (error) hay nhiễu (noise), do đó trong DEA không tồn tại yếu tố mức ý nghĩa hay độ tin cậy (significant level). Đồng thời, điểm hiệu quả DEA là hiệu quả tương đối giữa các DMU với nhau, do đó nếu 1 DMU có điểm hiệu quả là 100% và nằm trên đường PF thì cũng KHÔNG có nghĩa là nó đã tối ưu trên thực tế (nó chỉ tối ưu HƠN các DMU khác trong phạm vi phân tích mà thôi). Vì vậy, DEA thường được thực hiện kết hợp với phân tích hồi quy trong một mô hình 2 bước (2-stages DEA) hay nhiều bước (multi-stages DEA) để làm tăng thêm tính thuyết phục của mô hình**.

PS1. Vì đây là Intro nên tôi chỉ giới thiệu chung về nguyên lý của phương pháp phân tích bao dữ liệu mà không đi sâu về mặt toán học hay các dạng cụ thể của phân tích DEA. Những ai muốn trao đổi hoặc tìm hiểu thêm về vấn đề này có thể email trực tiếp cho tôi về địa chỉ butzvn-a-còng-gmail-chấm-com.

PS2. Một số bài viết của tôi sử dụng DEA: http://papers.ssrn.com/sol3/cf_dev/AbsByAuth.cfm?per_id=989383

* Xem thêm tại http://vi.wikipedia.org/wiki/Kinh_tế_học

** Cá nhân tôi cho rằng hiện nay chúng ta quá bị ảnh hưởng bởi phân tích hồi quy, cứ mở mồm ra là hỏi phân tích có tin cậy không, mức ý nghĩa bao nhiêu, etc. Phương pháp DEA xây dựng đường PF hiệu quả (có thực, có thể đạt được trên thực tế) dựa trên số liệu (tất nhiên cũng có thực) của các DMU, do đó cũng có thể nói mức độ tin cậy của phương pháp này là 100% (vì DEA có “dự tính” – estimate – gì đâu mà có thể cho ra kết quả sai lệch được).

[1] Charnes, A., Cooper, W. W., & Rhodes, E. (1978). Measuring The Efficiency Of Decision Making Units. European Journal of Operational Research, 2, 429-444.

[2] Farrell, M. J. (1957). The Measurement Of Productive Efficiency. Journal of the Royal Statistical Society, 120(3), 253-281.

[3] Banker, R. D., Charnes, A., & Cooper, W. W. (1984). Some Models for Estimating Technical and Scale Inefficiencies in Data Envelopment Analysis.Management Science, 30(9), 1078-1092.



Hướng dẫn sử dụng phương pháp Phân tích bao dữ liệu trong Excel

(Tác giả: Ngô Đăng Thành – Nguồn: sabapsau.wordpress.com)

Bài viết này nhằm mục đich khái quát lại về phương pháp Phân tích bao dữ liệu (Data Envelopment Analysis, viết tắt là DEA) trong việc tính toán và ước lượng hiệu quả (kỹ thuật) của các doanh nghiệp, ngân hàng, trường học,… (gọi chung là các đơn vị ra quyết định – Decision Making Unit, viết tắt là DMU – trong việc sử dụng các nguồn lực đầu vào để tạo ra các kết quả đầu ra). Việc đo lường hiệu quả như vậy dựa trên cơ sở của phương pháp phân tích giới hạn (frontier analysis), theo đó, các DMU có hiệu quả cao nhất sẽ xác lập nên một đường giới hạn khả năng sản xuất (production frontier), và các DMU sẽ được so sánh với đường giới hạn này để xác định xem chúng hoạt động có hiệu quả hay không. Đối với các DMU hiệu quả, vì chúng nằm trên đường giới hạn, nên điểm hiệu quả kỹ thuật (technical efficiency score, gọi tắt là TE) của chúng bằng 1. Đối với các DMU kém hiệu quả (nằm trong đường giới hạn), điểm hiệu quả của chúng sẽ nhỏ hơn 1 (xem thêm trong Mục 2)…

Tham khảo toàn văn bài viết ở đây hoặc ở đây.

Tiện ích VDEA 1.3 download ở đây.

Trân trọng.

Update: Phien ban VDEA 1.4 download ở đây.

Update 2 (16/09/15): Phien ban VDEA 2.0 da duoc cap nhat tai day. Phien ban nay co tich hop lua chon (option) de tinh toan trong so (shadow prices/weights) cua tung bien input va output de DMU dat hieu qua toi uu.
Ghi chú: Trước khi chạy VDEA, phải đảm bảo rằng Excel đã được cài đặt add-in Solver trong mục Tools>Add-ins (Ofice 2003-2007) hoặc File>Options>Add-ins>Manage Excel Add-ins>Go (office 2010+).

Update 3 (09/12/15): Phien ban VDEA 3.0 da duoc cap nhat tai day. Phien ban nay co the duoc su dung de tinh toan CCR- va BCC-DEA, Malmquist DEA va Shadow-prices DEA. Chuong trinh cung duoc tich hop them nut Clear Form de reset lai menu cua VDEA trong truong hop ban chay nhieu mo hinh.

———–&&———–

 

Gửi phản hồi

Mời bạn điền thông tin vào ô dưới đây hoặc kích vào một biểu tượng để đăng nhập:

WordPress.com Logo

Bạn đang bình luận bằng tài khoản WordPress.com Log Out / Thay đổi )

Twitter picture

Bạn đang bình luận bằng tài khoản Twitter Log Out / Thay đổi )

Facebook photo

Bạn đang bình luận bằng tài khoản Facebook Log Out / Thay đổi )

Google+ photo

Bạn đang bình luận bằng tài khoản Google+ Log Out / Thay đổi )

Connecting to %s

%d bloggers like this: