edx MOOC-Statistics and R: today – 20/9/2016; HarvardX.

edx MOOC-Statistics and R: today – 20/9/2016; HarvardX.

An introduction to basic statistical concepts and R programming skills necessary for analyzing data in the life sciences.

What you’ll learn

  • Random variables
  • Distributions
  • Inference: p-values and confidence intervals
  • Exploratory Data Analysis
  • Non-parametric statistics

Đăng kí (free): link

———-&&———-

Khám phá sự thú vị của phần mềm R trong định lượng rủi ro tín dụng

Khám phá sự thú vị của phần mềm R trong định lượng rủi ro tín dụng

 Lê Văn Tuấn

Đại học Thương mại

Tóm tắt. Bài viết trình bày tổng quan về các mô hình định lượng rủi ro tín dụng, trong đó đi sâu vào trình bày nền tảng toán học của các mô hình Merton, KMV và CreditMetrics. Bên cạnh đó, phần hướng dẫn thực hành trên phần mềm R để minh họa tính toán cho các mô hình này, cũng như để định giá quyền chọn, được cung cấp đầy đủ tới người đọc. Với mô hình CreditMetrics, chúng tôi sẽ minh họa việc thực hành tính toán cho giá trị VaR tín dụng (C-VaR) của danh mục. Với mô hình Merton-KMV, chúng tôi sẽ tính xác suất vỡ nợ PD ([1]) cho một số doanh nghiệp của VN với dữ liệu thực tế, từ đó sẽ minh họa phương pháp xếp hạng tín dụng doanh nghiệp. Kết quả cho thấy, để áp dụng được mô hình Merton-KMV trong thực tiễn VN, cần phải hiệu chỉnh mô hình này.

1. Mở đầu

Trong lĩnh vực quản trị rủi ro tại các ngân hàng, rủi ro tín dụng được xem là quan trọng nhất. Rủi ro tín dụng là loại rủi ro đầu tiên được đưa vào trong hiệp ước Basel I, tiếp tục là một trong ba loại rủi ro được quy định trong hiệp ước Basel II và III (bên cạnh rủi ro thị trường và rủi ro hoạt động). Các mô hình toán học đóng vai trò trong việc định lượng rủi ro tín dụng, giúp các ngân hàng tính toán được tài sản đã hiệu chỉnh rủi ro (được quy định ở trụ cột 1 – về vốn – trong Basel II, III) từ đó xác định được vốn bắt buộc, cũng như ước tính được vốn kinh tế. Với vai trò quan trọng như vậy, không có gì ngạc nhiên khi có một lượng lớn các sách, bài báo, báo cáo,… liên quan đến định lượng rủi ro tín dụng.

Bessis (2011) là cuốn tài liệu chuyên khảo, gắn liện với thực tế, về quản trị rủi ro trong ngân hàng (đã được dịch ra tiếng Việt); Crouhy (2001) cũng là cuốn tài liệu rất hữu ích trình bày về quản trị rủi ro trong ngân hàng với rất nhiều ví dụ minh họa (cuốn này được Robert C. Merton viết lời mở đầu); McNeil (2005, tái bản mới nhất năm 2015) là cuốn tài liệu kinh điển về quản trị rủi ro, tuy nhiên tài liệu này yêu cầu cao về nền tảng toán học . Trong tài liệu này, các tác giả đã trình bày lý thuyết để có thể nhúng các mô hình rủi ro tín dụng vào các mô hình thống nhất (dưới góc độ toán học).

Trong các mô hình rủi ro tín dụng, mô hình KMV, CreditMetrics, CreditRisk+ và CreditPortfolioView là các mô hình có bản quyền. Tuy nhiên, các tác giả (tổ chức) cũng công khai các tài liệu hướng dẫn các kỹ thuật xây dựng các mô hình [xem Crosbie (2002) và Sun (2012) cho mô hình KMV; Gupton (2007) cho CreditMetrics; Credit Suisse (1997) cho CreditRisk+; Wilson (1998) cho CreditPortfolioView]

Mô hình Merton là mô hình thiên về học thuật, có nhiều hướng mở rộng của mô hình Merton nhằm khắc phục các điểm yếu của nó. Trước hết là kỹ thuật cho phép xác định xác suất vỡ nợ khi giá trị tại sản của công ty rơi xuống mức ngưỡng nợ ở lần đầu tiên (thay vì chỉ xem xét tại thời điểm đáo hạn), những mô hình dạng này gọi là first-passage-time models. Hướng mở rộng tiếp theo (dựa trên giải tích ngẫu nhiên) đó là giả định lãi suất phi-vỡ nợ (default-free interest rate) là quá trình ngẫu nhiên hoặc xem (Vt) là quá trình khuếch tán (diffusion) với các bước nhảy. Một hướng mở rộng nữa là giả định mức chặn có yếu tố (kinh tế) ngoại sinh, giá trị nợ B được xác định dựa trên yếu tố ngoại sinh là chiến lược đầu tư của các cổ đông và không bị cố định từ trước. Hướng mở rộng (chính) cuối cùng là hướng nhúng mô hình Merton (các mô hình cấu trúc nói chung) vào trong mô hình dạng rút gọn, hướng này sẽ sử dụng giả thiết thông tin không đầy đủ về giá trị tài sản và nợ [xem các chỉ dẫn về tài liệu tham khảo trong McNeil (2005)].

Mô hình Merton-KMV nghiên cứu theo hướng thực nghiệm có những kết quả tiêu biểu như: Vassalou (2004) là nghiên cứu đầu tiên sử dụng mô hình này đánh giá ảnh hưởng của rủi ro vỡ nợ lên giá cổ phiếu. Trong Bharath (2004), các tác giả sử dụng mô hình Harard để kiểm định giả thiết: mô hình Merton-KMV có hiệu quả thống kê trong dự báo vỡ nợ; kết quả cho thấy giả thiết này bị bác bỏ. Trong Hillegeist (2004), kết quả kiểm định cho thấy, khả năng dự báo phá sản của mô hình Merton-KMV (được xếp vào market-based) là tốt hơn các mô hình Altman Z-score và Ohlson O-score (những mô hình dựa trên báo cáo tài chính, được xếp vào accounting- based).

Ở góc độ thực hành (trên phần mềm R), McNeil (2015) trình bày nhiều ví dụ cụ thể việc thực hành trên R để minh họa cho các mô hình rủi ro tín dụng (các ví dụ này có thể xem trên http://www.qrmtutorial.org/ – trang hỗ trợ phần thực hành trên R cho cuốn McNeil (2005)). Với mô hình CreditMetrics, Wittmann (2007) là tài liệu rất hữu ích khi thực hành ứng dụng với mô hình này.

Bài viết này gồm 6 phần:

  1. Mở đầu
  2. Phần mềm R
  3. Kiến thức cơ bản
  4. Các mô hình rủi ro tín dụng
  5. Thực hành ứng dụng trên R
  6. Kết luận

2. Phần mềm R

R là một phần mềm mã nguồn mở sử dụng cho phân tích thống kê và đồ thị, bạn có thể download miễn phí từ trang chủ r-project.org. Phần lớn các kỹ thuật phân tích trong kinh doanh đều được R hỗ trợ – từ thống kê đến học máy hay các kỹ thuật tối ưu hóa. Bằng chứng cho sức mạnh của R đó là những giải thưởng và sự tán dương từ những tạp chí hay cộng đồng uy tín trên thế giới như New York Times, Forbes, Intelligent, Enterprise, InfoWorld và The Register.

Các lí do chính nên sử dụng R trong học thuật cũng như thực tiễn là: Miễn phí (và mã nguồn mở); Phần mềm mạnh nhất trong các phần mềm miễn phí; Cạnh tranh (thậm chí vượt trội) so với các phần mềm thương mại; Đã sử dụng nhiều trong thực tiễn (industry); Chạy được trên nhiều hệ điều hành.

Xem Bảng so sánh sức mạnh trong thống kê của các phần mềm: R, MATLAB, SAS, STATA, SPSS: http://stanfordphd.com/Statistical_Software.html (EViews có lẽ thiên về kinh tế lượng nên không được đề cập tới)

Các thư viện (gói lệnh) của R sử dụng trong định lượng rủi ro tín dụng.

  • sde: Cung cấp các hàm cho phần thực hành của cuốn sách “Simulation and Inference for Stochastic Differential Equations”
  • fOptions: Định giá quyền chọn (với nhiều mô hình và nhiều loại quyền chọn)
  • CreditMetrics: Hỗ trợ mô hình CreditMetrics
  • CSFP và GCPM: Hỗ trợ mô hình CreditRisk+
  • qrmtools, QRM và qrmdata: Cung cấp các hàm và tập dữ liệu thực hiện phần thực hành cho cuốn sách kinh điển về quản trị rủi ro ”Quantitative Risk Management: Concepts, Techniques and Tools”

Download và cài đặt trên Windows (R có cả phiên bản trên Linux và (Mac) OS X)

  • Truy cập vào trang chủ: http://www.r-project.org/, click vào CRAN (dưới chữ Download ở cột bên trái), sẽ đến trang CRAN Mirrors, click vào một link (ví dụ của Thailand), click tiếp Download R for Windows, click tiếp install R for the first time, click tiếp Download R *.*.* for Windows  sẽ download được file R-*.*.*-win.exe (*.*.* chỉ  version tại thời điểm download).
  • Cài đặt như các phần mềm khác.

Cài đặt thư viện

  • Thư viện sde: Tại cửa sổ lệnh của R gõ: install.packages(“sde”)
  • Các thư viện khác cài tương tự

Sử dụng thư viện

  • Để sử dụng các hàm của thư viện sde (chẳng hạn), mỗi lần chạy R, tại cửa sổ lệnh gõ: library(sde)

Download bài viết đầy đủ: Kham pha su thu vi cua phan mem R trong dinh luong rui ro tin dung

Ghi chú “quan trọng”: Nội dụng chính của bài viết có được do tôi tổng hợp từ Tài liệu tham khảo, tôi “bịa” thêm rất ít (vì vậy nên độ tin tưởng là rất cao:) ) .

[1] Trong Hiệp ước Bassel II và III, để tính vốn bắt buộc cho rủi ro tín dụng: Nếu ngân hàng dùng phương pháp Standardized Approach (STA), sẽ không cần phải tính PD (chỉ cần dùng “mô hình” trung bình cộng có trọng số). Nếu dùng F-IRB, ngân hàng cần phải ước lượng PD, các tham số EAD, LGD sẽ được tính từ công thức của Basel. Nếu dùng A-IRB, ngân hàng được tự chủ (phải được duyệt và có kiểm soát) trong việc tính PD, EAD, LGD. Lưu ý rằng: Theo thứ tự: STA, F-IRB, A-IRB, nói chung, thì độ khó của phương pháp tăng dần, tuy nhiên lượng vốn bắt buộc được tính giảm dần (dẫn đến ngân hàng được quyền cho vay nhiều hơn).

Theo kế hoạch, từ tháng 2/2016, 10 ngân hàng do NHNN chỉ định sẽ chính thức bước vào thực hiện thí điểm phương pháp quản trị vốn và rủi ro theo tiêu chuẩn Basel II (BIDV, VietinBank, Vietcombank, Techcombank, ACB, VPBank, MB, Maritime Bank, Sacombank và VIB). NHNN cũng đã ra lộ trình đến năm 2018, cả 10 ngân hàng trên sẽ hoàn thành việc thí điểm, sau đó sẽ mở rộng áp dụng Basel II với các NHTM khác trong cả nước.

————-&&————–

Kinh Tế Lượng Ứng Dụng Với R

Kinh Tế Lượng Ứng Dụng Với R là cuốn tài liệu hướng dẫn sử dụng R cho học phần Kinh tế lượng của tác giả Nguyễn Chí Dũng.

Cuốn tài liệu được viết theo tiêu chí bám sát cuốn  Giáo Trình Kinh Tế Lượng (GS. TS. Nguyễn Quang Dong và PGS. TS. Nguyễn Thị Minh), nên rất dễ để tham khảo cơ sở lý thuyết cũng như thực hành trên R.

Hiện tại, cuốn tài liệu đang trong quá trình hoàn thiện, tuy nhiên, tác giả đã public một số chương đầu theo địa chỉ:

http://www.mediafire.com/download/3lg8bsfbu6csq8d/KinhTeLuongUngDungVoiR.rar

MỤC LỤC (hiện tại)

Chương 1: R với tư cách một công cụ nghiên cứu kinh tế lượng

Chương 2: Môi trường làm việc trong R

Chương 3: Các thống kê mô tả và graph trong R

Chương 4: Mô hình hồi quy tuyến tính hai biến số trong R

Chương 5: Hồi quy bội

Chương 6: Các mô hình hồi quy biến giả

Chương 7: Hiện tượng đa cộng tuyến

Chương 8: Phương sai sai số thay đổi

Chương 9: Lỗi định dạng mô hình

Chương 10: Các mô hình sử dụng dữ liệu mảng trong R

Chương 11: Mô hình Logit và Probit

Chương 12: Phân tích nhân tố khám phá EFA

PHỤ LỤC A: Cài đặt Rstudio và gia công hàm viết sẵn

PHỤ LỤC B: Text Data Mining

————&&————

Thư viện RQuantLib

Thư viện RQuantLib

RQuantLib là một package (của phần mềm R) cho phép R thực hiện các câu lệnh của thư viện tài chính định lượng QuantLib.

Các chức năng chính:

  • Định giá option. Hỗ trợ vanilla và exotic option: European và American option; Binary, Barrier và Asian option. Ngoài ra, implied volatility cũng được tính toán cho European và American option.
  • Fixed Income. Hỗ trợ: CallableBond; ConvertibleFixedCouponBond; ConvertibleFloatingCouponBond; ConvertibleZeroCouponBond; Enum; FittedBondCurveFixedRateBond; FixedRateBondCurve; FixedRateBondPriceByYield; FixedRateBondYield; FloatingRateBond; ZeroCouponBond; ZeroPriceByYield; ZeroYield.
  • Utilities. Xác định ngày giao dịnh (từ nhiều nước).

Trang chủ: http://dirk.eddelbuettel.com/code/rquantlib.html

——————-&&——————-

Enjoy the Joy of Christmas: With R

Noel

Câu lệnh R:

# Christmas tree

L <- matrix( c(0.03, 0, 0 , 0.1, 0.85, 0.00, 0.00, 0.85, 0.8, 0.00, 0.00, 0.8, 0.2, -0.08, 0.15, 0.22, -0.2, 0.08, 0.15, 0.22, 0.25, -0.1, 0.12, 0.25, -0.2, 0.1, 0.12, 0.2), nrow=4)

B <- matrix( c(0, 0, 0, 1.5, 0, 1.5, 0, 0.85, 0, 0.85, 0, 0.3, 0, 0.4), nrow=2)

prob = c(0.02, 0.6,.08, 0.07, 0.07, 0.07, 0.07)

# Iterate the discrete stochastic map
N = 1e5  #   number of iterations
x = matrix(NA,nrow=2,ncol=N)
x[,1] = c(0,2)   # initial point
k <- sample(1:7,N,prob,replace=TRUE) # values 1-7

for (i in 2:N) x[,i] = crossprod(matrix(L[,k[i]],nrow=2),x[,i-1]) + B[,k[i]] # iterate

par(bg=’darkblue’,mar=rep(0,4))

plot(x=x[1,],y=x[2,], col=grep(‘green’,colors(),value=TRUE), axes=FALSE, cex=.1, xlab=”, ylab=” )

bals <- sample(N,20)

points(x=x[1,bals],y=x[2,bals]-.1, col=c(‘red’,’blue’,’yellow’,’orange’), cex=2, pch=19 )

text(x=-.7,y=8, labels=’Merry’, adj=c(.5,.5), srt=45, vfont=c(‘script’,’plain’), cex=3, col=’gold’ )

text(x=0.7,y=8, labels=’Christmas’, adj=c(.5,.5), srt=-45, vfont=c(‘script’,’plain’), cex=3, col=’gold’ )

text(x=0,y=0, labels=’Viet Nam 2015′, adj=c(.5,.5), srt=0, vfont=c(‘script’,’plain’), cex=3, col=’red’ )

Nguồn: http://www.r-bloggers.com/merry-christmas-5/

——————-&&——————-

Khám phá sự thú vị của copula với gói lệnh R-copula trên TTCK Việt Nam

Khám phá sự thú vị của copula với gói lệnh R-copula  trên TTCK Việt Nam[1]

 Lê Văn Tuấn

Đại học Thương mại

Tóm tắt. Trong bài viết này, chúng tôi sẽ sử dụng gói lệch copula của phần mềm R để thực hành việc ứng dụng copula trên thị trường chứng khoán Việt Nam. Mục tiêu của bài viết là xây dựng phân bố đồng thời (qua copula) của lợi suất của danh mục cổ phiếu. Quá trình xây dựng bao gồm đầy đủ các vấn đề suy diễn thống kê cho copula: kiểm định sự độc lập, kiểm định goodness-of-fit, ước lượng tham số, sinh số ngẫu nhiên và vẽ hình minh họa 3d. Kết quả thực nghiệm cho thấy, các cổ phiếu trên TTCK Việt Nam là phụ thuộc theo copula – kết luận này gần như hiển nhiên; tuy nhiên, với các bộ cổ phiếu khác nhau có thể cho các copula khác nhau. Ngoài ra, kết quả thực nghiệm qua copula còn cho thấy các chỉ số đại diện cho TTCK Việt Nam và Mỹ là độc lập.

[1] Tên bài viết phỏng theo tên 2 bài báo: The Joy of Copulas Bivariate Distributions with Uniform MarginalsEnjoy the Joy of Copulas With a Package copula

  1. TỔNG QUAN

Ứng dụng của copula.

Lí thuyết copula là một công cụ hữu hiệu để xây dựng hàm phân phối đồng thời từ các phân phối biên duyên và để mô tả sự phụ thuộc giữa các biến ngẫu nhiên. Nelsen (1999) là cuốn tài liệu kinh điển giới thiệu chi tiết các khái niệm, kiến thức toán học nền tảng của lí thuyết copula. Bên cạnh đó, Cherubini, et al. (2004) và McNeil, et al. (2005) cũng có thể xem là các cuốn từ điển về lý thuyết copula, ngoài các khái niệm toán học, hai cuốn sách này cũng cung cấp một số công cụ thống kê (chưa bao gồm lí thuyết về kiểm định) và rất nhiều ứng dụng của copula trong tài chính. Lí thuyết kiểm định goodness-of-fit của copula được tổng hợp trong Genest, et al. (2007); kết quả đầu tiên là Wang-Wells (2000) – chỉ cho copula Archimedean.  Cho đến hiện tại, lý thuyết copula vẫn còn rất nhiều bài toán mở đặc biệt là trong trường hợp nhiều chiều.

Từ cuối những năm 90 của thế kỉ trước, giới khoa học chứng kiến một sự “đổ bộ như vũ bão” của copula trong tài chính, ở cả khía cạnh học thuật, ứng dụng và thực hành.

Ứng dụng đầu tiên trong tài chính của copula là quản trị rủi ro. Nghiên cứu được xem là tiên phong trong lĩnh vực này là Embrechts, et al. (2002) (được giới thiệu ở dạng tiền xuất bản năm 1999), trong tài liệu này, các tác giả đã trình bày chi tiết ứng dụng của copula để mô tả sự phụ thuộc của các đại lượng ngẫu nhiên cũng như chỉ ra một số sai lầm khi áp dụng hệ số tương quan trong quản trị rủi ro. Embrechts-Puccetti (2006) ứng dụng copula xây dựng chặn cho hàm các thước đo rủi ro ở trong một lớp và giữa các lớp rủi ro (rủi ro thị trường, rủi ro tín dụng, rủi ro hoạt động, …). Cherubini-Luciano (2000) ước lượng giá trị VaR cho danh mục với copula không điều kiện; Palaro-Hotta (2006) ước lượng giá trị VaR cho danh mục với copula điều kiện.

Ứng dụng thứ hai của copula trong tài chính là định giá các công cụ phái sinh: quyền chọn (option) và phái sinh tín dụng (credit derivative – những hợp đồng cho phép chuyển nhượng rủi ro tín dùng từ một đối tượng này sang đối tượng khác trên thị trường tài chính). Lí thuyết và thực hành ứng dụng copula trong định giá phái sinh được trình bày chi tiết trong Cherubini, et al. (2004). Công trình nổi tiếng nhất trong lĩnh vực này là Li (2001); trong đó, tác giả đã cải tiến mô hình rủi ro tín dụng trong định giá nợ công ti và đề xuất copula Gaussian để xây dựng phân phối đồng thời của danh mục rủi ro tín dụng. Trong mô hình của Li, các phân phối biên duyên (thời gian phá sản) là phân phối mũ 1 chiều, vấn đề ở đây là không tồn tại phân phối mũ nhiều chiều. Công trình của Li đã trở nên rất nổi tiếng ngay sau đó và được hàng loạt các định chế tài chính trên toàn thế giới áp dụng để định giá nghĩa vụ nợ có thế chấp (CDO – collateralized debt obligation). Tuy nhiên, cuộc khủng hoảng nợ thế chấp dưới chuẩn bắt đầu từ năm 2007 tại Mỹ đã biến Li từ một người anh hùng trở thành tội đồ, phương trình copula được gọi là công thức đã giết chết phố Wall, copula Gaussian được gọi là phát minh tồi tệ nhất trong quản trị rủi ro tín dụng. Cần nhấn mạnh rằng, mặc dù bị nhiều chỉ trích nhưng copula vẫn là công cụ phổ biến trong định giá phái sinh trên thế giới, giá trị của nó trong thực tế vẫn là vấn đề đang tranh cãi.

Ứng dụng thứ ba của copula trong tài chính là tối ưu hóa danh mục đầu tư. Patton (2004) xem xét cho danh mục gồm 2 tài sản. Garci-Tsafack (2007) xem xét cho danh mục gồm 4 tài sản: 2 cổ phiếu và 2 trái phiếu trong 2 nước.

Ứng dụng thứ tư của copula trong tài chính là nghiên cứu sự “lây lan” (contagion) giữa các thị trường tài chính. Rodriguez (2007) là công trình đầu tiên nghiên cứu sự lan truyền giữa các thị trường tài chính bằng công cụ copula, trong công trình này, tác giả đã sử dụng mô hình Markov switching copula.

Ngoài 4 lĩnh vực ứng dụng chính, còn nhiều công trình khác trình bày những ứng dụng riêng lẻ của copula trong tài chính, xem trong Patton (2006).

Ở góc độ “sư phạm”, Genest-Favre (2007) là tài liệu rất nên đọc khi tìm hiểu về lí thuyết copula. Trong tài liệu này, các tác giả đã sử dụng bộ dữ liệu gồm 6 số để minh họa cho việc xây dựng copula.

Ở góc độ thực hành tính toán, nhiều phần mềm cung cấp gói lệnh hỗ trợ copula như: Matlab, R, SAS, EViews, Maple, Mathematica, …  Tài liệu hướng dẫn của phần mềm R có thể xem trong Kojadinovic-Yan (2010) và Yan (2007).

Nền tảng toán học – copula là gì.

Lí thuyết copula được xem  là bắt nguồn từ định lí Sklar (1959): Cho X1, …, Xd là các b.n.n với các hàm phân phối liên tục F1, …, Fd và hàm phân phối đồng thời H. Khi đó tồn tại duy nhất một hàm C: [0, 1]d vào [0, 1] sao cho

Sklar

Hàm C ở trên được gọi là copula, được hiểu một cách đơn giản là hàm phân phối nhiều chiều với các hàm biên duyên là các phân phối đều chuẩn tắc.

Từ định lí Sklar ta thấy, phần phụ thuộc giữa các biến ngẫu nhiên được xác định bởi một copula, và có thể tách rời nó ra khỏi phần các biên duyên. (Hai phần này kết hợp lại với nhau thì cho phân phối đồng thời H). Vì vậy, copula còn được gọi là hàm (cấu trúc) của sự phụ thuộc.

Các họ copula nhiều chiều được R (gói lệnh copula) hỗ trợ là: Clayton, Gumbel-Hougaard, Frank, Plackett (thuộc họ Archimedean); và normal (copula Gaussian), t-copula (thuộc họ elliptical).

Mệnh đề đảo của định lí Sklar: Với bất kỳ copula C và Y1, …, Yd là các b.n.n với các hàm phân phối liên tục F1, …, Fd, công thức (1) định nghĩa một hàm phân phối d chiều H với các hàm biên duyên F1, …, Fd.

Mệnh đề đảo cho phép xây dựng hàm phân phối d chiều H từ các hàm biên duyên. Lưu ý rằng H không phải là hàm phân phối đồng thời “TRUE” của Y1, …, Yd; nhưng H có biên duyên trùng với các phân phối của Y1, …, Yd.

Mệnh đề đảo cho thấy đặc tính “mềm dẻo” của copula: để xây dựng H, ta không cần Y1, …, Yd phải cùng phân phối và cũng không cần có ràng buộc với C.

Một ưu điểm nữa của copula là tính bất biến: copula không đổi nếu ta chuyển dịch Y1, …, Yd dưới các ánh xạ tăng ngặt. Đặc tính này cho phép ta có thể xây dựng copula trực tiếp từ mẫu hoặc từ rank của mẫu; hơn nữa, nếu ta chuyển từ mô hình các lợi suất % của danh mục các tài sản tài chính sang mô hình lợi suất loga, thì copula cũng không đổi.

 Các suy diễn thống kê được thực hiện trên các giả quan sát và copula thực nghiệm.

Cho (X11,…, X1d), …, (X n1,…, Xnd) là n quan sát d chiều, kí hiệu Ri= (Ri1,…, Rid) với Rij là thứ hạng (rank) của Xij trong X1j,…, Xnj.

Giả quan sát (pseudo-observations): pseudo-observations

hệ số 1/(n+1) nhằm tránh những vấn đề nảy sinh tại biên.

Copula thực nghiệm (empirical copula) của mẫu được xác định là

empirical copula

(với 1(A) là hàm chỉ báo (indicator function) của tập A).

Thực hành trên thị trường chứng khoán Việt Nam.

Việc xây dựng phân bố nhiều chiều (thông qua copula) từ dữ liệu (mẫu quan sát nhiều chiều) thường được chia làm 2 bước:

Bước 1. Xây dựng các hàm phân phối biên duyên

Bước 2. Xây dựng hàm copula phù hợp

Ở mỗi bước, ta có thể sử sử dụng bất kì kỹ thuật nào trong thống kê: thống kê tham số, phi tham số, nửa-tham số hay thống kê Bayesian.

Bước 1 thuần túy là thống kê 1 chiều; Bước 2 gồm 2 vấn đề chính: Ước lượng tham số và kiểm định sự phù hợp của mô hình (goodness-of-fit). Tuy nhiên, 99.9%  các ứng dụng của copula đều bỏ qua bước kiểm định goodness-of-fit (xem Embrechts (2009)).

Trong những phần sau, ta sẽ xây dựng copula và phân phối đồng thời của danh mục cổ phiếu (VCB, FPT, HAG) trên sàn HOSE, dữ liệu là ma trận giả quan sát lưu trong biến pseudoReturns (xem phần phụ lục cách tạo biến này).

Tương tự, ta cũng thực hiện kiểm định sự độc lập (qua copula) của TTCK Việt Nam và Mỹ dựa trên hai chỉ số đại diện là chỉ số công nghiệp Dow Jones (DJI) và chỉ số của sàn chứng khoán Hà Nội (HNX).

Download bài viết đầy đủ: r-copula

 —————–&&—————-

Bài giảng: Phương pháp phân tích dữ liệu với ngôn ngữ R – GS. Nguyễn Văn Tuấn

Bài giảng: Phương pháp phân tích dữ liệu với ngôn ngữ R – GS. Nguyễn Văn Tuấn

Loạt bài giảng không chỉ hướng dẫn cách sử dụng R mà còn trình bày rất cô đọng các kiến thức trong Thống kê và Kinh tế lượng.

Link: https://www.youtube.com/user/drnguyenvtuan/videos

Danh sách bài giảng 
Bài giảng
Nội dung
Địa chỉ
1
Giới thiệu R
2
Giao diện và tương tác
3
Cách đọc ASCII file
4
Cách đọc Excel file
5
Biên tập dữ liệu (1)
6
Biên tập dữ liệu (2)
7
Biên tập dữ liệu (3)
8
Phân tích mô tả biến liên tục
9
Phân tích mô tả biến phân nhóm
10
T-test (1)
11
T-test (2)
12
Kiểm định phân bố chuẩn
13
Kiểm định Wilocoxon
14
Phương pháp kiểm định hoán vị
15
Kiểm định 2 biến nhị phân
16
Thông số trong biểu đồ
17
Biểu đồ hộp (box plot)
18
Biểu đồ sai số chuẩn
19
Biểu đồ thanh và phân bố
20
Biểu đồ tương quan đa biến
21
Tỉ số nguy cơ (risk ratio)
22
Tỉ số odss (odds ratio)
23
Giới thiệu phân tích phương sai (ANOVA)
24
Phân tích hậu định (posthoc analysis)
25
Phân tích phương sai phi tham số
26
Mô hình tuyến tính cho phân tích phương sai
27
Giới thiệu phương pháp kiểm định Ki bình phương
28
Kiểm định Ki bình thương (Chi square)
29
Hệ số tương quan
30
Hồi qui tuyến tính: giới thiệu
31
Hồi qui tuyến tính: phân tích phương sai
32
Phân tích dao động dư
33
Giới thiệu mô hình hồi qui tuyến tính đa biến https://www.youtube.com/watch?v=Uxh7tdg42UQ&list=UU21dOPe-YHO3Gw6BRbyeotQ
34
Hồi qui tuyến tính đa biến (ước tính) http://www.youtube.com/watch?v=yRj1-J7ZH5Y&list=UU21dOPe-YHO3Gw6BRbyeotQ
35
Ảnh hưởng tương tác trong mô hình hồi qui tuyến tính https://www.youtube.com/watch?v=i3e2zWKQGAE&list=UU21dOPe-YHO3Gw6BRbyeotQ
36
Vấn đề đa cộng tuyến (multicollinearity) https://www.youtube.com/watch?v=sjI94HvBfaY&list=UU21dOPe-YHO3Gw6BRbyeotQ
37
Đánh giá tầm quan trọng trong mô hình hồi qui tuyến tính https://www.youtube.com/watch?v=HsU3cDpQJko&list=UU21dOPe-YHO3Gw6BRbyeotQ
38
Chọn mô hình (model selection) trong phân tích hồi qui tuyến tính đa biến https://www.youtube.com/watch?v=Q40TFF2Opuc&list=UU21dOPe-YHO3Gw6BRbyeotQ
39
Chọn mô hình hồi qui tuyến tính bằng phương pháp Bayes https://www.youtube.com/watch?v=eVp0oyKxtrI&index=3&list=UU21dOPe-YHO3Gw6BRbyeotQ
40 Giới thiệu mô hình hồi qui logistic 1: Odds ratio https://www.youtube.com/watch?v=AJCmccF3faY&list=UU21dOPe-YHO3Gw6BRbyeotQ
41 Mô hình hồi qui logistic https://www.youtube.com/watch?v=0yILsvQZ0Uw&index=4&list=UU21dOPe-YHO3Gw6BRbyeotQ
42 Diễn giải kết quả phân tích hồi qui logistic https://www.youtube.com/watch?v=FcxY-Cheb6Y&index=2&list=UU21dOPe-YHO3Gw6BRbyeotQ
43 Đánh giá mô hình hồi qui logistic https://www.youtube.com/watch?v=q5M5N66QFBk&list=UU21dOPe-YHO3Gw6BRbyeotQ
44 Các “thước đo” mô hình hồi qui logistic https://www.youtube.com/watch?v=6rTAIAM-Vzw
45 Mô hình hồi qui logistic đa biến https://www.youtube.com/watch?v=I9JD2fDbcHY&list=UU21dOPe-YHO3Gw6BRbyeotQ
46 Phương pháp tìm mô hình hồi qui logistic tối ưu https://www.youtube.com/watch?v=bAUrZqhCNww
47 Đánh giá độ phân định (discrimination) mô hình tiên lượng https://www.youtube.com/watch?v=8msZdongyMc

————-&&————

Theo dõi

Get every new post delivered to your Inbox.

Join 105 other followers