Danh mục đầu tư sâu (Deep Portfolio)

Danh mục đầu tư sâu (Deep Portfolio)

(Nguồn: https://theintelligenceofinformation.wordpress.com/)

Bài viết xây dựng lý thuyết danh mục đầu tư sâu (deep portfolio theory). Bằng cách xây dựng trên cơ sở đánh đổi rủi ro cổ điển của Markowitz, chúng tôi phát triển một quy trình gồm bốn bước khép kín gồm mã hóa, hiệu chỉnh, xác thực và xác minh để xây dựng quy trình lựa chọn danh mục đầu tư chung và tự động. Trọng tâm của thuật toán là các cấu trúc phân cấp sâu sắc của danh mục đầu tư được xây dựng trong bước mã hóa. Sau đó, bước hiệu chỉnh cung cấp các khoản thanh toán đa biến dưới dạng danh mục đầu tư phân cấp sâu được thiết kế để nhắm mục tiêu nhiều chức năng mục tiêu. Bước xác thực đánh đổi lượng chính quy được sử dụng trong các bước mã hóa và hiệu chỉnh. Bước xác minh sử dụng phương pháp xác thực chéo để tìm ra biên hiệu quả (efficient frontier) cho danh mục đầu tư sâu. Chúng tôi minh họa tất cả bốn bước của lý thuyết danh mục đầu tư bằng số.
Các lý thuyết về danh mục tài chính là một trong những thành tựu quan trọng của kinh tế tài chính trong thế kỷ XX vừa qua. Một trong những lý thuyết như vậy được gọi là Lý thuyết Danh mục đầu tư Markowitz hay Lý thuyết Danh mục Đầu tư Hiện đại (Modern Portfolio Theory), được đặt theo tên của người đoạt giải Nobel Kinh tế Harry Markowitz. Có thể nhận thấy cốt loãi của nó là một lý thuyết thống kê và toán học. Và nếu nó là toán học và thống kê, nó có vị trí tốt để được cải thiện và nâng cao bằng một cách tiếp cận tính toán, thuật toán. Và đó là trường hợp với đề xuất của bài báo của chúng tôi: đó là một cách tiếp cận phần mềm khác đối với Lý thuyết danh mục đầu tư biến vấn đề tìm kiếm biên hiệu quả nhất mà lý thuyết dự đoán thành một bài toán tối ưu hóa, nhưng từ quan điểm học máy / học sâu mới. Nếu tối ưu hóa đủ lớn, nó có thể được tiếp cận tốt nhất như một vấn đề học sâu. 
Mục tiêu của bài báo là cung cấp một lý thuyết về danh mục đầu tư sâu. Mặc dù chúng tôi xây dựng dựa trên ý tưởng ban đầu của Markowitz rằng phân bổ danh mục đầu tư là sự đánh đổi giữa rủi ro và lợi nhuận, nhưng cách tiếp cận của chúng tôi khác nhau theo một số cách. Mục tiêu của lý thuyết danh mục đầu tư sâu là gấp đôi. Đầu tiên, chúng tôi giảm sự phụ thuộc vào mô hình đến mức tối thiểu thông qua phương pháp tiếp cận theo hướng dữ liệu thiết lập sự cân bằng rủi ro-lợi nhuận như một phần của giai đoạn xác nhận của lộ trình học có giám sát (supervised learning), một khái niệm quen thuộc với học máy. Thứ hai, chúng tôi xây dựng bộ mã hóa tự động và các khoản thanh toán cho danh mục đầu tư đa biến, được ký hiệu là Fˆm (X) và Fˆp (X), cho mục tiêu thị trường m và mục tiêu danh mục đầu tư p, từ một tập hợp các tài sản cơ sở, được ký hiệu là X, thông qua phân cấp ( hoặc sâu) tập hợp các lớp thanh toán phi tuyến đơn biến của các danh mục phụ. Chúng tôi cung cấp quy trình gồm bốn bước mã hóa, hiệu chỉnh, xác nhận và xác minh để xây dựng quy trình lựa chọn danh mục đầu tư. Mã hóa tìm bản đồ thị trường, hiệu chỉnh tìm bản đồ danh mục đầu tư được đưa ra một mục tiêu dựa trên nhiều chức năng mục tiêu của danh mục đầu tư. Bước xác thực đánh đổi số lượng quy định và lỗi liên quan đến các bước mã hóa và hiệu chỉnh. Bước xác minh sử dụng phương pháp xác nhận chéo để tìm ra biên sâu hiệu quả của danh mục đầu tư.
Chúng tôi hướng tới một cách tiếp cận khác với Markowitz, nhưng vẫn giả định sự đánh đổi rủi ro ban đầu. Sự khác biệt đầu tiên liên quan đến việc giả định số dư trả lại rủi ro là một vấn đề theo hướng dữ liệu, có thể tuân theo quy trình học máy được giám sát như một phần của bước xác thực; thứ hai giả định việc xây dựng một bộ mã tự động phân cấp sâu tính toán một tập hợp các danh mục con phi tuyến đơn biến được kết hợp với một tập hợp các khoản thanh toán cho danh mục đầu tư đa biến với một số chức năng mục tiêu. Với sự kết hợp của các bước mã hóa, hiệu chỉnh, xác thực và xác minh, người ta khẳng định rằng kết quả là dấu vết được cải thiện về biên hiệu quả của danh mục đầu tư sâu. 
Lý thuyết danh mục đầu tư sâu dựa trên các yếu tố sâu, các yếu tố trừu tượng lớp thấp hơn (hoặc ẩn), thông qua huấn luyện, tương ứng với biến độc lập. Yếu tố sâu là đặc điểm chính để phân biệt học sâu với các kỹ thuật giảm kích thước thông thường. Điều này có tầm quan trọng đặc biệt trong tài chính, nơi mà trước đây tất cả các mức trừu tượng đều có thể khả thi như nhau. 
Các yếu tố sâu chi phối, thường có mối quan hệ phi tuyến tính với dữ liệu đầu vào, đảm bảo khả năng áp dụng của giảm không gian con cho biến độc lập. Sự tồn tại của một biểu diễn như vậy xuất phát từ định lý Kolmogorov-Arnold phát biểu rằng không có hàm đa biến, chỉ có các cấu tạo của các hàm semiaffine đơn biến (tức là danh mục đầu tư). Điều này thúc đẩy tính tổng quát của các kiến ​​trúc sâu. 
Câu hỏi đặt ra là làm thế nào để sử dụng dữ liệu huấn luyện để xây dựng các yếu tố sâu. Cụ thể, đối với các chức năng kích hoạt đơn biến như tanh hoặc đơn vị tuyến tính điều chỉnh (ReLU), các yếu tố sâu có thể được hiểu là các thành phần của quyền chọn mua và bán tài chính trên kết hợp tuyến tính của các tài sản được đại diện bởi X. Như vậy, các yếu tố sâu trở thành danh mục đầu tư sâu và có thể đầu tư, đó là một quan sát trọng tâm. 
Tính linh hoạt về mặt lý thuyết để gần đúng với hầu như bất kỳ hàm thanh toán phi tuyến nào đặt việc chính quy hóa trong huấn luyện và xác nhận là trung tâm của lý thuyết danh mục đầu tư sâu. Trong khuôn khổ này, tối ưu hóa danh mục đầu tư và phát hiện tính kém hiệu quả trở thành một nhiệm vụ gần như hoàn toàn theo hướng dữ liệu (và do đó không có mô hình). Một trong những điểm mạnh chính là chúng tôi tránh được đặc tả của bất kỳ đầu vào thống kê nào như lợi nhuận dự kiến ​​hoặc ma trận phương sai-hiệp phương sai. Cụ thể, chúng ta thường có thể xem các mô hình thống kê như những bộ mã tự động kém theo nghĩa là nếu chúng ta cho phép cấu trúc phi tuyến tính phong phú hơn trong việc xác định bản đồ thị trường, chúng ta có thể thu được các lỗi định giá thấp hơn trong khi vẫn mang lại hiệu quả tốt cho danh mục đầu tư ngoài mẫu.

ỨNG DỤNG MỘT SỐ MÔ HÌNH HỌC MÁY TRONG DỰ BÁO CHIỀU BIẾN ĐỘNG CỦA THỊ TRƯỜNG CHỨNG KHOÁN VIỆT NAM

ỨNG DỤNG MỘT SỐ MÔ HÌNH HỌC MÁY TRONG DỰ BÁO CHIỀU BIẾN ĐỘNG CỦA THỊ TRƯỜNG CHỨNG KHOÁN VIỆT NAM(*)

Lê Văn Tuấn, Nguyễn Thu Thủy, Lê Thị Thu Giang

Bộ môn Toán, Đại học Thương mại, Hà Nội, Việt Nam


Tóm tắt. Bài viết sử dụng một số mô hình/thuật toán học máy để dự báo xu hướng biến động (tăng/giảm) của chỉ số thị trường chứng khoán của Việt Nam. Kết quả cho thấy, trong các mô hình hồi quy Logistic, mô hình phân tích phân biệt tuyến tính (LDA), phân tích phân biệt toàn phương (QDA) và mô hình K – lân cận (KNN): mô hình KNN(10) có độ chính xác dự báo tốt nhất. Câu lệnh R được cung cấp đầy đủ tới bạn đọc.


1.     MỞ ĐẦU

Chuỗi chỉ số thị trường chứng khoán thường được đặc trưng bởi một hành vi theo đám đông và phi tuyến tính khiến cho việc dự báo trở thành một nhiệm vụ đầy thách thức. Các yếu tố tạo ra sự biến động trong lĩnh vực này rất phức tạp và bắt nguồn từ nhiều nguyên nhân với bản chất khác nhau. Từ các quyết định kinh tế, chính trị và đầu tư cho đến những nguyên nhân không rõ ràng, ở một khía cạnh nào đó, đều gây ra nhiều khó khăn trong dự đoán chỉ số thị trường chứng khoán. Thị trường chứng khoán luôn thu hút các nhà đầu tư do khả năng sinh lời cao, tuy nhiên, nó cũng chứa đựng rất nhiều rủi ro. Vì vậy, cần có một công cụ thông minh để giảm thiểu rủi ro với hy vọng có thể tối đa hóa lợi nhuận. Ngày nay, các mô hình Học máy (Machine Learning) đã trở thành một công cụ phân tích mạnh mẽ được sử dụng để trợ giúp và quản lý đầu tư hiệu quả. Các mô hình này đã được sử dụng rộng rãi trong lĩnh vực tài chính để cung cấp những phương pháp mới nhằm giúp các nhà đầu tư đưa ra quyết định tốt hơn trong việc đầu tư chứng khoán.

Thị trường chứng khoán mỗi quốc gia ngày càng phát triển sâu rộng và hòa nhập vào thị trường quốc tế vì chúng có lợi nhuận hấp dẫn (He và cộng sự, 2015; Chou và Nguyễn, 2018) và là một tài sản có tính thanh khoản tương đối cao do chúng có thể được mua – bán nhiều lần thông qua các sở giao dịch chứng khoán. Mặc dù vậy, đầu tư cổ phiếu có rủi ro cao do sự không chắc chắn và biến động trên thị trường chứng khoán (Hyndman và Athanasopoulos, 2018). Do đó, các nhà đầu tư phải hiểu bản chất của từng cổ phiếu riêng lẻ và các yếu tố phụ thuộc của chúng ảnh hưởng đến giá cổ phiếu để tăng cơ hội đạt được lợi nhuận cao hơn. Quan trọng nhất, các nhà đầu tư cần phải đưa ra các quyết định đầu tư hiệu quả vào đúng thời điểm (Ijegwa và cộng sự, 2014) bằng cách sử dụng lượng thông tin chính xác và thích hợp (Nguyen và cộng sự, 2015).

Dự báo sự biến động trên thị trường chứng khoán là một chủ đề quan trọng trong lĩnh vực tài chính. Việc dự báo hiệu quả sẽ giúp nhà đầu tư xây dựng được chiến lược đầu tư tối ưu cũng như phòng ngừa rủi ro. Dự báo một số chỉ số tài chính dựa trên một số yếu tố tác động sẽ dễ dàng nhưng kết quả có thể không chính xác vì các yếu tố chưa được đưa vào mô hình cũng có thể quan trọng trong việc giải thích sự biến động của chỉ số tài chính. Chẳng hạn, giá của cổ phiếu hoặc chỉ số của thị trường có thể bị ảnh hưởng bởi nhiều yếu tố khác nhau, ví dụ: tăng trưởng kinh tế (Perwej và Perwej, 2012; Selvin và cộng sự, 2017). Rất khó để phân tích tất cả các yếu tố theo cách thủ công (Nguyen và cộng sự, 2015; Sharma và cộng sự, 2017), vì vậy, sẽ tốt hơn nếu có các công cụ hỗ trợ phân tích dữ liệu này. Trong đầu tư chứng khoán, việc đưa ra quyết định đúng đắn trong khoảng thời gian kịp thời là một thách thức lớn vì cần một lượng thông tin đồ sộ để dự đoán sự biến động của giá thị trường chứng khoán. Những thông tin này rất quan trọng đối với các nhà đầu tư vì sự biến động của thị trường chứng khoán có thể dẫn đến tổn thất đầu tư đáng kể. Do đó, việc phân tích thông tin lớn này rất hữu ích cho các nhà đầu tư và cũng hữu ích cho việc phân tích xu hướng biến động của các chỉ số thị trường chứng khoán (Kim và Kang, 2019).

Với sự thành công rực rỡ của các mô hình Học máy (Machine Learning) trong nhiều lĩnh vực, ứng dụng của  Học máy trong tài chính ngày càng được chú ý và phát triển không ngừng (Nguyen et al., 2015; Attigeri et al., 2015; Kim and Kang, 2019). Việc áp dụng các mô hình Học máy để dự báo chứng khoán, cổ phiếu cũng rất phổ biến trên thế giới, không chỉ trong học thuật mà còn trong thực tiễn. Ở các bài toán dự báo ở những nghiên cứu trước đây, các tác giả thường sử dụng dữ liệu lịch sử của chuỗi thời gian để cung cấp các ước lượng cho các giá trị trong tương lai. Gần đây, các nhà nghiên cứu đã bắt đầu phát triển các kỹ thuật Học máy giống với quá trình sinh học và tiến hóa để giải quyết các vấn đề phức tạp và phi tuyến. Kỹ thuật này trái ngược với cách tiếp cận truyền thống, tức là các phương pháp thống kê cổ điển. Ví dụ về các kỹ thuật học máy có thể nhắc đến như Mạng thần kinh nhân tạo (Artificial Neural Networks  – ANN), Máy vectơ hỗ trợ (Support Vector Machines – SVM) và Lập trình di truyền (Genetic Programming  – GP), thuật toán K-lân cận (K-nearest neighbors – KNN), Mô hình hồi quy Logistic, phân tích phân biệt tuyến tính (Linear Discriminant Analysis – LDA), phân tích phân biệt toàn phương (Quadratic Discriminant  Analysis – QDA).

Bài báo này sẽ khám phá một ứng dụng của Học máy trong tài chính. Cụ thể, chúng tôi sẽ sử dụng các mô hình Học máy quen thuộc để áp dụng dự báo cho thị trường chứng khoán Việt Nam. Kết quả cho thấy, trong các mô hình hồi quy Logistic, LDA, QDA, và KNN: mô hình KNN(10) có độ chính xác dự báo tốt nhất.

(*) Đăng Kỷ yếu Hội thảo Khoa học Quốc tế thường niên các nhà khoa học trẻ của các trường khối kinh tế và kinh doanh (ICYREB 2020)

download bài viết đầy đủ:

ỨNG DỤNG MÔ HÌNH LOGISTIC CHẤM ĐIỂM KHÁCH HÀNG CÁ NHÂN NỘP HỒ SƠ VAY TRÊN LENDINGCLUB

ỨNG DỤNG MÔ HÌNH LOGISTIC CHẤM ĐIỂM KHÁCH HÀNG CÁ NHÂN NỘP HỒ SƠ VAY TRÊN LENDINGCLUB

(Nguồn: http://tapchiktdn.ftu.edu.vn)

Nguyễn Thị Thúy Quỳnh [1]

Trần Thị Xuân Anh[2]

Bùi Lê Trà Linh[3]

 Tóm tắt:Bài nghiên cứu ứng dụng mô hình logistic chấm điểm 235.629 khách hàng cá nhân nộp hồ sơ vay vốn tại Lendungclub – một trong những tổ chức cho vay ngang hàng (Peer – to – Peer) đầu tiên tại Mỹ. Dữ liệu nghiên cứu được thực hiện trong hai năm 2014-2015 bao gồm 111 đặc điểm của khách hàng vay vốn. Nhóm nghiên cứu đã sử dụng mô hình Logistic để đo lường xác suất một khách hàng vay vốn là khách hàng tốt. Trên cơ sở đó,tổ chức tín dụng sẽ xác định được mức rủi ro tín dụng của khách hàng vay vốn nhằm đưa ra quyết định cho vay phù hợp. Nếu người đi vay có xác suất là khách hàng tốt thấp hơn mức xác suất đưa ra thì sẽ bị từ chối khoản vay, ngược lại người đi vay có xác suất là khách hàng tốt cao hơn mức xác suất đưa ra thì được chấp nhận khoản vayđó tuỳ vào mức độ sẵn sàng chấp nhận rủi ro tín dụng từ tổ chức cho vay.

Từ khóa: chấm điểm khách hàng, logistic, xếp hạng tín dụng, xếp hạng tín nhiệm.

 

Abstract:The paper applied logistics model for rating 235.629 individual borrowers in lendingclub – one of the first peer – to – peer lending institution in US. The research is implemented based on date of two years from 2014 to 2015, including 111 characteristics of clients. The paper used the logistic model to measure the probability that a customer is a good one. Accordingly, the credit institution will determine the level of credit risk of the borrower to make appropriate loan decision. If the borrower has a good probability of being well below the given probability, then the loan will be denied. In contrast, if the borrower has a probability of being a good client higher than the given probability, then the loan is accepted. The given probability depends on the willingness to accept credit risk from the lender.

Keywords: client rating, logistic, credit rating.

 

  1. Giới thiệu về chấp điểm khách hàng và xếp hạng tín dụng

Tín dụng là một trong những hoạt động chính mang lại lợi nhuận cho các ngân hàng thương mại(NHTM). Trong quá trình cấp tín dụng, các ngân hàng thường đối mặt với nguy cơ rủi ro từ nhiều nguyên nhân khác nhau và thường chung một hệ quả là khách hàng không thực hiện được hoặc không thực hiện đầy đủ các nghĩa vụ tài chính khi đến hạn. Những nguy cơ rủi ro khó loại trừ hoàn toàn mà chỉ có thể hạn chế và phòng ngừa. Một trong những biện pháp hạn chế rủi ro tín dụng hiệu quả và phổ biến hiện nay là xây dựng mô hìnhchấm điểm khách hàng nhằm xếp hạng tín dụng, phân loại khách hàng, hỗ trợ công tác ra quyết định và quản lý tín dụng.

Xếp hạng tín dụng (XHTD)phát trển mạnh từ nhiều năm nay ở Mỹ và các nước Châu Âu. Ba công ty đánh giá tín dụng lớn nhất trên thế giới hiện nay là công ty Standard & Poor’s (S&P), Moody’s và Fitch Group. S&P và Moody’s có trụ sở ở Mỹ, Fitch trụ sở tại cả Mỹ và Anh và do FIMALAC của Pháp kiểm soát.

Trong quá khứ, các tổ chức tín dụng thườngsử dụng các mô hình chấm điểm khách hàng và XHTDđể đánh giá và phân loại khách hàng vay nợ.Abdou và Pointon (2011) đã hệ thống hoá 2 phương pháp XHTD chính được sử dụng gồm phương pháp chuyên gia và phương pháp thống kê. Phương pháp chuyên gia là phương pháp thu thập và xử lý những đánh giá dự báo bằng cách tập hợp và hỏi ý kiến các chuyên gia giỏi trong lĩnh vực tài chính ngân hàng để xác định rủi ro và chất lượng của khoản tín dụng.Phương pháp này mất nhiều chi phí và thời gian do cần số lượngchuyên gia lớn tham giađánh giá.Phương pháp thống kê dựa trên các số liệu thực tiễn như mức độ nợ, khả năng trả nợ… và phương pháp kiểm định thống kê để phát hiện các biến số ảnh hưởng tới rủi ro tín dụng. Sự phù hợp của mô hình thống kê phụ thuộc rất lớn vào chất lượng của bộ dữ liệu thực nghiệm. Bộ dữ liệu cần đủ lớn và chính xác thì mô hình thống kê sẽ đưa ra kết quả có ý nghĩa.

Ở Việt Nam, hoạt động XHTD được phát triển từ năm 2002. Trước đó, việc xem xét cấp tín dụng thông thường dựa vào đánh giá chủ quan và mang cảm tính lớn của những người xét cấp tín dụng nên dễ dẫn đến những rủi ro khó lường hoặc có thể mất cơ hội của người đi vay. Những rủi ro gặp phải có thể dẫn đến sự đổ vỡ của ngân hàng…

Năm 1988, Ủy ban Basel về giám sát ngân hàng đã ban hành hiệp ước Basel II nhằm chuẩn mực hóa hoạt động ngân hàng theo xu hướng toàn cầu, thiết lập một hệ thống ngân hàng quốc tế ổn định, thống nhất, bình đẳng, giảm cạnh tranh không lành mạnh đã tạo ra sự thay đổi về quản trị rủi ro trong các ngân hàng, giúp các ngân hàng hoạt động an toàn hơn.

Ở Việt Nam, việc áp dụng Basel II tại cácNHTM đang gặp không ít khó khăn về chi phí tài chính, hệ thống cơ sở dữ liệu và các quy định của ngân hàng nhà nước trong việc hiệu chỉnh các quy định Basel II phù hợp với điều kiện thực tế. Vì vậy, việc tìm kiếm mô hình, phương thức đánh giá rủi ro tín dụng của khách hàng vay tại các NHTM là cần thiết, đặc biệt trong bối cảnh tự do hoá tài chính hiện nay.

Bài viết trình bày kết quả nghiên cứu ứng dụng mô hình Logicstic trên cơ sở dữ liệu khách hàng vay vốn tại Lendingclub (LC), một tổ chức cho vay ngang hàng lớn nhất trên thế giới hiện nay, nhằm đưa ra minh chứng thực nghiệm về tính hiệu quả, khách quan của mô hình XHTD nói chung, mô hình Logistic nói riêng, từ đó khuyến nghị đối với các tổ chức tín dụng tại Việt Nam về việc áp dụng mô hình logicstic xếp hạng khách hàng cá nhân vay vốn.

  1. Cơ sở lý thuyết của mô hình Logistic

Mô hình Logistic (Maddala[12], 1992) được ứng dụng rộng rãi trong phân tích rủi ro tín dụng,ở đó dựa trên các yếu tố ảnh hưởng đến mức độ tín nhiệm của khách hàng dự báo xác suất (mức độ) xảy ra rủi ro tín dụng, quy ra mức điểm tương ứng nhằm XHTD của khách hàng và làm cơ sở xác định khoản vay phù hợp.

Lựa chọn biến độc lập: Biến độc lập được lựa chọn dựa trên bộ dữ liệu thu thập về các đặc trưng được cho là có tác động ảnh hưởng đến việc trả nợ của khách hàng.

Thông tin cá nhân Tình trạng việc làm, nghề nghiệp, thu nhập, tình trạng nhà ở, bản ghi về bản án và số lượng người phụ thuộc…
Lịch sử tín dụng gần đây Chiều dài của lịch sử tín dụng, số lượng và giá trị của quá khứ vay vốn, số lượng và giá trị của các khoản vay trễ hạn trong quá khứ thường được cung cấp bởi các tổ chức cung cấp thông tin tín dụng.
Dữ liệu hành vi Lịch sử sử dụng của tín dụng trên các sản phẩm trước đó: Số tiền chi tiêu, việc trả nợ thực tế….

Hai công cụ sử dụng lựa chọn các biến độc lập nhằm đảm bảo phân loại khách hàng tốt và khách hàng xấu là: The Weight of Evidence (WOE ) và Information Value (IV). WOE mô tả mối quan hệ giữa một biến giải thích và biến phụ thuộc nhị phân; IV đo lường sức mạnh của mối quan hệ đó. Cụ thể

Theo Siddiqi ([13]), nếu IV< 0.02 thì biến độc lập không có quan hệ với biến phụ thuộc; từ 0.02 đến 0.1 thì biến độc lập không có quan hệ quá chặt chẽ với biến phụ thuộc; IV từ  0.1 đến 0.3 thì biến độc lập có mối quan hệ khá chặt chẽ với biến phụ thuộc;IV ≥ 0.3 thì biến độc lập rất chặt chẽ với biến độc lập.

Đánh giá sự phù hợp của mô hình: Đối với mô hình Logistic thông thường có các phương pháp kiểm định tỷ số hàm hợp lý (LR), đo độ phù hợp qua tỷ lệ phần trăm dự báo đúng, kiểm định sự phù hợp Goodness of Fit test,…Tuy nhiên có thể sử dụng đường cong Receiver Operating Characteristic (ROC) và hệ số Gini.Hệ số Gini từ 0.8-1 cho biết mô hình rất tốt; từ  0.6-0.8 là mô hình tốt; từ 0.4-0.6 là mô hình khá; từ 0.2-0.4 là mô hình trung bình; từ  0.0-0.2 là mô hình yếu.

3. Ứng dụng mô hình Logistic chấm điểm khách hàng cá nhân nộp hồ sơ vay

Trên LC người đi vay chỉ cần điền thông tin vào đơn và nộp trực tuyến. Hệ thống của LC sẽ tự động phân tích dữ liệu, đánh giá rủi ro, chấm điểm tín dụng và đưa ra mức lãi suất phù hợp.Sau đó công ty kết nối người đi vay với nhà đầu tư để nhà đầu tư lựa chọn khoản đầu tư thích hợp dựa trên những thông tin về người đi vay như XHTD, mục đích vay tiền, lịch sử tín dụng,…. Đây là hình thức cho vay mà người có tiền và người cần tiền được kết nối trực tiếp với nhau mà không cần thông qua ngân hàng.

Bài viết sử dụng bộ số liệu khách hàng cá nhân trong hai năm 2014 và 2015 trên website www.lendingclub.com để mô tả các bước ứng dụng mô hình logistic nhằmđánh giá khả năng khách hàng là tốt, chấm điểm khách hàng, chỉra điểm cắt làm căn cứ giúp các nhà đầu tư ra quyết định khoản cho vay. Các bước cụ thể như sau:

v  Phân chia biến thành các nhóm

Dữ liệu gồm 235.629 hồ sơ khách hàng đi vay, mỗi khách hàng kê khai 111 đặc điểm tương ứng với 111 biến độc lập.

Bảng 1. Mô tả nhóm biến và các biến đưa vào mô hình

 

 

 

 

Các biến trước vay

Các biến giống Id id, member_id, địa chỉ, … 5 biến
Thông tin cá nhân Tình trạng nhà ở, công việc, thu nhập, tỷ lệ nợ/ thu nhập, mô tả khoản vay,… 11

biến

Hồ sơ tín dụng – Tháng sớm nhất/muộn nhất đánh giá, mở hạn mức tín dụng, lần điều tra hồ sơ…

– Số tháng kể từ lần công khai hồ sơ cuối cùng, lần quá hạn cuối cùng, cuộc điều tra gần đây, lần mở thẻ, tài khoản cuối cùng,…

– Số lần điều tra, số tài khoản quay vòng mở, số tài khoản thẻ mở,…trong khoảng 6 tháng/12 tháng/24 tháng

– Số lượng tài khoản trả góp, số tài khoản quay vòng, số tài khoản thẻ…

– Tổng số hoặc trung bình tổng số dư hiện tại, tổng mức quay vòng tín dụng cao, tổng dư nợ tín dụng, …

– Các biến tỷ lệ sử dụng quay vòng tín dụng, tỷ lệ các tài khoản thẻ quá 75% hạn mức…

74

biến

 

LC đánh giá Gồm 2 biến grade và sub_grade thể hiện đánh giá của LC về mức độ rủi ro đối với mỗi bộ hồ sơ vay dựa trên thông tin cá nhân và thông tin hồ sơ tín dụng của người vay. Grade có các giá trị A,B,C,D,… , còn sub_grade có các giá trị A1,A2…,B1,B2,… càng gần A1 càng được đánh giá là tốt và lãi suất vay càng thấp. 2 biến
Các biến sau vay Thông tin ban đầu khoản vay Các biến thông tin ban đầu của khoản vay, ngay sau khi khoản vay được tài trợ, như: tổng số tiền cho vay, lãi suất, khoản tiền phải thanh toán hàng tháng,… 6 biến
Nhà đầu tư theo dõi khoản vay Các thông tin về tình trạng khoản vay cho đến thời điểm quan sát: Dư nợ gốc, khoản tiền nhà đầu tư nhận đến nay, tiền gốc đến nay, tiền lãi, chi phí thu hồi nợ, phí trả trễ, … 13 biến

Nhóm tác giả thực hiện

Sử dụng phân tích định tính bài nghiên cứu lựa chọn 89 biến độc lập vào mô hình.

Tiếp tục loại bỏ các biến thiếu quan sát và xóa bỏ một vài quansát; Các biến có IV < 0.02 sẽ bị loại, biến có IV > 0.02 sẽ được chọn vào mô hình, các biến có tương quan lớn hơn 0.7 thì sẽ dựa trên IV của biến nào cao hơn sẽ giữ lại. Sử dụng Stepwise lựa chọn các biến đưa vào mô hình. Có 17 biến được lựa chọn và tính giá trị tương ứng.

Bảng 2: Danh sách các biến được lựa chọn làm biến độc lập

Step Effect Entered DF Score

Chi-Square

Pr > 

Chi_Square

1 dti3w

(Tỷ lệ giá trị khoản vay/thu nhập khả dụng)

1 1003.639 <.0001
2 acc_open_past_24mths

(số TK giao dịch mở trong 24 tháng trước ngày nộp hồ sơ vay)

1 995.2945 <.0001
3 bc_open_to_buyw

(số tiền còn lại có thể vay trong các tài khoản thẻ ngân hàng quay vòng)

1 973.1144 <.0001
4 inq_last_6mthsw

(số lần điều tra trong 6 tháng qua)

1 525.435 <.0001
5 mo_sin_old_rev_tl_op

(số tháng kể từ khi mở tài khoản đầu tiên)

1 264.2194 <.0001
6 Purposew

(mục đích vay tiêu dùng, đảo nợ, tín dụng..)

1 208.7095 <.0001
7 tyle_loanw

(Giá trị khoản vay trên Lending Club/ Tổng dư nợ hiện tại)

1 124.3415 <.0001
8 Termw

(thời hạn vay của khoản vay)

1 121.9971 <.0001
9 mo_sin_old_il_acctw

(Số tháng kể từ tài khoản ngân hàng mở đầu tiên)

1 85.1731 <.0001
10 mths_since_recent_bc

(số tháng từ khi  mở tài khoản thẻ gần nhất đến nay)

1 78.2574 <.0001
11 percent_bc_gt_75w

(tỷ lệ phần trăm số tài khoản thẻ vượt qua 75% hạn mức tín dụng chia cho tổng số tài khoản thẻ)

1 65.4251 <.0001
12 annual_incw

(thu nhập hàng năm của người vay)

1 70.8672 <.0001
13 Verification_statusw

(trạng thái xác minh thu nhập của khách hàng)

1 84.6592 <.0001
14 Dtiw

(% số thu nhập dành vào việc trả nợ hàng tháng)

1 35.484 <.0001
15 revol_utilw

(các khoản tín dụng của người vay được sử dụng liên quan đến tất cả các tín dụng quay vòng có sẵn)

1 27.2376 <.0001
16 mths_since_recent_inq

(Số tháng kể từ khi hầu hết các cuộc điều tra gần đây)

1 21.9252 <.0001
17 mo_sin_rcnt_tlw

(số tháng kể từ khi lần mở tài khoản bất kỳ gần nhất đến hiện tại)

1 16.4708 <.0001

Nguồn: Truy suất kết quả từ phần mềm SAS

Nhóm tác giả thực hiện

 

  • Lựa chọn biến phụ thuộc và định nghĩakhách hàng tốt và khách hàng xấu

Tháng 2 năm 2016, dựa vào trạng thái của các khoản vay năm 2014 trên LC,lựa chọn Loan statuslàm biến phụ thuộc Ygồm 7 trạng thái như sau:

  • Current: Các khoản vay còn dư nợ nhưng thanh toán đầy đủ các khoản nợ hàng tháng.
  • Fully Paid: Khách hàng đã thanh toán đầy đủ khoản vay.
  • In Grace Period: Trong thời gian ân hạn, khách hàng được phép thanh toán khoản vay mà không phải nộp phạt (15 ngày tính từ ngày phải thanh toán khoản vay).
  • Late (16-30 days): Các khoản vay trả muộn so với hạn trả từ 16 đến 30 ngày.
  • Late (31-120 days): Các khoản vay trả muộn so với hạn trả nợ từ 31 đến 120 ngày.
  • Default: Khách hàng bị vỡ nợ, quá hạn trên 120 ngày.
  • Charged Off: Các khoản vay quá hạn, nợ không thể hoàn trả (chậm quá 150 ngày).

Biểu đồ 1. Các nhóm trong biến phụ thuộc Y trước khi phân lớp

Nhóm  tác giả thực hiện

Đến cuối tháng 8 năm 2016, cập nhật trạng thái của các khoản vay và xem lại trạng thái của các khoản vay tại tháng 2 năm 2016.

Bảng 3. Bảng tính tỷ lệ thay đổi trạng thái của khách hàng sau 8 tháng

Trạngthái

trước vay

Fully

Paid

Current In

Grace Period

Late

(16-30 days)

Late

(31-120

days)

Default Charged Off
Fully Paid 100.00% 0.00% 0.00% 0.00% 0.00% 0.00% 0.00%
Current 13.88% 80.40% 1.09% 0.61% 2.29% 0.00% 1.73%
In Grace Period 8.88% 33.12% 19.14% 2.60% 9.76% 0.10% 26.40%
Late (16-30 days) 3.28% 21.79% 0.28% 5.98% 7.55% 0.00% 61.11%
Late (31-120 days) 1.40% 4.73% 0.96% 0.58% 5.60% 0.09% 86.64%
Default 1.05% 0.00% 0.00% 0.00% 0.53% 0.53% 97.89%
Charged Off 0.00% 0.00% 0.00% 0.00% 0.00% 0.00% 100.00%

Nhóm tác giả tính toán

Biểu đồ 2. Tỷ lệ thay đổi trạng thái của khách hàng sau 8 tháng

Nhóm tác giả thực hiện

Nhóm khách hàng có trạng thái là “Late (31-120 days)” là khách hàng xấu tương ứng với . Những quan sát có trạng thái “In Grace Period” và “Late (16-30 days)” ở trạng thái trung tính sẽ được loại bỏ khỏi mẫu.

Lấy ngẫu nhiên 70% mẫu để xây dựng mô hình và 30% mẫu sử dụng để hậu kiểm.

Bảng 4. Kết quả Mô hình

Analysis of Maximum Likelihood Estimates
Parameter DF Estimate Standard Error Wald

Chi_Square

Pr > Chi_Square
Intercept 1 2.3289 0.00912 65272.4514 <.0001
acc_open_past_24mths 1 0.7831 0.0425 339.9262 <.0001
annual_incw 1 0.5267 0.052 102.655 <.0001
dti3w 1 0.5389 0.0455 140.3659 <.0001
dtiw 1 0.259 0.0504 26.4611 <.0001
inq_last_6mthsw 1 0.7158 0.0556 165.7191 <.0001
mo_sin_old_il_acctw 1 0.5404 0.0666 65.8343 <.0001
mo_sin_old_rev_tl_op 1 0.5253 0.0485 117.4692 <.0001
mo_sin_rcnt_tlw 1 0.2318 0.0571 16.4552 <.0001
mths_since_recent_bc 1 0.4349 0.0695 39.1241 <.0001
mths_since_recent_inq 1 0.2604 0.0625 17.3486 <.0001
percent_bc_gt_75w 1 0.4587 0.0748 37.5524 <.0001
purposew 1 0.9315 0.0644 209.1187 <.0001
revol_utilw 1 0.5908 0.1057 31.2147 <.0001
termw 1 0.6653 0.053 157.4741 <.0001
tyle_loanw 1 0.535 0.0523 104.5204 <.0001
verification_statusw 1 0.5056 0.0556 82.7335 <.0001
bc_open_to_buyw 1 0.6831 0.0541 159.6187 <.0001

Nguồn: Truy suất kết quả từ phần mềm SAS

Nhóm tác giả thực hiện

4. Chấm điểm khách hàng dựa trên kết quả của mô hình Logistic

Bảng 4 cho thấy mỗi khách hàngtrên LCứng với một véc tơ thông tin đầu vào đều tính được xác suất để khách hàng là tốt.Lấy mức xác suất khách hàng tốt nhân với 1000 thu được điểm của khách hàng đó.

Lựa chọn điểm cắt xác suất khách hàng tốt 10% (mức thông thường của các ngân hàng) tương ứng với xác suất 0.842 (tương ứng với mức điểm 842) làm căn cứ cho vay thì khách hàng nào dưới 842 điểmsẽ bị từ chối cho vay.

Bảng 5: Bảng chấm điểm khách hàng trên mẫu xây dựng mô hình

Class Total

N

Percent Number of Good Distr of Goods Cumulative frequency

of Good

Number of

 Bad

Distr

 of Bad

Cumulative frequency

of Bad

Diện tích dưới đường cong
. 163023 148511 14512 0.667017462
…< – 814 8280 5.08% 6534 4.40% 4.40% 1746 12.03% 12.03% 0.002646717
814< – 842 8073 4.95% 6698 4.51% 8.91% 1375 9.47% 21.51% 0.007562939
842< – 860 8226 5.05% 6986 4.70% 13.61% 1240 8.54% 30.05% 0.012126358
860< – 874 8663 5.31% 7472 5.03% 18.65% 1191 8.21% 38.26% 0.017184072
874< – 884 7589 4.66% 6680 4.50% 23.14% 909 6.26% 44.52% 0.018617101
884< – 894 9022 5.53% 8021 5.40% 28.54% 1001 6.90% 51.42%    0.02590869
894< – 902 8284 5.08% 7403 4.98% 33.53% 881 6.07% 57.49% 0.027144782
902< – 909 8147 5.00% 7376 4.97% 38.50% 771 5.31% 62.80% 0.029872711
909< – 915 7542 4.63% 6881 4.63% 43.13% 661 4.55% 67.36% 0.03015398
915< – 921 8054 4.94% 7389 4.98% 48.10% 665 4.58% 71.94% 0.034653214
921< – 927 8328 5.11% 7695 5.18% 53.29% 633 4.36% 76.30% 0.038405526
927< – 933 8888 5.45% 8279 5.57% 58.86% 609 4.20% 80.50% 0.043705776
933< – 938 7873 4.83% 7334 4.94% 63.80% 539 3.71% 84.21% 0.040670305
938< – 943 7922 4.86% 7472 5.03% 68.83% 450 3.10% 87.31% 0.043149997
943< – 948 7770 4.77% 7362 4.96% 73.79% 408 2.81% 90.13% 0.043980196
948< – 954 9166 5.62% 8754 5.89% 79.68% 412 2.84% 92.96% 0.053961276
954< – 959 7351 4.51% 7008 4.72% 84.40% 343 2.36% 95.33% 0.044426119
959< – 965 7940 4.87% 7659 5.16% 89.56% 281 1.94% 97.26%    0.0496618
965< – 973 8583 5.26% 8317 5.60% 95.16% 266 1.83% 99.10% 0.054983796
973< – HIGH 7322 4.49% 7191 4.84% 100.00% 131 0.90% 100.00% 0.048202109

Nhóm tác giả tính toán

Như vậy 30% lượng khách hàng xấu tập trung ở 3 lớp khách hàng trên tổng số 20 lớp khách hàng có xác suất khách hàng tốt thấp nhất. Lớp khách hàng thứ 6 có 51.45% khách hàng xấu chứng tỏ mô hình có khả năng phân loại khách hàng tốt và xấu khá rõ nét. Tỷ lệ phần trăm lượng khách hàng xấu giảm dần theo lớp khách hàng có xác suất khách hàng tốt tăng dần. 3.77% lượng khách hàng xấu thuộc 3 lớp khách hàng có xác suất khách hàng tốt cao nhất.

  1. Đánh giá chất lượng mô hình bằng hệ số GINI

Biểu đồ. Đường cong ROC dựa trên 70% mẫu xây dựng mô hình

 

Nhóm tác giả thực hiện

cho thấy mô hình có khả năng dự báo mức trung bình.

Hậu kiểm mô hình: Sử dụng 30% mẫuđược giữ lạiđể tính toán hệ số GINI.

Biểu đồ 4: Đường cong ROC dựa trên 30% mẫu hậu kiểm

Nhóm tác giả thực hiện

cho thấy mô hình có khả năng dự báo mức trung bình và hệ số Gini giữa mẫu xây dựng mô hình và mẫu kiểm định khá ổn định, không sai khác nhiều.

6. Đánh giá kết quả ứng dụng mô hình Logistic

Ứng dụng mô hình Logistic trong XHTD và chấm điểm khách hàng là chủ đề không mới, với việc ứng dụng trên cơ sở dữ liệu của LC một lần nữa khẳng định tính khoa học và hữu dụng trong vấn đề XHTD khách hàng cho các tổ chức tín dụng. Cùng với mô hình XHTD hiện nay tại cácNHTMViệt Nam,mô hình Logistic nếu được áp dụng trên cơ sở bộ dữ liệu cập nhật, đầy đủ sẽ giúp các ngân hàng đưa ra được đánh giá khách quan hơn đối với khách hàng vay vốn, giảm thiểu rủi ro tín dụng cũng như tỷ lệ nợ xấu trong các ngân hàng hiện nay.

Tài liệu tham khảo

 

  1. Lê Thị Hạnh (2017), “Kiểm soát rủi ro tín dụng theo Basel II tại các NHTM Việt Nam”, Tạp chí Tài chính, Truy cập ngày 16.6.2017, http://tapchitaichinh.vn/tai-chinh-kinh-doanh/tai-chinh-doanh-nghiep/kiem-soat-rui-ro-tin-dung-theo-basel-ii-tai-cac-ngan-hang-thuong-mai-viet-nam-100966.html
  2. Trương Thị Hồng, Lê Thị Minh Ngọc (2014),“Xếp hạng tín dụng khách hàng cá nhân tại NHTM Việt Nam, thực trạng và những hạn chế cần hoàn thiện”, Thị trường Tài chính Tiền tệ, số 21, trang 17-21.
  3. Bùi Lê Trà Linh, Hoàng Ngọc Hà, Nguyễn Văn Khoa, Phạm Thị Mai (2016), “Ứng dụng mô hình Logistic chấm điểm khách hàng nộp hồ sơ vay tại NHTM”, Kỷ yếu Hội thi NCKH sinh viên toàn quốc“Olympic Kinh tế lượng và ứng dụng” lần 1, trang 99-131.
  4. Lê Văn Triết (2010), “Hoàn thiện hệ thống xếp hạng tín dụng cá nhân của ngân hàng TMCP Á Châu”, Luận văn thạc sĩ kinh tế, trường Đại học Kinh tế Thành phố Hồ Chí Minh, Truy cập 15.6.2017, http://dulieu.tailieuhoctap.vn/books/luan-van-de-tai/luan-van-de-tai-cao-hoc/file_goc_770495.pdf.
  5. Lê Thanh Tùng (2014), “Hệ thống xếp hạng tín dụng nội bộ và các ứng dụng trong quản trị rủi ro tín dụng theo Basel II”, Thị trường Tài chính Tiền tệ, số 15, trang 18-21.
  6. NHNN, Quyết định số 18/2007/QĐ-NHNN về việc sửa đổi, bổ sung một số điều của Quyết định số 493/2005/QĐ-NHNN.
  7. NHNN, Quyết định số 493/2005/QĐ-NHNN ban hành quy định về phân loại nợ, trích lập và sử dụng dự phòng để xử lý rủi ro tín dụng trong hoạt động ngân hàng của tổ chức tín dụng.
  8. NHNN, Quyết định số 57/2002/QĐ-NHNN về việc triển khai thí điểm đề án phân tích, xếp loại tín dụng doanh nghiệp.
  9. NHNN, Thông tư số 02/2013/TT-NHNN quy định về phân loại tài sản có, mức trích, phương pháp trích lập dự phòng rủi ro và việc sử dụng dự phòng để xử lý rủi ro trong hoạt động của tổ chức tín dụng, chi nhánh ngân hàng nước ngoài.
  10. Damodar N. Gujarati (2004), Basic Econometrics, McGraw-Hill, Fourth Edition.
  11. Logistic Regression and Newton’s Method, 36-402, Addvanced Data Analysis, 15 March 2011, Truy cập ngày 15.8.2016,https://www.stat.cmu.edu/~cshalizi/402/lectures/14-logistic-regression/lecture-14.pdf.
  12. Maddala (1992), Introduction to Econometrics, Macmillan Publishing company, New York, Second Edition.
  13. Naeem Siddiqi (2006), Credit Risk Scorecards, John Wiley & Sons, Inc.
  14. Thomas G.Tape, MD, Interpreting Diagnostic Tests, truy cập ngày 20.8.2016, <http://gim.unmc.edu/dxtests/Default.htm>

 

[1] Học viện Tài chính, Email: nguyenthithuyquynh@hvtc.edu.vn

[2] Học viện Ngân hàng, Email: ttxahvnh@gmail.com

[3] Hiệp hội Doanh nghiệp Châu Âu tại Việt Nam, Email: tralinhbuile@gmail.com

———————-&&&———————–

Dự báo và quản trị rủi ro trên TTCK Việt Nam

Dự báo và quản trị rủi ro trên TTCK Việt Nam

(Manh Ha Nguyen, Olivier Darné)

Tóm tắt. Bài báo này phân tích các mô hình biến động và khả năng dự báo rủi ro khi có sự xuất hiện của bước nhảy trên TTCK Việt Nam. Chúng tôi áp dụng các mô hình họ GARCH, với trí nhớ ngắn và dài và hiệu ứng đòn bẩy, ước lượng cho cả chuỗi lợi suất nguyên thủy và được lọc. Dữ liệu bao gồm 2 chỉ số thị trường là VN index và HNX index, trong khoảng thời gian 2007-2015. Kết quả thực nghiệm cho thấy mô hình FIAPARCH là phù hợp nhất cho cả hai chỉ số VN index và HNX index.

Kết luận.

Độ biến động (Volatility) là một trong những chủ đề quan trọng và thú vị nhất trong các lĩnh vực dự báo kinh tế và kinh tế lượng trong những thập kỷ gần đây. Một trong những công cụ tiêu biểu để phản ánh được độ biến động là mô hình GARCH được Bollerslev (1986) xây dựng. Có một lượng lớn các kết quả thực nghiệm áp dụng mô hình GARCH để nghiên cứu độ biến động của tỷ giá hối đoái, lợi suất cổ phiếu, tỷ lệ lãi suất và các biến kinh tế khác. Mô hình hóa độ biến động của thị trường chứng khoán là một vấn đề quan trọng trong thực tế, bao gồm cả thị trường phát triển và thị trường mới nổi.

Bài báo này nghiên cứu độ biến động của lợi suất cổ phiếu trong giai đoạn 2007-2015 dựa trên họ mô hình GARCH (GARCH, EGARCH, GJRGARCH, IGARCH, RiskMetrics, APARCH, FIGARCH, FIAPARCH, FIAGARCH và HYGARCH) cho mẫu dữ liệu của 2 chỉ số VN index và HNX index. Chúng tôi cũng áp dụng thủ tục của Franses and Ghijsels (1999) để phát hiện và hiệu chỉnh ngoại lệ cộng tính khi sử dụng mô hình GARCH. Hơn nữa, để đánh giá được hiệu quả của việc dự báo độ biến động, chúng tôi sử dụng back-testing VaR với kiểm định Kupiec và DQT. Thứ nhất, chúng tôi phát hiện ra rằng FIAPARCH là mô hình phù hợp nhất cho cả hai chỉ số. Thứ hai, kết quả thực nghiệm cho thấy bằng chứng của trí nhớ dài và tính không đối xứng của độ biến động.

Full paper: https://halshs.archives-ouvertes.fr/halshs-01679456/document

———————&&&——————–

Ứng dụng Copula trong lựa chọn danh mục đầu tư chứng khoán tại Việt Nam

Ứng dụng Copula trong lựa chọn danh mục đầu tư chứng khoán tại Việt Nam

(Nguồn: http://tapchitaichinh.vn)

TS. PHẠM HOÀNG UYÊN, TS. NGUYỄN PHÚC SƠN – ĐẠI HỌC KINH TẾ – LUẬT, THS. LÝ SEL- ĐẠI HỌC TÔN ĐỨC THẮNG

(Taichinh) –Đo lường rủi ro luôn luôn là mối quan tâm hàng đầu của các lĩnh vực tài chính và bảo hiểm. Tuy đã có nhiều độ đo rủi ro được đưa vào sử dụng từ cuối thập niên 1950 nhưng chưa có độ đo nào thỏa mãn tất cả các tính chất cơ bản cần thiết cho ứng dụng. Gần đây, trên thế giới xuất hiện một cách tiếp cận mới về xây dựng độ đo rủi ro sử dụng Copula và các hàm biến dạng. Bài viết này nghiên cứu tính chất của một số Copula trên các lớp hàm biến dạng thường gặp và ứng dụng của nó, đặc biệt trong các lĩnh vực khác nhau của kinh tế, tài chính và kinh doanh.
Ảnh minh họa. Nguồn: internetẢnh minh họa. Nguồn: internet

Xu hướng rủi ro trong lĩnh vực đầu tư tài chính

Trong kinh tế, lý thuyết quyết định dựa trên hàm hữu ích là một hướng nghiên cứu chủ đạo xuyên suốt thế kỷ XX. Hàm hữu ích mô tả sự ưa thích của khách hàng, từ đó, giúp các nhà kinh tế giải thích lý do đưa ra các quyết định của khách hàng. Tuy nhiên, còn một yếu tố quan trọng khác ảnh hưởng đến cách thức ra quyết định của người dùng đó là rủi ro. Rủi ro tồn tại trong mọi lĩnh vực kinh tế tài chính và là mối quan tâm hàng đầu của khách hàng. Do đó, từ nhiều năm nay, các nhà kinh tế, tài chính luôn quan tâm đến mối tương quan giữa hàm hữu ích và các hàm số đo lường rủi ro.

Trong lĩnh vực đầu tư tài chính, rất nhiều nghiên cứu tìm cách mô tả thái độ của nhà đầu tư đối với rủi ro. Nhìn chung có thể chia các nhà đầu tư thành 3 nhóm: nhóm thích rủi ro, nhóm trung tính với rủi ro và nhóm không thích rủi ro. Thái độ với rủi ro ảnh hưởng trực tiếp tới quyết định đầu tư. Có 2 cách hữu hiệu để mô tả thái độ rủi ro: thông qua hàm biến dạng hay thông qua hàm trọng.

Với mục đích mô tả tốt hơn các yếu tố then chốt giúp ra quyết định của khách hàng, từ vài năm gần đây, nhóm tác giả liên tục nghiên cứu các cách thức hàm biến dạng, hàm trọng và hàm hữu ích tương tác với nhau và đã đạt được một số kết quả khả quan. Trong nhiều trường hợp, chúng tôi đã tạo ra được các công thức toán học tường minh mô tả những sự tương tác này. Ngoài ra, chúng tôi cũng sử dụng công thức này để đưa vào nghiên cứu thực tế trên dữ liệu giá chứng khoán của Viêt Nam và thế giới.

Bài viết, nghiên cứu tính chất của một số copula trên các lớp hàm biến dạng thường gặp và ứng dụng của nó, đặc biệt trong các lĩnh vực khác nhau của kinh tế, tài chính và kinh doanh. Cụ thể hơn, nghiên cứu định nghĩa một độ đo mức độ phụ thuộc của hai đại lượng ngẫu nhiên hoàn toàn mới được ký hiệu là trong đó C là một copula. Độ đo này đặc biệt hữu dụng trong việc nắm bắt sự thay đổi của mức độ phụ thuộc các đại lượng ngẫu nhiên khi có các hàm biến dạng tác động.

Các phương pháp ước lượng độ đo phụ thuộc

Cấu trúc phụ thuộc hay còn gọi là độ đo phụ thuộc là một trong các chủ đề nghiên cứu chủ đạo trong ngành phân tích tương quan. Schweizer và Wolff (1981) sử dụng các metric  để tạo ra các độ đo của sự phụ thuộc đơn điệu khi P là copula tích hoặc copula độc lập. Trong khi đó, Stoimenov (2008) định nghĩa metric Sobolev  để xây dựng độ đo  cho một lớp của các sự phụ thuộc đầy đủ lẫn nhau (mutual complete dependences – MCD).

Một kết quả cổ điển chứng minh rằng, lớp các phụ thuộc đơn điệu là một lớp con của lớp MCD. Từ đó, trong một công trình trước đây, chúng tôi đã đề nghị một độ đo mới cho các sự phụ thuộc đơn điệu dựa trên các metric Sobolev. Độ đo mới này có thể được dùng để đặc trưng cho các sự phụ thuộc đồng biến, nghịch biến và độc lập.

Tran và cộng sự (2015) đề nghị một độ đo phụ thuộc phi tham số cho hai biến ngẫu nhiên liên tục X, Y với copula C như sau:

Trong đó, ||C||   s là chuẩn Sobolev hiệu chỉnh cho copula C, được cho bởi công thức sau:

 Bài viết này trình bày hai phương pháp ước lượng . Trong đó, phương pháp thứ nhất được sử dụng khi chúng ta biết trước copula C, phương pháp này dựa trên kỹ thuật mô phỏng Monte Carlo có điều kiện dựa trên copula. Phương pháp thứ hai được sử dụng trong trường hợp chúng ta không biết trước copula C và việc ước lượng phải hoàn toàn dựa trên dữ liệu thực nghiệm.

Dựa trên các phương pháp ước lượng trên, chúng tôi tính toán cụ thể trên các copula thông dụng nhất là copula giá trị cực hạn, copula PH và copula Gauss, trong đó sử dụng hai lớp hàm biến dạng quan trọng là biến dạng Wang và biến dạng PH. Lưu ý biến dạng Wang là biến dạng giúp xây dựng mô hình Black-Scholes trong thị trường tài chính.Trong phần ứng dụng, bài viết sử dụng dữ liệu giá đóng cửa trên thị trường chứng khoán để đo mức độ phụ thuộc của một số cặp mã cổ phiếu. Từ thông tin này, tác giả xây dựng một số danh mục đầu tư có trung bình lợi nhuận cao nhưng chịu mức rủi ro thấp (được thể hiện qua phương sai của danh mục thấp) cho một số cổ phiếu.

Ứng dụng

Trong bài nghiên cứu, tác giả ứng dụng chọn lựa danh mục dựa trên dữ liệu giá đóng cửa điều chỉnh của 10 công ty đang niêm yết tại Sở Giao dịch chứng khoán TP. Hồ Chí Minh (HSX). Từ đó, có thể xây dựng một số danh mục đầu tư tối ưu với trung bình lợi nhuận cao trong khi rủi ro thấp (phương sai thấp).

Độ đo mới  cùng hai thuật toán đóng vai trò quan trọng trong việc theo dấu sự thay đổi thông tin phụ thuộc trong các ứng dụng. Dữ liệu giá được thu thập trong thời gian 10 năm trở lại đây (từ ngày 25/04/2005 đến 31/05/2015 do Thomson Reuter cung cấp. Suất sinh lợi của cổ phiếu được tính toán bằng (Pt –Pt-1)/ Pt . Trong đó, là giá cổ phiếu đóng cửa tại ngày thứvàlà giá cổ phiếu đóng cửa trước thời điểmmột ngày. Thống kê mô tả dữ liệu nghiên cứu được trình bày cụ thể tại Bảng 1.

Để thực nghiệm chọn lựa chúng ta cần tính toán mức độ tương quan của các ứng viên cho danh mục đầu tư. Kết quả tương quan cũng được trình bày ở Bảng 2.

Thông qua một số kết quả tính toán, chúng ta thấy rằng có đủ điều kiện để ứng dụng hàm biến dạng với các dữ liệu thực nghiệm. Cụ thể, VNM và FPT có hệ số tương quan r = 0.40. Để ước lượng độ đo, vớilà copula thực nghiệm từ dữ liệu. Tính toán cho kết quảvới khoảng tin cậy 95% (0,3808, 0,3932). Trong trường hợp này, bậc đơn điệu này lớn hơn cả hệ số Spearman   và hệ số Kendall.

Sau đó, sử dụng copula biến dạng, tính toán độ đo   chúng ta nhận thấy độ đo   tăng đáng kể khi tham số  tăng. Điều đó chứng tỏ, cấu trúc phụ thuộc đã thay đổi từ countermonotonicity sang comonotonicity. Và danh mục tối ưu được chọn lựa với tỷ trọng đầu tư cho 2 cổ phiếu này, chọn lựa từ 10 cổ phiếu ứng viên, là 82% cho VNM và 18% cho FPT.

Kết luận và khuyến nghị

Như vậy, nghiên cứu này đã đặt nền tảng cho các ứng dụng trong kinh tế, tài chính của copula biến dạng thông qua sự kết hợp của các hàm biến dạng với copula truyền thống. Đóng góp quan trọng nhất là độ đo mới kèm theo các thuật toán ước lượng hiệu quả giúp định lượng sự phụ thuộc giữa các đại lượng ngẫu nhiên.

Trong thực tế, các định chế tài chính, các công ty bảo hiểm rất cần định lượng thông tin phụ thuộc giữa các đại lượng ngẫu nhiên để đánh giá rủi ro trong nhiều tình huống cơ bản, quan trọng trong kinh doanh. Copula biến dạng và độ đo  là công cụ thích hợp cho tác vụ này. Ngoài ra, trong lĩnh vực đầu tư, để thiết kế các danh mục đầu tư hiệu quả, ít rủi ro, thông tin phụ thuộc giữa các mã cổ phiếu đóng vai trò rất quan trọng.

Kết quả nghiên cứu mặc dù chỉ mới ứng dụng được cho 1 số mã cổ phiếu tiêu biểu niêm yết trên HSX nhưng đã tạo được nền tảng để mở rộng cho các ứng dụng thực tế với quy mô lớn hơn tại Việt Nam và quốc tế. Việc mở rộng các cổ phiếu trong chọn lựa danh mục đầu tư tối ưu sẽ giúp danh mục ổn định và đạt hiệu quả cao hơn. Tuy vậy, kết quả nghiên cứu này đã giúp mở rộng phương pháp tiếp cận trong chọn lựa và điều chỉnh mô hình chọn lựa danh mục đầu tư.

Nghiên cứu được tài trợ bởi Đại học Quốc gia TP. Hồ Chí Minh trong khuôn khổ Đề tài mã số C2016-34-02.

Tài liệu tham khảo:

1. Phạm Hoàng Uyên, Lý Sel, Lê Thanh Hoa (2016), Các lớp hàm distortion tương ứng với các thái độ chấp nhận rủi ro của người ra quyết định;

2. Hien Duy Tran, Uyen Hoang Pham, Sel Ly, T. Vo-Duy (2017), Extraction Dependence Structure of Distorted Copula via a Measure of Dependence. Accepted to Annals of Operations Research;

3. Tran, H. D., Pham, U. H., Ly, S., & Vo-Duy, T. (2015), A New Measure of MonotoneDependence by Using Sobolev Norms for Copula. In Integrated Uncertainty in Knowledge Modelling and Decision Making (pp. 126-137). Springer International Publishing;

4. Schweizer, B., & Wolff, E. F. (1981), On nonparametric measures of dependence for random variables. TheAnnals of Statistics, 9(4), 879–885;

5. Stoimenov, P. A. (2008), A measure of mutual complete dependence.Ph.D.Thesis,TU.Dormund.

——————&&&—————

Giao dịch thuật toán/định lượng cơ bản

Giao dịch thuật toán/định lượng cơ bản

(Nguồn: http://scue.vn)

[Algorithmic trading (algo trading)/ Quantitative trading/ Automated trading/ Robot trading/ Electronic trading/ Dark pool trading]

Giao dịch định lượng cơ bản (P1)

Bài viết này sẽ cung cấp một số khái niệm cơ bản về hệ thống giao dịch định lượng (quantitative trading system). Đối tượng của bài viết này bao gồm hai nhóm. Trước tiên sẽ là những ai đang có mục tiêu trở thành một chuyên viên giao dịch định lượng trong các quỹ đầu tư. Thứ hai là những người muốn cố gắn thiết kế thuật toán giao dịch cho công việc kinh doanh cá nhân.

Giao dịch định lượng (quantitative trading) là gì?

Giao dịch định lượng (giao dịch bằng thuật toán) là một lĩnh vực cực kỳ tinh vi, phức tạp của tài chính định lượng. Nghiên cứu nó có thể cần một khoảng thời gian lớn để nắm bắt những kiến thức cần thiết nhằm vượt qua một cuộc phỏng vấn nghề nghiệp hay xây dựng một chiến lược giao dịch riêng cho bản thân. Không chỉ vậy nó còn đòi hỏi kỹ năng lập trình trên nhiều ngôn ngữ như MATLAB, R hay Python. Khi mà chiến thuật giao dịch tần số cao đang gia tăng thì công nghệ càng ngày quan trọng và có liên quan mật thiết. Do đó việc nắm vững và sử dụng các ngôn ngữ lập trình, đặc biệt là C/C++ là một điều tối quan trọng.

Một hệ thống giao dịch định lượng bao gồm 4 thành phần chính như sau:

1. Xác định chiến lược (Strategy Identification): Tìm một chiến lược, khai thác lợi thế đó và quyết định tần suất giao dịch

2. Kiểm định lại chiến lược (Strategy Backtesting): Khai thác dữ liệu, phân tích hiệu quả của chiến lược và loại bỏ những sai lệch.

3. Thực thi hệ thống (Execution System): Tạo một liên kết tới khu môi giới (broker), tự động hóa các giao dịch và giảm thiểu chi phí giao dịch.

4. Quản trị rủi ro (Risk Management): Phân bổ nguồn vốn tối ưu nhằm giảm thiểu rủi ro.

Xác định chiến lược (Strategy Identification)

Tất cả tiến trình giao dịch định lượng đều bắt đầu với vấn đề nghiên cứu. Quá trình nghiên cứu này bao gồm việc tìm kiếm một chiến lược, xem thử chiến lược có phù hợp với danh mục đầu tư của các chiến lược khác đang thực hiện, thu thập các dữ liệu cần thiết để kiểm tra chiến lược và thử tìm cách tối ưu hóa chiến lược để đạt được lợi nhuận cao hơn và/hoặc rủi ro thấp hơn. Chúng ta sẽ cần tính đến lượng vốn cần thiết nếu thực hiện nếu là một nhà giao dịch cá nhân và sự ảnh hưởng của chi phí giao dịch đến chiến lược.

Trái ngược với quan niệm phổ biến cho rằng sẽ khá dễ để tìm một chiến lược có lợi nhuận qua nhiều nguồn tài nguyên công cộng, việc tìm kiếm một chiến lược khả thi và tin cậy đòi hỏi công sức và nền tảng kiến thức lý thuyết cũng như thực tế để phát triển thuật toán cho chính mình. Các nhà nghiên cứu thường công bố những kết quả giao dịch theo lý thuyết trong khi các blog về tài chính định lượng sẽ thảo luận các chiến lược một cách chi tiết còn các tạp chí giao dịch sẽ tổng hợp các chiến lược được sử dụng của những quỹ đầu tư. Bạn có thể đặt câu hỏi tại sao các cá nhân và tổ chức lại sẵn sàng thảo luận về những chiến lược liên quan đến lợi nhuận của họ, đặc biệt là họ lại biết rất rõ đám đông nhà đầu tư còn lại có thể áp dụng chiến thuật này và làm nó trở nên mất hiệu lực trong dài hạn. Lý do nằm ở chỗ ho sẽ không nói về những thông số và phương pháp điều chỉnh mà họ đã thực hiện. Những tham số được tối ưu hóa mới chính là chìa khóa để biến một chiến lược tầm thường thành một chiến lược có lợi nhuận cao. Do đó trong thực tế một trong những cách tốt nhất để tạo ra một chiến lược độc đáo có lợi nhuận là dựa trên các phương pháp tương tự và sau đó tiến hành các thủ thuật để tối ưu hóa theo cách riêng của mình.

Một số website có thể dùng để tìm kiếm chiến lược giao dịch:

·         Social Science Research Network – www.ssrn.com

·         arXiv Quantitative Finance – arxiv.org/archive/q-fin

·         Seeking Alpha – www.seekingalpha.com

·         Elite Trader – www.elitetrader.com

·         Nuclear Phynance – www.nuclearphynance.com

·         Quantivity – quantivity.wordpress.com

Nhiều chiến lược khi bạn xem xét thường rơi vào các nhóm mean-reversion và trend-following/momentum. Chiến lược mean-reverting cố gắng để khai thác vấn đề trung bình trong dài hạn của một chuỗi giá (price series) và những sai lệch trong ngắn hạn này sẽ được điều chỉnh về quy luật của nó trong dài hạn. Chiến lược momentum lại cố gắng khai thác cả tâm lý nhà đầu tư và chiến lược của các quỹ lớn để đi theo xu hướng bằng cách tìm kiếm các đà tăng/giảm của thị trường cho đến khi nó bị đảo ngược.

Một khía cạnh rất quan trọng khác của giao dịch định lượng là tần số của chiến lược giao dịch. Giao dịch tần suất thấp (Low frequency trading – LFT ) thường được dùng để đề cập đến chiến lược nào giữ các tài sản dài hơn một ngày giao dịch. Tương ứng thì giao dịch tần suất cao (High frequency trading – HFT) dùng để đề cập đến các chiến lược chỉ giữ tài sản trong ngày giao dịch và giao dịch tần suất siêu cao (Ultra-high frequency trading – UHFT) là giữ tài sản chỉ trong vài giây hoặc mili giây. Do tính chất rất phức tạp của HFT và UHFT nên bài viết này sẽ không nghiên cứu 2 loại chiến lược này chi tiết.


Giao dịch định lượng cơ bản (P2)

Kiểm định lại chiến lược (Strategy Backtesting)

Mục tiêu của việc kiểm định lại chiến lược là tìm các bằng chứng xác thực khả năng sinh lời của một chiến lược khi ứng dụng vào dữ liệu lịch sử (historical data) và dữ liệu ngoài mẫu(*) (out-of-sample data). Bước kiểm định này dễ tạo ra kỳ vọng rằng sẽ có các chiến lược tạo ra lợi nhuận tốt trên thị trường thực. Tuy nhiên thực sự khâu kiểm định không đảm bảo cho sự thành công vì nhiều lý do. Đây chính là phần nhạy cảm nhất của giao dịch định lượng khi mà nó đòi hỏi phải vô số các sai lệch (bias) phải được xem xét cẩn thận và loại bỏ càng nhiều càng tốt. Chúng ta sẽ bàn đến một số loại sai lệch thông thường bao gồm look-ahead bias, survivorship bias và optimisation bias (hay còn gọi là data-snooping bias). Một số vấn đề quan trọng khác ảnh hưởng đến mô hình là tính khả dụng và độ “trong sạch” của dữ liệu, phân tích các chi phí giao dịch trong thực tế cũng như việc đưa ra quyết định dựa trên nền tảng vững chắc của khâu kiểm định. Chúng ta sẽ nói thêm về chi phí giao dịch trong phần thực thi hệ thống bên dưới.

(*Out-of-sample data: Ví dụ một mô hình được xây dựng dựa trên dữ liệu từ 1970-1979, sau đó người ta thử nghiệm mô hình này với dữ liệu từ 1980-1989 thì dữ liệu này gọi là out-of-sample).

Một khi chiến lược đã được xác định thì phải tiến hành thu thập dữ liệu lịch sử rồi tiến hành thử nghiệm và cải tiến mô hình. Có rất nhiều nhà cung cấp dữ liệu cần thiết cho tất cả các loại tài sản, thông thường chi phí họ yêu cầu tỉ lệ với chất lượng, độ sâu và độ lâu dài của dữ liệu. Cách truyền thống để trở thành một chuyên viên giao dịch quant (ít nhất ở vị trí sales) là sử dụng các bộ dữ liệu miễn phí trên Yahoo Finance.

Những vấn đề chính cần phải quan tâm đối với dữ liệu lịch sử (historical data) bao gồm tính chính xác/trong sạch, survivorship bias và điều chỉnh số liệu lại do những hoạt động của công ty như chia cổ tức và tách cổ phiếu:

  • Tính chính xác (Accuracy) gắn liền với chất lượng tổng thể của dữ liệu. Một vài lỗi có thể dễ dàng tìm thấy bằng cách sử dụng các bộ lọc các điểm bất thường (spike filter), bộ lọc này sẽ tìm ra các điểm bất thường này trong chuỗi dữ liệu thời gian và chỉnh sửa lại cho phù hợp. Tuy nhiên sẽ có những lỗi rất khó phát hiện, vì vậy cần thiết phải có hai hay nhiều nguồn cung cấp dữ liệu trở lên để kiểm tra lẫn nhau.
  • Survivorship bias thường là đặc điểm của dữ liệu rẻ hoặc miễn phí. Bộ dữ liệu có survivorship bias nghĩa là nó không có hoặc thiếu dữ liệu về những tài sản đã không còn được giao dịch. Một ví dụ trường hợp loại tài sản vốn như cổ phiếu bị hủy niêm yết, vỡ nợ. Thiên kiến sai lệch này cho thấy bất kỳ chiến lược giao dịch của phiếu kiểm định trên bộ dữ liệu này dễ dẫn đến có kết quả tốt hơn so với kết quả thực giống như người chiến thắng đã được lịch sử lựa chọn trước.
  • Các hoạt động của công ty (Coporate actions) những hoạt động có tác động đến dữ liệu như giá cổ phiếu cần phải được điều chỉnh cho phù hợp, trường hợp điển hình là điều chỉnh cho việc chia cổ tức và tách cổ phiếu. Quá trình thực hiện các công việc điều chỉnh này gọi là quá trình điều chỉnh (back adjustment process). Một lưu ý khá quan trọng là cần phải phân biệt rõ ràng giữa việc chia tách cổ phiếu và điều chỉnh lại lợi nhuận cho phù hợp vì nhiều giao dịch viên thường không phân biệt rõ ràng sự khác biệt giữa hai khái niệm này.

Để thực hiện thủ tục kiểm định lại này cần phải sử dụng một phần mềm làm nền tảng. Có thể thực hiện kiểm định bằng phần mềm kiểm định chuyên dụng như Tradestation, phần mềm chuyên tính toán như Excel, MATLAB hoặc sử dụng ngôn ngữ lập trình để tự tạo ra một công cụ kiểm định riêng cho mình ví dụ như Python hay C++. Chúng ta sẽ không quan tâm nhiều đến phương pháp sử dụng các phần mềm có sẵn để kiểm định, thay vào đó là xây dựng các công cụ bằng cách tự lập trình. Một trong những lợi ích của cách làm này là chúng ta có thể tích hợp (liên kết) phần mềm kiểm định và hệ thống thực thi, điều này cho phép tính toán các phép tính thống kê phức tạp hơn trên hệ thống ngay cả khi hệ thống đang giao dịch, đặc biệt đối với các chiến lược HFT.

Công việc kiểm định phải định lượng được hiệu suất của hệ thống tốt đến mức nào. Các tiêu chuẩn để định lượng các chiến lược là maximum drawdown và Sharpe ratio. Maximum drawdown là chỉ số đặc trưng cho mức giảm lớn nhất (từ đỉnh đến đáy) của đường cong tài khoản vốn (account equity curve) trong một khoảng thời gian (thường là một năm). Chỉ số này thường được thể hiện ở tỉ số phần trăm, thông thường chiến lược LFT sẽ có maximum drawdown lớn hơn so với HFT do một số yếu tố khi thống kê. Kiểm định lại lịch sử giao dịch sẽ cho thấy maximum drawdown lớn nhất trong quá khứ từ đó có thể định hướng và kiểm soát các chiến lược có drawdown phù hợp. Chỉ số thứ hai cần phải quan tâm là Sharpe ratio, chỉ số này là trung bình của tỉ suất sinh lợi vượt trội chia cho độ lệch chuẩn của các tỉ suất sinh lợi vượt trội đó. Tỉ suất sinh lợi vượt trội là phần chên lệch giữa lợi nhuận chiến lược tạo ra và một tỉ suất sinh lợi tiêu chuẩn như chỉ số S&P 500 hay trái phiếu kho bạc T-bill kỳ hạn 3 tháng. Một vấn đề nữa là không nên sử dụng lợi nhuận hàng năm để làm thước đo tính hiệu quả của chiến lược hiện tại vì chiến lược có thể được điều chỉnh qua thời gian.

 

Backtesting bằng cách sử dụng phần mềm MATLAB

Một khi chiến lược đã được kiểm định và nó hạn chế được các sai lệch càng nhiều càng tốt đồng thời được thử nghiệm và có chỉ số Sharpe tốt cũng như các drawdown nhỏ sẽ được tiến hành bước tiếp theo – xây dựng hệ thống thực thi.

Thực thi hệ thống (Execution Systems)

Thực thi hệ thống là danh sách các lệnh được tạo ra bởi chiến lược sẽ được gửi đến và thực hiện bởi broker. Các hệ thống giao dịch của sàn giao dịch thế hệ mới có thể bán tự động hoặc hoàn toàn tự động và cơ chế thực hiện của hệ thống của chúng ta xây dựng có thể bằng tay, bán tự động (qua 1 click chuột) hay tự động hoàn toàn. Đối với chiến lược LFT thường sử dụng kỹ thuật bằng tay và bán tự động trong khi chiến lược HFT cần phải tạo ra một cơ chế giao dịch tự động hoàn toàn.

Những vấn đề quan trọng khi tạo ra một hệ thống thực thi là quá trình tương tác với broker, tối thiểu hóa chi phí giao dịch (bao gồm hoa hồng, sự trượt giá…) và sự khác biệt của hiệu năng thực tế với hiệu năng trong khâu kiểm định.

Có nhiều cách để tương tác với broker. Từ việc đơn giản như gọi điện trực tiếp đến các broker qua điện thoại tới sử dụng các chương trình ứng dụng tương tác (API – Application Programming Interface) hoàn toàn tự động. Lý tưởng nhất chính là tự động hóa các công việc điều hành giao dịch càng nhiều càng tốt. Điều này sẽ giải phóng chúng ta khỏi các tác vụ này và tập trung sâu hơn vào khâu nghiên cứu cũng như thử nghiệm nhiều chiến lược giao dịch khác nhau cùng lúc, thậm chí là chiến lược tần suất cao HFT (trong thực tế, chiến lược HFT không thể thực hiện mà không sử dụng phương pháp tự động). Các phần mềm kiểm định đã được nói ở trên như MATLAB, Excel và Tradestation thì phù hợp với các chiến lược đơn giản, tần suất thấp. Tuy nhiên, cần thiết phải xây dựng một hệt thống thực thi được viết trên một ngôn ngữ lập trình có hiệu năng cao như C++ nhằm thực thi những chiến lược HFT bởi vì các ngôn ngữ mạnh như C/C++ cho phép chúng ta xử lý dữ liệu với tần suất là phút, giây hay tới mili giây và micro giây – một đặc tính lý tưởng với HFT.

Các quỹ lớn thông thường không phải là nơi phù hợp với những chuyên gia giao dịch định lượng để tối ưu hóa các hoạt động đầu tư của họ. Tuy nhiên trong những quỹ nhỏ hơn hay các công ty HFT, các chuyên gia giao dịch cũng là những nhà điều hành do đó cần thiết kỹ năng chuyên môn rộng hơn. Nếu bạn vẫn muốn làm cho một quỹ đầu tư lớn, kỹ năng lập trình vẫn quan trọng không kém kỹ năng về thống kê và kinh tế lượng.

Một vấn đề chính trong khâu thực thi là giảm thiểu chi phí giao dịch. Thông thường có ba loại chi phí giao dịch: hoa hồng (hoặc thuế) được trả cho các broker hay chi phí giao dịch cho SEC (Ủy ban chứng khoán Hoa Kỳ) hoặc cơ quan đại diện tương đương; sự trượt giá là sự thay đổi giữa giá được đặt mua và giá thực sự mua được; sự chênh lệch (spread) về giá bid/ask (mua/bán) của cổ phiếu được giao dịch. Sự chênh lệch về giá mua/bán không cố định và phụ thuộc vào tính thanh khoản hiện tại trên thị trường.

Các chi phí giao dịch có thể tạo ra sự khác biệt giữa một chiến lược cực kỳ lợi nhuận với tỉ số Sharpe tốt và một chiến lược không có lợi nhuận với tỉ số Sharpe không tốt. Tuy nhiên dự đoán chi phí giao dịch chính xác ở khâu kiểm định chiến lược là một điều khá khó khăn. Dựa vào tần suất của chiến lược, chúng ta cần tiếp cận với các dữ liệu giao dịch trong quá khứ bao gồm cả dữ liệu của giá bid/ask.

Vấn đề chính cuối cùng đối với hệ thống thực thi là sự khác biệt giữa hiệu năng chiến lược trên thực tế với hiệu năng ở khâu kiểm định, điều này xảy ra do nhiều nguyên nhân đã được nói đến ở trên như các sai lệch (look-ahead bias, optimisatoin bias) khi xem xét ở khâu kiểm định. Tuy nhiên vẫn có một số chiến lược không dễ kiểm tra những sai lệch này trước khi triển khai thực hiện. Điều này thường xảy ra đối với các chiến lược HFT, UHFT như có thể xuất hiện các lỗi trong hệ thống thực thi cũng như lỗi trong chiến lược giao dịch mà không xuất hiện khi kiểm định mà chỉ xuất hiện khi giao dịch thực tế. Ngoài ra, thị trường hoàn toàn có thể thay đổi sau khi triển khai các chiến lược giao dịch như môi trường pháp lý thay đổi, tâm lý nhà đầu tư thay đổi và các hiện tượng kinh tế vĩ mô dẫn đến thị trường sẽ có những hành vi khác dự tính ảnh hưởng đến lợi nhuận của chiến lược.


Giao dịch định lượng cơ bản (P3-phần cuối)

Quản trị rủi ro (Risk management)

Công việc cuối cùng phải làm đối với hệ thống giao dịch là tiến trình quản trị rủi ro. Rủi ro ở đây bao gồm tất cả những lệch lạc mà chúng ta đã nói đến các phần trước. Nó bao gồm rủi ro về công nghệ ví dụ như các hệ thống máy chủ (server) ở sàn giao dịch đột nhiên xuất hiện lỗi đĩa cứng; rủi ro về broker như broker bị phá sản (bankrupt)…Tóm lại, những rủi ro này bao gồm gần như tất cả mọi thứ có thể gây trở ngại đến việc thực thi giao dịch của hệ thống và mỗi rủi ro là lại có thể có nhiều nguyên nhân gây ra nó. Hầu hết tất cả các quyển sách nói về chiến lược giao dịch đều đề cập đến quản trị rủi ro một cách chi tiết và đầy đủ, do đó trong phạm vi tính chất bài viết này sẽ không đề cập đầy đủ tất cả những nguyên nhân gây ra rủi ro với hệ thống.

Quản trị rủi ro cũng bao hàm cả khái niệm phân bổ nguồn vốn tối ưu (optimal capital allocation) là một nhánh của lý thuyết danh mục đầu tư. Khái niệm này có nghĩa là bao nhiêu vốn sẽ được phân phối tương ứng cho các chiến lược khác nhau và cho những giao dịch trong những chiến lược đó. Đây là một lĩnh vực phức tạp và nó dựa rất nhiều vào các kỹ thuật toán học để tính toán. Trong thực tế tiêu chuẩn được sử dụng trong việc phân bổ nguồn vốn tối ưu và tỉ lệ đòn bẩy của các chiến lược có liên quan đến khái niệm Tiêu chuẩn Kelly (Kelly criterion). Do bài viết này chỉ mang tính chất giới thiệu nên chúng tôi sẽ không đề cập sâu đến các vấn đề tính toán.

Công thức tiêu chuẩn Kelly: Kelly% = W – [(1-W)/R]

Có hai thành tố chính trong công thức này cần tính toán khi áp dụng vào việc giao dịch: W: xác suất xảy ra lợi nhuận dương của một giao dịch và R (win/loss): tỉ lệ giữa tổng những giao dịch lời và tổng những giao dịch lỗ.

Thành phần quan trọng khác của quản trị rủi ro là đối mặt với vấn đề tâm lý của bản thân mình. Có nhiều lệch lạc do nhận thức cảm tính của chuyên viên giao dịch, thiết kế hệ thống có thể đan xen vào công việc giao dịch. Có thể thừa nhận rằng các vấn đề về tâm lý sẽ được loại bỏ nếu như các chuyên viên giao dịch để hệ thống tự động thực thi mà không can thiệp. Một lệch lạc thông thường là “cảm giác mất mát” khi mà bạn đang bị thua lỗ nhưng không muốn đóng giao dịch đó lại vì điều đó đồng nghĩa với việc thừa nhận thua lỗ đó. Tương tự như vậy, trong trường hợp có lời thì giao dịch thường sẽ bị đóng quá sớm vì sợ mất lợi nhuận đã đạt được một cách tuyệt vời. Một lệch lạc khác thường được nhắc đến là lệch lạc gần đây (recency bias) có nghĩa là nhà đầu tư đặt quá nhiều trọng tâm vào các giao dịch/sự kiện xảy ra trong thời gian gần đây và không lâu dài, ví dụ như các chuyên viên giao dịch tính toán mức độ sinh lời của chiến lược dựa trên những kết quả giao dịch gần đây mà không phải trong một khoảng thời gian đủ dài, điều đó sẽ dẫn đến đánh giá không chính xác hiệu năng của chiến lược. Và tất nhiên không thể không nhắc đến một cặp lệch lạc cảm xúc truyền thống chính là sợ hãi và tham lam. 2 lệch lạc này thường dẫn đến việc sử dụng đòn bẩy quá thấp hoặc quá cao dẫn đến tình trạng blow-up (tài khoản vốn bị thua lỗ về 0 hoặc tình trạng xấu hơn) hay làm giảm lợi nhuận.

Tổng kết

Có thể thấy rằng giao dịch định lượng cực kỳ phức tạp mặc dù rất thú vị và cũng là một nhánh của tài chính định lượng. Bài viết trên chỉ đề cập đến những khía cạnh bề ngoài của giao dịch định lượng mọt cách đơn giản nhất, có rất nhiều quyển sách, bài nghiên cứu đã được viết ra chỉ dành riêng cho một chủ đề nhỏ đã nhắc đến ở trên. Do đó, bất kỳ ai muốn làm việc cho các quỹ ở vị trí giao dịch thì cần phải sẵn sàng học và nghiên cứu một khối lượng kiến thức lớn. Ít nhất thì các chuyên viên này phải có nền tảng vững ở lĩnh vực thống kê và kinh tế lượng với kinh nghiệm trong việc áp dụng chúng bằng các phần mềm như MATLAB, Python hay R. Đối với các chiến lược tinh vi, phức tạp hơn như giao dịch tần suất cao thì cần thêm các kỹ năng bao gồm lập trình nhân của Linux (Linux kernel), lập trình C/C++ và assembly, tối ưu hóa mạng lưới độ trễ.

Nếu bạn đang muốn thử tạo ra một chiến lược giao dịch cho bản thân, lời khuyên chúng tôi đưa ra là phải có kỹ năng lập trình tốt trước tiên. Tự xây dựng các chương trình thu thập dữ liệu, kiểm định lại chiến lược và hệ thống điều hành cho bản thân càng nhiều càng tốt. Nếu như vốn của bạn đang được giao dịch trên hệ thống, ít nhất bạn có thể ngủ ngon khi biết rằng hệ thống đã được kiểm tra đầy đủ và những rủi ro đã được tính toán trước. Sử dụng phần mềm được gia công bởi các nhà cung cấp khác có thể giúp tiết kiệm thời gian trong ngắn hạn, tuy nhiên trong dài hạn lại có thể rất tốn kém vì khó điều chỉnh lại hệ thống theo mục tiêu của mình cũng như tối ưu hóa các vấn đề khác.


Source: https://www.quantstart.com/articles/Beginners-Guide-to-Quantitative-Trading


Xem thêm:

———————-&&&———————

Giới thiệu ngành tài chính định lượng

Giới thiệu ngành tài chính định lượng

(Nguồn: http://scue.vn)

Giới thiệu ngành tài chính định lượng P1

I. Tài chính định lượng là gì?

Tài chính định lượng (Quantitative Finance hay Mathematical Finance) là một mảng của toán học ứng dụng vào thị trường tài chính, ứng dụng các mô hình toán học nhằm dự báo, định giá giá trị chứng khoán; quản lý danh mục đầu tư; quản trị rủi ro tài chính hay giao dịch tự động.

Cần phân biệt rõ ràng giữa tài chính định lượng với một ngành khác dễ gây nhầm lẫn là kinh tế tài chính (financial economics). Sự khác biệt cơ bản thể hiện qua ví dụ so sánh:

Các nhà kinh tế tài chính nghiên cứu các lý do tại sao giá cổ phiếu của công ty lại biến động do các yếu tố khác.

Các nhà tài chính định lượng lại tìm cách định giá hay dự báo giá trị cổ phiếu công ty trong tương lai bằng các mô hình và công cụ toán học hiện đại.

II. Lịch sử của tài chính định lượng

Lịch sử của tài chính định lượng gắn liền với sự phát triển của các ngành khoa học tự nhiên: toán học, vật lý học, tin học.

Những ứng dụng đầu tiên của toán học là lý thuyết tối ưu hóa danh mục của Harry Markowitz. Sử dụng ước tính trung bình phương sai của các danh mục để đánh giá chiến lược đầu tư làm thay đổi hoàn toàn cách làm trước đó là cố gắng tìm kiếm một cổ phiếu riêng lẻ tốt nhất để đầu tư. Hay sử dụng hồi quy tuyến tính để hiểu rõ và định lượng rủi ro (như phương sai) và lợi nhuận (như giá trị trung bình) của toàn bộ cổ phiếu và trái phiếu, chiến lược tối ưu hóa đã được sử dụng để chọn danh mục đầu tư với lợi nhuận trung bình lớn nhất với mức độ rủi ro (phương sai) chấp nhận được. Đồng thời, William Sharpe đã phát triển công cụ toán học xác định mối quan hệ giữa mỗi cổ phiếu và thị trường cùng với các đồng sự. Do đó năm 1990, Markowitz, Sharpe cùng với Merton Miller đã được trao giải nobel kinh tế. Trong thời gian này toán học trở nên tinh vi và phức tạp hơn. Nhờ những cống hiến của Robert Merton và Paul Samuelson những mô hình một thời điểm đã được thay thế bởi các mô hình thời gian liên tục, mô hình chuyển động Brown.

Cuộc cách mạng quan trọng tiếp theo trong ngành tài chính định lượng là công trình mô hình hóa thị trường tài chính của Fischer Black và Myron Scholes cùng với những đóng góp nền tảng của Robert C.Merton. Scholes và Merton đã được trao giải nobel kinh tế năm 1997.

Các mô hình toán học tinh vi, phức tạp và chiến lược định giá sản phẩm phái sinh đã được phát triển liên tục nhưng tính đảm bảo an toàn đã bị phá hủy bởi cuộc khủng hoảng tài chính 2007-2010. Tuy nhiên, nhiều tổ chức trong lĩnh vực tài chính vẫn đang tiếp tục tìm kiếm các phương pháp và lý thuyết hiệu quả hơn.

Trong lĩnh vực vật lý, Bachelier là người đầu tiên tìm cách “định lượng” chuyển động Brown (chuyển động của hạt nhỏ li ti trong nước hay của các phân tử chất khí trong không khí) vào năm 1900 và được coi là cha đẻ của ngành toán tài chính hiện đại. Ông đã phát triển lý thuyết toán để nghiên cứu các quá trình ngẫu nhiên, lý thuyết mà sau này được tái khám phá bởi Einstein. Ngày nay mô hình chuyển động Brown dựa trên lý thuyết xác suất thống kê chính là mô hình chuẩn và nền tảng trong việc dự báo giá chứng khoán, lãi suất trái phiếu, rủi ro đầu tư trong tài chính hiện đại.

Sự bùng nổ mạnh mẽ ở lĩnh vực công nghệ thông tin và khoa học máy tính cuối thế kỷ 20 làm nền tảng quan trọng nhất cho sự phát triển ngành tài chính định lượng. Các máy tính với tốc độ xử lí tăng theo định luật Moore(*) là công cụ mạnh mẽ và không thể thay thế để thực thi các mô hình, các dự báo tài chính. Ngoài ra nhiều máy tính, hệ thống quản lí điện tử đã được đưa vào ứng dụng ở các sở giao dịch chứng khoán như NYSE (New York Stock Exchange) những năm 1970 và từ năm 1980 xuất hiện hình thức giao dịch tự động (algorithmic trading hay automated trading), đặc biệt là giao dịch tần số cao HFT (high- frequency trading). Hệ thống giao dịch tự động sử dụng các thuật toán (algorithm) do các nhà tài chính định lượng viết ra cho các máy tính tự động giao dịch liên tục nhằm tối ưu hóa lợi nhuận bằng chênh lệch giá.

Tiếp tục đọc

Dự báo biến động giá chứng khoán qua mô hình Arch-Garch

Dự báo biến động giá chứng khoán qua mô hình Arch-Garch

(Tác giả: Phạm Chí Khoa – Nguồn: http://tapchitaichinh.vn)

Có nhiều phương pháp dự báo biến động giá tài sản tài chính. Trong nghiên cứu này, tác giả dự báo những biến động có điều kiện của thị trường chứng khoán Việt Nam với dữ liệu về biến động của chỉ số VN-Index từ ngày 15/06/2006 đến ngày 15/06/2016. Kết quả cho thấy, mô hình GARCH (1,1) là phù hợp để ước tính sự biến động của thị trường chứng khoán trong nước. Những biến động trong quá khứ của thị trường có thể được lặp lại trong hiện tại và nghiên cứu dự báo những biến động của thị trường góp phần cung cấp dữ liệu quan trong trọng trong việc quyết định phân bổ tài sản, quản lý rủi ro và quản lý các danh mục đầu tư cho các nhà đầu tư trên thị trường chứng khoán Việt Nam.

 

Ảnh minh họa. Nguồn: internetẢnh minh họa. Nguồn: internet

Dữ liệu và phương pháp nghiên cứu

Hiện có nhiều nghiên cứu về những biến động của thị trường chứng khoán (TTCK) thực hiện trên thế giới và ở Việt Nam. Việc nghiên cứu những biến động của TTCK Việt Nam thông qua chỉ số VN-Index đóng vai trò quan trọng đối với các nhà quản lý quỹ, các nhà đầu tư trên thị trường.

Nhìn lại TTCK Việt Nam trong 10 năm qua đã có không ít biến động lớn, trong đó đỉnh cao của thị trường đạt mốc với gần 1.200 điểm vào 12/03/2007 rồi lao dốc khi rơi xuống còn 235 điểm vào ngày 24/02/2009. Để nghiên cứu về biến động giá chứng khoán, nghiên cứu này áp dụng đồng thời dự báo rủi ro thông qua mô hình ARIMA và dự báo rủi ro thông qua GARCH.

Dữ liệu thu thập là chỉ số VN-Index theo ngày từ ngày 15/6/2006 đến ngày 15/6/2016, bao gồm 2.421 quan sát được sử dụng đo lường sự biến động của lợi nhuận hàng ngày. Theo đó, lợi suất của giá chứng khoán sẽ được xác định theo công thức sau:

VNRln = log (Pt/Pt-1)

Trong đó, Pt là giá đóng cửa của VN-Index thời điểm t được chuyển đổi theo logarit; Pt-1 là giá đóng cửa của VN-Index thời điểm t-1 được chuyển đổi theo logarit.

Một biến giả được đưa vào mô hình để chèn vào ngày thị trường bị đóng cửa (ngày 1/4/2014). Bởi các biến động của tỷ suất lợi nhuận của tài sản có mối tương quan chuỗi và để làm rõ các tương quan này, Engle (1982) đã có một cách tiếp cận mới trong nghiên cứu về dữ liệu chuỗi thời gian thông qua mô tả giá trị các biến thời gian khác nhau và được gọi là phương sai sai số có điều kiện và hiện tượng tự tương quan (Arch). Mô hình Arch mô tả phương sai có điều kiện của các biến trễ phân phối theo thời gian:

δt2=ω+α(L)ηt2

Trong đó, α (L) là một đa thức trong biến trễ. Để phương sai có điều kiện dương thì ω và α(L) phải không âm. Tuy nhiên, Fan và Yao (2001) lại cho rằng, Arch(p) chỉ thích hợp cho mô hình tài chính với độ trễ đủ lớn và điều này đảm bảo các phần mở rộng cho mô hình Arch. Trong khi đó, mô hình Garch là mô hình mở rộng của mô hình Arch được phát hiện bởi Bolleslev (1986). Mô hình Garch dựa vào các biến động nối tiếp nhau. Mô hình Garch(1,1) đơn giản nhất được mô tả như sau:

Phương trình trung bình:

rt = μ = εt

Phương trình phương sai:

σt = ω + α1εt-1+ β1σt-1

Trong đó, mô hình Garch phải thỏa mãn α1 ≥ 0 và β1 ≥ 0 để đảm bảo σ2là phương sai có điều kiện luôn dương. Hệ số α1 đo lường biến động có thể xảy ra ở thời kỳ tiếp theo. Nếu hệ số β1 cao điều đó chỉ ra rằng có sự biến động trong thời gian dài. Nếu α1 cao, nó có thể chỉ ra các biến động làm thay đổi thị trường là mạnh.

Bên cạnh đó, nếu α1 cao và β1 thấp, sự biến động là rất mạnh mẽ. Nếu tổng α1 và β1 tiến gần tới 1, một cú sốc tại thời điểm t sẽ tồn tại trong một thời gian dài ở tương lai. Nếu tổng α1 và β1 nhỏ hơn 1 nó sẽ dẫn đến sự thay đổi thường xuyên trong thời gian dài. Nếu tổng α1 và β1bằng 1, những cú sốc sẽ làm thay đổi tạm thời các giá trị trong tương lai. Mô hình Garch dựa vào sự phụ thuộc của chuỗi các biến động, đưa ra các quan sát trong tương lai dựa vào các quan sát ở qua khứ, do đó mô hình Garch dựa trên phương sai thay đổi theo thời gian.

Kết quả nghiên cứu

Nghiên cứu căn cứ vào tiêu chuẩn Schwarz (SIC) để quyết định bậc phù hợp trong mô hình Arma áp dụng cho dự báo giá trị trung bình của lợi suất VN-Index. Ender (2010) cho rằng, SIC thì tốt hơn tiêu chuẩn Akaike (AIC) trong việc lựa chọn mô hình phù hợp. Nghiên cứu dự báo sự kết hợp của bậc p,q của mô hình Arma với độ trễ tối ưu Arma (4,1) là phù hợp nhất với bộ dữ liệu của nghiên cứu này.

Ta thấy giá trị của hằng số là khác 0 và giá trị của AR và MA đều dương để đảm bảo phương sai có điều kiện là không âm. Bên cạnh đó, hệ số α1 và β1 có ý nghĩa thống kê và điều này có thể cho biết sự biến động của thời kỳ trước có thể giải thích cho những biến động ở thời kỳ này. Hệ số β1= 0.780229 là cao và điều đó chỉ ra rằng có sự biến động trong thời gian dài. Biến động của thị trường tồn tại lâu dài.

 Hệ số α1 cho thấy cường độ của biến động đối với thị trường, α1 = 0.163667 cho thấy, VN – Index khá nhạy trong phản ứng với các biến động diễn ra trên thị trường. Tổng α1 và β1 tiến gần tới 1, chứng tỏ một cú sốc tại thời điểm t sẽ tồn tại trong một thời gian dài ở tương lai và tổng α1 và β1 nhỏ hơn 1 chỉ ra rằng phương sai không điều kiện εt là cố định.

Với α1 nhỏ hơn β1 có thể đưa ra kết luận rằng biến động của thời kỳ này bị ảnh hưởng bởi biến động của thời kỳ trước hơn là bị ảnh hưởng bởi thông tin có liên quan của thời kỳ trước. Biến giả DUM không có ý nghĩa thống kê trong ước lượng này. Bài viết đã dùng các kiểm định để xem xét sự vững và không chệch của mô hình. Với kiểm định Arch-LM kiểm tra phần dư có còn biểu hiện hiệu ứng Arch. Tương tự, kiểm định Ljung-Box Q-statistic kiểm tra hiện tượng tự tương quan phần dư.

Cuối cùng, để kiểm định chuỗi dữ liệu lợi suất VN-Index theo ngày trong 10 năm có cần áp dụng thêm một mô hình phi tuyến, tác giả đã sử dụng kiểm định BDS phần dư của mô hình, kết quả được mô tả tại bảng 1. Kết quả kiểm định BDS cho thấy, bên cạnh mô hình Arma (4,1) – Garch (1,1), bộ dữ liệu còn cần một mô hình phi tuyến để dự báo nhằm nâng cao tính chính xác. Điều này có thể xảy ra và có thể đoán trước bởi biến động Vn – Index là quá lớn và do nhiều nguyên nhân, dẫn đến tính kém chính xác của bộ dữ liệu nghiên cứu.

Kết luận

Dựa trên dữ liệu thu thập là chỉ số VN-Index từ ngày 15/6/2006 đến ngày 15/6/2016, bao gồm 2421 quan sát được sử dụng đo lường sự biến động của lợi nhuận hàng ngày và sử dụng mô hình Arch-Garch để dự báo. Chuỗi lợi suất theo ngày của VN-Index tuân theo quy luật phân phối không chuẩn và lệch âm. Áp dụng mô hình ARMA(4,1)-GARCH(1,1) cho thấy lợi suất trong quá khứ có vai trò quyết định lợi suất hiện tại. Biến động của Vn-Index sẽ tồn tại lâu dài. Biến động trong quá khứ sẽ ảnh hưởng đến biến động trong hiện tại.

Dựa vào kết quả này, những nhà phân tích kỹ thuật, nhà quản lý danh mục sẽ tự tin hơn trong việc phân tích dự báo của mình thông qua các mô hình phân tích kỹ thuật chủ yếu dựa trên biến động có quy luật của giá chứng khoán. Thêm nữa, các nhà đầu tư có thể sử dụng kết quả này để áp dụng vào lý thuyết đánh giá hiệu quả của danh mục đầu tư chủ động nhằm nhấn mạnh vai trò của thời điểm thị trường.

Như vậy, nghiên cứu này giúp dự báo những biến động của TTCK, góp phần cung cấp dữ liệu quan trong trọng trong việc quyết định phân bổ tài sản, nguồn vốn đầu tư, quản lý rủi ro và quản lý các danh mục đầu tư cho các nhà đầu tư trên TTCK Việt Nam, từ đó góp phần mạng lại thành công khi đầu tư trên thị trường này.

Tài liệu tham khảo

1. Lakshmi Kalyanaraman(2014), Stock Market Voltality in Saudi Arabia: An Application of Univariate GARCH Model, Canadian Center of Science and Education;

2. Bolleslev T, Engle RF, Nelson DB. (1994), Garch Model. In the Handbook of Econometrics, Vol.4;

3. Tsay (2010), Analysis of Financial Time Series. A John Wiley & Son, Inc., Publication.

————————&&&————————

Xây dựng đường cong lãi suất chuẩn của Việt Nam

Xây dựng đường cong lãi suất chuẩn của Việt Nam

(Nguồn: http://duyviet90.blogspot.com)

I – Các mô hình xây dựng đường cong lãi suất chuẩn

1.1. Các đường cong lãi suất hoàn vốn

Đường cong lãi suất hoàn vốn (yield curve): được hình thành bằng cách minh họa các mức lãi suất hoàn vốn của các trái phiếu chỉ khác nhau về kỳ hạn đáo hạn trên cùng một đồ thị.

Đường cong lãi suất hoàn vốn đến kỳ đáo hạn (yield-to-maturity yield curve):được hình thành bằng cách minh họa các mức lãi suất hoàn vốn đến kỳ đáo hạn của các trái phiếu chỉ khác nhau về kỳ hạn đáo hạn trên cùng một đồ thị.

 

Đường cong lãi suất hoàn vốn đến kỳ đáo hạn của các trái phiếu có cùng mức coupon (coupon yield curve): minh họa lãi suất hoàn vốn đến kỳ đáo hạn của các trái phiếu có cùng mức coupon và chỉ khác nhau về kỳ hạn đáo hạn lên cùng một đồ thị.

Đường cong lãi suất hoàn vốn của trái phiếu được giao dịch với giá bằng mệnh giá (par yield curve): minh họa các mức lãi suất hoàn vốn đến kỳ đáo hạn của các trái phiếu hiện hành chỉ khác nhau về kỳ hạn và đều được giao dịch ở mức gần bằng mệnh giá.

Cấu trúc kỳ hạn của lãi suất (the term structure of interest rates): chính là đường cong lãi suất hoàn vốn của trái phiếu chiết khấu (zero-coupon yield curve) hay đường cong lãi suất hoàn vốn giao ngay (spot yield curve).

1.2. Các mô hình xây dựng đường cong lãi suất chuẩn

1.2.1. Mô hình một nhân tố

Mô hình một nhân tố là loại mô hình cho phép xây dựng được một cấu trúc kỳ hạn hoàn chỉnh từ một loại lãi suất ngắn hạn. Gồm có: (1) Mô hình Vasicek; (2) Mô hình Merton; (3) Mô hình Cox-Ingersoll-Ross (CIR).

1.2.2. Các mô hình tự do chênh lệch giá

Mô hình tự do chênh lệch giá có mục đích là xây dựng nên một cấu trúc kỳ hạn lý thuyết tương thích với cấu trúc thực tế quan sát được để khiến cho lãi suất hoàn vốn quan sát trên thị trường thì có giá trị bằng với lãi suất hoàn vốn được tính toán trên cơ sở mô hình. Bao gồm các mô hình: (1) Mô hình Ho-Lee; (2) Mô hình Hull-White; (3) Mô hình Black-Derman-Toy (BDT).

1.2.3. Mô hình đa nhân tố

Mô hình đa nhân tố cho phép giải thích được dạng thức thay đổi phi song song hoặc những thay đổi về độ dốc của đường cong. Trong nhóm này có: (1) Mô hình hai nhân tố; (2)Mô hình đa nhân tố Heath-Jarrow-Morton (HJM).

1.2.4. Các kỹ thuật sử dụng phương pháp tham số

– Mô hình Nelson-Siegel: Bản chất của kỹ thuật này là mô hình hóa lãi suất kỳ hạn bằng cách sử dụng hàm số hóa.

– Mô hình hàm nối trục bậc ba (cubic spline model): Mô hình hàm nối trục ra đời với mục đích là để phát huy ưu điểm của mô hình tham số trong việc mô phỏng tốt các mức lãi suất hoàn vốn của các kỳ hạn đáo hạn dài đồng thời khắc phục nhược điểm của mô hình tham số ở các kỳ hạn đáo hạn ngắn.

– Mô hình hàm nối trục cơ bản (B-spline)Bên cạnh công thức tổng quát của hàm nối trục bậc ba như trên, người ta cũng thường tạo ra các đường nối trục bằng cách kết hợp tuyến tính các đường nối trục cơ bản lại với nhau.

1.3. Điều kiện áp dụng các mô hình xây dựng đường cong lãi suất chuẩn

1.3.1. Yêu cầu của mô hình xây dựng đường cong lãi suất chuẩn

– Mô hình có thể đưa ra được một đường cong lý thuyết khớp với số liệu hiện hành trên thị trường.

– Mô hình có thể phản ánh được diễn biến của lãi suất theo thời gian và diễn biến này phải theo dõi được thông qua việc tính toán cụ thể trên cơ sở các hàm toán học trực quan.

– Mô hình phải đảm bảo tính hiệu quả và kịp thời trên cơ sở các nguồn lực có sẵn như mức độ có sẵn và đáng tin cậy của số liệu, năng lực xử lý số liệu của máy tính,…

Từ những yêu cầu nói trên, ta có thể thấy rằng mô hình được sử dụng sẽ đưa ra kết quả chính xác khi: (i) Lãi suất đầu vào phản ánh tính khách quan của thị trường, (ii) Các thông tin về thị trường là minh bạch, và (iii) Phải có thị trường trái phiếu phát triển với các kỳ hạn đa dạng và khối lượng phát hành đủ lớn.

1.3.2. Điều kiện áp dụng của các mô hình xây dựng đường cong lãi suất chuẩn

Việc nghiên cứu các mô hình xây dựng đường cong lãi suất chuẩn cho thấy mỗi mô hình sẽ phát huy hiệu quả riêng biệt trong việc xây dựng đường cong lãi suất chuẩn của từng quốc gia.

1.4. Bài học từ việc xây dựng đường cong lãi suất chuẩn của các nước

1.4.1. Kinh nghiệm của các nước:

Nghiên cứu thực tế xây dựng đường cong lãi suất chuẩn của các nước Mỹ, Malaysia,Singapore cho thấy, mỗi mô hình được xây dựng trên một giả định riêng và các nước khi lựa chọn mô hình đều xem xét sự phù hợp của các giả định đối với trường hợp của riêng mình. Việc lựa chọn mô hình để xây dựng đường cong lãi suất chuẩn của các nước này phụ thuộc vào mức độ phát triển của thị trường trái phiếu, mức độ đa dạng về các kỳ hạn của trái phiếu chính phủ, khối lượng các đợt phát hành, tính hiệu quả của thị trường cũng như sự sẵn có của số liệu …

1.4.2. Lựa chọn mô hình cho Việt Nam

Từ quá trình nghiên cứu trên, tiếp cận từ giác độ NHTW thì chúng ta có thể xây dựng cấu trúc kỳ hạn của lãi suất hay đường cong lãi suất hoàn vốn giao ngay hoặc đường cong lãi suất của trái phiếu chiết khấu.


II – Đặc điểm thị trường các công cụ nợ của Việt Nam

2.1. Thị trường trái phiếu Chính phủ

2.1.1. Thực trạng thị trường trái phiếu Chính phủ

            – Hiện thời, trái phiếu Chính phủ bao gồm: Tín phiếu Kho bạc; Trái phiếu Kho bạc; Trái phiếu công trình trung ương; Trái phiếu đầu tư; Công trái xây dựng Tổ quốc; Trái phiếu ngoại tệ. Từ năm 2007, KBNN đã triển khai đề án phát hành TPCP lô lớn. Bộ Tài chính đã xây dựng kế hoạch phát hành hàng năm và  lịch trình phát hành TPCP từng quí. TPCP được phát hành qua các kênh: Bán lẻ qua hệ thống Kho bạc Nhà nước; Phát hành tín phiếu kho bạc qua đấu thầu tại NHNN; Phát hành TPCP qua đấu thầu tại Sở giao dịch chứng khoán; Bảo lãnh phát hành TPCP; Phát hành qua kênh Bảo hiểm Xã hội mua.

– Trên thị trường mở, đến năm 2009 có 58 tổ chức tín dụng được cấp giấy chứng nhận là thành viên nghiệp vụ thị trường mở; trong đó có 5 NHTM Nhà nước và ngân hàng cổ phần Nhà nước nắm cổ phần chủ yếu, 34 NHTM cổ phần, 3 ngân hàng liên doanh, 14 chi nhánh NH nước ngoài, 1 Công ty tài chính và QTD Trung ương. Doanh số trúng thầu từ năm 2000 đến 2005 hàng năm bình quân tăng gấp khoảng 3 lần so với năm trước.

2.1.2. Đặc điểm thị trường trái phiếu Chính phủ

2.1.2.1. Tính thanh khoản của thị trường

– Tính thanh khoản tại sở giao dịch chứng khoán Hà Nội thấp.

– Tính thanh khoản trong giao dịch thị trường mở tương đối cao, thể hiện ở tần suất và số lượng các phiên giao dịch thị trường mở liên tục tăng.

2.1.2.2. Lãi suất TPCP

a/ Tính thị trường của lãi suất TPCP:

–  Tính thị trường của lãi suất TPCP mới phát hành thấp:

 b/ Mức độ nhạy cảm của lãi suất đối với sự tác động của Ngân hàng Trung ương:

– Lãi suất nghiệp vụ thị trường mở chịu sự chi phối bởi cặp lãi suất chỉ đạo của NHNN. Tuy nhiên, tại những thời điểm nhất định lãi suất TTM đã biến động ra khỏi cặp lãi suất chỉ đạo, thể hiện ở các phiên thực hiện theo phương thức đấu thầu lãi suất.

– Lãi suất phát hành TPCP hầu như không chịu sự chi phối bởi mức lãi suất chỉ đạo của NHNN mà theo mục đích huy động vốn cho NSNN trong từng thời kỳ.

– Lãi suất TPCP đôi khi tăng cao, hơn cả lãi suất tín dụng ngân hàng.

2.2. Thị trường trái phiếu doanh nghiệp

2.2.1. Thực trạng thị trường trái phiếu doanh nghiệp

– Giá trị vốn huy động của các doanh nghiệp qua TTCK rất thấp, chỉ đạt 15-20% lượng vốn doanh nghiệp huy động

–  Trong số chứng khoán doanh nghiệp phát hành, trái phiếu là công cụ được các doanh nghiệp lựa chọn trong vài năm trở lại đây.

– Tỷ trọng giá trị trái phiếu doanh nghiệp phát hành so với tổng vốn huy động qua TTCK nhỏ, đặc biệt năm 2008 tỷ lệ này chỉ đạt 4,07%.

– Tỷ trọng giá trị trái phiếu doanh nghiệp phát hành trong tổng giá trị trái phiếu phát hànhrất thấp, khoảng 23-37%, thậm chí chỉ chiếm 5,28% trong năm 2008.

2.2.2. Đặc điểm thị trường trái phiếu doanh nghiệp

– Thị trường trái phiếu doanh nghiệp có tính thanh khoản thấp

– Lãi suất trái phiếu doanh nghiệp: lãi suất TPDN phần nào chịu sự chi phối bởi lãi suất chỉ đạo của NHNN, song qui mô thị trường trái phiếu doanh nghiệp quá nhỏ bé, lãi suất trái phiếu doanh nghiệp không phải là mức lãi suất tiêu biểu của thị trường.

2.3. Thị trường tín dụng ngân hàng

2.3.1. Thị trường giữa tổ chức tín dụng và doanh nghiệp, cá nhân (thị trường 1)

2.3.1.1. Thực trạng thị trường

– Tín dụng ngân hàng là hoạt động truyền thống, là kênh huy động và cung ứng vốn chủ yếu ở Việt Nam.

– Với vai trò là trung gian tín dụng trên thị trường tài chính, các tổ chức tín dụng, đặc biệt là các Ngân hàng thương mại đã thực hiện việc huy động vốn và đáp ứng phần lớn nhu cầu vốn của các doanh nghiệp và cá nhân trong nền kinh tế. Khối lượng vốn huy động và cho vay tăng liên tục qua các năm.

2.3.1.2. Đặc điểm thị trường

– Thị trường tín dụng ngân hàng có tính thanh khoản rất cao.

– Mức độ tự do hoá lãi suất ngày càng cao. Từ đầu năm 2009, các cơ chế kiểm soát hành chính dần dần được dỡ bỏ. Tuy nhiên, trong những thời điểm nhất  định, tính thị trường của lãi suất bị hạn chế  do được khống chế bởi trần lãi suất và sự can thiệp của Hiệp hội ngân hàng.

– Lãi suất tín dụng ngân hàng đã phản ánh sự tác động CSTT của NHNN. Hiện nayNHNN Việt Nam ấn định các loại lãi suất cơ bản, lãi suất tái cấp vốn, lãi suất tái chiết khấu, lãi suất cho vay qua đêm, lãi suất tiền gửi dự trữ bắt buộc để điều hành lãi suất thị trường. Bên cạnh đó còn sử dụng các công cụ CSTT để tác động đến lãi suất liên ngân hàng, lãi suất nghiệp vụ thị trường mở, từ đó ảnh hưởng đến lãi suất của các NHTM, nhằm thực hiện mục tiêu chính sách tiền tệ và mục tiêu kinh tế vĩ mô trong từng thời kỳ.

2.3.2. Thị trường tiền tệ liên ngân hàng (thị trường 2)

2.3.2.1. Thực trạng hoạt động thị trường

– Năm 1992, NHNN ban hành Chỉ thị số 07/CT-NH1 ngày 7/10/1992, là văn bản pháp lý đầu tiên quy định về hoạt động về quan hệ tín dụng giữa các TCTD. Từ năm 2001 đến nay, NHNN tiếp tục ban hành đồng bộ các văn bản thể chế đối với hoạt động của thị trường, từng bước tiến gần hơn tới thông lệ quốc tế.

2.3.2.1. Đặc điểm của thị trường

– Doanh số giao dịch trên thị trường nhìn chung có sự tăng trưởng mạnh theo từng năm, đặc biệt là trong khoảng 10 năm trở lại đây.

– Tính thanh khoản của thị trường liên ngân hàng rất cao, các giao dịch trên thị trường liên ngân hàng diễn ra hàng ngày với doanh số giao dịch lớn, đặc biệt trong những thời điểm các ngân hàng căng thẳng về vốn khả dụng.

– Lãi suất liên ngân hàng có tính thị trường cao, ngày càng phản ánh sát thực hơn cung cầu vốn khả dụng của các ngân hàng.

– Lãi suất liên ngân hàng có quan hệ chặt chẽ với lãi suất huy động, cho vay trên thị trường 1 song có mức biến động mạnh.

– Lãi suất liên ngân hàng cũng bị khống chế bởi trần lãi suất.

– Lãi suất liên ngân hàng phản ánh rõ tác động của NHNN đến dự trữ của các ngân hàng.

– Lãi suất liên ngân hàng đôi khi ít chịu tác động bởi lãi suất chỉ đạo của NHNN.

III- Xây dựng đường cong lãi suất chuẩn của Việt Nam

download bài viết đầy đủ: http://www.cantholib.org.vn/Database/Content/2521.pdf

———————&&&———————

Machine Learning 4 Trading [Talk]

Quantitative finance and programming trading strategies w/ Yves Hilpisch, The Python Quants

(Nguồn: https://chatwithtraders.com)

  • In case you’re new to this, Yves explains what it means to be a “quant” and how one tries to make sense of markets which varies from other types of participants.
  • How a quant looks for opportunities and areas where they can exploit the market. Plus, a brief walk through history; applying quantitative methods to finance.
  • Yves shares his thoughts on the effectiveness of machine learning (and similar techniques) and where he sees potential value from social sentiment data.
  • Many years ago, Yves started The Python Quants—he speaks about his motives and what goes on inside the events and meet-ups they host in various countries.
  • Out of all the programming languages in existence, Yves talks about why Python is his preferred choice for financial applications and it’s overall popularity.
  • Yves uses Pandas—a Python library created by a programmer within a large hedge fund—as a paramount example for open-sourced code and value of collaboration.
  • A practical way for non-programmers to learn how to code in Python, educational resources, and what sort of commitment is required to become proficient.

Strategy development—powered by machine learning

(Nguồn: https://chatwithtraders.com)

  • How large funds and institutions put on $100-million positions; how they work orders into the market, structure the trade and handle market impact etc.
  • Morgan explains why he feels as though the common approach to strategy development is counter intuitive, and shares an alternative 3-step formula.
  • A simple description of how machine learning and data science is being used by traders, and an example of how ML has been used to improve existing strategies.

Ứng dụng tốt (và không thật tốt) của Học máy trong kinh doanh và tài chính.

(Nguồn: https://chatwithtraders.com)

Học máy (Machine learning) là một chủ đề nóng hiện nay,  rất nhiều người tự hỏi làm thế nào nó có thể được sử dụng trong tài chính và kinh doanh. Nếu sử dụng ML một cách “ngây thơ”, nó có thể dẫn tới rất nhiều rủi ro. Chúng tôi sẽ thảo luận về lý do tại sao rủi ro có thể xảy ra và một số cách tốt để sử dụng ML một cách cẩn thận.

Chủ đề của cuộc thảo luận:

  • Máy học (Machine learning) là gì và làm thế nào nó được sử dụng trong cuộc sống hàng ngày?
  • Học có giám sát vs Học không có giám sát, và khi nào thì sử dụng chúng.
  • Liệu Học máy có cung cấp bất cứ điều gì nhiều hơn các phương pháp thống kê truyền thống.
  • Ứng dụng tốt (và không thật tốt) của máy học trong kinh doanh và tài chính.
  • Sự cân bằng giữa đơn giản và phức tạp.

Machine learning for algorithmic trading

(Nguồn: https://chatwithtraders.com)

  • Bert’s takeaway from reading a ton of trading books, and why there’s “no such thing as a bad book” – because you can always learn something (even if it’s doing the opposite).
  • In it’s purest form, Bert explains the purpose of machine learning, and gives an example of how it’s used in everyday technology.
  • How Bert uses machine learning to discover and create effective trading algorithms, from starting point through to live trading. And the information which is “nice to incorporate” outside of price.
  • The ways in which machine learning techniques differ from more common ways of developing algorithms, and how it removes further bias from your models.
  • Bert shares his opinion about whether a strategy should make sense logically, or if a statistical edge is the only evidence you need.
  • How Bert  thinks about diversification, and why he prefers to allocate additional capital to new markets, instead of adding to the markets he’s already actively trading.
  • The affects of machines becoming more and more prominent in the trading landscape; positive or negative?
  • Bert speaks about his attitude to always be learning and striving for continual progression. As well as his mindset of setting goals that are just out of reach, to really push yourself.
  • And much, much more…

Machine Learning With Kris Longmore

(Nguồn: http://bettersystemtrader.com)

Machine learning has seen a huge amount of growth over recent years with the increase in available data and processing power.

It’s an incredibly powerful toolset for uncovering patterns and relationships in data, however, these tools can be challenging to learn, apply correctly and are also open to abuse.

  • How Machine Learning can be used to analyse huge amounts of data, uncover patterns and relationships, and define a trading edge,
  • How Machine Learning tools can be abused and the common mistakes that traders make with Machine Learning,
  • Strategy validation techniques that best suit market data and 1 popular technique that shouldn’t be used,
  • How to approach the vast libraries of algorithms available today,
  • Why delaying the trading process can lead to opportunity cost and how to know when a model is ready for trading.

A Guided Tour of Machine Learning for Traders – Dr. Tucker Balch

(Nguồn: https://blog.quantopian.com)

Which algorithms really matter for investing? In his presentation, Professor Balch helps declutter the Machine Learning jungle. He introduces a few of the most important ML algorithms and shows how they can be applied to the challenges of trading.

Talk Overview 

  • Machine Learning: Big Picture
  • Decision Trees: Classification
  • Decision Trees: Regression
  • Decision Trees Example: Sentiment-based strategy
  • kNN: Classification
  • kNN: Regression • Reinforcement Learning

Slide: link


Market Timing, Big Data, and Machine Learning – Dr. Xiao Qiao

(Nguồn: https://blog.quantopian.com)

Return predictability has been a controversial topic in finance for a long time. We show there is substantial predictive power in combining forecasting variables. We apply correlation screening to combine twenty variables that have been proposed in the return predictability literature, and demonstrate forecasting power at a six-month horizon. We illustrate the economic significance of return predictability through a simulation which takes positions in SPY proportional to the model forecast.

The simulated strategy yields annual returns more than twice that of the buy-and-hold strategy, with a Sharpe ratio four times as large. This application of big data ideas to return predictability serves to shift the sentiment associated with market timing.

Slide: link

———–&&&———–