Nhà khoa học dữ liệu – Thế hệ quant mới

Nhà khoa học dữ liệu – Thế hệ quant mới

(Nguồn: vnquants.com)

Có rất nhiều lời đồn đoán về vai trò của các nhà khoa học dữ liệu trong việc phân tích dữ liệu lớn (big data) và định hình những hướng phân tích mới trên thị trường tài chính.

Những tổ chức đầu tư thuộc bên mua luôn tìm kiếm những phương pháp mới để phân tích dữ liệu nhằm hướng đến việc đạt được lợi nhuận mức alpha cao hơn (alpha là chênh lệch giữa tỷ suất sinh lợi có được và tỷ suất sinh lợi bình quân của thị trường), vì thế bạn đừng nên ngạc nhiên khi biết những chuyên viên quản lý tài sản trong những hedge funds (quỹ đầu cơ) là những nhà khoa học dữ liệu.

“Ngành khoa học dữ liệu còn rất trẻ, chỉ mới phát triển từ ba đến bốn năm trở lại đây và chủ yếu xoay quanh việc xử lý big data – dữ liệu lớn” – theo lời của John “Fawce” Fawcett, CEO của Quantopian – một cộng đồng mạng dành cho những chuyên gia phát triển thuật toán.

Ngân hàng Bank of New York Mellon (BNY Mellon) vừa công bố một báo cáo về ảnh hưởng mang tính biến đổi của khoa học dữ liệu lên trên mọi mảng của dịch vụ tài chính.

Theo báo cáo, big data sẽ dẫn đến những hướng phân tích mới trong mọi lĩnh vực của thị trường tài chính, bao gồm quản lý tài sản, nghiên cứu, phân tích, phân bổ tài sản, giao dịch và quản trị rủi ro.

“Đối với những tổ chức đầu tư bên mua, áp dụng phân tích và thống kê rồi sau đó là tự động hóa những phân tích đó thông qua máy học là một lĩnh vực đang được ứng dụng nhiều nhất vào các lĩnh vực khác” – Fawcett nhận xét – “Và vì thế, nhiều người đang học cách áp dụng khoa học dữ liệu vào mọi bước của quá trình đầu tư.”

Phân tích danh mục đầu tư và rủi ro luôn là những chủ đề mang tính định lượng, sự khác nhau ở đây đó là với cách tiếp cận, các quant phát triển những mô hình giải thích hành vi thị trường và sử dụng mô hình đó để dự báo tương lai. Tuy nhiên những chuyên gia dữ liệu lại khác, họ tập trung hơn vào “đào sâu” dữ liệu (data mining) và săn tìm những xu hướng đầu tư thú vị. “Điều nguy hiểm là “overfitting” của dữ liệu, nhất là khi bạn “đào” đủ sâu trong mớ dữ liệu và bạn nghĩ bạn vừa khám phá ra một quy luật gì đó có thể dự báo được” – Fawcett cảnh báo.

Sở dĩ khoa học dữ liệu lại quan trọng đến thế là vì sự phổ biến của giao dịch thuật toán (algorithmic trading) trên thị trường tài chính, và bản thân mọi giao dịch thuật toán và các luồng thông tin trên thị trường đều đã bão hòa với máy học (machine learning) và phân tích tự động (automated analysis), Fawcett cho biết. Giao dịch thuật toán dựa trên một số kỹ thuật tương tự nhau – ông lưu ý.

Nhà khoa học dữ liệu là ai?

Theo Wikipedia, nhà khoa học dữ liệu giải quyết những vấn đề phức tạp liên quan đến dữ liệu với chuyên môn sâu trong một số ngành. Nói một cách tổng quát, họ làm việc với các chuyên ngành như toán, thống kê và khoa học máy tính, dù họ không cần hiểu biết hết tất cả ba chuyên ngành đó, thực tế họ thường chỉ là chuyên gia trong hai và có thể sử dụng hiệu quả kiến thức và kỹ năng của cái còn lại. Dường như không có nhà khoa học dữ liệu còn sống nào mà thông suốt cả ba chuyên ngành đó cả – nếu có thì cực kỳ hiếm. Chính vì thế các nhà khoa học dữ liệu thường phải hoạt động theo nhóm, trong đó các thành viên có thể tận dụng kiến thức và chuyên môn của nhau để giải quyết công việc.

Thực tế cho thấy có sự thiếu hụt chuyên gia với kinh nghiệm thực tế cần thiết, thường đa số những nhân sự có kinh nghiệm trong việc xử lý dữ liệu cũng là dân quant hoặc là những nhân viên đang làm cho các công ty Internet như Google hay Facebook.

Khi mà những nhân tài xuất hiện (trong lĩnh vực này) càng nhiều hơn, thì những trader đầy khao khát sẽ là những người có xuất thân từ ngành kỹ thuật, toán và những ngành khoa học cơ bản khác, cũng như là thống kê và sinh học, bởi vì những ngành này chú trọng đào tạo kỹ năng định lượng. Nghiên cứu hoạt động của là một lĩnh vực hàn lâm phổ biến khác đào tạo ra nhân lực cho lĩnh vực này, cha đẻ của Quantopian cho biết.

Những trang web giống như Quantopian cũng giúp những nhà nghiên cứu quant thiết kế thuật toán riêng cho mình. Quantopian cũng đang phát triển nhiều công cụ xây dựng thuật toán trên website cũng như những công cụ kiểm tra (backtesting), đồng thời, trang web cũng đẩy mạnh phát triển mảng giao dịch thời gian thực.

Trong tháng vừa qua, Quantopian ra mắt Fetcher – một công cụ kiểm tra, cho phép kiểm tra mức độ hiệu quả của một thuật toán dựa trên dữ liệu quá khứ và thậm chí trên thời gian thực, Fawcett giải thích. Các trader có thể tải dữ liệu từ Quandl, một trang web cung cấp bốn triệu gói dữ liệu và tích hợp với Fetcher dưới dạng các tập tin CSV (common separate values) – dạng dữ liệu thường thấy nhất của các chuỗi dữ liệu thời gian.

Một trong những điều mà Quantopian đang cải thiện đó là thu ngắn khoảng cách giữa những chuyên gia quant thuần túy và những chuyên gia thiết kế phần mềm quant. Thông thường một nhà nghiên cứu quant thuần túy sẽ gửi công trình của mình cho chuyên gia viết phần mềm quant để “dịch” chiến lược quant sang các ngôn ngữ lập trình như C, Java hay Python. Điều này có thể khá nguy hiểm vì nó phát sinh vấn đề mà Fawcett gọi là “lỗi viết lại” – những lỗi có thể phát sinh trong quá trình viết phần mềm, tạo ra sự khác nhau không đáng có giữa ý tưởng đầu tư ban đầu và phần mềm triển khai ý tưởng đó. “Điều chúng tôi có gắng làm là loại bỏ hoàn toàn những lỗi viết lại. “Những ý tưởng bạn viết để hậu kiểm hoặc giả lập đều được chúng tôi chạy trực tiếp khi bạn giao dịch thời gian thực” – Fawcett nói.

Nếu ngành khoa học dữ liệu trở nên lớn mạnh hơn, nó có thể đưa ra phương pháp phân tích hàng loạt dòng dữ liệu cực lớn cũng như những chiến lược đầu tư mới, và những nhà khoa học dữ liệu sẽ một ngày nào đó thay thế những nhà khoa học tên lửa (từ lóng chi các chuyên gia quant) ở Wall Street.

 

Nguồn: Wall Street & Technology
Tác giả: Ivy Schmerken

——————-&&——————-

Trả lời

Mời bạn điền thông tin vào ô dưới đây hoặc kích vào một biểu tượng để đăng nhập:

WordPress.com Logo

Bạn đang bình luận bằng tài khoản WordPress.com Log Out / Thay đổi )

Twitter picture

Bạn đang bình luận bằng tài khoản Twitter Log Out / Thay đổi )

Facebook photo

Bạn đang bình luận bằng tài khoản Facebook Log Out / Thay đổi )

Google+ photo

Bạn đang bình luận bằng tài khoản Google+ Log Out / Thay đổi )

Connecting to %s

%d bloggers like this: