R/Finance 2017: Applied Finance with R – May 19-20, 2017

R/Finance 2017: Applied Finance with R – May 19-20, 2017

Friday, May 19th, 2017
08:00 – 09:00 Optional Pre-Conference Tutorials
Ross Bennett: PortfolioAnalytics Tutorial
Dirk Eddelbuettel: Rcpp: From Simple Examples to Machine learning (pdf)
R. Douglas Martin: Fundamental Factor Models in FactorAnalytics
M. Weylandt + T. Harte: Advanced Bayesian Time Series Analysis using Stan
09:00 – 09:30 Registration (2nd floor Inner Circle) & Continental Breakfast (3rd floor by Sponsor Tables)
Transition between seminars
09:30 – 09:35 Kickoff (video)
09:35 – 09:40 Sponsor Introduction
09:40 – 10:10 Marcelo Perlin: GetHFData: An R package for downloading and aggregating high frequency trading data from Bovespa (pdf) (video)
Jeffrey Mazar: The obmodeling Package (html)
Yuting Tan: Return Volatility, Market Microstructure Noise, and Institutional Investors: Evidence from High Frequency Market (pdf)
Stephen Rush: Adverse Selection and Broker Execution (pdf)
Jerzy Pawlowski: How Can Machines Learn to Trade? (html)
10:10 – 10:30 Michael Hirsch: Revealing High-Frequency Trading Provisions of Liquidity with Visualization in R (html) (video)
10:30 – 10:50 Eric Glass: Equity Factor Portfolio Case Study (html) (video)
10:50 – 11:10 Break
11:10 – 11:30 Seoyoung Kim: Zero-Revelation RegTech: Detecting Risk through Linguistic Analysis of Corporate Emails and News (pdf) (video)
11:30 – 12:10 Szilard Pafka: No-Bullshit Data Science (pdf) (video)
12:10 – 13:30 Lunch
13:30 – 14:00 Francesco Bianchi: Measuring Risk with Continuous Time Generalized Autoregressive Conditional Heteroscedasticity Models (pdf) (video)
Eina Ooka: Bunched Random Forest in Monte Carlo Risk Simulation (pdf)
Matteo Crimella: Operational Risk Stress Testing: An Empirical Comparison of Machine Learning Algorithms and Time Series Forecasting Methods (pdf)
Thomas Zakrzewski: Using R for Regulatory Stress Testing Modeling (pdf)
Andy Tang: How much structure is best? (pptx)
14:00 – 14:20 Robert McDonald: Ratings and Asset Allocation: An Experimental Analysis (pdf)
14:20 – 14:50 Break
14:50 – 15:10 Dries Cornilly: Nearest Comoment Estimation with Unobserved Factors and Linear Shrinkage (pdf) (video)
15:10 – 15:30 Bernhard Pfaff: R package: mcrp: Multiple criteria risk contribution optimization (pdf) (video)
15:30 – 16:00 Oliver Haynold: Practical Options Modeling with the sn Package, Fat Tails, and How to Avoid the Ultraviolet Catastrophe (pdf) (video)
Shuang Zhou: A Nonparametric Estimate of the Risk-Neutral Density and Its Applications (pdf)
Luis Damiano: A Quick Intro to Hidden Markov Models Applied to Stock Volatility
Oleg Bondarenko: Rearrangement Algorithm and Maximum Entropy (pdf)
Xin Chen: Risk and Performance Estimator Standard Errors for Serially Correlated Returns (pdf)
16:00 – 16:20 Qiang Kou: Text analysis using Apache MxNet (pdf) (video)
16:20 – 16:40 Robert Krzyzanowski: Syberia: A development framework for R (pdf) (video)
16:40 – 16:52 Matt Dancho: New Tools for Performing Financial Analysis Within the ‘Tidy’ Ecosystem (pptx) (video)
Leonardo Silvestri: ztsdb, a time-series DBMS for R users (pdf)
16:52 – 17:00 Information about reception and dinner
17:00 – 18:30 Conference Reception
18:30 – 19:00 (Optional) Transfer to Conference Dinner
19:00 – (Optional) Conference Dinner (Rooftop, Wyndham Hotel)
Saturday, May 20th, 2017
08:00 – 09:00 Coffee/ Breakfast
09:00 – 09:05 Kickoff
09:05 – 09:35 Stephen Bronder: Integrating Forecasting and Machine Learning in the mlr Framework (pdf) (video)
Leopoldo Catania: Generalized Autoregressive Score Models in R: The GAS Package (pdf)
Guanhao Feng: Regularizing Bayesian Predictive Regressions (pdf)
Jonas Rende: partialCI: An R package for the analysis of partially cointegrated time series (pdf)
Carson Sievert: Interactive visualization for multiple time series (pdf)
09:35 – 09:55 Emanuele Guidotti: yuimaGUI: A graphical user interface for the yuima package (pptx) (video)
09:55 – 10:15 Daniel Kowal: A Bayesian Multivariate Functional Dynamic Linear Model (pdf) (video)
10:15 – 10:45 Break
10:45 – 11:05 Jason Foster: Scenario Analysis of Risk Parity using RcppParallel (pdf) (video)
11:05 – 11:35 Michael Weylandt: Convex Optimization for High-Dimensional Portfolio Construction (pdf) (video)
Lukas Elmiger: Risk Parity Under Parameter Uncertainty (pdf)
Ilya Kipnis: Global Adaptive Asset Allocation, and the Possible End of Momentum (pptx)
Vyacheslav Arbuzov: Dividend strategy: towards the efficient market (pdf)
Nabil Bouamara: The Alpha and Beta of Equity Hedge UCITS Funds – Implications for Momentum Investing (pdf)
11:35 – 12:15 Dave DeMers: Risk Fast and Slow (pdf) (video)
12:15 – 13:35 Lunch
13:35 – 13:55 Matthew Dixon: MLEMVD: A R Package for Maximum Likelihood Estimation of Multivariate Diffusion Models (pdf) (video)
13:55 – 14:15 Jonathan Regenstein: Reproducible Finance with R: A Global ETF Map (html) (video)
14:15 – 14:35 David Ardia: Markov-Switching GARCH Models in R: The MSGARCH Package (pdf) (video)
14:35 – 14:55 Keven Bluteau: Forecasting Performance of Markov-Switching GARCH Models: A Large-Scale Empirical Study (pdf) (video)
14:55 – 15:07 Riccardo Porreca: Efficient, Consistent and Flexible Credit Default Simulation (pdf) (video)
Maisa Aniceto: Machine Learning and the Analysis of Consumer Lending (pdf)
15:07 – 15:27 David Smith: Detecting Fraud at 1 Million Transactions per Second (pdf) (video)
15:27 – 15:50 Break
15:50 – 16:10 Thomas Harte: The PE package: Modeling private equity in the 21st century (pdf) (video)
16:10 – 16:30 Guanhao Feng: The Market for English Premier League (EPL) Odds (pdf) (video)
16:30 – 16:50 Bryan Lewis: Project and conquer (html) (video)
16:50 – 17:00 Prizes and Feedback
17:00 – 17:05 Conclusion
17:05 – 17:15 Transition to Jak’s
17:15 – 21:15 Post-conference Drinks at Jak’s Tap


R in Financial Services: Challenges and Opportunities [NYR-2017]

R in Financial Services: Challenges and Opportunities [NYR-2017]

(Nguồn: http://blog.revolutionanalytics.com)

At the New York R Conference earlier this year, Lixun Zhang gave a presentation on the challenges and opportunites financial services companies encounter when using R. In the talk, he shares some lessons learned while working with an couple of international banks that have been using SAS, but are transitioning workloads to R. The talk also includes an example of operationalizing R code for production using Microsoft R Server.

You can see his presentation linked below, and the slides are available here (PDF).

You can find many more interesting presentations from the 2017 New York R Conference archived at the link below.

New York R Conference: 2017 Videos


Khóa học: Giới Thiệu Về Khoa Học Dữ Liệu. VIASM. 15-17/05/2017

Khóa học: Giới Thiệu Về Khoa Học Dữ Liệu. VIASM. 15-17/05/2017

(Nguồn: http://viasm.edu.vn)

Link các slides bài giảng: http://www.jaist.ac.jp/~bao/DS2017/

Thời gian: 09:00:15/05/2017 đến 11:30:17/05/2017

Địa điểm: VIASM

Tóm tắt:

Các bài giảng này cung cấp một bức tranh tổng thể, các khái niệm cơ bản, ý tưởng các phương pháp, những tiến bộ quan trọng của Khoa học Dữ liệu (KHDL), lĩnh vực thời sự hiện nay của khoa học và công nghệ số, là nền tảng của Cách mạng Công nghiệp 4.0.Các bài giảng này hướng đến giáo viên đại học và sinh viên, những người làm R&D ở các viện, các doanh nghiệp, các cán bộ quản lý KH&CN, và những người muốn tìm hiểu về Khoa học Dữ liệu. Các bài giảng này chia làm hai phần.

Phần 1 (Cơ bản về Khoa học Dữ liệu) cung cấp bức tranh tổng thể, khái niệm và vấn đề của KHDL, thích hợp cho người cần biết chung, quản lý và dùng KHDL.

Phần 2 (Nguyên lý và Phương pháp của Khoa học Dữ liệu) cung cấp ý tưởng cơ bản của các phương pháp của KHDL và chia sẻ kinh nghiệm. Phần này thích hợp cho người làm nghiên cứu, ứng dụng và phát triển KHDL.

Chương trình Hà Nội

Ngày 15.5: Cơ bản về Khoa học Dữ liệu

Sáng 9:00 – 11:30 Tổng quan về Khoa học dữ liệu 

– Bài giảng 1.1: Cách mạng Công nghiệp 4.0 và Khoa học Dữ liệu

Diễn giả: GS Hồ Tú Bảo (90 phút)

  • Bản chất của cách mạng công nghiệp 4.0
  • Khoa học dữ liệu và cách mạng công nghiệp 4.0
  • Nguyên lý của khoa học dữ liệu

– Bài giảng 1.2: Nền tảng Công nghệ của Khoa học Dữ liệu

Diễn giả: GS Phùng Quốc Định (60 phút)

  • Khoa học phân tích dữ liệu lớn
  • Xử lý dàn trải, phân tán và song song
  • Công nghệ Hadoop, Spark và TensorFlow cho dữ liệu lớn và mô hình nhiều tầng (deep learning).

Chiều 1:30 – 4:00Ứng dụng Khoa học Dữ liệu – Toạ đàm

– Bài giảng 1.3: Khoa học Dữ liệu và Y tế điện tử (e-health)

Diễn giả: GS Hồ Tú Bảo (40 phút)

  • Bệnh án điện tử (BADT) và e-health
  • Vấn đề của khoa học dữ liệu trong y tế điện tử (e-health)

– Bài giảng 1.4: Khoa học Dữ liệu trong Công nghiệp

Diễn giả: TS Bùi Hải Hưng (50 phút)

  • Bài toán và bài học về khoa học dữ liệutrong công nghiệp



Ngày 16.5: Nguyên lý và Phương pháp của Khoa học Dữ liệu  

Sáng 9:00 – 11:30Nguyên lý vàmô hình thống kê

– Bài giảng 2.1: Mô hình suy diễn Bayes và tần suất

Diễn giả: GS Nguyễn Xuân Long (150 phút)

  • Phương pháp Bayes và tần suất trong suy diến thống kê
  • Kết quả mới, thách thức và triển vọng

Chiều 1:30 – 4:00 Mô hình tư vấn và học nhiều tầng

– Bài giảng 2.2: Mô hình tư vắn ra quyết định

Diễn giả: TS Bùi Hải Hưng(60 phút)

  • Hệ tư vấn ra quyết định (recommender systems)
  • Bài học trong ứng dụng

– Bài giảng 2.3Các phương pháp học nhiều tầng

Diễn giả: GS Phùng Quốc Định (90 phút)

  • Các mô hình học nhiều tầng (deep learning)
  • Kinh nghiệm, bài học, hạn chế và xu hướng


Ngày 17.5: Nguyên lý và phương pháp của Khoa học Dữ liệu 

Sáng 9 – 11:30 Giải pháp khi dữ liệu có kích thước lớn

– Bài giảng 3.1: Phương pháp và Công nghệ của Dữ liệu lớn

Diễn giả: GS Phùng Quốc Định & TS  Bùi Hải Hưng (90 phút)

  • Thách thức khi xử lý dữ liệu với kích thước và độ phức tạp cực lớn
  • Các phương pháp tiếp cận



Hạn đăng ký tham dự và gửi CV: 8/5/2017

Đăng kí: link

Chương trình Hồ Chí Minh


Hội thảo: Một số phương pháp phân tích thống kê hiện đại và các ứng dụng. Viện Toán học. 11-13/5/2017

Hội thảo: Một số phương pháp phân tích thống kê hiện đại và các ứng dụng. Viện Toán học. 11-13/5/2017

(Nguồn: http://math.ac.vn)

Viện Toán học – Viện HLKHCNVN kết hợp với Trường Đại học Sư phạm Hà Nội và Học viện Nông nghiệp Việt Nam tổ chức Hội thảo khoa học “Một số phương pháp phân tích thống kê hiện đại và các ứng dụng” tại Hà Nội từ ngày 11 đến 13/5/2017.

HoiThaoTKeUngDung20170511_.jpg (716×1024)
Chủ đề của Hội thảo là các phương pháp phân tích thống kê hiện đại được sử dụng như công cụ nghiên cứu của nhiều ngành khoa học khác ngoài Toán. Bên cạnh một số báo cáo về các kết quả mới liên quan đến Thống kê ứng dụng, nội dung chủ đạo của Hội thảo sẽ bao gồm các phương pháp phân tích thống kê để giúp giải quyết các bài toán nghiên cứu do chính các thành viên tham gia Hội thảo đề xuất.
Do vậy, Ban tổ chức Hội thảo khuyến khích các cán bộ nghiên cứu của các đơn vị (nhất là các đơn vị chuyên môn ngoài Toán như Môi trường; Sinh học; Y học; Dược; Nông nghiệp; Lâm nghiệp; Kinh tế; Xã hội học; Khoa học Giáo dục, …) đăng ký tham gia Hội thảo cung cấp trước thông tin về các vấn đề nghiên cứu đơn vị mình đang tiến hành, nhưng còn vướng mắc về phương pháp phân tích thống kê, để các chuyên gia thống kê sẽ tổ chức tư vấn ngay tại Hội thảo. Nên cung cấp thông tin về các vấn đề nghiên cứu như vậy cùng với bộ dữ liệu liên quan, có thể chỉ cung cấp một phần nhỏ chứ không phải toàn bộ dữ liệu, để các chuyên gia của Hội thảo hiểu được cấu trúc của dữ liệu, nhằm đề xuất được phương pháp phân tích thống kê thích hợp.

Ban tổ chức: Hồ Đăng Phúc (Phòng XSTK – Viện Toán học), Ngô Hoàng Long (Khoa Toán – ĐHSP Hà Nội), Nguyễn Văn Hạnh (Khoa CN Thông tin – Học viện Nông nghiệp), Phạm Quang Khoái (ĐH Lâm nghiệp), Bùi Quảng Nam (Học viện PKKQ), Cấn Văn Hảo, Trần Văn Thành (Viện Toán học, Thư ký).
Thông tin cập nhật về Hội thảo có thể tham khảo trên trang web của Viện Toán học.
Kinh phí tham dự hội thảo:

  • Phí tham dự: 200.000 đồng;
  • Các đại biểu có báo cáo tại Hội thảo được miễn phí tham dự;
  • Các đại biểu có cung cấp cho Ban tổ chức Hội thảo các vấn đề nghiên cứu cùng dữ liệu kèm theo cũng được miễn phí tham dự.

Địa chỉ liên hệ: Để biết thêm thông tin chi tiết về hội nghị xin liên hệ với
Trần Văn Thành
Viện Toán học, Viện HLKHCN Việt Nam
18 Hoàng Quốc Việt, Q. Cầu Giấy, Hà Nội
E-mail: tvthanh@math.ac.vn

Hồ Đăng Phúc
Viện Toán học, Viện HLKHCN Việt Nam
18 Hoàng Quốc Việt, Q. Cầu Giấy, Hà Nội
E-mail: hdphuc@math.ac.vn

hoặc các thành viên khác trong Ban tổ chức.
Mẫu đăng ký tham dự download tại đây


Bài giảng: How to learn a dictionary. VIASM. 04/01/2017. Vũ Hà Văn

Bài giảng: How to learn a dictionary. VIASM. 04/01/2017. Vũ Hà Văn

(Nguồn: http://viasm.edu.vn)

Thời gian: 08:30 đến 11:30 Ngày 04/01/2017

Địa điểm: C2-714

Báo cáo viên: Vũ Hà Văn

Tóm tắt:

Imagine an orchestra with hundred of instruments, but we managed to record only a few random moments.

At each of these random moments, only a small part of the instruments are playing with different intensities (we do not know which instruments and what intensity.) Can one detect all the instruments in the orchestra from the broken record ?

This is a toy description of a new and fundamental problem in machine learning theory. One needs to learn a dictionary (a collection of signals), having only a record of the mixture of only few signals at random sample points.

The question is: when and how could one reconstruct the dictionary ? Mathematically, it reduces to a problem of solving the linear equation XY= B, where X,Y, B are matrices, and we know only B.

Impossible as it sounds, the problem is actually solvable, under a mild and natural assumption.

(Based on work of Spielman, Wang, Wright 2012 and Luh and Vu 2015)

8h30-9h00: Registration
9h00-10h00: Lecture
10h00-10h30: Coffee break
10h30-11h30: Lecture

Tài chính định lượng (Viện JVN – Workshop & Talk)

Tài chính định lượng (Viện JVN – Workshop & Talk)

JVN-logo-trans-02-300x267.png (300×267)

Tiêu đề Năm Link
Tương lai của TTCK VN – Sản phẩm phái sinh 2013 ngay1S; ngay1C; ngay2S; ngay2C; ngay3S
Ứng dụng toán trong QTRR tài chính 2014 ngay1; ngay2
Tài chính tính toán định lượng: Nhu cầu thực tiễn 2016 1ngay


Bài giảng đại chúng: Mật mã học hiện đại – Adi Shamir

Bài giảng đại chúng: Mật mã học hiện đại – Adi Shamir

(Nguồn: http://viasm.edu.vn)

Adi Shamir – ‘S’ trong hệ mã hoá khoá công khai RSA – là người khởi đầu cho nhiều hướng nghiên cứu của mật mã hiện đại.


– Phần 1: Cryptography: State of the Science

Abstract: This month we are celebrating the 40-th anniversary of the paper “New Directions in Cryptography” which was published by Diffie and Hellman in November 1976. This paper was a turning point in the history of cryptography, and established it for the first time as an academic research area. In this talk I’ll survey the main developments of the last 40 years, describe the current state of the field, and try to make some predictions about new cryptographic and cryptanalytic developments.
A more technical talk about my latest research can be an expanded version of my Crypto 2016 talk given three months ago.

– Phần 2: Memory-Efficient Algorithms for Finding Needles in Haystacks

(Joint work with Itai Dinur, Orr Dunkelman and Nathan Keller.)

Abstract: One of the most common tasks in cryptography and cryptanalysis is to find some interesting event (a needle) in an exponentially large collection (haystack) of N=2^n possible events, or to demonstrate that no such event is likely to exist. In particular, we are interested in finding needles which are defined as events that happen with an unusually high probability of p ≫ 1/N in a haystack which is an almost uniform distribution on N possible events. When the search algorithm can only sample values from this distribution, the best known time/memory tradeoff for finding such an event requires O(1/Mp^2) time given O(M) memory.

In this talk I will describe much faster needle searching algorithms in the common cryptographic setting in which the distribution is defined by applying some deterministic function f to random inputs.

Such a distribution can be modeled by a random directed graph with N vertices in which almost all the vertices have O(1) predecessors while the vertex we are looking for has an unusually large number of O(pN) predecessors. When we are given only a constant amount of memory, we propose a new search methodology which we call NestedRho. As p increases, such random graphs undergo several subtle phase transitions, and thus the log-log dependence of the time complexity T on p becomes a piecewise linear curve which bends four times. Our new algorithm is faster than the O(1/p^2) time complexity of the best previous algorithm in the full range of 1/N < p < 1 , and in particular it improves the previous time complexity by a significant factor of \sqrt{N} for any p in the range N^(−0.75) < p < N^(−0.5).
When we are given more memory, we show how to combine the NestedRho technique with the parallel collision search technique in order to further reduce its time complexity. Finally, we show how to apply our new search technique to more complicated distributions with multiple peaks when we want to find all the peaks whose probabilities are higher than p.

Cryptography: State of the Science

Delivered by ACM A.M. Turing Laureate Adi Shamir (2002)