Phần mềm R

“Phần mềm (tự do nguồn mở) chuẩn mực trong phân tích thống kê & khoa học dữ liệu”

R là phần mềm (cũng gọi là ngôn ngữ lập trình R) để phân tích dữ liệu được xây dựng bởi Ross Ihaka và Robert Gentleman tại  The University of Auckland, New Zealand, tiếp tục được phát triển bởi nhóm R Development Core Team. Phần lớn các kỹ thuật phân tích trong kinh doanh đều được R hỗ trợ – từ Thống kê đến Học máy hay các kỹ thuật Tối ưu hóa. Bằng chứng cho sức mạnh của R đó là những giải thưởng và sự tán dương từ những tạp chí hay cộng đồng uy tín trên thế giới như New York Times, Forbes, Intelligent, Enterprise, InfoWorld và The Register; cũng như được tích hợp phát triển bởi các tập đoàn công nghệ hàng đầu như Microsoft ; GoogleIBMOracle ; Amazon-AWS.

R là một phần mềm hoàn toàn miễn phí. Tuy miễn phí, nhưng chức năng của R không thua kém các phần mềm thương mại. Tất cả những phương pháp, mô hình mà các phần mềm thương mại có thể làm được thì R cũng có thể làm được. R có lợi thế là khả năng phân tích biểu đồ tuyệt vời. Không một phần mềm nào có thể sánh với R về phần biểu đồ! Một lợi thế  khác là R gắn liền với giới học thuật, hầu hết những mô hình thống kê mới nhất đều được hỗ trợ bởi R. Trong các bài báo của tạp chí hàng đầu về các phần mềm thống kê – Journal of Statistical Software – hầu hết là về R.

Nói một cách vắn tắt, các lí do chính nên sử dụng R trong học thuật cũng như thực tiễn là: Miễn phí (và nguồn mở); Số 1 trong các phần mềm miễn phí; Cạnh tranh (thậm chí vượt trội) so với các phần mềm thương mại (*); Đã sử dụng nhiều trong thực tiễn (industry)(**); Chạy được trên nhiều hệ điều hành.

Nhưng R có cái bất lợi là dùng lệnh (giống như Matlab) chứ không dùng menu như Excel. Điều này có nghĩa là đối với người “lười biếng” thì sẽ thấy R bất tiện. Nhưng với người muốn nắm lấy những cơ chế căn bản của toán học, thì sẽ thích ngôn ngữ này ngay. [Thực ra, nếu phải làm việc nhiều thì người “lười biếng” cũng sẽ thấy việc không dùng menu lại là ưu điểm chứ không phải nhược điểm, vì dùng lệch thì sẽ được copy & paste]. Một nhược điểm khác là R có rất nhiều “tác giả”, số thư viện/package vào tháng 1/2017 đã hơn 10.000; vấn đề nảy sinh là làm thế nào để chọn thư viện phù hợp nhất (ngoài các thư viện mặc định/có sẵn). [Nhấn mạnh là chỉ với các thư viện mặc định, thì R đã là đủ khi giải quyết các mô hình “Sách giáo khoa”]. Các giải pháp có thể xem ở đây; tuy nhiên, theo tôi Google đã là gần đủ để cho giải pháp tối ưu nhất.

Hiện tại, RStudio (cũng nguồn mở) là một công cụ hỗ trợ (IDE) rất được ưa thích (đặc biệt trong giáo dục) khi làm việc với R. Công cụ RMarkdown của RStudio cho phép tạo đồng thời các loại tài liệu tĩnh và động, bao gồm: HTML, PDF, Word, … Công cụ Shiny của RStudio cho phép xây dựng các ứng dụng web (tương tác) từ R.

R được cấp phép theo GNU GPL.

TRANG CHỦ (download):

http://www.r-project.org/


Tài liệu (tiếng Việt):

  • Ứng dụng phần mềm R tại Việt Nam:
  1. Toán cao cấp
  2. Phân tích cổ phiếu
  3. Mô hình GARCH
  4. Lý thuyết Copula
  5. Lý thuyết Markowitz
  6. Mô hình Black-Scholes
  7. Định giá quyền chọn
  8. Mô hình Merton
  9. Rủi ro tín dụng (Credit Risk)
  10. Phân rã Oaxaca-Blinder
  11. Phân tích bao dữ liệu (DEA)
  12. Phân tích EFA, CFA và SEM với R
  13. Mô hình Học máy: Hồi quy Logistic, LDA, QDA, KNN
  • Tài liệu của GS. Nguyễn Văn Tuấn (Viện Nghiên cứu Y khoa Garvan & Đại học New South Wales, Úc):
  1. Phân tích số liệu và biểu đồ bằng R: link
  2. https://www.youtube.com/user/drnguyenvtuan/videos
  1. Kinh Tế Lượng Ứng Dụng Với R: link
  2. https://rpubs.com/chidungkt

R-How to learn:

(4 beginner)

(4 adv.)

Hội nghị (thường niên):

Khóa học (miễn phí):

Tạp chí (open access):

Podcast:

Blog:

Ghi chú: Phần mềm rất mạnh. Thích hợp cho giảng dạy, nghiên cứu khoa học & thực tiễn.


(*)

(**)

————-&&————