Phần mềm R

“Phần mềm (tự do nguồn mở) chuẩn mực trong phân tích thống kê & khoa học dữ liệu”

R là phần mềm (cũng gọi là ngôn ngữ lập trình R) để phân tích dữ liệu được xây dựng bởi Ross Ihaka và Robert Gentleman tại  The University of Auckland, New Zealand, tiếp tục được phát triển bởi nhóm R Development Core Team. Phần lớn các kỹ thuật phân tích trong kinh doanh đều được R hỗ trợ – từ Thống kê đến Học máy hay các kỹ thuật Tối ưu hóa. Bằng chứng cho sức mạnh của R đó là những giải thưởng và sự tán dương từ những tạp chí hay cộng đồng uy tín trên thế giới như New York Times, Forbes, Intelligent, Enterprise, InfoWorld và The Register; cũng như được tích hợp phát triển bởi các tập đoàn công nghệ hàng đầu như Microsoft ; GoogleIBMOracle ; Amazon-AWS.

R là một phần mềm hoàn toàn miễn phí. Tuy miễn phí, nhưng chức năng của R không thua kém các phần mềm thương mại. Tất cả những phương pháp, mô hình mà các phần mềm thương mại có thể làm được thì R cũng có thể làm được. R có lợi thế là khả năng phân tích biểu đồ tuyệt vời. Không một phần mềm nào có thể sánh với R về phần biểu đồ! Một lợi thế  khác là R gắn liền với giới học thuật, hầu hết những mô hình thống kê mới nhất đều được hỗ trợ bởi R. Trong các bài báo của tạp chí số 1 về các phần mềm thống kê – Journal of Statistical Software – hầu hết là về R.

Nói một cách vắn tắt, các lí do chính nên sử dụng R trong học thuật cũng như thực tiễn là: Miễn phí (và nguồn mở); Số 1 trong các phần mềm miễn phí; Cạnh tranh (thậm chí vượt trội) so với các phần mềm thương mại (*); Đã sử dụng nhiều trong thực tiễn (industry); Chạy được trên nhiều hệ điều hành.

Nhưng R có cái bất lợi là dùng lệnh (giống như Matlab) chứ không dùng menu như EViews. Điều này có nghĩa là đối với người “lười biếng” thì sẽ thấy R bất tiện. Nhưng với người muốn nắm lấy những cơ chế căn bản của toán học, thì sẽ thích ngôn ngữ này ngay.  Đối với những người thích vi tính và toán, R là phần mềm lí tưởng. [Thực ra, nếu phải làm việc nhiều thì người “lười biếng” cũng sẽ thấy việc không dùng menu lại là ưu điểm chứ không phải nhược điểm, vì dùng lệch thì sẽ được copy & paste]. Một nhược điểm khác là R có rất nhiều “tác giả”, số thư viện/package vào tháng 1/2017 đã hơn 10.000; vấn đề nảy sinh là làm thế nào để chọn thư viện phù hợp nhất (ngoài các thư viện mặc định/có sẵn – nhấn mạnh là chỉ với các thư viện mặc định, thì R đã là đủ khi giải quyết các mô hình “Sách giáo khoa”). Các giải pháp có thể xem ở đây; tuy nhiên, theo tôi Google đã là gần đủ để cho giải pháp tối ưu nhất.

Hiện tại, RStudio (cũng nguồn mở) là một công cụ hỗ trợ (IDE) rất được ưa thích (đặc biệt trong giáo dục) khi làm việc với R. Công cụ RMarkdown của RStudio cho phép tạo đồng thời các loại tài liệu tĩnh và động, bao gồm: HTML, PDF, Word, … Công cụ Shiny của RStudio cho phép xây dựng các ứng dụng web (tương tác) từ R.

R được cấp phép theo GNU GPL.

Link (download): http://www.r-project.org/

Tài liệu (tiếng Việt):

[1] Hướng dẫn sử dụng phần mềm R:

  1. Toán cao cấp
  2. Phân tích cổ phiếu
  3. Lý thuyết Copula
  4. Lý thuyết Markowitz
  5. Mô hình Black-Scholes
  6. Mô hình Merton
  7. Rủi ro tín dụng (Credit Risk)

[2] Tài liệu của GS. Nguyễn Văn Tuấn (Viện Nghiên cứu Y khoa Garvan & Đại học New South Wales, Úc):

  1. Phân tích số liệu và biểu đồ bằng R: link
  2. https://www.youtube.com/user/drnguyenvtuan/videos

[3] Tài liệu của Nguyễn Chí Dũng:

  1. Kinh Tế Lượng Ứng Dụng Với R: link
  2. https://rpubs.com/chidungkt

[4] Ngôn ngữ lập trình R (Đỗ Thanh Nghị): link

[5] Thống Kê Công Nghiệp Hiện Đại với ứng dụng viết trên R, MINITAB và JMP: link

Hội nghị (thường niên):

Khóa học (miễn phí):

Podcast:

Ghi chú: Phần mềm rất mạnh. Thích hợp cho giảng dạy, nghiên cứu khoa học & thực tiễn.

(*) https://tuanvanle.wordpress.com/2014/08/21/bang-so-sanh-kha-nang-trong-thong-ke-cua-cac-phan-mem-r-matlab-sas-stata-spss/

————-&&————

6 phản hồi

  1. Chú ơi cho cháu hỏi chú có bài giảng nào về meta-analysis (random effect model) không giới thiệu cho cháu với ạ? Cháu mới mò mẫm học về systematic review và dùng random effect model trong estimate the prevalence. Cháu đã install metafor package trong R nhưng ko biết cách sử dụng. Cháu cảm ơn chú!

  2. Chào thầy. Em đang nghiên cứu mô hình Markov Switching VAR bằng phần mềm R. Em đã nhập số liệu và định dạng timeseries và cũng đã chạy mô hình xong nhưng trong kết quả em không tìm thấy các giá trị p-value hoạc các t-statistic của các hệ số. Mong nhận được hỗ trợ từ thầy. Em cám ơn thầy rất nhiều.

  3. thầy ơi, thầy có thể cho em biết làm thế nào để đọc các file RDA sau khi lưu dữ liệu không ạ? em tìm hoài mà không thấy

  4. Tôi Google cái thấy ngay mà.
    ##Tạo file
    x <- 1:5
    save(x, file="x.Rda")
    ##Đọc file
    new_x2 <- load("x.Rda")
    new_x2
    [1] "x"
    x
    [1] 1 2 3 4 5

Trả lời

Mời bạn điền thông tin vào ô dưới đây hoặc kích vào một biểu tượng để đăng nhập:

WordPress.com Logo

Bạn đang bình luận bằng tài khoản WordPress.com Đăng xuất / Thay đổi )

Twitter picture

Bạn đang bình luận bằng tài khoản Twitter Đăng xuất / Thay đổi )

Facebook photo

Bạn đang bình luận bằng tài khoản Facebook Đăng xuất / Thay đổi )

Google+ photo

Bạn đang bình luận bằng tài khoản Google+ Đăng xuất / Thay đổi )

Connecting to %s

%d bloggers like this: