Phần mềm R

“Phần mềm (tự do nguồn mở) chuẩn mực trong thống kê và phân tích dữ liệu”

R là phần mềm (cũng gọi là ngôn ngữ lập trình R) để phân tích dữ liệu được xây dựng bởi Ross Ihaka và Robert Gentleman tại  The University of Auckland, New Zealand, tiếp tục được phát triển bởi nhóm R Development Core Team. Phần lớn các kỹ thuật phân tích trong kinh doanh đều được R hỗ trợ – từ Thống kê đến Học máy hay các kỹ thuật Tối ưu hóa. Bằng chứng cho sức mạnh của R đó là những giải thưởng và sự tán dương từ những tạp chí hay cộng đồng uy tín trên thế giới như New York Times, Forbes, Intelligent, Enterprise, InfoWorld và The Register.

R là một phần mềm hoàn toàn miễn phí. Tuy miễn phí, nhưng chức năng của R không thua kém các phần mềm thương mại. Tất cả nhưng phương pháp, mô hình mà các phần mềm thương mại có thể làm được thì R cũng có thể làm được. R có lợi thế là khả năng phân tích biểu đồ tuyệt vời. Không một phần mềm nào có thể sánh với R về phần biểu đồ! Một lợi thế  khác là R gắn liền với giới học thuật, hầu hết những mô hình thống kê mới nhất đều được hỗ trợ bởi R. Trong các bài báo của tạp chí số 1 về các phần mềm thống kê – Journal of Statistical Software – hầu hết là về R.

Nói một cách vắn tắt, các lí do chính nên sử dụng R trong học thuật cũng như thực tiễn là: Miễn phí (và nguồn mở); Số 1 trong các phần mềm miễn phí; Cạnh tranh (thậm chí vượt trội) so với các phần mềm thương mại (*); Đã sử dụng nhiều trong thực tiễn (industry); Chạy được trên nhiều hệ điều hành.

Nhưng R có cái bất lợi là dùng lệnh (giống như  SAS/Stata) chứ không dùng “button” như  SPSS/Stata.  Điều này có nghĩa là đối với người “lười biếng” thì sẽ thấy R bất tiện.  Nhưng với người muốn nắm lấy những cơ chế căn bản của toán học, thì sẽ thích ngôn ngữ này ngay.  Đối với những người thích vi tính và toán, R là phần mềm lí tưởng. Một nhược điểm khác là R có rất nhiều “tác giả”, số thư viện/package vào tháng 1/2017 đã hơn 10.000; vấn đề nảy sinh là làm thế nào để chọn thư viện phù hợp nhất (ngoài các thư viện mặc định – nhấn mạnh là chỉ với các thư viện mặc định, thì R đã là đủ khi giải quyết các mô hình “Sách giáo khoa”). Các giải pháp có thể xem ở đây; tuy nhiên, theo tôi Google đã là gần đủ để cho giải pháp tối ưu nhất.

Hiện tại,  RStudio (cũng nguồn mở) là một công cụ hỗ trợ (IDE) rất được ưa thích (đặc biệt trong giáo dục) khi làm việc với R. Công cụ R Markdown của RStudio cho phép tạo đồng thời các loại tài liệu tĩnh và động, bao gồm: HTML, PDF, Word, …

R được cấp phép theo GNU GPL.

Link (download): http://www.r-project.org/

Tài liệu (tiếng Việt):

[1] Hướng dẫn sử dụng phần mềm R

  1. Toán cao cấp
  2. Phân tích cổ phiếu
  3. Lý thuyết Copula
  4. Lý thuyết Markowitz
  5. Mô hình Black-Scholes
  6. Mô hình Merton
  7. Rủi ro tín dụng (Credit Risk)

[2] Kinh Tế Lượng Ứng Dụng Với R (Nguyễn Chí Dũng):

https://tuanvanle.wordpress.com/2016/04/20/kinh-te-luong-ung-dung-voi-r/

[3] Tài liệu của GS. Nguyễn Văn Tuấn (Viện Nghiên cứu Y khoa Garvan & Đại học New South Wales, Úc):

  1. http://cran.r-project.org/doc/contrib/Intro_to_R_Vietnamese.pdf
  2. https://www.youtube.com/user/drnguyenvtuan/videos

[4] Ngôn ngữ lập trình R (Đỗ Thanh Nghị):

http://www.cit.ctu.edu.vn/~dtnghi/dataminingR/NNR.pdf

[5] Thống Kê Công Nghiệp Hiện Đại với ứng dụng viết trên R, MINITAB và JMP:

http://viasm.edu.vn/xuat-ban/tu-sach/chi-tiet/thong-ke-cong-nghiep-hien-dai-voi-ung-dung-viet-tren-r-minitab-va-jmp

Hội nghị (thường niên):

Khóa học (miễn phí):

Ghi chú: Phần mềm rất mạnh. Thích hợp cho giảng dạy, nghiên cứu khoa học & thực tiễn.

(*) https://tuanvanle.wordpress.com/2014/08/21/bang-so-sanh-kha-nang-trong-thong-ke-cua-cac-phan-mem-r-matlab-sas-stata-spss/

————-&&————

6 phản hồi

  1. Chú ơi cho cháu hỏi chú có bài giảng nào về meta-analysis (random effect model) không giới thiệu cho cháu với ạ? Cháu mới mò mẫm học về systematic review và dùng random effect model trong estimate the prevalence. Cháu đã install metafor package trong R nhưng ko biết cách sử dụng. Cháu cảm ơn chú!

  2. Chào thầy. Em đang nghiên cứu mô hình Markov Switching VAR bằng phần mềm R. Em đã nhập số liệu và định dạng timeseries và cũng đã chạy mô hình xong nhưng trong kết quả em không tìm thấy các giá trị p-value hoạc các t-statistic của các hệ số. Mong nhận được hỗ trợ từ thầy. Em cám ơn thầy rất nhiều.

  3. thầy ơi, thầy có thể cho em biết làm thế nào để đọc các file RDA sau khi lưu dữ liệu không ạ? em tìm hoài mà không thấy

  4. Tôi Google cái thấy ngay mà.
    ##Tạo file
    x <- 1:5
    save(x, file="x.Rda")
    ##Đọc file
    new_x2 <- load("x.Rda")
    new_x2
    [1] "x"
    x
    [1] 1 2 3 4 5

Trả lời

Mời bạn điền thông tin vào ô dưới đây hoặc kích vào một biểu tượng để đăng nhập:

WordPress.com Logo

Bạn đang bình luận bằng tài khoản WordPress.com Log Out / Thay đổi )

Twitter picture

Bạn đang bình luận bằng tài khoản Twitter Log Out / Thay đổi )

Facebook photo

Bạn đang bình luận bằng tài khoản Facebook Log Out / Thay đổi )

Google+ photo

Bạn đang bình luận bằng tài khoản Google+ Log Out / Thay đổi )

Connecting to %s

%d bloggers like this: