The life and times of genius problem solver, Claude Shannon w/ Jimmy Soni [Talk]

The life and times of genius problem solver, Claude Shannon w/ Jimmy Soni

(Nguồn: https://chatwithtraders.com)

Shannon was born in 1916 and became one of the foremost intellects of the twentieth century, before passing away in 2001. He was a mathematician, a scientist, an inventor and also, a stock market investor…

Although he’s widely unknown by the general public, Shannon is responsible for Information Theory—a revolutionary method of measuring information which stands behind much of the technology we use all day everyday.

Shannon’s other achievements, discoveries and inventions range from artificial intelligence to cryptography and fire breathing trumpets to chess playing machines and the world’s first wearable computer, and that’s not all!

  • What compelled Jimmy and Rod to write Claude Shannon’s biography, the numerous challenges, and why Shannon shied away from the public spotlight.
  • About Shannon’s life growing up in a small town, whether he was a brilliant mind from the outset, and one of the great lessons we can adapt from his character.
  • Information Theory; the breakthrough discovery of Shannon’s career, what it means in layman’s terms and how it’s responsible for much of today’s technology.
  • How the Shannon’s approached the stock market—without doing anything overly complex, the performance of their portfolio and their best investments.

———————-&&&———————-

Bảy sai lầm chết người khi hiểu sai về thống kê và cách tránh chúng

Bảy sai lầm chết người khi hiểu sai về thống kê và cách tránh chúng

(Nguồn: http://vienthongke.vn)

Thống kê là một công cụ hữu ích để tìm hiểu về các mô hình trong thế giới xung quanh chúng ta. Nhưng sự hiểu biết bằng trực giác thường khiến chúng ta dễ dãi hơn khi giải thích những mô hình đó. Trong bài viết này, chúng tôi sẽ chỉ ra một số sai lầm phổ biến thường mắc phải và cách tránh chúng khi đề cập đến số liệu thống kê, xác suất và rủi ro.

1. Giả sử những khác biệt nhỏ là có ý nghĩa

Các biến động hàng ngày trên thị trường chứng khoán biểu thị cho cơ hội, may rủi hơn là một điều gì đó có ý nghĩa. Sự khác biệt trong các cuộc thăm dò ý kiến khi một bên (mã cổ phiếu) vượt lên một hoặc hai điểm thường chỉ là thông tin nhiễu trong thống kê.

Bạn có thể tránh đưa ra các kết luận sai lầm về nguyên nhân của các biến động, bằng cách yêu cầu được xem “phạm vi sai số” liên quan đến các số liệu.

Nếu những khác biệt nhỏ hơn phạm vi sai số, đó là sự khác biệt không có ý nghĩa, và sự biến thiên có thể chỉ là các biến động ngẫu nhiên.

2. Ý nghĩa thống kê tương đương với ý nghĩa thực tế

Chúng ta thường khái quát hóa về sự khác biệt giữa hai nhóm như thế nào, chẳng hạn như thể lực phụ nữ thường yếu hơn so với nam giới.

Những khác biệt này thường dựa trên những định kiến và kinh nghiệm dân gian, nhưng lại bỏ qua sự tương đồng của những người giữa hai nhóm, và những khác biệt của những người trong cùng một nhóm.

Nếu bạn chọn ngẫu nhiên hai người đàn ông, có thể có khá nhiều khác sự biệt giữa họ về mặt thể lực. Nếu bạn chọn một người đàn ông và một phụ nữ, có thể hai người được nuôi dưỡng tương tự nhau, hoặc có thể người đàn ông được nuôi dưỡng tốt hơn người phụ nữ.

Hình 1: Các biểu đồ sai số minh họa mức độ không chắc chắn trong một điểm. Khi phạm vi sai số trùng nhau, sự khác biệt có thể là do thông tin nhiễu trong thống kê.

Bạn có thể tránh được lỗi này bằng cách hỏi về “hệ số ảnh hưởng” của những sự khác biệt giữa các nhóm. Đây là công cụ đo lường sự khác nhau về mức độ trung bình giữa hai nhóm.

Nếu hệ số ảnh hưởng nhỏ, thì có thể đưa ra kết luận là hai nhóm khá tương đồng. Ngay cả khi hệ số ảnh hưởng lớn, vẫn có nhiều cá thể tương đồng giữa hai nhóm, không phải tất cả thành viên của nhóm này đều sẽ khác biệt với tất cả thành viên của nhóm khác.

3. Không chú ý đến các điểm cực trị

Mặt khác, hệ số ảnh hưởng có liên quan khi bạn tập trung vào “phân phối chuẩn” (còn được gọi là “đường cong hình chuông”). Đây là vùng mà hầu hết mọi giá trị đều ở gần điểm trung bình và chỉ có một nhóm nhỏ nằm ở trên hoặc dưới mức trung bình.

Khi điều này xảy ra, một thay đổi nhỏ trong hoạt động của nhóm tạo ra sự bất thường, không có ảnh hưởng đến nhóm người ở mức trung bình (xem hình 2) nhưng lại tác động đến các giá trị ở những điểm cực trị rất lớn.

Chúng ta có thể tránh lỗi này bằng cách nhìn lại việc chúng ta có xem xét các điểm cực trị hay không. Khi bạn chỉ quan tâm đến nhóm người ở mức trung bình, sự khác biệt nhóm nhỏ thường không thành vấn đề. Khi bạn quan tâm đến các điểm cực trị, sự khác biệt nhóm nhỏ có thể trở nên rất quan trọng.

Hình 2: Trong hai tổng thể phân phối chuẩn, sự khác biệt giữa chúng sẽ rõ ràng hơn ở những điểm cực trị so với điểm trung bình.

4. Tin vào sự trùng hợp ngẫu nhiên

Bạn có biết rằng có sự tương quan giữa số người bị chết đuối mỗi năm tại Hoa Kỳ do ngã vào bể bơi và số lượng phim mà Nicholas Cage xuất hiện?

Nếu bạn đủ kiến thức bạn có thể tìm ra sự thú vị của mô hình về mối tương quan này, thực ra chỉ đơn thuần là do sự trùng hợp ngẫu nhiên.

Điều này xảy ra khi hai hiện tượng diễn ra cùng thời điểm, hoặc trong cùng một mô hình tương đồng nhau, không có nghĩa là chúng có liên quan đến nhau.

Tránh lỗi này bằng cách tìm hiểu mức độ liên kết quan sát được giữa các vấn đề có đáng tin cậy hay không. Nó chỉ xảy ra một lần hay diễn ra nhiều lần? Các mối liên hệ có thể dự đoán được trong tương lai không? Nếu bạn nhận thấy nó chỉ xảy ra một lần duy nhất, thì đó là sự tình cờ ngẫu nhiên.

Hình 3: Có tồn tại mối liên hệ nhân quả?

5. Xem xét ngược lại các nguyên nhân

Khi hai sự việc tương quan với nhau – ví dụ, các vấn đề về tình trạng thất nghiệp và bệnh tâm thần – có thể khiến chúng ta liên tưởng đến lối suy nghĩ nhân quả “hiển nhiên” là – hậu quả của bệnh tâm thần chính là tình trạng thất nghiệp.

Nhưng đôi khi mối quan hệ nhân quả xảy ra theo một cách khác, chẳng hạn như tình trạng thất nghiệp mới dẫn đến các vấn đề về sức khoẻ tâm thần.

Bạn có thể tránh được lỗi này bằng cách nhớ suy nghĩ về hướng ngược lại trong mối quan hệ nhân quả, khi bạn thấy một mối liên hệ xảy ra. Liệu ảnh hưởng có đi theo hướng khác không? Hoặc chúng có tác động lẫn nhau, tạo ra một vòng lặp thông tin phản hồi?

6. Bỏ quên việc đánh giá các nguyên nhân bên ngoài

Mọi người thường bỏ qua không đánh giá “các yếu tố thứ ba” hoặc các nguyên nhân bên ngoài có thể xảy ra tạo ra mối liên hệ giữa hai vấn đề mặc dù thực chất cả hai đều là kết quả của yếu tố thứ ba.

Ví dụ, có thể tồn tại mối liên hệ giữa việc ăn ở nhà hàng và sức khỏe tim mạch tốt hơn. Điều đó sẽ khiến bạn tin rằng có một sự liên hệ giữa hai sự việc này.

Tuy nhiên, có thể nghĩ ngay rằng những người có khả năng ăn ở nhà hàng đều đặn là những người nằm trong nhóm có điều kiện kinh tế cao, và họ cũng có điều kiện để chăm sóc sức khoẻ tốt hơn, trong đó bao gồm cả việc chú ý đến sức khỏe tim mạch nhiều hơn.

Bạn có thể tránh được lỗi này bằng cách nhớ hãy suy nghĩ về tác động của các yếu tố thứ ba khi nhìn nhận về một mối tương quan nào đấy. Nếu bạn quan tâm đến một vấn đề như là một nguyên nhân có thể xảy ra, hãy tự hỏi mình “cái gì, trong hoàn cảnh nào, gây ra điều đó? Có phải yếu tố thứ ba có thể cùng gây ra cả hai kết quả quan sát được không?”.

7. Biểu đồ dễ gây ra sự nhầm lẫn

Rất nhiều mối nguy hại xảy ra trong việc chia giá trị/tỷ lệ và ghi nhãn ở trục tung đồ thị. Việc ghi nhãn chỉ ra phạm vi đầy đủ ý nghĩa của bất cứ điều gì bạn đang nghiên cứu.

Nhưng đôi khi người tạo ra đồ thị lựa chọn một phạm vi hẹp hơn, nhằm tạo sự khác biệt nhỏ hoặc làm rõ sự liên hệ hiệu quả hơn. Trên thang đo từ 0 đến 100, hai cột có thể có cùng chiều cao. Nhưng nếu bạn sử dụng đồ thị có nguồn dữ liệu tương tự nhưng vùng chỉ hiển thị từ 52.5 đến 56.5, chúng có thể trông hoàn toàn khác biệt.

Hình 4: Các đồ thị cho thấy sự khác nhau nhiều hay ít phụ thuộc vào việc chia tỷ lệ

Bạn có thể tránh được lỗi này bằng cách chú ý phần nhãn ghi dọc theo các trục của biểu đồ. Hãy hoài nghi về bất cứ đồ thị nào không ghi nhãn.

Nhung Phạm (dịch)

Nguồn: https://phys.org/news/2017-03-deadly-statistical-misinterpretation.html

———————-&&&———————-

Ứng dụng của 7 công cụ thống kê trong vấn đề sản xuất

Ứng dụng của 7 công cụ thống kê trong vấn đề sản xuất

(Nguồn: http://pms.edu.vn)

Một trong các nguyên tắc của quản lý hiện đại là các quyết định phải dựa trên dựa trên sự kiện, dữ liệu, không được quyết định dựa trên cảm tính. Muốn vậy cần phải thu thập, thống kê, phân tích các dữ liệu riêng lẻ thành những thông tin, sự kiện thể hiện bản chất của vấn đề, từ đó sẽ có cách giải quyết nó.
7 công cụ thống kê (seven tools) đã được người Nhật lựa chọn và ứng dụng rất thành công từ sau chiến tranh thế giới lần thứ II. Từ đó việc áp dụng chúng càng rộng rãi và phổ biến trên toàn thế giới từ cải tiến công nghệ, thay thế nguyên liệu đến kiểm soát chất lượng.

1

Tại các doanh nghiệp vừa và nhỏ ở Việt Nam, việc áp dụng các công cụ thống kê trong kiểm soát chất lượng rất hạn chế hoặc không biết áp dụng. Sử dụng một hoặc nhiều trong số 7 công cụ, mỗi doanh nghiệp có thể phân tích các yếu tố trong quá trình để xác định vấn đề. Giá trị của các công cụ thống kê ở chỗ, nó đem lại những công cụ đơn giản nhưng hữu hiệu. Chúng có thể được sử dụng một cách độc lập hoặc kết hợp để xác định chính xác những điểm bất thường, các điểm thiếu kiểm soát và giảm thiểu những tác động của chúng trong quá trình sản xuất, kinh doanh.

Tóm lại, việc sử dụng các công cụ thống kê trong kiểm soát chất lượng đảm bảo cho việc quản lý chất lượng có căn cứ thực tế và khoa học khi ra quyết định. Sử dụng các công cụ thống kế giúp giải thích được tình hình quản lý chất lượng một cách đúng đắn, phát hiện kịp thời các nguyên nhân gây lỗi để có biện pháp điều chỉnh thích hợp.

13(39)
Chính nhờ những hiệu quả của chúng nên việc sử dụng 7 công cụ thống kê trong kiểm soát chất lượng trở thành một nội dung không thể thiếu trong quản lý chất lượng của mỗi doanh nghiệp, 7 công cụ đề cập ở đây bao gồm:

  1. Phiếu kiểm tra (Check sheet): được sử dụng cho việc thu thập dữ liệu. Dữ liệu thu được từ phiếu kiểm tra là đầu vào cho các công cụ phân tích dữ liệu khác, do đó đây bước quan trọng quyết định hiệu quả sử dụng của các công cụ khác.
  2. Biểu đồ Pareto (Pareto chart): sử dụng các cột để minh họa các hiện tượng và nguyên nhân ảnh hưởng có tính đến tầm quan trọng của chúng đối với sản phẩm. Sử dụng biểu đồ này giúp cho quản lý biết được những nguyên nhân cần phải tập trung xử lý.
  3. Biểu đồ nhân quả (Cause-effect diagram): giúp liệt kê những nguyên nhân có thể có dẫn đến kết quả, từ đó giúp ra nguyên nhân của một vấn đề.
  4. Biểu đồ phân bố (Histogram): là một dạng của đồ thị cột trong đó các yếu tố biến động hay các dữ liệu đặc thù được chia thành các lớp hoặc thành các phần và được diễn tả như các cột với khoảng cách lớp được biểu thị qua đường đáy và tần suất biểu thị qua chiều cao. Biểu đồ dạng này được sử dụng để theo dõi sự phân bố thô của sản phẩm/quá trình, từ đó đánh giá được năng lực của quá trình đó, giúp phòng ngừa trước khi các vấn đề đó sảy ra.
  5. Biểu đồ kiểm soát (Control chart): là biểu đồ với các đường giới hạn đã được tính toán bằng phương pháp thống kê được sử dụng nhằm mục đích theo dõi sự biến động của các thông số về đặc tính chất lượng của sản phẩm, theo dõi những thay đổi của quy trình để kiểm soát tất cả các dấu hiệu bất thường xảy ra khi có dấu hiệu đi lên hoặc đi xuống của biểu đồ.
  6. Biểu đồ phân tán (Scatter diagram): Biểu đồ phân tán chỉ ra mối quan hệ giữa 2 biến trong phân tích bằng số, để giải quyết các vấn đề và xác định điều kiện tối ưu bằng cách phân tícḥ lượng mối quan hệ nhân quả giữa các biến số.
  7. Phương pháp phân vùng (Stratified diagram): Phân vùng thông thường để tìm ra nguyên nhân của khuyết tật.

Trong bối cảnh môi trường kinh tế cạnh tranh gay gắt hiện nay, bên cạnh việc đổi mới công nghệ, các doanh nghiệp, đặc biệt là các doanh nghiệp vừa và nhỏ cần chú trọng ứng dụng các công cụ quản lý để cải tiến, nâng cao năng suất chất lượng trong hoạt động sản xuất, kinh doanh. Vì đây là những công cụ hữu hiệu, đã được các doanh nghiệp của các nước phát triển như Nhật Bản Hàn Quốc, Mỹ … áp dụng và gặt hái được những thành công vượt trội về năng suất chất lượng.

——————-&&&——————-

Tuyên bố của ASA về ý nghĩa thống kê và trị số P

Tuyên bố của ASA về ý nghĩa thống kê và trị số P

(Nguồn: http://ibsgacademic.com)

Giới thiệu

Gia tăng định lượng trong nghiên cứu khoa học và phát triển các tập hợp dữ liệu lớn, phức tạp trong những năm gần đây đã mở rộng phạm vi ứng dụng của các phương pháp thống kê. Điều này đã tạo ra những hướng mới cho tiến bộ khoa học, nhưng nó cũng mang lại những lo ngại về kết luận rút ra từ dữ liệu nghiên cứu. Giá trị (validity) của kết luận khoa học, bao gồm cả khả năng tái lặp (reproducibility) của chúng, phụ thuộc nhiều hơn so với tự thân phương pháp thống kê. Các kỹ thuật thích hợp được lựa chọn, phân tích thực hiện đúng và giải thích chính xác của kết quả thống kê cũng đóng một vai trò quan trọng trong việc đảm bảo rằng kết luận là có cơ sở và sự không chắc chắn xung quanh chúng được trình bày một cách đúng đắn.

Làm cơ sở cho nhiều kết luận khoa học được công bố là khái niệm về “có ý nghĩa thống kê,” thường được đánh giá bằng một chỉ số được gọi là trị số p. Trong khi trị số p có thể là một phương pháp thống kê hữu ích, nó thường được sử dụng sai và hiểu sai. Điều này đã dẫn đến một số tạp chí khoa học không tán thành việc sử dụng trị số p, và một vài nhà khoa học và nhà thống kê đề nghị việc từ bỏ, với vài lập luận rằng không có thay đổi cơ bản nào kể từ khi trị số p lần đầu tiên được giới thiệu.

Trong văn bản này, Hiệp hội thống kê Mỹ (American Statistical Association, ASA) tin rằng cộng đồng khoa học có thể được hưởng lợi từ một tuyên bố chính thức làm sáng tỏ những nguyên tắc cơ bản được đồng thuận rộng rãi trong việc sử dụng thích hợp và giải thích trị số p. Các vấn đề được đưa ra ở đây không chỉ ảnh hưởng đến nghiên cứu, mà còn là kinh phí nghiên cứu, thực hành viết lách, phát triển nghề nghiệp, giáo dục khoa học, chính sách công, báo chí, và pháp luật. Tuyên bố này không tìm cách giải quyết tất cả các vấn đề liên quan đến thực hành thống kê cũng như những tranh cãi nền tảng. Thay vào đó, tuyên bố nêu rõ về một vài lựa chọn nguyên tắc phi kỹ thuật mà có thể cải thiện việc thực hiện hoặc diễn giải khoa học định lượng, theo sự đồng thuận rộng rãi trong cộng đồng thống kê.

Trị số p (P-value) là gì?

Một cách không chính thức, trị số p là xác suất theo một mô hình thống kê xác định và là một dữ liệu thống kê tóm tắt (ví dụ, sự khác biệt có ý nghĩa của mẫu giữa hai nhóm được so sánh) sẽ bằng hoặc cực đoan (extreme) hơn so với giá trị quan sát của nó.

Các nguyên tắc

  1. Trị số p có thể chỉ ra sự không tương thích các dữ liệu với một mô hình thống kê xác định ra sao.

Trị số p cung cấp một cách tiếp cận tổng hợp sự không tương thích giữa một tập hợp các dữ liệu và một mô hình đề xuất cho dữ liệu. Hình thức phổ biến nhất là một mô hình, được xây dựng theo một tập hợp các giả định, cùng với cái gọi là “giả thuyết không” (null hypothesis). Thường thì “giả thuyết không” mặc nhiên công nhận sự vắng mặt của một ảnh hưởng, chẳng hạn như không có sự khác biệt giữa hai nhóm, hoặc sự vắng mặt của mối quan hệ giữa các yếu tố và một kết quả. Trị số p càng nhỏ, sự không tương thích thống kê của các dữ liệu với các giả thuyết càng lớn, nếu các giả định cơ bản được sử dụng để tính toán trị số p nắm chắc. Sự không tương thích này có thể được hiểu như là sự kiểm định hoặc cung cấp bằng chứng chống lại “giả thuyết không” hoặc các giả định cơ bản.

  1. Trị số p không đo lường xác suất mà từ đó giả thuyết nghiên cứu là đúng, hoặc xác suất mà các dữ liệu đã được tạo ra bởi một sự xuất ngẫu nhiên một cách riêng lẻ.

Các nhà nghiên cứu thường muốn đưa trị số p vào tuyên bố về tính đúng đắn của một giả thuyết không, hoặc về xác suất mà sự xuất hiện ngẫu nhiên tạo ra các dữ liệu quan sát được. Trị số p không phải như vậy. Đó là một tuyên bố về dữ liệu liên quan với một sự diễn giải giả thuyết xác định, và không phải là một tuyên bố về sự diễn giải chính nó [giả thuyết].

  1. Các kết luận khoa học và quyết sách kinh tế hoặc chính sách không nên chỉ dựa vào trị số p vượt qua một ngưỡng cụ thể.

Những thực hành giảm bớt phân tích dữ liệu hoặc suy luận khoa học với các quy tắc “sáng tỏ” (Bright-line Rules) một cách máy móc (chẳng hạn như “p < 0.05”) để biện minh cho các tuyên bố hoặc kết luận khoa học có thể dẫn đến niềm tin sai lầm và việc đưa ra quyết định vô giá trị. Một kết luận không ngay lập tức trở thành “đúng” trên một mặt của sự phân chia và “sai” về mặt khác. Các nhà nghiên cứu nên mang nhiều yếu tố bối cảnh (contextual factor) vào nghiên cứu để truy tìm những kết luận khoa học, bao gồm các thiết kế nghiên cứu, chất lượng của các thang đo, các bằng chứng bên ngoài cho các hiện tượng được nghiên cứu, và tính hợp lệ của các giả định làm cơ sở cho việc phân tích dữ liệu. Những xem xét thực tế thường đòi hỏi tính nhị phân, quyết định “yes-no”, nhưng điều này không có nghĩa là trị số p riêng lẻ có thể đảm bảo rằng một quyết định là đúng hay sai. Việc sử dụng rộng rãi “ý nghĩa thống kê” (thường được hiểu là “p ≤ 0,05”) như một chứng thực để làm tuyên bố của một phát hiện khoa học (hay sự đúng đắn được ngầm hiểu) dẫn đến biến dạng đáng kể tiến trình khoa học.

  1. Suy luận hợp lý đòi hỏi tường trình đầy đủ và minh bạch

Trị số p và phân tích có liên quan không nên được báo cáo có chọn lọc. Tiến hành nhiều phân tích các dữ liệu và báo cáo chỉ với trị số p duy nhất (thường là vượt qua một ngưỡng quan trọng) ám chỉ rằng trị số p được báo cáo về cơ bản không thể sáng tỏ. Những kết quả đầy hứa hẹn do “lỗi suy luận” (Cherry-picking), còn được gọi bằng thuật ngữ như vét dữ liệu (data dreging), đuổi bắt ý nghĩa (significance chasing), truy vấn ý nghĩa (significance questing), suy luận có chọn lọc (selective inference) và “p-hacking” [tất cả các thuật ngữ này ám chỉ việc tìm mọi cách để đạt được p < 0.05], dẫn đến dư thừa giả tạo các kết quả có ý nghĩa về mặt thống kê trong các tài liệu được công bố và nên tránh một cách mạnh mẽ. Một nhu cầu không chính thức tiến hành nhiều kiểm định thống kê cho vấn đề này phát sinh: Bất cứ khi nào một nhà nghiên cứu chọn những gì để trình bày dựa trên kết quả thống kê, giải thích giá trị của những kết quả là bị tổn hại nghiêm trọng nếu người đọc không được thông báo về sự lựa chọn và cơ sở của nó. Các nhà nghiên cứu nên tiết lộ số lượng giả thuyết khám phá trong quá trình nghiên cứu, tất cả các quyết định thu thập dữ liệu, tất cả các phân tích thống kê được thực hiện và tất cả các trị số p được tính toán. Kết luận khoa học có giá trị dựa trên các trị số p và thống kê liên quan không thể được rút ra mà không biết ít nhất bao nhiêu phân tích được tiến hành, và làm thế nào những phân tích (bao gồm cả trị số p) đã được lựa chọn để báo cáo.

  1. Trị số p, hay ý nghĩa thống kê, không đo lường kích thước của một ảnh hưởng hoặc tầm quan trọng của kết quả.

Ý nghĩa thống kê không tương đương với ý nghĩa khoa học, con người, hoặc kinh tế. trị số p nhỏ hơn không nhất thiết phải bao hàm sự hiện diện của các ảnh hưởng lớn hơn hoặc quan trọng hơn, và trị số p lớn hơn không ám chỉ thiếu tầm quan trọng hoặc thậm chí không có ảnh hưởng. Bất kỳ tác động, dù nhỏ thế nào, có thể tạo ra một trị số p nhỏ nếu kích thước mẫu hoặc thang đo chính xác là đủ cao, và các ảnh hưởng lớn có thể tạo ra trị số p không mấy ấn tượng nếu kích thước mẫu nhỏ hoặc các thang đo là không chính xác. Tương tự như vậy, những tác động ước lượng giống hệt nhau sẽ có trị số p khác nhau nếu độ chính xác của các ước lượng khác nhau.

  1. Tự thân, trị số p không cung cấp một phép đo bằng chứng tốt về một mô hình hay giả thuyết.

Các nhà nghiên cứu nên nhận thấy rằng trị số p không kèm bối cảnh hoặc các bằng chứng khác thì cung cấp thông tin hạn chế. Ví dụ, một trị số p gần 0,05 đơn giản chỉ cung cấp bằng chứng yếu ớt bác bỏ giả thuyết không. Tương tự như vậy, một trị số p tương đối lớn không bao hàm bằng chứng ủng hộ giả thuyết không; nhiều giả thuyết khác có thể tương đương hoặc phù hợp hơn với các dữ liệu quan sát. Với những lý do này, phân tích dữ liệu không nên kết thúc với việc tính toán trị số p khi cách tiếp cận khác là phù hợp và khả thi.

Các phương pháp tiếp cận khác (Other approaches)

Theo quan điểm về sự lạm dụng thường xuyên và quan niệm sai lầm về trị số p, một số nhà thống kê có khuynh hướng bổ sung hoặc thậm chí thay thế trị số p với các cách tiếp cận khác. Chúng bao gồm các phương pháp nhấn mạnh tính toán qua thử nghiệm, chẳng hạn như khoảng tin cậy (confidence interval & credibility interval đều là khoảng tin cậy nhưng thuộc 2 trường phái thống kê khác nhau) hoặc khoảng dự báo (prediction interval); phương pháp Bayesian; các phép đo thay thế của bằng chứng, chẳng hạn như tỷ số  khả dĩ (likelihood ratio) hoặc các yếu tố Bayes; và các phương pháp khác như mô hình ra quyết định lý thuyết (decision-theoretic modeling) và tỷ lệ phát hiện sai (false discovery rate). Tất cả những phép đo và cách tiếp cận này dựa trên nhiều giả định hơn, nhưng chúng có thể tiếp cận trực tiếp hơn trong việc xác định kích thước của một ảnh hưởng (và sự không chắc chắn liên quan của nó) cho dù giả thuyết là đúng.

Kết luận

Thực hành thống kê tốt, như là một phần thiết yếu của thực hành khoa học tốt, nhấn mạnh nguyên tắc của thiết kế nghiên cứu và tiến hành tốt, một loạt các tóm tắt các dữ liệu dạng số và đồ họa, sự hiểu biết về các hiện tượng được nghiên cứu, giải thích kết quả trong bối cảnh, tường trình đầy đủ, hợp logic và hiểu biết định lượng của những gì tóm tắt dữ liệu có ý nghĩa. Không nên có chỉ số duy nhất nào thay thế cho lý luận khoa học.

Ghi nhận: Ban Điều hành ASA cảm ơn những người sau đây vì việc chia sẻ kinh nghiệm và quan điểm của mình trong sự phát triển bản tuyên bố. Tuyên bố không nhất thiết phản ánh quan điểm của tất cả những người này, và trong thực tế có một số quan điểm là đối lập với tất cả hoặc một phần của tuyên bố. Tuy nhiên, chúng tôi tri ân sâu sắc đối với những đóng góp của họ. Naomi Altman, Jim Berger, Yoav Benjamini, Don Berry, Brad Carlin, John Carlin, George Cobb, Marie Davidian, Steve Fienberg, Andrew Gelman, Steve Goodman, Sander Greenland, Guido Imbens, John Ioannidis, Valen Johnson, Michael Lavine, Michael Lew, Rod Little, Deborah Mayo, Chuck McCulloch, Michele Millar, Sally Morton, Regina Nuzzo, Hilary Parker, Kenneth Rothman, Don Rubin, Stephen Senn, Uri Simonsohn, Dalene Stangl, Philip Stark, Steve Ziliak.

Chuyển Ngữ: Vương Tuấn

Nguồn: ASA


Xem thêm: 10 hiểu lầm về trị số P trong khoa học

 

————————-&&&————————–

 

Dự báo biến động giá chứng khoán qua mô hình Arch-Garch

Dự báo biến động giá chứng khoán qua mô hình Arch-Garch

(Tác giả: Phạm Chí Khoa – Nguồn: http://tapchitaichinh.vn)

Có nhiều phương pháp dự báo biến động giá tài sản tài chính. Trong nghiên cứu này, tác giả dự báo những biến động có điều kiện của thị trường chứng khoán Việt Nam với dữ liệu về biến động của chỉ số VN-Index từ ngày 15/06/2006 đến ngày 15/06/2016. Kết quả cho thấy, mô hình GARCH (1,1) là phù hợp để ước tính sự biến động của thị trường chứng khoán trong nước. Những biến động trong quá khứ của thị trường có thể được lặp lại trong hiện tại và nghiên cứu dự báo những biến động của thị trường góp phần cung cấp dữ liệu quan trong trọng trong việc quyết định phân bổ tài sản, quản lý rủi ro và quản lý các danh mục đầu tư cho các nhà đầu tư trên thị trường chứng khoán Việt Nam.

 

Ảnh minh họa. Nguồn: internetẢnh minh họa. Nguồn: internet

Dữ liệu và phương pháp nghiên cứu

Hiện có nhiều nghiên cứu về những biến động của thị trường chứng khoán (TTCK) thực hiện trên thế giới và ở Việt Nam. Việc nghiên cứu những biến động của TTCK Việt Nam thông qua chỉ số VN-Index đóng vai trò quan trọng đối với các nhà quản lý quỹ, các nhà đầu tư trên thị trường.

Nhìn lại TTCK Việt Nam trong 10 năm qua đã có không ít biến động lớn, trong đó đỉnh cao của thị trường đạt mốc với gần 1.200 điểm vào 12/03/2007 rồi lao dốc khi rơi xuống còn 235 điểm vào ngày 24/02/2009. Để nghiên cứu về biến động giá chứng khoán, nghiên cứu này áp dụng đồng thời dự báo rủi ro thông qua mô hình ARIMA và dự báo rủi ro thông qua GARCH.

Dữ liệu thu thập là chỉ số VN-Index theo ngày từ ngày 15/6/2006 đến ngày 15/6/2016, bao gồm 2.421 quan sát được sử dụng đo lường sự biến động của lợi nhuận hàng ngày. Theo đó, lợi suất của giá chứng khoán sẽ được xác định theo công thức sau:

VNRln = log (Pt/Pt-1)

Trong đó, Pt là giá đóng cửa của VN-Index thời điểm t được chuyển đổi theo logarit; Pt-1 là giá đóng cửa của VN-Index thời điểm t-1 được chuyển đổi theo logarit.

Một biến giả được đưa vào mô hình để chèn vào ngày thị trường bị đóng cửa (ngày 1/4/2014). Bởi các biến động của tỷ suất lợi nhuận của tài sản có mối tương quan chuỗi và để làm rõ các tương quan này, Engle (1982) đã có một cách tiếp cận mới trong nghiên cứu về dữ liệu chuỗi thời gian thông qua mô tả giá trị các biến thời gian khác nhau và được gọi là phương sai sai số có điều kiện và hiện tượng tự tương quan (Arch). Mô hình Arch mô tả phương sai có điều kiện của các biến trễ phân phối theo thời gian:

δt2=ω+α(L)ηt2

Trong đó, α (L) là một đa thức trong biến trễ. Để phương sai có điều kiện dương thì ω và α(L) phải không âm. Tuy nhiên, Fan và Yao (2001) lại cho rằng, Arch(p) chỉ thích hợp cho mô hình tài chính với độ trễ đủ lớn và điều này đảm bảo các phần mở rộng cho mô hình Arch. Trong khi đó, mô hình Garch là mô hình mở rộng của mô hình Arch được phát hiện bởi Bolleslev (1986). Mô hình Garch dựa vào các biến động nối tiếp nhau. Mô hình Garch(1,1) đơn giản nhất được mô tả như sau:

Phương trình trung bình:

rt = μ = εt

Phương trình phương sai:

σt = ω + α1εt-1+ β1σt-1

Trong đó, mô hình Garch phải thỏa mãn α1 ≥ 0 và β1 ≥ 0 để đảm bảo σ2là phương sai có điều kiện luôn dương. Hệ số α1 đo lường biến động có thể xảy ra ở thời kỳ tiếp theo. Nếu hệ số β1 cao điều đó chỉ ra rằng có sự biến động trong thời gian dài. Nếu α1 cao, nó có thể chỉ ra các biến động làm thay đổi thị trường là mạnh.

Bên cạnh đó, nếu α1 cao và β1 thấp, sự biến động là rất mạnh mẽ. Nếu tổng α1 và β1 tiến gần tới 1, một cú sốc tại thời điểm t sẽ tồn tại trong một thời gian dài ở tương lai. Nếu tổng α1 và β1 nhỏ hơn 1 nó sẽ dẫn đến sự thay đổi thường xuyên trong thời gian dài. Nếu tổng α1 và β1bằng 1, những cú sốc sẽ làm thay đổi tạm thời các giá trị trong tương lai. Mô hình Garch dựa vào sự phụ thuộc của chuỗi các biến động, đưa ra các quan sát trong tương lai dựa vào các quan sát ở qua khứ, do đó mô hình Garch dựa trên phương sai thay đổi theo thời gian.

Kết quả nghiên cứu

Nghiên cứu căn cứ vào tiêu chuẩn Schwarz (SIC) để quyết định bậc phù hợp trong mô hình Arma áp dụng cho dự báo giá trị trung bình của lợi suất VN-Index. Ender (2010) cho rằng, SIC thì tốt hơn tiêu chuẩn Akaike (AIC) trong việc lựa chọn mô hình phù hợp. Nghiên cứu dự báo sự kết hợp của bậc p,q của mô hình Arma với độ trễ tối ưu Arma (4,1) là phù hợp nhất với bộ dữ liệu của nghiên cứu này.

Ta thấy giá trị của hằng số là khác 0 và giá trị của AR và MA đều dương để đảm bảo phương sai có điều kiện là không âm. Bên cạnh đó, hệ số α1 và β1 có ý nghĩa thống kê và điều này có thể cho biết sự biến động của thời kỳ trước có thể giải thích cho những biến động ở thời kỳ này. Hệ số β1= 0.780229 là cao và điều đó chỉ ra rằng có sự biến động trong thời gian dài. Biến động của thị trường tồn tại lâu dài.

 Hệ số α1 cho thấy cường độ của biến động đối với thị trường, α1 = 0.163667 cho thấy, VN – Index khá nhạy trong phản ứng với các biến động diễn ra trên thị trường. Tổng α1 và β1 tiến gần tới 1, chứng tỏ một cú sốc tại thời điểm t sẽ tồn tại trong một thời gian dài ở tương lai và tổng α1 và β1 nhỏ hơn 1 chỉ ra rằng phương sai không điều kiện εt là cố định.

Với α1 nhỏ hơn β1 có thể đưa ra kết luận rằng biến động của thời kỳ này bị ảnh hưởng bởi biến động của thời kỳ trước hơn là bị ảnh hưởng bởi thông tin có liên quan của thời kỳ trước. Biến giả DUM không có ý nghĩa thống kê trong ước lượng này. Bài viết đã dùng các kiểm định để xem xét sự vững và không chệch của mô hình. Với kiểm định Arch-LM kiểm tra phần dư có còn biểu hiện hiệu ứng Arch. Tương tự, kiểm định Ljung-Box Q-statistic kiểm tra hiện tượng tự tương quan phần dư.

Cuối cùng, để kiểm định chuỗi dữ liệu lợi suất VN-Index theo ngày trong 10 năm có cần áp dụng thêm một mô hình phi tuyến, tác giả đã sử dụng kiểm định BDS phần dư của mô hình, kết quả được mô tả tại bảng 1. Kết quả kiểm định BDS cho thấy, bên cạnh mô hình Arma (4,1) – Garch (1,1), bộ dữ liệu còn cần một mô hình phi tuyến để dự báo nhằm nâng cao tính chính xác. Điều này có thể xảy ra và có thể đoán trước bởi biến động Vn – Index là quá lớn và do nhiều nguyên nhân, dẫn đến tính kém chính xác của bộ dữ liệu nghiên cứu.

Kết luận

Dựa trên dữ liệu thu thập là chỉ số VN-Index từ ngày 15/6/2006 đến ngày 15/6/2016, bao gồm 2421 quan sát được sử dụng đo lường sự biến động của lợi nhuận hàng ngày và sử dụng mô hình Arch-Garch để dự báo. Chuỗi lợi suất theo ngày của VN-Index tuân theo quy luật phân phối không chuẩn và lệch âm. Áp dụng mô hình ARMA(4,1)-GARCH(1,1) cho thấy lợi suất trong quá khứ có vai trò quyết định lợi suất hiện tại. Biến động của Vn-Index sẽ tồn tại lâu dài. Biến động trong quá khứ sẽ ảnh hưởng đến biến động trong hiện tại.

Dựa vào kết quả này, những nhà phân tích kỹ thuật, nhà quản lý danh mục sẽ tự tin hơn trong việc phân tích dự báo của mình thông qua các mô hình phân tích kỹ thuật chủ yếu dựa trên biến động có quy luật của giá chứng khoán. Thêm nữa, các nhà đầu tư có thể sử dụng kết quả này để áp dụng vào lý thuyết đánh giá hiệu quả của danh mục đầu tư chủ động nhằm nhấn mạnh vai trò của thời điểm thị trường.

Như vậy, nghiên cứu này giúp dự báo những biến động của TTCK, góp phần cung cấp dữ liệu quan trong trọng trong việc quyết định phân bổ tài sản, nguồn vốn đầu tư, quản lý rủi ro và quản lý các danh mục đầu tư cho các nhà đầu tư trên TTCK Việt Nam, từ đó góp phần mạng lại thành công khi đầu tư trên thị trường này.

Tài liệu tham khảo

1. Lakshmi Kalyanaraman(2014), Stock Market Voltality in Saudi Arabia: An Application of Univariate GARCH Model, Canadian Center of Science and Education;

2. Bolleslev T, Engle RF, Nelson DB. (1994), Garch Model. In the Handbook of Econometrics, Vol.4;

3. Tsay (2010), Analysis of Financial Time Series. A John Wiley & Son, Inc., Publication.

————————&&&————————

Kho hàng của Amazon trông cực kỳ lộn xộn, nhưng thực ra đó lại là đỉnh cao của nghệ thuật lưu trữ bằng công nghệ

Kho hàng của Amazon trông cực kỳ lộn xộn, nhưng thực ra đó lại là đỉnh cao của nghệ thuật lưu trữ bằng công nghệ

(Nguồn: http://cafef.vn)

Mọi món đồ trong kho của Amazon đều được sắp xếp không theo thứ tự, búp bê đồ chơi có thể được xếp cùng ngăn với bàn chải đánh răng và tiểu thuyết, thế nhưng nó lại là sự đỉnh cao của nghệ thuật lưu trữ thời công nghệ.

Mỗi khi nhắc tới hình ảnh của những kho chứa hàng, đặc biệt là kho chứa của những công ty bán lẻ trực tuyến hàng đầu như Amazon , người ta sẽ liên tưởng ngay tới những giá, kệ ngăn nắp với nhãn ghi tên sản phẩm và được bộ trí thẳng tắp, vuông vắn như ô bàn cờ.

Mặc dù vậy, điều này không đúng sự thật với Amazon, khi mà kho hàng của họ được bố trí một cách hết sức ngẫu nhiên và lộn xộn đến khó ngờ.

Mỗi kho hàng rộng tới cả chục thậm chí là trăm nghìn m2 và rất nhiều người làm việc bên trong nó.

 Kho hàng của Amazon khi mà mọi thứ được xếp lung tung, không theo bất kì trình tự hay danh mục nào.

Kho hàng của Amazon khi mà mọi thứ được xếp lung tung, không theo bất kì trình tự hay danh mục nào.

Thế nhưng, mọi thứ đều có lý do của nó

Nhân viên làm trong kho hàng của Amazon được phép cất đồ dùng ở bất kì nơi nào họ thích, thế nhưng nó không có nghĩa là họ có thể ném bừa đồ dùng ở bất kì đâu rồi bỏ đi. Mỗi khi để một món đồ lên kệ, nó sẽ quét một mã vạch lên món đồ đó, mã vạch này sẽ được chuyển về máy chủ của Amazon từ đó tạo thành một hệ thống bản đồ cho người lấy hàng.

Điều này khiến cho những nhân viên làm việc tại Amazon hết sức nhàn hạ, họ có thể quay vài vòng gần những kệ trống và lưu trữ toàn bộ đồ trong xe đẩy của mình. Không như phương pháp lưu trữ truyền thống khi mà họ muốn cất một chiếc đĩa chẳng hạn, họ phải di chuyển tới một khu vực và rồi lại phải tiếp tục di chuyển tới khu vực khác để cất một món đồ khác.

Với những kho hàng có diện tích lớn như thế này, việc cất từng món đồ ở khu vực cố định sẽ rất tốn thời gian, công sức của nhân viên.

Bằng việc sử dụng phương pháp lưu trữ này, những khay, kệ chứa của Amazon được lấp kín rất nhanh chóng, một số nhân viên còn cố tình nhồi nhét thêm để đầy kệ, nó giúp cho các ô trống khác thừa nhiều chỗ hơn, lưu trữ được nhiều hơn và quá trình chuyển hàng vào kho diễn ra nhanh chóng.

Trong kho của Amazon, búp bê có thể được xếp cùng ngăn với tiểu thuyết, máy sấy xếp cùng khăn mặt… mọi thứ được xếp một cách ngẫu nhiên nhất có thể.

Mọi thứ còn tuyệt vời hơn mỗi khi xuất kho, lấy hàng

Việc lấy đồ trong kho mới là thứ đang đề cập, mỗi đơn hàng của khách sẽ được nạp vào thiết bị cầm tay của nhân viên kho. Hệ thống sẽ tự động xác định cho họ khoảng cách gần nhất giữa những món đồ ngẫu nhiên bên trong nhà kho này để họ hoàn thành “cua lấy đồ” của mình trong khoảng thời gian ngắn nhất.

Thời gian lấy đồ ngắn đồng nghĩa với thời gian món hàng tới tay khách ngắn hơn, khách hàng hài lòng hơn.

Mọi thứ đều được tự động hoá thế nên nhân viên chỉ cần đi theo chỉ dẫn của thiết bị cầm tay là có thể hoàn thành công việc của mình.

Sự ngẫu nhiên trong cách lưu trữ của Amazon được coi là hệ thống lưu trữ hoàn hảo nhất trên thế giới. Nó mang lại rất nhiều lợi ích cho những kho hàng có diện tích lớn.

Tiết kiệm lượng lưu trữ: Bất kì ô trống nào đều được lấp đầy, lượng lưu trữ của kho được tăng cường rất lớn. Amazon cho rằng chỉ với phương pháp sắp xếp ngẫu nhiên này, kho của họ đã chứa được nhiều gấp 2 lần so với cách thức lưu trữ truyền thống.

Sự chính xác khi lấy hàng: Mọi thứ đều được thực hiện bởi máy móc, yếu tố con người được giảm tối thiểu, nhân viên chỉ cần làm theo chỉ dẫn của hệ thống, đi theo quãng đường ngắn nhất, lấy món hàng và rồi mang đi gửi cho khách. Nó giúp giảm thiểu rủi ro như lấy sai màu quần áo, sai kích thước hay nhiều vấn đề khác.

Sự đơn giản: Nhân viên kho thường xuyên thay đổi, nếu theo quy tắc truyền thống, một nhân viên mới vào sẽ mất cả tháng trời chỉ để học thuộc các khu vực chứa hàng. Cách lưu trữ của Amazon đơn giản hơn, dễ thực hiện hơn vì luôn luôn làm theo cái máy. Nhân viên được phép lười!

Giảm thiểu gánh nặng quản lý kho: Thay vì có người nhập sổ sách, đếm số hàng còn lại, mọi thứ đều được tự động hoá bởi máy tính, chỉ với vài lần bấm chuột, nhà quản lý có thể tìm ra chính xác “chiếc áo màu đỏ size XL với cổ V” này còn số lượng bao nhiêu trong kho mà không cần vào kho kiểm tra độ chính xác.

Theo Van Vu

Trí thức trẻ

———————&&&———————

Sự hiệu quả đến khó hiểu của toán học trong khoa học tự nhiên

Sự hiệu quả đến khó hiểu của toán học trong khoa học tự nhiên

(Tác giả: Eugene Wigner – Nguồn: http://tiasang.com.vn)

Có một câu chuyện giữa hai người bạn từng học cùng lớp thời phổ thông, nói về công việc hiện tại của họ. Một người trở thành nhà thống kê nghiên cứu về các xu hướng phát triển dân số. Anh ta đưa ra một dữ liệu được biểu diễn bằng phân bố Gaussian, và giải thích cho bạn về ý nghĩa của các ký hiệu phản ánh tình trạng dân số, dân số trung bình, v.v. Người bạn ngạc nhiên hỏi: “Làm sao cậu biết được điều đó, và ký hiệu này có ý nghĩa gì?” Nhà thống kê nói đó là số Pi, chính là tỉ số giữa chu vi đường tròn với đường kính của nó. “Thôi đi, cậu đùa quá mức rồi đấy”, người bạn phản đối. “Chắc chắn rằng dân số không liên quan gì đến cái chu vi của đường tròn”.


Eugene Wigner (1902 -1995) là nhà vật lý, toán học người Mỹ gốc Hungary. Ông được trao giải Nobel vật lý năm 1963 “cho những đóng góp về lý thuyết hạt nhân nguyên tử và các hạt cơ bản, đặc biệt thông qua khám phá và ứng dụng các nguyên lý đối xứng cơ bản”. 

Một cách tự nhiên, chúng ta chỉ mỉm cười về cái nhìn đơn giản của người bạn nọ. Tuy nhiên, khi nghe câu chuyện này, tôi phải thừa nhận một cảm giác huyền hoặc bởi phản ứng của người bạn kia là điều rất bình thường. Tôi thậm chí bị rối khi một vài ngày sau đó, một người khác tình cờ nói với tôi sự khó hiểu của anh ta về thực tế là các nhà nghiên cứu thường chỉ chọn một số ít dữ liệu để kiểm chứng lý thuyết của mình đưa ra. “Khi chúng ta tạo ra một lý thuyết tập trung vào các hiện tượng chưa được quan sát đầy đủ, và bỏ sót các hiện tượng khác lẽ ra phải được quan tâm đến, vậy làm sao ta biết rằng mình không thể xây dựng một lý thuyết khác, không hề giống lý thuyết đang có, nhưng hoàn toàn có khả năng tương đương trong việc lý giải các hiện tượng?” Phải thừa nhận rằng chúng ta không có bằng chứng phủ định sự tồn tại của một lý thuyết như thế.

Hai câu chuyện trên minh chứng cho hai điểm sẽ được bàn trong bài viết này. Điều đầu tiên là giữa những khái niệm toán học hình thành các mối liên hệ có khả năng mô tả các hiện tượng tự nhiên một cách chính xác ngoài mong đợi của chúng ta. Điều thứ hai, do thực tế như vậy và do chúng ta vẫn chưa hiểu căn nguyên dẫn tới sự hữu ích này, chúng ta cũng không thể khẳng định rằng một lý thuyết được diễn tả bằng các khái niệm toán học là chân lý duy nhất. Để dễ hiểu, chúng ta có thể hình dung về một người được cấp một chùm chìa khóa để mở nhiều cánh cửa nối tiếp nhau, và anh ta luôn dùng đúng chìa khóa với mỗi cánh cửa chỉ sau một hoặc hai lần thử. Kết quả đó khiến anh ta trở nên hoài nghi, rằng liệu có đúng là mỗi cánh cửa chỉ có thể được mở bằng một chìa duy nhất.

Bài viết này sẽ tập trung bàn về hiệu quả thần bí của toán học trong khoa học tự nhiên, điều không thể có lời giải thích hợp lý; việc này dẫn tới nghi vấn về tính đúng đắn duy nhất ở các lý thuyết vật lý. Để thiết lập điểm thứ nhất, rằng toán học đóng vai trò quan trọng đến mức khó lí giải trong vật lý, ta cần nói vài lời để trả lời câu hỏi, Toán học là gì? Rồi Vật lý là gì?, sau đó là câu hỏi toán học được áp dụng trong lý thuyết vật lý như thế nào, cuối cùng tại sao sự thành công của toán học trong vật lý gợi lên cảm giác khó hiểu.

Toán học là gì?

Toán học là khoa học của những thao tác nhuần nhuyễn trên các khái niệm và quy luật, những thứ được tạo ra thuần túy cho mục đích tự thân của toán học. Toán học chủ yếu chú trọng việc tạo ra những khái niệm mới, bởi nếu chỉ dựa trên những khái niệm cũ của những tiên đề sẵn có thì sẽ chẳng mấy chốc toán học sẽ không còn định lý nào mới mẻ thú vị. Toán học sơ cấp, đặc biệt là hình học sơ cấp, được xây dựng nhằm mô tả những đối tượng trực tiếp liên quan tới thế giới tự nhiên, nhưng điều này không còn đúng với những khái niệm toán học cao cấp hơn, cụ thể là những khái niệm đóng vai trò quan trọng trong vật lý học.

Trong thực tế, các khái niệm toán học với cách định nghĩa cho phép mở ra những suy xét thú vị và đột phá, chính là minh chứng đầu tiên cho thiên tài của các nhà toán học xây dựng nên các định nghĩa đó. Chiều sâu tư duy ẩn sau quá trình xây dựng các khái niệm toán học được bộc lộ ra về sau, thông qua những kỹ năng thao tác trên các khái niệm này. Nhà toán học thiên tài là người khai thác triệt để, tới tận cùng địa phận có thể tư duy, và đi đường vòng né qua những lãnh địa nơi không thể tư duy. Thật kỳ diệu khi sự táo tợn ấy không khiến anh ta sa lầy trong những kết quả mâu thuẫn nhau.

Điểm chính yếu cần lưu ý ở đây là nhà toán học sẽ tạo ra rất ít các định lý nếu họ không vượt rào, xây dựng những khái niệm nằm ngoài các tiên đề, được định nghĩa với tầm nhìn hướng tới những thao tác logic thông minh phù hợp với cảm quan của nhà toán học, cho ra những kết quả có tính bao quát và minh giản một cách tuyệt vời. Một ví dụ rất điển hình là số phức. Chắc chắn rằng các nhà toán học đưa ra khái niệm này mà không hề dựa trên một kinh nghiệm đời thực nào.

Vật lý là gì?

Điều các nhà vật lý quan tâm là khám phá những quy luật của tự nhiên. Vậy trước hết, cần hiểu rõ thế nào là quy luật của tự nhiên.

Như Schrodinger đã nói, bất chấp sự phức tạp khôn lường của tự nhiên, thật kỳ diệu rằng chúng ta vẫn có thể khám phá ra một số quy luật từ các sự kiện. Một trong những quy luật đó, được khám phá bởi Galileo, là hai hòn đá được thả từ cùng một độ cao ở cùng một thời điểm thì chạm mặt đất cùng một thời điểm. Quy luật do Galileo khám phá là hình mẫu cho một nhóm lớn các quy luật, nó đáng kinh ngạc bởi ba lý do.

Lí do thứ nhất là nó đúng không chỉ ở tháp nghiêng Pisa trong thời đại của Galileo, mà nó đúng ở mọi nơi mọi lúc. Tính chất này được ghi nhận là tính bất biến, một điều kiện tiên quyết cho sự tồn tại của vật lý học.

Điều đáng kinh ngạc thứ hai là quy luật mà chúng ta đang bàn đến không phụ thuộc vào rất nhiều điều kiện tưởng chừng có thể liên quan. Bất kể trời mưa hay không, được tiến hành trong phòng hay từ tháp nghiêng Pisa, và bất kể người thả hòn đá là đàn ông hay phụ nữ,… rõ ràng, có vô số những điều kiện tưởng chừng có thể can thiệp nhưng thực chất không hề gây ảnh hưởng gì tới quy luật khám phá bởi Galileo. Sự không chịu ảnh hưởng bởi nhiều hoàn cảnh khác nhau cũng được coi là tính bất biến. Việc tìm ra những yếu tố có ảnh hưởng hay không có ảnh hưởng đến hiện tượng là công việc sơ khởi của những thí nghiệm thực tế trên con đường khám phá một lĩnh vực. Chính là kỹ năng và tài cán của của người thực hiện thí nghiệm đã chỉ ra cho anh ta thấy những hiện tượng chịu phụ thuộc vào một số ít các điều kiện có tính lặp lại và cho phép tiến hành tái thí nghiệm được. Trong trường hợp Galileo, bước tiến quan trọng ông đạt được là giới hạn điều kiện tiến hành thí nghiệm với những vật thể nặng. Nhấn mạnh một lần nữa, nếu như không có hiện tượng nào chỉ phụ thuộc vào một số ít điều kiện và độc lập với tất cả những điều kiện khác thì vật lý sẽ không thể hình thành và tồn tại.

Quay lại với quy luật của tự nhiên mà Galileo tìm ra, rằng một vật nặng rơi từ một độ cao cho sẵn rơi xuống đất trong một lượng thời gian không phụ thuộc vào kích thước, loại vật liệu và hình thù của vật rơi đó. Trong khuôn khổ định luật II của Newton, nó tương đương với phát biểu rằng trọng lực tác động lên vật rơi tỉ lệ thuận với khối lượng nhưng không phụ thuộc vào kích thước, chất liệu, và hình thù của vật rơi.

Như vậy, những quy luật của tự nhiên thực ra không tồn tại một cách tự nhiên [bởi thực chất chúng đã lược bỏ đi vô vàn các điều kiện, hoàn cảnh có trong tự nhiên, chỉ tập trung vào một số ít điều kiện chọn lọc nhất định nào đó], và việc con người tìm ra chúng lại càng không thể coi là điều tự nhiên. Tất cả những quy luật tự nhiên này chứa đựng chỉ một phần nhỏ hiểu biết của chúng ta về thế giới xung quanh. Tất cả các quy luật của tự nhiên là những phát biểu có điều kiện, chúng cho phép dự đoán một vài sự kiện trong tương lai dựa trên những kiến thức có được ở hiện tại, song dự đoán đó lại không liên hệ gì với phần lớn những yếu tố và điều kiện của thế giới đang hiện hữu – sự không liên hệ được hiểu theo nghĩa đã thảo luận tại điểm đáng kinh ngạc thứ hai về định lý của Galileo.

Trong trạng thái hiện tại của thế giới, nơi tồn tại trái đất cùng sự sống của nhân loại, nơi trước đây Galileo từng tiến hành thí nghiệm, nơi tồn tại mặt trời cùng tất cả những gì xung quanh chúng ta, ở đó các quy luật của tự nhiên hoàn toàn im lặng. Chúng được dùng để tiên đoán các sự kiện sẽ xảy ra trong tương lai nhưng chỉ đúng với điều kiện hết sức đặc biệt – đó là các yếu tố quyết định đến trạng thái hiện tại của thế giới đều đã được biết trước. Tuy nhiên, nhờ kỳ tích vĩ đại của các nhà vật lý, con người chế tạo được những cỗ máy vận hành một cách chính xác, trong đó nhà vật lý tạo ra một hoàn cảnh đặc thù nơi tất cả các yếu tố liên đới được biết trước và cho phép hoạt động của cỗ máy có thể dự đoán được. Ra đa và lò phản ứng hạt nhân là những ví dụ.

Trên đây chúng ta đã khẳng định rằng tất cả các quy luật của tự nhiên là những phát biểu đúng với các điều kiện nhất định và chúng chỉ liên hệ đến một phần rất nhỏ kiến thức của chúng ta về thế giới. Cũng cần nói cho chính xác hơn rằng, chúng ta đã khám phá ra 30 năm về trước rằng ngay cả các phát biểu kèm theo điều kiện cũng không đảm bảo tính chính xác: chúng chỉ là quy luật mang tính xác suất, cho phép chúng ta đánh cược một cách thông minh khi nhận định về các tính chất của thế giới tương lai. Tính xác suất của quy luật tự nhiên được phản ánh rõ trong các cỗ máy do con người chế tạo, có thể kiểm chứng ít nhất với các lò hạt nhân khi chạy ở mức năng lượng thấp.

Vai trò của toán học trong các lý thuyết vật lý

Một cách tự nhiên, chúng ta sử dụng toán học trong vật lý thường ngày để đánh giá kết quả của những quy luật tự nhiên, áp dụng những phát biểu có điều kiện vào những hoàn cảnh cụ thể, hiện hữu một cách rõ rệt hoặc khiến chúng ta chú ý vì lý do nào đó. Muốn vậy, quy luật của tự nhiên cần được diễn tả bằng ngôn ngữ toán học. Tuy nhiên, đánh giá hệ quả của các lý thuyết đã được thiết lập sẵn không phải là vai trò quan trọng nhất của toán học trong vật lý, bởi ở đó toán học hay đúng hơn là toán ứng dụng chỉ đơn giản được sử dụng như là một công cụ. Vai trò quan trọng hơn của toán học trong vật lý chính là điều ta đã khẳng định phía trên, rằng quy luật của tự nhiên phải được thể hiện bằng ngôn ngữ toán để có thể được xem xét bằng toán ứng dụng.

Vật lý học đã chọn một số ít khái niệm trong toán học để biểu diễn quy luật tự nhiên. Trong nhiều trường hợp, nếu không muốn nói là đa số các trường hợp, các nhà vật lý lựa chọn các khái niệm một cách độc lập, sau đó họ mới nhận ra rằng các khái niệm này đã được các nhà toán học sáng tạo ra trước đó. Tuy nhiên, người ta thường ngộ nhận rằng các nhà vật lý lựa chọn các khái niệm toán học bởi tính minh giản của chúng. Như chúng ta thấy, các nhà toán học xây dựng các khái niệm toán học không phải vì chúng đơn giản, mà nhằm dễ vận dụng các thao tác, dẫn tới những lý luận đột phá. Đừng quên rằng không gian Hilbert trong cơ học lượng tử là không gian Hilbert phức, với tích vô hướng Hermitean (Hermitean scalar product) mà số phức thì chắc chắn không hề đơn giản và cũng không xuất phát từ các hiện tượng quan sát được trong tự nhiên. Hơn nữa, việc sử dụng số phức trong trường hợp này không xuất phát từ đòi hỏi kỹ năng tính toán, mà là một phần không thể thiếu khi thiết lập quy luật cơ học lượng tử.

Lý giải tốt nhất cho sự xuất hiện các khái niệm toán học trong vật lý có lẽ nằm trong phát biểu của Einstein, rằng chỉ những lý thuyết vật lý đẹp đẽ mới có thể được chúng ta sẵn sàng công nhận. Điều đó gián tiếp minh chứng cho vẻ đẹp của các khái niệm toán học. Tuy nhiên, phát hiện của Einstein chỉ cho thấy tính chất của các lý thuyết mà chúng ta sẵn sàng tin tưởng, nó không hề chứng minh các lý thuyết đó là đúng đắn.

Thành công của các lý thuyết vật lý thật đáng kinh ngạc?

Việc sử dụng toán học để xây dựng các quy luật của tự nhiên có thể được tạm lý giải là do nhà vật lý hơi thiếu trách nhiệm. Khi thấy một sự liên hệ nào đó giữa hai đại lượng khá giống với một liên hệ đã biết nào đó trong toán học, anh ta thường nhanh chóng kết luận rằng mối liên hệ giữa các đại lượng kia chính là sự liên hệ sẵn có trong toán học, đơn giản vì anh ta không hề biết một sự liên hệ tương đương nào khác. Tuy nhiên, cần thấy rằng việc sử dụng công thức toán học căn cứ trên kinh nghiệm thô sơ của các nhà vật lý thường dẫn tới những mô tả chính xác một cách đáng kinh ngạc các hiện tượng trong nhiều trường hợp. Điều này cho thấy rằng ngôn ngữ toán học xứng đáng được ca ngợi, hay thực sự có thể nói, đó là một ngôn ngữ chính xác. Hãy xem xét một vài ví dụ sau.

Đầu tiên là sự di chuyển của các hành tinh. Quy luật về sự rơi của vật thể được thiết lập nhờ những thí nghiệm được tiến hành chủ yếu ở Italy. Những thí nghiệm này không thể đạt được độ chính xác như hiểu biết của chúng ta ngày nay, đơn giản vì ảnh hưởng lực cản của không khí và vì thời đó người ta chưa có khả năng đo các khoảng thời gian ngắn. Tuy vậy, những nhà khoa học tự nhiên Italia, thông qua các thí nghiệm, đã đạt được một sự hiểu biết tương đối tốt về sự di chuyển của vật thể trong không khí. Sau này, chính Newton đã nhìn thấy mối quan hệ giữa sự rơi tự do của vật thể với sự di chuyển của mặt trăng, nhìn thấy rằng quỹ đạo của một viên đá khi ném vào không trung và đường cong di chuyển của mặt trăng trên bầu trời là những trường hợp cụ thể của một hình ellipse, và đưa ra giả thuyết về lực hấp dẫn phổ quát dựa trên nền tảng của một sự trùng hợp ngẫu nhiên về số học. Xét về lý luận, quy luật về lực hấp dẫn như được mô tả bởi Newton quá cấp tiến so với thời đại của Newton cũng như với chính bản thân ông ta. Xét về thực nghiệm, nó dựa trên một quan sát quá ít ỏi. Ngôn ngữ toán học được sử dụng ở đây bao hàm khái niệm về đạo hàm bậc hai, một khái niệm khá trừu tượng với ngay cả đa số mọi người bình thường ngày nay. Tuy nhiên, kết quả là định luật về lực hấp dẫn mà Newton xây dựng đã được ông tự kiểm chứng với độ chính xác sai lệch khoảng 4%, ngày nay đã được khoa học chứng minh với độ chính xác sai lệch dưới 0,0001%, xem như gần chính xác tuyệt đối (R.H. Dicke. Am. Sci. t.25, 1959).

Ví dụ thứ hai liên quan đến cơ học lượng tử cơ bản (elementary quantum mechanics). Điều này bắt nguồn từ phát hiện của Max Born rằng những phép tính mà Heisenberg đưa ra giống hệt phép tính ma trận từ lâu vẫn được các nhà toán học sử dụng. Born, Jordan và Heisenberg, sau đó, đề nghị dùng ma trận thay thế những biến số liên quan đến vị trí và động lượng của những phương trình cơ học cổ điển. Họ áp dụng phép tính ma trận này vào các trường hợp lý tưởng và đạt được kết quả như mong đợi. Tuy nhiên, thời điểm đó chưa có bằng chứng nào cho thấy phương pháp ma trận trong cơ học áp dụng được vào những điều kiện thực tế. Phải tới sau này, tính toán năng lượng thấp nhất của helium được thực hiện bởi Kinoshita ở Đại học Cornell và Bazley ở Cục Tiêu chuẩn mới cho thấy sự phù hợp với kết quả thực nghiệm chính xác tới 1/10 triệu. Rõ ràng, ở đây các nhà vật lý đã may mắn thu được một kết quả mà họ không ngờ tới. Đây là điều kỳ diệu điển hình nhất mà ta từng biết trong quá trình phát triển của cơ học lượng tử cơ bản, và nhờ có những thành công đặc biệt như vậy, chúng ta mới có thể tin rằng lý thuyết này là đúng đắn.

Ví dụ cuối cùng liên quan đến điện động lực học lượng tử (quantum electrodynamics), hay lý thuyết về sự dịch chuyển Lamb. Khác với lý thuyết về lực hấp dẫn của Newton vẫn có những liên hệ rõ ràng với thực nghiệm, những ma trận cơ học lượng tử được xây dựng một cách thuần túy trừu tượng theo mô tả của Heisenberg. Lý thuyết lượng tử về sự chuyển dịch Lamb, như đã được khái niệm hóa bởi Bethe và được thiết lập bởi Schwinger, là một lý thuyết thuần túy toán học. Thực nghiệm chỉ đóng vai trò khi kiểm chứng sự tồn tại của các thông số đo đạc, cho thấy độ chính xác đạt được tốt hơn một phần nghìn.

Có thể nêu ra vô vàn ví dụ khác ngoài ba trường hợp nêu trên, cho thấy các nhà vật lý đã lựa chọn các khái niệm một cách phù hợp trong quá trình xây dựng mô hình toán học cho các quy luật của tự nhiên, đạt được mức chính xác gần như kỳ diệu, tuy nhiên lại kèm theo những điều kiện ràng buộc hết sức ngặt nghèo. Những thí nghiệm này minh chứng cho điều mà chúng ta có thể gọi là quy tắc thực nghiệm của nhận thức. Cùng với những quy tắc về tính bất biến, nó tạo nên nền tảng không thể thay thế cho những lý thuyết vật lý. Nếu không có các quy tắc về tính bất biến, các định luật vật lý sẽ không có nền tảng thực nghiệm nào; nếu quy tắc thực nghiệm của nhận thức là không đúng, chúng ta sẽ thiếu động lực và niềm tin cần thiết, điều kiện tiên quyết dẫn tới khám phá thành công các quy luật của tự nhiên.

Những lý thuyết vật lý có phải không thể thay thế?

Rất có thể luôn tồn tại một số các quy luật của tự nhiên không hề gắn kết với nhau. Ở thời điểm hiện tại điều này là đúng, ví dụ giữa những quy luật di truyền và những quy luật của vật lý. Thậm chí có những quy luật tự nhiên mâu thuẫn với nhau, nhưng mỗi trong số chúng lại có sức thuyết phục trong từng lĩnh vực riêng. Chúng ta có thể phải bằng lòng thực tế ấy, hoặc là mong muốn xóa bỏ những mâu thuẫn đó của chúng ta sẽ ngày một phai nhạt, và không còn hứng thú tìm kiếm một chân lý bao trùm cuối cùng.

Toán học, nhìn một cách chính xác, không chỉ chứa đựng sự thật mà cả cái đẹp tối thượng, lạnh lùng và chính xác như những kiệt phẩm điêu khắc; nó không hề mơn trớn những bản ngã yếu đuối trong con người chúng ta, cũng không hề mang vẻ bề ngoài lộng lẫy như hội họa hay âm nhạc; toán học tinh khiết một cách cao cả và có khả năng thể hiện sự hoàn mỹ tuyệt đối mà chỉ thứ nghệ thuật cao nhất mới có thể làm được. Cảm xúc vui sướng chân thành, sự thăng hoa, vượt lên trên tầm vóc Con Người, đạt đến sự cao quý nhất, có thể được tìm thấy trong toán học cũng như trong thơ. Bertrand Russell, Nghiên cứu toán học

Một ví dụ điển hình trong vật lý là hai lý thuyết có sức mạnh to lớn được quan tâm hàng đầu, thuyết cơ học lượng tử và thuyết tương đối. Chúng có nguồn gốc từ hai nhóm hiện tượng độc lập. Thuyết tương đối áp dụng cho các vật thể vô cùng lớn, như các ngôi sao, tuy nhiên, khi xem xét đến tận cùng tại điểm khởi nguồn trong không – thời gian, tức là sự kiện cơ bản nhất trong thuyết tương đối, người ta phải tìm hiểu sự tương tác xảy ra cùng một lúc giữa các hạt ở quy mô vô cùng nhỏ. Thuyết cơ học lượng tử bắt nguồn từ thế giới vi mô, nhìn từ thuyết này thì sự va chạm, thậm chí nếu xảy ra giữa các hạt rất gần nhau trong không gian, không phải là nhỏ nhất và thậm chí không thể tách biệt trong không thời gian. Hai thuyết vận hành với các khái niệm toán học khác nhau – một thuyết sử dụng không gian 4 chiều Riemann, thuyết còn lại dùng không gian Hilbert (không xác định số chiều). Cho đến nay, hai thuyết này không thể hợp nhất, có nghĩa là chưa có mô hình toán học nào cho phép hợp nhất hai thuyết này để đạt đến một mô hình gần đúng cho cả hai. Tất cả các nhà vật lý đều tin rằng việc hợp nhất hai lý thuyết đó là có thể và chúng ta sẽ tìm ra cách. Tuy vậy, cũng hoàn toàn có thể chúng ta sẽ không bao giờ hợp nhất được hai thuyết trên.

Một nghịch lý khác là một số thuyết vật lý mà chúng ta biết là sai nhưng lại cho những kết quả đúng đến kinh ngạc. Nếu sự hiểu biết của chúng ta ít hơn, căn cứ trên một lượng hữu hạn những kết quả đúng từ các lý thuyết “sai” này cũng đủ làm cho chúng ta tin rằng các thuyết đó là đúng và đã được chứng minh. Tuy nhiên, chúng bị coi là sai sau khi chúng ta thực hiện các phân tích trên một bình diện bao quát hơn và dẫn tới những kết quả không tương thích. Khi các lý thuyết sai đạt tới một số lượng đủ lớn, sẽ xuất hiện tình trạng mâu thuẫn nhau. Tương tự như vậy, các lý thuyết ngày nay được coi là đúng nhờ các căn cứ số liệu mà chúng ta cho rằng đã đủ thỏa mãn, nhưng chúng cũng hoàn toàn có thể mâu thuẫn với một lý thuyết tổng quát hơn nào đó ở một tầm mức mà năng lực hiểu biết và khám phá ngày nay của con người chưa đạt tới. Nếu điều này là đúng, sự mâu thuẫn giữa các lý thuyết sẽ đến lúc xuất hiện ngày càng nhiều, trở thành cơn ác mộng cho các nhà lý thuyết.

Hãy nhìn lại một số lý thuyết “sai” nhưng lại mô tả đúng nhiều nhóm các hiện tượng. Ví dụ như thuyết electron tự do (free-electron theory) mà ngày nay chỉ được coi là sự mô tả gần đúng các hiện tượng liên quan đến chất rắn, cần được thay thế bằng một lý thuyết khác chính xác hơn. Tuy nhiên, thuyết electron tự do vẫn có khả năng mô tả vô cùng chính xác nhiều tính chất của kim loại, chất bán dẫn, và chất cách điện. Đặc biệt nó có thể giải thích hiện tượng chất cách điện có điện trở riêng đạt tới 226 lần lớn hơn kim loại, điều không thể lý giải bởi bất kỳ thuyết nào khác được biết đến. Thực tế đó quả là gây phiền lòng, khiến chúng ta nghi ngờ về sự phù hợp số học giữa lý thuyết với thực nghiệm, rằng liệu đó có thể coi như bằng chứng cho sự đúng đắn của một lý thuyết?

Sẽ còn nan giải và khó hiểu hơn nếu một ngày nào đó chúng ta có thể thiết lập được lý thuyết về các hiện tượng của nhận thức, hay của sinh vật học, đạt đến mức độ thống nhất và đáng tin cậy như các lý thuyết vật lý. Quy luật của Mendel về sự di truyền và những nghiên cứu về sau liên quan đến gene có thể cung cấp một sự khởi đầu cho một lý thuyết như vậy. Hơn nữa, rất có thể người ta tìm ra sự mâu thuẫn giữa một lý thuyết như vậy với các nguyên lý đã được thừa nhận của vật lý. Lý luận đó có thể trừu tượng tới mức mâu thuẫn giữa hai bên là không thể hóa giải hoặc phân xử thông qua thí nghiệm. Điều ấy sẽ ảnh hưởng mạnh đến lòng tin dành cho các lý thuyết của chúng ta cũng như cho cách thức hình thành các khái niệm mà chúng ta vẫn tiến hành trong thực tế, và khiến chúng ta nản lòng một cách sâu sắc trong cuộc truy tìm một chân lý bao trùm cuối cùng.

Một kịch bản như vậy là điều chúng ta không thể bác bỏ, chủ yếu bởi ta không hề biết vì sao các lý thuyết con người xây dựng được lại chính xác đến vậy nên sự chính xác ấy chưa hẳn đã minh chứng cho chân lý và cũng không chắc sẽ đảm bảo nhất quán xuyên suốt. Người viết tin rằng một hiện tượng như vậy hoàn toàn có thể xảy ra nếu ta đem những quy luật di truyền trong sinh học đối mặt với những quy luật trong vật lý.

Tóm lại, sự diệu kỳ của ngôn ngữ toán học trong việc biểu diễn các quy luật trong vật lý là một món quà tuyệt vời mà con người không thể lý giải, và cũng không thể coi đó là phần thưởng mà chúng ta xứng đáng được nhận. Vì vậy, hãy biết ơn điều đó, và hy vọng rằng nó sẽ tiếp tục kéo dài trong suốt sự nghiệp nghiên cứu của chúng ta trên mọi lĩnh vực.

Lê Quốc Chơn dịch từ bài viết The Unreasonable Effectiveness of Mathematics in the Natural Sciences của Eugene Wigner,

Thanh Xuân lược và hiệu đính

Nguồn: https://www.dartmouth.edu/~matc/MathDrama/reading/Wigner.html

—————–&&&—————