Tất cả mô hình tiên lượng Covid đều sai!

Tất cả mô hình tiên lượng Covid đều sai!

(Nguồn: https://nguyenvantuan.info/)

Nhiều bạn thắc mắc tại sao mô hình dự báo covid ở VN quá sai. Tôi dành ra khá nhiều thì giờ để suy nghĩ và làm về tiên lượng [1], nên có thể chia sẻ những khó khăn đằng sau để các bạn biết. Không phải ai có kĩ năng toán hay thống kê học là có thể xây dựng mô hình tốt đâu. Xây dựng mô hình tiên lượng tốt đòi hỏi những kiến thức chuyên ngành, kinh nghiệm thực tế, và kĩ thuật thật tốt. Cái note này giải thích tại sao các mô hình covid đều sai và nên sử dụng mô hình như thế nào.

Có lẽ các bạn còn nhớ tuần qua tôi có ‘tâm sự’ nỗi khổ của người làm Academic Editor khi phụ trách mấy bài nghiên cứu về covid. Trong cái note đó tôi có đề cập đến Giáo sư Neil Furguson (một chuyên gia lừng danh về dịch tễ toán học ở Anh và là cố vấn cho Chánh phủ Anh về Covid) xây dựng một mô hình tiên lượng nổi tiếng trên thế giới. Mô hình này ước lượng rằng dịch Vũ Hán sẽ gây ra 500,000 cái chết nếu Chánh phủ Anh không có hành động. Chánh phủ Anh lập tức ra chánh sách hạn chế đi lại, giãn cách xã hội, và phong toả. Đó là một mô hình có ảnh hưởng lớn trên thế giới.

Thế nhưng mô hình với 15,000 dòng codes [2] của Ferguson sai. Sai nghiêm trọng. Những gì xảy ra không như mô hình của ông tiên lượng. Vài nhóm nghiên cứu trên thế giới chỉ ra một số sai sót về giả định và kĩ thuật của mô hình. Có người thậm chí còn chê rằng những mã / codes trong mô hình đó chưa đạt trình độ chuyên nghiệp [3]!

Ngay cả trước đây ông cũng có mô hình tiên lượng số ca tử vong liên quan đến dịch cúm gia cầm (bird flu) sẽ gây ra 200 triệu người chết trên thế giới. Thế nhưng trong thực tế thì chỉ có 282 người chết trong thời gian 2003 đến 2009. Mô hình này cũng sai nghiêm trọng, và có chuyên gia chỉ ra rằng ông đã dùng chương trình máy tính quá xưa để dự báo cho dịch ngày nay.

Rồi chính ông vi phạm qui định về phong toả năm 2020, và thế là Ferguson quyết định từ chức cố vấn cho Chánh phủ Anh. Một kết cục buồn. Nhưng tôi hoàn toàn hiểu và thông cảm cho nỗi khổ của ông ấy. Không ai hoàn hảo, huống chi là một mô hình với 15,000 dòng codes.

Ở bên Mĩ, một trong những mô hình được Chánh phủ đề cập nhiều là của Institute of Health Metrics and Evaluation (IIHME) [4]. Mô hình này dự báo số ca tử vong cho mỗi tiểu bang trong 4 tháng. Nhìn bề ngoài thì nó có vẻ ok đối với người không am hiểu dịch tễ học, nhưng nhìn từ góc độ chuyên môn thì mô hình có vấn đề. Chẳng hạn như mô hình này giả định rằng hệ số phản ảnh ảnh hưởng giãn cách xã hội giống như những gì quan sát ở Vũ Hán, trong khi môi trường sống ở Vũ Hán rất khác so với Mĩ.

Ngay cả con số tử vong dự báo của mô hình cũng chẳng dựa vào dịch tễ học mà lệ thuộc vào số ca tử vong trước đây, nhưng số ca tử vong đó được báo cáo không đầy đủ. Hậu quả là mô hình đầy triển vọng này cho ra nhiều dự báo sai nghiêm trọng, ảnh hưởng đến việc hoạch định chánh sách.

Chỉ vài ví dụ trên để chúng ta thấy rằng mô hình toán học và mô hình dịch tễ học chỉ là một dạng ‘thể thao trí não’ (không phải ‘trí tuệ’ nghen). Mô hình là những công cụ có ích, nhưng đừng nên quá lệ thuộc vào chúng để dự báo tương lai xa. Tôi sẽ giải thích dưới đây tại sao mô hình rất dễ sai. Và chính vì sai nên giới lãnh đạo không nên quá lệ thuộc vào mô hình để hoạch định chánh sách có thể gây ảnh hưởng đến hàng triệu người.

1.  Hai bộ môn dịch tễ học

Tiên lượng bệnh tật là chuyên môn của giới dịch tễ học. Nhưng có lẽ đa số các bạn, kể cả người trong ngành y, không biết rằng có hai nhánh dịch tễ học. Một nhánh tạm gọi là Dịch tễ học Lâm sàng (clinical epidemiology), là các môn học liên quan đến ứng dụng các khái niệm căn bản như thiết kế nghiên cứu, điều tra dịch tễ, diễn giải và ứng dụng kết quả cho điều trị, v.v. Đây là những môn hay được giảng dạy cho bác sĩ và nhân viên y tế nói chung. Cá nhân tôi và vài đồng nghiệp hay tổ chức những lớp học như thế này ở Việt Nam và vài nước Á châu.

Một nhánh khác gọi là Dịch tễ Toán học (mathematical epidemiology). Đây là môn học đòi hỏi người theo học phải biết về y khoa, bệnh truyền nhiễm, và giỏi toán thống kê và máy tính. Người theo học phải có kiến thức về những môn như xác suất, qui trình ngẫu nhiên, phương trình vi phân, phương pháp Bayes, mô phỏng, v.v. Rất ít ai dạy môn này ở đại học cho bác sĩ hay các nhà dịch tễ học lâm sàng, nhưng những ai làm nghiên cứu thì phải học môn này.

Có thể nói rằng 100% người Việt chúng ta chỉ học dịch tễ học lâm sàng. Còn dịch tễ toán học thì rất hiếm ai học qua một cách bài bản, hay có kinh nghiệm ở trình độ nghiên cứu (research level).

Khi nói về mô hình dịch covid, chúng ta nói về nhánh dịch tễ toán học, chớ không phải dịch tễ học lâm sàng. Lí do đơn giản là các phương pháp dịch tễ toán học cung cấp hàng loạt ‘phương tiện’ để mô hình hoá. Các mô hình này có thể chia thành 2 nhóm: tiên lượng và dự báo.

Tiên lượng và Dự báo

Có lẽ vài bạn chưa hiểu rõ sự khác biệt giữa 2 khái niệm prediction (tiên lượng) và forecasting (dự báo), nên tôi xin có một giải thích ngắn gọn như sau:

  • Prediction hay tiên lượng là dùng tham số để giải thích một biến cố trong tương lai. Ví dụ như tôi dùng các yếu tố như hệ số lây nhiễm và cơ cấu dân số để hiểu dịch đang xảy ra như thế nào và dùng đó để giải thích rằng ảnh hưởng của phong toả là như thế nào.
  • Forecasting hay dự báo là sử dụng dữ liệu quá khứ để ước tính xác suất một biến số xảy ra trong tương lai. Chẳng hạn như tôi dùng số ca nhiễm hàng ngày trong tháng qua để dự báo số ca nhiễm tháng tới với một xác suất nào đó.

Những mô hình tiên lượng và dự báo trong dịch tễ học thì rất nhiều. Các bạn có thể xem qua trang này [5] để biết trên thế giới người ta đã làm đến đây về mô hình dịch tễ học. Tôi nghĩ tựu trung lại có 3 dạng mô hình chánh:

  • Mô hình SEIR
  • Mô hình Agent
  • Mô hình thống kê

Dưới đây, tôi xin giải thích cho các bạn rõ hơn sự khác biệt giữa 3 dạng mô hình đó. Nên nhớ rằng mỗi dạng như thế có hàng chục mô hình khác nhau (chớ không phải chỉ 1), tuỳ thuộc vào sự phức tạp của môi trường dịch tễ.

2. Mô hình SEIR (susceptible – exposed – infection – recovery)

Mô hình SEIR đại khái phân chia quần thể thành 4 tình trạng (còn gọi là compartment): S là số người có thể bị nhiễm; E là số người bị phơi nhiễm; I là số người có thể lây lan cho người khác; và R là số người bình phục.

Mỗi chuyển biến tư S sang E, từ E sang I, và I sang R chịu sự chi phối của hàng loạt tham số. Chẳng hạn như từ S sang E, nhà nghiên cứu phải biết số lần tiếp xúc trong mỗi đơn vị thời gian và xác suất chuyễn từ S sang E. Tương tợ, từ E sang I lệ thuộc vào thời gian ủ bệnh và xác suất những ca không triệu chứng. Cụ thể, mô hình này đòi hỏi nhà nghiên cứu phải có những dữ liệu sau đây:

  • Dân số phân bố theo từng độ tuổi và giới tính;
  • Xác suất số ca nhiễm nhẹ sẽ đến khám ở phòng mạch bác sĩ;
  • Xác suất cố ca nhiễm nhẹ nhập viện;
  • Xác suất số ca do bác sĩ gia đình điều trị sẽ nhập viện;
  • Xác suất ca xuất viện và cần bác sĩ điều trị;
  • Xác suất số ca nhiễm nặng;
  • Xác suất số ca nhiễm nặng cần nhập viện;
  • Xác suất số ca nhiễm nặng cần nhập ICU;
  • Xác suất số ca nhiễm nặng cần thở máy;
  • Phân bố thời gian nằm viện;
  • Phân bố thời gian nằm ICU;
  • Chỉ số turnover giường bệnh và ICU.  

Tất cả những tham số đó rất khó có. Khi dịch mới khởi phát thì làm sao nhà nghiên cứu có những tham số đó. Thành ra, cách mà họ làm là đưa ra một con số nào đó cho mỗi tham số. Nhưng thử tưởng tượng, một mô hình như SEIR nếu đơn giản thì cần đến ít nhứt là 9 tham số, tức là nhà nghiên cứu có hàng trăm mô hình khả dĩ.

Minh hoạ cho mô hình SEIR. Nguồn: https://tuanvnguyen.medium.com/move-away-from-lockdowns-ad24fe2d995b

Trong tình huống thiếu thốn dữ liệu thì chỉ có cách là mô phỏng. Nhưng mô phỏng lại tuỳ thuộc vào hàng loạt tham số kĩ thuật khác mà nhà nghiên cứu có khi không biết hết, và một lần nữa họ phải … võ đoán.

3.  Mô hình Agent

Mô hình này còn gọi là ABM (Agent-based Model) trong dịch tễ học. Mô hình ABM hoàn toàn dựa vào mô phỏng bằng máy tính loại công suất cao (như supercomputer chẳng hạn). ABM thường được ứng dụng để nghiên cứu về tương tác giữa người với người, giữa các môi trường, địa phương, và thời gian. Đây là mô hình hoàn toàn dựa vào xác suất, và có thể xem như là một dạng ‘system modeling’ chớ không đơn giản như mô hình thống kê truyền thống.

Các bạn thử tưởng tượng người ta mô hình các mối tương tác giữa 10 triệu người thuộc 100 địa điểm và suốt 365 ngày. Ông A gặp ông B ở địa điểm 1 trong thời gian t1; ông Ba tiếp xúc bà C tại địa điểm 2 trong thời gian t2; v.v. Rất phức tạp và tuỳ thuộc vào rất nhiều tham số. Vì tính phức tạp, nên mô hình này thường đòi hỏi phải có máy tính công suất lớn, kể cả siêu máy tính.

Minh hoạ cho mô hình ABM. Nguồn: https://www.sciencedirect.com/science/article/pii/S1755436517300221

Nhưng mô hình ABM nếu đúng thì có thể giúp nhà nghiên cứu biết được các biện pháp giãn cách xã hội có hiệu quả như thế nào.

4.  Mô hình thống kê truyền thống

Đây là các mô hình tôi xếp vào nhóm ‘truyền thống’ như mô hình dữ liệu dãy thời gian (time series models như ARMA, ARIMA, SARIMA), mô hình hồi qui (regression models), hay những kĩ thuật gọi chung là ‘curve fitting’. Những mô hình này nói chung là khá đơn giản, vì chỉ sử dụng conn số ca nhiễm hay tử vong mỗi ngày và tìm một phương trình tiên lượng cho tương lai.

Các mô hình thống kê này chỉ có thể ứng dụng cho dịch trong một thời gian ngắn và đơn giản. Tuy vậy, các mô hình này vẫn phải dựa vào nhiều giả định liên quan đến kĩ thuật và can thiệp. Chẳng hạn như nhà nghiên cứu phải giả định rằng biện pháp can thiệp sẽ diễn ra vào lúc nào và hiệu quả ra sao, tức là những tham số không thể nào biết trước được.

Đối với dịch phức tạp và có nhiều can thiệp như covid thì những mô hình truyền thống này không được ứng dụng. Dĩ nhiên, trong thực tế cũng có người ‘mạo hiểm’ ứng dụng các mô hình này, nhưng dân trong chuyên ngành chỉ cần nhìn qua là biết không phải người trong ‘bộ lạc’.

Dĩ nhiên, còn nhiều mô hình khác nữa mà tôi không đề cập ở đây. Chẳng hạn như có người dùng Machine Learning để dự báo dịch covid cũng rất hay [6]. Nhưng cá nhân tôi thì không mặn mà với mô hình loại này, vì nó thiếu các nguyên lí dịch tễ đằng sau. Mô hình cần phải có lí thuyết và nguyên lí, chớ thiếu yếu tố này thì chỉ là ‘hộp đen’ mà thôi.

5.  Mô hình nào cũng sai

Ở trên, tôi đã giải thích sự phức tạp và qui mô của mô hình tiên lượng SEIR và ABM. Phức tạp là vì các mô hình này tuỳ thuộc vào quá nhiều tham số và giả định. Những tham số đó thường không có sẵn. Còn giả định thì có thể sai. Sai là vì nhà nghiên cứu nhìn hiện tượng theo cảm nhận của mình, chớ ít khi nào theo sự vật. Nói như Einstein là “assumptions are made and most assumptions are wrong” (Giả định là cái mình tự đặt ra và đa số giả định đều sai).

Như tôi trình bày trên, tính hợp lí của mô hình lệ thuộc vào 3 yếu tố: giả định và phẩm chất của dữ liệu. Một trong những giả định quan trọng là thời gian ủ bệnh, hệ số ảnh hưởng của giãn cách xã hội, và chỉ số lây lan (reproduction ratio). Vấn đề là trong thời điểm dịch mới bùng phát thì dữ liệu rất hạn chế, có thể do báo cáo tư cơ sở không đầy đủ, do xét nghiệm kém chính xác, hay do số liệu được thu thập còn quá rời rạc. Một trong những vấn đề về dùng dữ liệu gộp từ nhiều nguồn là nó bỏ qua sự khác biệt giữa các địa phương. Những yếu tố lâm sàng như bệnh đi kèm, độ tuổi, yếu tố nguy cơ, v.v. bị trung bình hoá, thành ra dẫn đến một nghịch lí là mô hình có vẻ rất tốt cho tất cả địa phương, nhưng lại rất kém cho mỗi địa phương!

Các mô hình phải có tính minh bạch. Minh bạch hiểu theo nghĩa nhóm nghiên cứu nên công bố chi tiết kĩ thuật về mô hình cho thế giới xem và đánh giá. Điều này cũng giống như làm nghiên cứu khoa học thì phải công bố kết quả và phương pháp nghiên cứu. Chẳng hạn như nhóm của Neil Furguson [7] hay nhóm Doherty [8] người ta công bố mô hình bằng những bài báo khoa học hay trên các trạm như MedrXiv.

Nhà thống kê học trứ danh George Box [9] (con rể của Ronald Fisher) từng nói một câu nổi tiếng rằng ‘Tất cả các mô hình đều sai, nhưng một số mô hình vẫn có ích’ (‘All Models Are Wrong, Some are Useful). Nhiều người hiểu sai câu này và biện minh cho cái sai của mình. Nhưng câu đó phải hiểu đúng như sau: tất cả các mô hìn đều sai, bởi vì bản chất của mô hình là xấp xỉ với thực tế (và xấp xỉ thì phải sai).

Tại sao ‘một số mô hình có ích’? Tại vì các mô hình được xây dựng theo đúng phương pháp và có dữ liệu tốt thì nó vẫn có thể giúp cho việc hoạch định chánh sách và nhìn thấy trước viễn cảnh. Câu nói đó không biện minh cho những mô hình sai từ kiến thức đến phương pháp.

6.  Tiêu chuẩn 4R cho mô hình tiên lượng

Để xây dựng một mô hình nghiêm chỉnh, một mô hình mà tôi gọi là ‘actionable model’ (tức mô hình có thể giúp lãnh đạo hành động) thì đòi hỏi nhiều hơn là một bài tập toán dịch tễ học. Bây giờ nghĩ lại, tôi thấy giá trị của một mô hình actionable được xác định bởi người làm ra nó và 4 tiêu chuẩn mà tôi gọi là 4R.

Ai cũng có thể xây dựng một mô hình tiên lượng hay dự báo, nhưng mô hình đó có được ‘công nhận’ hay không và công nhận bởi ai là một chuyện khác. Mô hình tiên lượng như là một công cụ, và công cụ có thể xem như một món hàng. Khách hàng khi lựa chọn mua món hàng, họ muốn biết ai là người sản xuất ra món hàng, nhà sản xuất đã có kinh nghiệm làm món hàng như thế chưa, và uy tín của nhà sản xuất ra sao. Một nhà sản xuất đùng một cái tuyên bố rằng họ làm ra [ví dụ] thuốc điều trị ung thư, nhưng họ chưa bao giờ có tên tuổi trong ngành, thì rất khó được công nhận. Trong mô hình tiên lượng cũng vậy, tác giả mô hình là một yếu tố khá quan trọng.

Xin chia sẻ một câu chuyện trong chuyên ngành loãng xương chúng tôi. Chuyên ngành này có 3 mô hình tiên lượng (một của nhóm tôi, một của WHO, và một của một nhóm bên Anh), nhưng chỉ có mô hình của nhóm tôi và WHO là được đồng nghiệp công nhận và sử dụng trong lâm sàng. Tại sao mô hình bên Anh cũng làm khá tốt mà không được sử dụng? Phải một thời gian sau người ta mới nhận ra lí do: vì họ không phải là người trong ‘bộ lạc’. Họ không có những ‘track record’ như nhóm chúng tôi và WHO (hiểu theo nghĩa từng công bố những nghiên cứu trong lãnh vực mô hình tiên lượng và quá quen mặt trong các hội nghị quốc tế). Họ xuất hiện khá … đột ngột. Một lí do khác là mô hình của họ quá phức tạp để bác sĩ có thể sử dụng.

Mô hình tiên lượng covid cũng vậy. Trong hàng trăm mô hình khắp thế giới, người ta biết chọn mô hình nào? Đầu tiên là người ta phải xem thành tích khoa học của tác giả, họ xuất phát từ đâu và đã từng làm trong lãnh vực này bao lâu. Chẳng hạn như ở Úc này, giữa mô hình của nhóm Viện Doherty và Viện Burnet, có lẽ đa số sẽ chọn mô hình của Viện Doherty vì người đứng đầu có một thành tích khoa học khá lâu trong lãnh vực này.

Muốn xây dựng một mô hình tiên lượng tốt, cần phải đạt tiêu chuẩn gì? Xin ‘khoe’ với các bạn là cách đây 5 năm khi tôi được bổ nhiệm ở UTS [1], và theo truyền thống của đại học, tôi có một bài nói chuyện gọi là ‘ra mắt’. Bài này khá quan trọng vì qua đó mà người ta đánh giá mình trong faculty của đại học. Trong bài nói chuyện đó, tôi nói về “Predictive Medicine in the Genomic Era”, và đề ra tiêu chuẩn 4R cho một mô hình lí tưởng. Tôi có đề cập đến 4 tiêu chuẩn này trong cuốn sách mới xuất bản ở Việt Nam [10].  

  • Reliable (tin cậy)
  • Relevant (liên đới)
  • Real world (thực tế)
  • Realtime (trực tuyến)

Tiêu chuẩn Reliable ở đây có nghĩa là mô hình phải đạt độ chính xác có thể chấp nhận được (nhưng không thể 100%). Để đạt được độ chính xác đó thì giá trị tiên lượng của mô hình phải unbiased, có nghĩa là không chịu ảnh hưởng bởi các yếu tố nhiễu. Ngoài ra, mô hình đó phải mang tính tái lập (reproducible), có nghĩa là người ta có thể lặp lại mô hình — nếu họ muốn.

Bất cứ mô hình nào cũng phải qua giai đoạn xây dựng trước rồi kiểm định sau. Có khi mô hình xây dưng rất tốt trên nền một dữ liệu ở Anh, nhưng có thể khi kiểm định ở Việt Nam thì sẽ thất bại. Chuyện này xảy ra khá thường xuyên. Tuyên bố rằng mình đã có một mô hình vẫn chưa đủ, mà phải chứng minh rằng mô hình đó reliable thì mới đáng xem xét (chưa nói đến sử dụng).

Tiêu chuẩn Relevance đề cập đến mô hình phải ‘actionable’, tức có thể dựa vào đó mà hành động. Nói cách khác, mô hình có thể dùng làm cơ sở để hoạch định chánh sách. Nhiều mô hình xây dựng cho đẹp, nhưng không sử dụng được vì có thể nó chỉ là ‘hộp đen’.

Có những mô hình có quá nhiều tham số và giả định, mà người sử dụng rất khó kiểm tra tính hợp lí của chúng. Những mô hình này có thể cho ra kết quả tiên lượng hay dự báo khá tốt, nhưng nó không mang tính liên đới. Chẳng hạn như mô hình với 20 tham số, và có tham số liên quan đến yếu tố A, và người sử dụng mô hình sẽ hỏi “Nếu tôi can thiệp vào A, thì kết quả sẽ ra sao?” Nếu kết quả can thiệp A không làm thay đổi giá trị tiên lượng thì mô hình đó được xem là irrelevant, không mang tính liên đới. Một mô hình loại đó chỉ làm như là một trò toán học thôi, không có giá trị thực tế.

Tiêu chuẩn Realworld là phải phản ảnh thực tế và có giá trị kinh tế. Đó là mô hình phản ảnh thực trạng của một địa phương, thay vì mô hình chung chung. Mỗi địa phương có những yếu tố đặc thù, và mô hình lí tưởng cần phải xem xét đến các yếu tố đó.

Có nhiều mô hình khả dĩ để xây dựng, và người xây dựng phải dung hoà giữa 2 thái cực: phức tạp và đơn giản. Mô hình đơn giản thì không phản ảnh đầy đủ sự phức tạp của dịch. Còn mô hình quá phức tạp thì khó diễn giải, và có khi không phù hợp với dịch tễ và sinh học. Do đó, phải tìm một mô hình trung dung giữa 2 thái cực để phù hợp với tình hình thực tế.

Tiêu chuẩn Realtime là phản ảnh sự biến chuyển theo thời gian của các yếu tố nguy cơ hay các tham số. Nói theo triết lí Vô Thường là không có yếu tố nào là cố định cả, cho nên mô hình tốt phải uyển chuyển theo thời gian. Đa số các mô hình tiên lượng thất bại ở tiêu chuẩn này vì giả định rằng các tham số của mô hình là cố định.

Trong các mô hình tiên lượng hay dự báo covid, cái sai sót lớn nhứt là thiếu tính realtime. Chẳng hạn như quay lại các giả định trong mô hình SEIR, chúng ta thấy tất cả đều có thể thay đổi theo thời gian. Vả lại, nhà chức trách sẽ áp dụng các biện pháp giãn cách xã hội khác để kiểm soát dịch, nhưng nhiều mô hình tiên lượng không xem xét đến — hay có xem xét nhưng không đầy đủ — dễ dẫn đến sai lầm trong tiên lượng.

7.  Hướng đi tương lai: hợp tác

Khi đại dịch xảy ra, có nhiều cá nhân và nhóm tự hình thành để góp một vài ý kiến hay việc làm cụ thể. Điều đó cũng dễ hiểu, vì mỗi chúng ta đều có tấm lòng với quê hương. Nhưng sự bất lợi của các nhóm tự phát là rời rạc và không có liên kết chặt chẽ. Một điểm yếu khác có lẽ là sự tự tin của các cá nhân rằng họ là chuyên gia và biết tất cả, mà không cần tham vấn những người ngoài nhóm.

Nói chung, sự hình thành các nhóm ‘tự phát’ phản ảnh một phần cái văn hoá của người Việt chúng ta. Nhiều người trong chúng ta hay nghĩ mình là nhứt, và vì thế họ thấy không cần hợp tác với người ngoài có chuyên môn nhưng họ bất đồng chánh kiến.

Trong khi ở Úc và các nước phương Tây thì người ta có văn hoá hợp tác rất tốt. Chẳng hạn như các chuyên gia ở Mĩ và Úc, họ huy tụ thành các nhóm và làm tư vấn cho chánh phủ. Có nhóm chuyên về lâm sàng và y học thực chứng, chuyên đánh giá chứng cớ khoa học của các nghiên cứu và ra khuyến cáo. Có nhóm chuyên về tiên lượng và dự báo, huy tụ những chuyên gia từ các bộ môn dịch tễ học lâm sàng, dịch tễ toán học, toán học, thốg kê học, khoa học máy tính, IT, vật lí, v.v. Kết quả là họ có những mô hình khả dĩ dùng làm cơ sở khuyến cáo chánh phủ.

Tôi nghĩ hướng đi tương lai là chúng ta nên hợp tác với nhau và làm việc vì mục tiêu chung. Chúng ta phải học cách làm việc của người phương Tây, vì sự phức tạp của các mô hình tiên lượng đòi hỏi người ta phải làm việc theo nhóm. Trong nhóm phải có người ‘chỉ huy’ cấp giáo sư có ‘track record’ trong chuyên ngành, và có nhiều chuyên gia có kinh nghiệm thực tế tốt. Các bạn thử xem cách Viện Doherty của Úc xây dựng mô hình tiên lượng ra sao. Ai cũng có thể xây dựng mô hình, nhưng mô hình có sử dụng hay có ích hay không còn tuỳ thuộc vào uy tín khoa học của người lãnh đạo.

Tôi hình dung ra nhóm nghiên cứu có những ‘tổ’ nhỏ như sau. Tổ chuyên thu thập và đánh giá phẩm chất dữ liệu. Tổ phân tích dữ liệu dịch tễ học và công bố báo cáo thường xuyên cho công chúng biết sự diễn biến của dịch. Tổ chuyên nghiên cứu mô hình dịch tễ học thích hợp nhứt cho Việt Nam; tổ này bao gồm những người có chuyên môn về dịch tễ toán học. Tổ chuyên viết chương trình máy tính và xây dựng website, hỗ trợ tổ phân tích và tổ mô hình. Mỗi tổ có một người đứng đầu và chịu trách nhiệm với trưởng nhóm.

Tóm lại, một mô hình tiên lượng dựa vào rất nhiều giả định và có nhiều tham số mà nhà nghiên cứu không bao giờ có đầy đủ. Ở Việt Nam tình trạng thiếu thốn dữ liệu còn trầm trọng hơn nữa, mà ngay cả có dữ liệu thì chất lượng rất kém. Xây dựng mô hình trên dữ liệu với chất lượng thấp thì kết quả sai là đương nhiên. (Cũng xin nhắc các bạn đừng gởi msg cho tôi nói rằng Việt Nam có đầy đủ dữ liệu. Mất thì giờ. Không có đâu. Loại dữ liệu cần cho mô hình không phải là dữ liệu hành chánh). Tôi nghĩ hướng đi, nếu ai còn tha thiết, cho tương lai có lẽ là:

(1) Hợp tác. xây dựng một mô hình tiên lượng là một việc làm rất khó khăn, đòi hỏi sự đóng góp của nhiều người có kinh nghiệm cao, và cần thời gian để thử nghiệm trước khi triển khai. Không thể và không nên xây dựng những mô hình theo ý mình (đa số giới khoa học là vậy) mà nên mô hình theo hiện tượng thực tế.

(2) Dữ liệu. Mô hình nào cũng cần dữ liệu với phẩm chất cao, bởi vì dữ liệu hay đầu vào là rác thì đầu ra của mô hình cũng là rác rưởi mà thôi (Garbage in, Garbage out). Do đó, cần phải có hệ thống thu thập dữ liệu cho thật tốt để phục vụ cho phân tích, và điều này thì tôi đã có đề nghị cụ thể trước đây [8].

(3) Mô hình chỉ là tham khảo. Tất cả các mô hình tiên lượng và dự báo không bao giờ được xem là ‘sự thật’ hay ‘fact’, bởi vì các mô hình này dựa vào nhiều giả định và phán xét của tác giả. Do đó, lệ thuộc vào mô hình để ra chánh sách là một sai lầm nguy hiểm.

(4) Khiêm tốn. Trong dịch tễ học người ta có câu hiểu nôm nà là “không có mô hình toán học nào có thể xác định được diễn biến của dịch, chỉ có con virus quyết định diễn biến của dịch.” Điều này có nghĩa là mô hình phải có yếu tố ‘Vô Thường’, hiểu theo nghĩa uyển chuyển thích ứng với tình huống mỗi ngày. Quên câu nói này có thể dẫn đến nhiều hậu quả khó lường.

Trong khi chờ mô hình Việt Nam, các bạn có thể dùng mô hình của Úc để có một cái nhìn ngắn hạn về diễn biến dịch ở Việt Nam tại đây:

https://covid19forecast.science.unimelb.edu.au

Các mô hình phòng ngừa dịch bệnh: Khoa học mạng lưới

Các mô hình phòng ngừa dịch bệnh: Khoa học mạng lưới

(Nguồn: https://tiasang.com.vn/)

10/06/2020 07:35 – Nguyễn Quang

Covid-19 không chỉ làm xáo trộn cuộc sống của từng cá nhân mà còn làm thay đổi cách mỗi quốc gia ứng phó với dịch bệnh. Ở khía cạnh này, chúng ta có thể áp dụng thêm một công cụ mới, khoa học mạng lưới để tạo ra các mô hình phòng ngừa dịch bệnh hiệu quả.

Các mô hình lan truyền dịch bệnh từng được Kermack và McKendrick phát triển đầu tiên vào năm 1927 dựa trên lý thuyết trường trung bình động1, các mô hình lan truyền dịch bệnh đầu tiên đã được ứng dụng rộng rãi trong thực tế. Mô hình này dựa trên giả thuyết cơ bản là mỗi cá nhân có thể tương tác với tất cả các cá nhân khác trong xã hội một cách ngẫu nhiên với xác suất giống nhau. Do vậy xác suất bị nhiễm bệnh hay khỏi bệnh của mỗi cá nhân cũng giống nhau và chỉ phụ thuộc vào trạng thái chung của cả xã hội. Bằng cách viết các phương trình cho cá nhân, chúng ta có thể suy rộng ra tỷ lệ trung bình chung cho cả xã hội. Trong phần thứ nhất về khoa học mạng lưới (Tia Sáng số 10/2020), chúng ta đã bàn tới mô hình cổ điển, phần này chúng ta cùng bàn về ứng dụng của khoa học mạng lưới trong việc mô phỏng quá trình lan truyền dịch bệnh.

Mô hình lan truyền cổ điển

Khi áp dụng khoa học mạng lưới để lập các mô hình lan truyền cổ điển, chúng ta đã coi xã hội như một tập hợp N các nhân có thể ở trong một số trạng thái xác định là có khả năng mắc bệnh (Susceptible – ký hiệu S), nhiễm bệnh và có thể lây cho người khác (Infected – ký hiệu I), không còn khả năng mắc bệnh (Removed hay Recovered – đã chữa khỏi và không bị nhiễm lại nữa hoặc đã chết ký hiệu R).

Đây là những yếu tố nền tảng để chúng ta có thể thiết lập nhiều biến thể của mô hình, trong đó hai mô hình phổ biến nhất là SIS (Susceptible-Infected-Susceptible) và SIR (Susceptible-Infected-Removed).

Với mô hình SIS, mỗi cá nhân chỉ có thể có 2 trạng thái là S (khỏe mạnh) hoặc (nhiễm bệnh) và được khởi đầu ở trạng thái S.

Nếu ở trạng thái S, mỗi cá nhân thì có thể bị nhiễm bệnh và do đó nhanh chóng chuyển sang trạng thái I với xác suất α trong một đơn vị thời gian tỷ lệ. Xác suất này lại tỷ lệ với số người nhiễm bệnh I chia cho tổng số người N,

Có thể viết lại

với β là tỷ lệ nhiễm bệnh (infection rate).

Nếu ở trạng thái I, mỗi cá nhân có thể được chữa khỏi và chuyển sang S với xác suất μ trong một đơn vị thời gian, với giả thuyết việc chữa bệnh được áp dụng như nhau cho mọi người bệnh.

Kết hợp lại, chúng ta có thể mô tả quá trình động lực của số nhiễm bệnh (I) và khỏe mạnh (S) bằng các phương trình vi phân (xem 4.1 ở phụ lục) và giải được kết quả (Hình 1). Có thể thấy số bị lây nhiễm (màu nâu) sẽ tăng theo tốc độ hàm mũ trong giai đoạn đầu cho đến khi đạt điểm bão hòa và đi ngang. Khi đó số lượng khỏi bệnh bằng số lượng nhiễm mới và trạng thái cân bằng với số bị nhiễm rất cao.


Hình 1: Kết quả giải hệ SIS – nguồn: https://www.cim.pt/

Trong thời gian diễn ra đại dịch, chúng ta còn biết thêm khái niệm R0, hay còn gọi là hệ số lây nhiễm cơ bản và được tính bằng công thức

có thể hiểu đây là tỷ lệ nhiễm trên tỷ lệ chữa khỏi. Kết quả lan truyền dịch bệnh phụ thuộc vào hệ số R0 như sau: nếu R0>1 thì dịch bệnh sẽ bùng phát (như trong hình trên); nếu R0<1 thì dịch bệnh sẽ tự tiêu biến; nếu R0=1 thì dịch bệnh ở trạng thái dừng đặc hữu (endemic). Để ngăn ngừa dịch bệnh một mặt chúng ta hạn chế lây nhiễm (giảm β), mặt khác tích cực tăng khả năng chữa trị cho người bệnh (tăng μ).

Mô hình phổ biến thứ hai là SIR. Trong mô hình này, một cá nhân từ S có thể bị nhiễm bệnh và chuyển sang I, sau đó cá nhân từ I có thể được chữa khỏi (và không thể lây nhiễm tiếp) hoặc chết đi và chuyển sang R. Cơ chế của mô hình SIR tương tự như SIS, trong đó có thêm trạng thái R (trong SIS thì R ẩn trong S). Kết quả của SIR được giải từ các phương trình vi phân (xem 4.2 ở phụ lục) như sau (Hình 2).


Hình 2: Kết quả giải hệ SIR – nguồn: https://www.cim.pt/

Số lượng bị nhiễm bệnh (màu đỏ) tăng mạnh trong giai đoạn đầu nhưng sau đó đạt đỉnh và đi xuống dần. Số lượng được chữa khỏi tăng tương ứng và bão hòa. Trong giai đoạn cuối, số lượng người khỏe còn quá ít và số lượng bị nhiễm mới giảm theo và tiến gần về 0. (những người chữa khỏi không có khả năng mắc thêm nữa, hoặc đã chết).

Nhìn chung, kết quả từ hai mô hình cổ điển SIS và SIR cho thấy trong giai đoạn đầu, tỷ lệ nhiễm (cho SIS) và chết (cho SIR) sẽ tăng theo hàm mũ và đạt ngưỡng bão hòa sau một thời gian. Ngưỡng này thường sẽ rất cao lên đến nhiều chục % trong dân số nếu không có biện pháp phòng ngừa hiệu quả. Nếu xảy ra tình trạng này thì số lượng người khỏe còn quá ít và số lượng nhiễm rất cao và ổn định vì số lượng nhiễm mới bằng số lượng khỏi (βS=μI). Đây chính là trạng thái miễn dịch cộng đồng.

Mô hình lan truyền theo mạng lưới

Dù các mô hình cổ điển về lan truyền dịch bệnh hiệu quả trong quá khứ nhưng một thế giới mới với những tương tác xã hội ngày một phức tạp và mở rộng đòi hỏi những mô hình mới.

Các giả thuyết cho mỗi cá nhân giống nhau và giao tiếp ngẫu nhiên đều trong toàn xã hội của các mô hình cổ điển còn khá đơn giản. Trên thực tế, mỗi người có mạng lưới tương tác xã hội của riêng mình. Phần lớn các cá nhân chỉ tương tác với một số lượng hạn chế người khác, trong khi đó có một phần nhỏ cá nhân tương tác với rất nhiều người khác. Dựa trên mô hình mạng lưới, Diekmann2 cho rằng, hệ số lây nhiễm cơ bản R0 cần phải điều chỉnh tính đến cấu trúc của mạng lưới tương tác.

Mạng lưới tương tác xã hội cũng giống như nhiều mạng lưới phức hợp khác (complex networks) với nhiều đặc trưng riêng biệt, trong đó các quan trọng nhất về cấu trúc sự phân bố của bậc theo hàm mũ và tính phân nhóm (mạng tương tác xã hội thường phân cụm thành những nhóm riêng biệt. Phần lớn các cá nhân chỉ tương tác với những cá nhân trong cùng một nhóm, một phần nhỏ các cá nhân tương tác với những cá nhân trong nhiều nhóm khác nhau. Các cá nhân này mang tính liên kết rất cao và có thể, nhưng không nhất thiết, là các cá nhân có bậc cao hoặc rất cao) (Hình 3).


Hình 3: Một mạng lưới xã hội với tính phân nhóm cao – nguồn: [3]

Để mô phỏng cho sự phân bố kết nối khác nhau trong quá trình lan truyền dịch bệnh, Pastor-Satorras và Vespignani (2001) đề xuất4 xét những cá nhân có cùng số bậc tương tác k thì có xác suất nhiễm bệnh giống nhau, còn không thì sẽ khác nhau và tỷ lệ theo số bậc k này. Tiếp đó các tác giả kế thừa trên lý thuyết trường trung bình động cho mỗi giá trị k và phát triển thành mô hình trường trung bình theo bậc (degree-based mean-field theory DBMF). Phương trình vi phân được điều chỉnh lại cho mỗi giá trị bậc k (xem 4.3 ở phụ lục) và có thể giải một cách xấp xỉ bởi phương pháp phân tích trung bình tuyến tính [6] (lời giải chính xác không khả thi). Kết quả chính của mô hình này là điều kiện xảy ra bùng phát dịch (điểm tới hạn) nếu:


(<> là ký hiệu của kỳ vọng, giả thiết các nút không tương quan (uncorrelated network)).

có nghĩa là hệ số lây nhiễm cơ bản của mạng lưới sẽ bằng tỷ lệ trung bình của bậc và trung bình của bình phương bậc.

Hình vẽ trên (bên trái) là một ví dụ một mạng xã hội nhỏ gồm 6005 nút với các thông số mạng là:

=7.15

<k2>=79</k

/<k2>=0.012</k

Giả sử tỷ lệ chữa khỏi μ=0.4 thì xác suất nhiễm bệnh khi tiếp xúc β cần phải dưới giá trị μ/<k2> = 0.4≈0.012 ≈ 0.5% và rất không khả thi. (Hình 4+5).Tuy nhiên nếu chúng ta hạn chế các tương tác (cách ly xã hội) thì số cạnh trên mạng lưới sẽ giảm đi và các thông số mới trở thành:</k

=1.27=1.27

=3.45=3.45

/<k2>=0.289=0.289</k

Figure 4+5: Một mạng lưới xã hội với phân bố bậc dạng hàm mũ và tính phân nhóm cao ở trạng thái ban đầu (bên trái) và trạng thái cách ly (hạn chế tương tác/giảm số cạnh – bên phải) nguồn: [3]

Cũng với tỷ lệ chữa khỏi μ=0.4 thì xác suất nhiễm bệnh khi tiếp xúc β cần phải dưới giá trị mới là μ/<k2> = 0.4 ≈ 0.289 ≈ 11.5%. Xác suất này dễ đạt được hơn và cao hơn ngưỡng trước khi cách ly hơn 20 lần.</k

Bên cạnh phương pháp lấy trung bình theo bậc nói trên, chúng ta có thể mô phỏng trực tiếp quá trình lây lan theo từng đỉnh và cạnh. Phương pháp này đặc biệt có ích nếu tính đến tính phân nhóm và các tính chất đa dạng khác của mạng tương tác xã hội thực tế (mà các mô hình lý thuyết không mô tả hay giải được).

Điểm mạnh của phương pháp mô phỏng trên mạng lưới là chúng ta có thể lường trước được ảnh hưởng của các yếu tố của mạng lưới, ví dụ như tính phân nhóm hay sự phản ứng khác nhau của mỗi cá nhân khi tiếp xúc người bệnh. Đây là các yếu tố thực tế nhưng rất khó đưa vào mô hình giải tích để giải tường minh.

Ngoài ra, với mạng lưới, chúng ta cũng có thể mô phỏng các hành động ngăn ngừa dịch bệnh cụ thể hơn, ví dụ như: ngăn chặn cả một nhóm, ngăn chặn bằng dò đường ngẫu nhiên, ngăn chặn theo cường độ tương tác… Từ đó có thể đưa ra các số liệu hỗ trợ cho các quyết định phòng ngừa nhằm tối ưu hiệu quả của tác động hoặc giảm thiểu chi phí cho một mục tiêu xác định.

Điểm thuận lợi lớn nhất khi chúng ta áp dụng những mô hình này là máy tính và dữ liệu xã hội đều đang sẵn có, do đó các phương pháp mô phỏng trên mạng lưới sẽ càng trở nên có nhiều ưu thế so với các cách tiếp cận truyền thống trong mô phỏng lan truyền bệnh dịch, không chỉ trong Covid-19 mà còn trong tương lai. □

———————–&&&———————–

Tìm hiểu về một Mô hình dự báo dịch Covid-19 từ Vũ Hán

Tìm hiểu về một Mô hình dự báo dịch Covid-19 từ Vũ Hán

(Tác giả: Nguyễn Hoàng Thạch và Phan Thị Hà Dương – Nguồn: http://vinif.org)

Giới thiêu: Chúng tôi trình bày và giải thích về một mô hình dự báo ngắn hạn và dài hạn (gọi tắt là mô hình SEIR-C19) của việc lây lan dịch bệnh Covid-19 từ Vũ Hàn đến các tỉnh của Trung Quốc và quốc tế. Mô hình này do các tác giả GS. TS. Joseph T Wu, TS. Kathy Leung, GS. TS. BS. Gabriel M Leung (Trung tâm Hợp tác của WHO về Nghiên cứu dịch bệnh và Kiểm soát Bệnh truyền nhiễm, Khoa Y tế công cộng, Trường Y Li Ka Shing, Đại học Hồng Kông, Hồng Kông, Trung Quốc) thực hiện, và đăng trên tạp chí Lancet, xuất bản trực tuyến ngày 31/01/2020.

https://doi.org/10.1016/S0140-6736(20)30260-9

Mô hình cơ bản nhất về dịch bệnh là mô hình SIR của Kermack và McKendrick từ năm 1927 [1] và đã có rất nhiều biến thể của mô hình này cho các dịch bệnh khác nhau. Điểm đáng chú ý của mô hình SEIR của Wu et al. là đã xét những yếu tố sau:

  • Có quá trình phơi nhiễm trước khi nhiễm bệnh.
  • Nguồn bệnh từ người bệnh và cả từ động vật.
  • Xét đến số lượng người di chuyển giữa Vũ Hàn và các vùng khác: vùng lân cận Vũ Hán và các vùng xa hơn.

Kết quả của mô hình được giới chuyên môn và nhiều bài báo chú ý được tóm lược như sau.

Kết quả: Trong kịch bản cơ sở, chúng tôi ước tính rằng hệ số lây nhiễm cơ bản của Covid-19 là 2,68 (CrI 95%: 2,47-2,86) và ở Vũ Hán tính đến 25/01/2020 đã có 75.815 người bị nhiễm (CrI 95%: 37.304-130.330). Thời gian tăng gấp đôi của dịch là 6,4 ngày (CrI 95%: 5,8-7,1). Chúng tôi ước tính rằng trong kịch bản cơ sở, số người bị lây nhiễm từ Vũ Hán ở Trùng Khánh, Bắc Kinh, Thượng Hải, Quảng Châu và Thâm Quyến lần lượt là 461 (CrI 95%: 227-805), 113 (57-193), 98 (49-168), 111 (56-191) và 80 (40-139). Nếu khả năng lây nhiễm của Covid-19 là giống nhau ở các địa phương và các thời điểm khác nhau, chúng tôi kết luận rằng dịch đã phát triển theo cấp số nhân ở nhiều thành phố lớn của Trung Quốc, với thời gian trễ (lag time) từ 1 đến 2 tuần so với sự bùng phát ở Vũ Hán.

Bài viết này chia làm hai phần:

  • Phần 1: giới thiệu về mô hình dịch bệnh kinh điển SIR: giải thích và một số mô hình liên quan.
  • Phần 2: mô hình SEIR-C19: chi tiết cách xây dựng mô hình, lấy số liệu, và kết quả của mô hình.

Phần 1: Mô hình dịch bệnh SIR

Mô hình SIR là một mô hình toán học cơ bản về dịch bệnh, được giới thiệu trong bài báo kinh điển của Kermack và McKendrick [11]. Trong mô hình này, dân số được chia thành 3 nhóm, dựa theo trạng thái đối với bệnh: 1) những người có khả năng mắc bệnh (Susceptible), 2) những người đang nhiễm bệnh và có thể lây cho người khác (Infected), và 3) những người không còn khả năng mắc bệnh (Removed hay Recovered). Trong mô hình này, trạng thái của một người chỉ có thể chuyển từ S sang I (nhiễm bệnh), hoặc từ I sang R (bình phục hoặc chết, nhưng không thể nhiễm lại).

Số người thuộc mỗi nhóm tại một thời điểm t được ký hiệu lần lượt là S(t)I(t) và R(t). Trong mô hình SIR đơn giản, tổng dân số được coi là không đổi, có nghĩa S(t) + I(t) + R(t) = N không phụ thuộc vào t. Đại lượng được quan tâm nhất là I(t): chiều tăng hay giảm (theo t) và độ lớn của nó cho biết xu hướng lây lan và quy mô của dịch bệnh.

Khi dân số N “đủ lớn”, sự vận động của hệ SIR có thể được xấp xỉ bằng hệ phương trình vi phân sau:

Các phương trình lần lượt biểu diễn tốc độ thay đổi (vế trái) của các đại lượng Svà R tại thời điểm theo trạng thái của hệ tại thời điểm đó (vế phải). Tham số β biểu diễn tỷ lệ lây nhiễm (theo đầu người), có thể được hiểu là xác suất (trung bình) để một người khỏe mạnh bị nhiễm bệnh (chuyển từ S sang I). Tham số γ biểu diễn tỷ lệ hồi phục, nói cách khác, khoảng thời gian mắc bệnh trung bình (tức là ở trong trạng thái I) là 1/γ.

Hệ số lây nhiễm cơ bản (R0)

Một trong những đại lượng quan trọng nhất đối với một mô hình dịch bệnh là hệ số lây nhiễm cơ bản, hay thường gọi là “hệ số R0”. Nếu R0 < 1, dịch sẽ tắt trước khi kịp bùng phát, còn nếu R0 > 1, dịch sẽ bùng phát. Thí dụ, trong mô hình SIR đơn giản ở trên, R0 = βN/γ, trong đó βN là số người khỏe mạnh trung bình mà một người mắc bệnh có thể lây cho trong khoảng thời gian mắc bệnh 1/γ [12, chương 2]. Một cách trực giác, điều này khá hợp lý: nếu trung bình một người mắc bệnh lây cho nhiều hơn một người thì số người mắc bệnh phải tăng (theo cấp số nhân), còn nếu trung bình một người mắc bệnh lây cho ít hơn một người khác thì số người mắc bệnh phải giảm dần.

Các mô hình tương tự

Trong mô hình SIR, một người sau khi khỏi bệnh không có nguy cơ mắc bệnh lại (không thể chuyển từ R sang S), do đó mô hình này thích hợp với những bệnh tạo thành miễn dịch sau khi khỏi. Với những bệnh không tạo thành miễn dịch hoặc chỉ có miễn dịch tạm thời, các mô hình SIS và tương ứng là SIRS sẽ được sử dụng. Các mô hình SEIR (dùng trong bài báo về Covid-19) và SEIS được sử dụng trong trường hợp khoảng thời gian mắc bệnh được chia thành hai giai đoạn nhỏ: chưa có khả năng lây cho người khác (Exposed – phơi nhiễm) và có khả năng lây cho người khác (Infected hay Infective). Những mô hình phức tạp hơn có thể tính đến nhiều yếu tố ngoài dịch bệnh ảnh hưởng đến dân số như tỷ lệ sinh, tỷ lệ chết tự nhiên, sự di cư, nhập cư giữa vùng có dịch và bên ngoài hoặc giữa các vùng có dịch với nhau, v.v.

Thí dụ, trong bài báo về dịch Covid-19 ở Vũ Hán, các tác giả đã sử dụng một mô hình SEIR (với một hệ thống ký hiệu hơi khác để phù hợp hơn với dữ liệu đầu vào) và có tính đến yếu tố di chuyển, cũng như nguồn lây nhiễm từ bên ngoài (động vật). Tham số γ trong đó chính là 1/DI, tham số tương tự cho E(t) là 1/DE, còn tỷ lệ lây nhiễm là β = R0/(NDI).

Mô hình và kết quả mô phỏng

Việc giải ra công thức chính xác của I(t) theo t là hầu như không thể. Thay vào đó, người ta thường tìm lời giải số, với sự trợ giúp của máy tính. Tính hợp lý của mô hình được kiểm nghiệm bằng tính phù hợp của kết quả của mô phỏng với dữ liệu đã có, cũng như tính chính xác của các dự báo cho tương lai. Tuy nhiên, kết quả của mô phỏng có thể nhạy cảm với độ chính xác của dữ liệu đầu vào và đặc biệt là các giả định và tham số. Hai yếu tố sau đòi hỏi hiểu biết rõ về căn bệnh đang được nghiên cứu, do đó việc tìm ra một mô hình phù hợp cho một bệnh mới (như bệnh viêm phổi do Covid-19) luôn là một thách thức lớn.

Phần 2: Mô hình SEIR-C19 mô phỏng dịch Covid-19 ở Vũ Hán.

  1. Mô hình và giải thích mô hình.

Mô hình: có nguy cơ – phơi nhiễm – nhiễm – hồi phục (SEIR) mô phỏng dịch ở Vũ Hán kể từ khi nó bắt đầu vào tháng 12/2019:

Các tham số và các biến:

  • S(t) số người khỏe, E(t) số người phơi nhiễm, I(t) số người nhiễm ở thời điểm t,
  • R(t) số người đã khỏi hoặc đã chết ở thời điểm t,
  • DE thời gian phơi nhiễm trung bình,
  • DI thời gian nhiễm trung bình,
  • R0 hệ số lây nhiễm cơ bản; trung bình một người nhiễm có thể lây cho bao nhiêu người, làm cho họ bị phơi nhiễm (trong toàn bộ thời gian nhiễm bệnh của người đó),
  • zt là nguồn lây nhiễm từ động vật, bằng 86 ca mỗi ngày trong kịch bản cơ sở trước khi chợ hải sản đóng cửa ngày 01/01/2020 và bằng 0 sau đó.
  • LW,I(t) (tương ứng, LW,C(t)): số người từ Vũ Hán đến vùng lân cận (đến các thành phố khác).
  • LI,W(t) (tương ứng, LC,W(t)): số người đến Vũ Hán từ vùng lân cận (từ các thành phố khác).

Ý nghĩa các tham số và các biến

  • Một người khỏe (S) sẽ có thể bị phơi nhiễm (E) khi gặp một người nhiễm (I) (với hệ số R0 /N) hoặc khi gặp động vật,
  • Một người phơi nhiễm (E) sẽ có khả năng bị nhiễm (I), trung bình sau DE ngày,
  • Một người nhiễm (I) sẽ có khả năng khỏi hoặc chết (R), trung bình sau DI ngày.
  • Tốc độ hổi phục thường được gọi là ɤ = 1/ DI,
  • Tốc độ lây lan thường được gọi là β = ɤ R0 / N = R0 / NDI.

Hệ phương trình

 

Giải thích các Phương trình:

Phương trình 3: I(t) số người bị nhiễm, và dI(t)/dt thể hiện số người bị nhiễm thêm ở ngày thứ t: (nếu quy ước đơn vị là ngày, dt= 1), thì dI(t)= I(t+1) – I(t). Đại lượng này được tính dựa trên 3 yếu tố:

  • Tăng: số người bị phơi nhiễm trở thành bị nhiễm sau ngày t = số người bị phơi nhiễm ở ngày t chia cho số ngày bị phơi nhiễm = E(t)/ DE
  • Giảm: số người bị nhiễm đã khỏi (hoặc chết) sau ngày t = số người bị nhiễm ở ngày t chia cho số ngày bị nhiễm = I(t)/ DI
  • Giảm: số người bị nhiễm đi khỏi Vũ Hán (đến các vùng lân cận LW,I(t), hoặc đến các thành phố khác LW,C(t)): tính tổng số người này nhân với tỷ lệ nhiễm I(t)/N: vậy là (LW,I(t)/N + LW,C(t)/N) I(t).

Phương trình 2: E(t) thể hiện số người bị phơi nhiễm, và dE(t)/dt thể hiện số người bị nhiễm thêm ở ngày thứ t: nghĩa là E(t+1) – E(t). Đại lượng này được tính dựa trên các yếu tố:

  • Tăng: Số người khỏe (có khả năng phơi nhiễm) trở nên phơi nhiễm = Khả năng người khỏe (S(t)/N) gặp nguồn bệnh, gồm:
    • Từ người nhiễm: hệ số lây nhiễm * người nhiễm chia số ngày bị nhiễm: R0* I(t)/ DI
    • Từ động vật: z(t)
  • Giảm: Số người phơi nhiễm trở thành nhiễm: E(t)/ DE Giảm: số người bị phơi nhiễm đi khỏi Vũ Hán (đến vùng lân cận LW,I(t), hoặc đến thành phố khác LW,C(t)): tính tổng số người này nhân với tỷ lệ phơi nhiễm E(t)/N: vậy là (LW,I(t)/N + LW,C(t)/N) E(t).

Phương trình 1: S(t) thể hiện số người khỏe (có nguy cơ bị nhiễm), và dS(t)/dt thể hiện số người bị nhiễm thêm ở ngày thứ t: nghĩa là S(t+1) – S(t). Đại lượng này được tính dựa trên các yếu tố:

  • Giảm: Số người khỏe (có khả năng phơi nhiễm) trở nên phơi nhiễm S(t)/N (R0 I(t)/ DI + z(t) )
  • Tăng: số người có khả năng phơi nhiễm đến khỏi Vũ Hán (từ các vùng lân cận LW,I(t), hoặc từ các thành phố khác LW,C(t)): LI,W(t) + LC,W(t)
  • Giảm: số người có khả năng phươi nhiễm đi khỏi Vũ Hán (đến các vùng lân cận LW,I(t), hoặc đến các thành phố khác LW,C(t)): tính tổng số người này nhân với tỷ lệ nhiễm S(t)/N: vậy là (LW,I(t)/N + LW,C(t)/N) S(t).

Sau đây là cách ước lượng hệ số lây lan R0.

Giả định thói quen di chuyển không bị ảnh hưởng bởi bệnh dịch, do đó sự lây lan ra quốc tế xảy ra theo một quá trình không thuần nhất với tốc độ

Từ đó, kỳ vọng của số ca lây ra quốc tế vào ngày d là

Hàm khả năng [likelihood function] là

 

Ước lượng R0 bằng phương pháp Monte Carlo xích Markov với phép lấy mẫu Gibbs và xác suất tiên nghiệm không có thông tin [non-informative flat prior]. Với mỗi R0 nhận được từ phân phối hậu nghiệm, sử dụng cùng mô hình SEIR để ước lượng quy mô bùng phát dịch ở Vũ Hán và phân phối xác suất của số ca lây nhiễm đến các thành phố khác trong Trung Quốc đại lục (dựa trên phân phối điểm đến tính từ cơ sở dữ liệu di chuyển của Tencent). Các giá trị ước lượng là giá trị trung bình hậu nghiệm, và tính bất định thống kê được biểu diễn bằng các khoảng tin cậy 95%.

  1. Số liệu:
  • Dữ liệu về số ca lây nhiễm từ Vũ Hán tới các quốc gia: từ 31/12/2019 đến 28/01/2020 (phát hiện triệu chứng từ ngày 25/12/2019 đến ngày 19/01/2020) để tính số người bị nhiễm ở Vũ Hán từ ngày 01/12/2019 đến ngày 25/01/2020. Sau đó, chúng tôi ước lượng số ca lây nhiễm từ Vũ Hán sang các nơi khác ở Trung Quốc.
  • Dự báo sự lây lan của 2019-nCoV ở Trung Quốc và trên toàn thế giới, có tính đến tác động của việc phong tỏa Vũ Hán và các thành phố lân cận từ ngày 23-24/01/2020.
  • LW,I(t), LW,C(t), LI,W(t), LC,W(t) :dữ liệu đặt vé máy bay hàng tháng của Official Aviation Guide và dữ liệu di chuyển của dân ở hơn 300 thành phố Trung Quốc đại lục từ cơ sở dữ liệu Tencent.
  • I(t): theo báo cáo đã công bố của Trung tâm Kiểm soát và Phòng ngừa Dịch bệnh Trung Quốc.
  • DI , DE: ước lượng theo các nghiên cứu về (SARS-CoV).
  • R0: được ước lượng bằng các phương pháp Monte Carlo xích Markov và được biểu diễn bằng giá trị trung bình hậu nghiệm và khoảng tin cậy (CrI) 95%.
  1. Kết quả

Hình 2 tóm tắt các ước lượng về R0 và quy mô bùng phát dịch ở Vũ Hán tính đến 25/01/2020. Trong kịch bản cơ sở, ước lượng R0 là 2,68 (CrI 95%: 2,47 – 2,86) với khoảng thời gian nhân đôi của dịch bệnh là 6,4 ngày (CrI 95%: 5,8 – 7,1). Ước tính có 75815 người (CrI 95%: 37304 – 130330) đã nhiễm virus ở Vũ Hán và khu vực lân cận tính đến 25/01/2020. Ước tính số ca nhiễm mang từ Vũ Hán đến Trùng Khánh, Bắc Kinh, Thượng Hải, Quảng Châu và Thâm Quyến lần lượt là 461 (227 – 805), 113 (57 – 193), 98 (49 – 168), 111 (56 – 191) và 80 (40 – 139) (hình 3). Các thành phố Bắc Kinh, Thượng Hải, Quảng Châu và Thâm Quyến chiếm 53% lượng bay quốc tế từ Trung Quốc và 69% lượng bay quốc tế ra khỏi châu Á, trong khi Trùng Khánh có 32 triệu dân và có lượng giao thông đường bộ rất cao với Vũ Hán. Sự lây lan nhanh chóng của dịch ở các thành phố này sẽ góp phần khiến 2019-nCoV lan rộng trong và ngoài Trung Quốc đại lục.

Hình 2: Phân phối hậu nghiệm các ước lượng hệ số lây nhiễm cơ bản và quy mô dịch ở Vũ Hán và khu vực lân cận.

Ước lượng tính đến thời điểm 25/01/2020. Chỉ tính số ca biểu hiện triệu chứng hoặc có khả năng lây nhiễm. Số ca ở đây nhỏ hơn tổng số bị nhiễm vì một số người đã nhiễm nhưng còn trong thời gian ủ bệnh. Chúng tôi giả định người bệnh không có khả năng lây trong thời gian ủ bệnh (nghĩa là tương tự SARS-CoV [2]). PDF=probability density function (hàm mật độ xác suất). FOI=force of infection (nguồn lây nhiễm).

Hình 3: Ước lượng số ca lây nhiễm từ Vũ Hán đến các thành phố Trung Quốc có lượng di chuyển từ Vũ Hán lớn nhất

Ước lượng tính đến thời điểm 26/01/2020. Dữ liệu là trung bình hậu nghiệm với khoảng tin cậy 95%.

Nếu nguồn lây nhiễm từ động vật ban đầu ở Vũ Hán cao hơn kịch bản cơ sở 50% và 100%, thì các giá trị tương ứng của R0 lần lượt là 2,53 (CrI 95%: 2,32 – 2,71) và 2,42 (2,22 – 2,60). Ước lượng số ca nhiễm tương ứng ở Vũ Hán sẽ giảm lần lượt 38% và 56% so với kịch bản cơ sở. Số ca lây đến Trùng Khánh, Bắc Kinh, Thượng Hải, Quảng Châu và Thâm Quyến cũng giảm tương tự (hình 3).

Trong hình 4 là đồ thị bệnh dịch của Vũ Hán, Trùng Khánh, Bắc Kinh, Thượng Hải, Quảng Châu và Thâm Quyến với R0=2,68 và dưới các giả định khả năng lây nhiễm giảm 0%, 25%, 50% ở tất cả các thành phố, cùng với các giả định giao thông giữa các thành phố giảm 0% và 50% sau khi Vũ Hán bị đóng cửa ngày 23/01/2020. Dịch sẽ tắt dần nếu khả năng lây nhiễm giảm xuống dưới 1 – 1/R0=63%. Ước lượng của chúng tôi gợi ý rằng mức giảm 50% của giao thông giữa các thành phố có ảnh hưởng không đáng kể đối với sự phát triển của dịch bệnh. Chúng tôi dự đoán rằng nếu khả năng lây nhiễm không giảm, dịch ở Vũ Hán sẽ đạt đỉnh vào khoảng tháng 04/2020, và các dịch cục bộ ở các thành phố khác trong Trung Quốc đại lục sẽ đi sau từ 1 đến 2 tuần. Nếu khả năng lây nhiễm giảm 25% ở mọi thành phố trong nước, cả tốc độ phát triển lẫn quy mô của các dịch cục bộ sẽ giảm đáng kể; đỉnh dịch sẽ lùi lại khoảng 1 tháng và quy mô của nó giảm khoảng 50%. Khả năng lây nhiễm giảm 50% sẽ đưa hệ số lây nhiễm của virus xuống 1,3 và dịch sẽ tăng chậm mà không đạt đỉnh trong nửa đầu năm 2020. Tuy nhiên, mô phỏng của chúng tôi cho thấy cô lập hoàn toàn dân chúng cả Vũ Hán và khu vực lân cận có ảnh hưởng không đáng kể đối với chiều hướng tiếp theo của dịch, vì nhiều thành phố lớn ở Trung Quốc đã có hàng chục mầm lây nhiễm (chúng tôi không trình bày những kết quả này vì các đồ thị giống với hình 4). Xác suất để một chuỗi lây nhiễm bắt đầu từ một người kết thúc trước khi gây bùng phát dịch giảm nhanh khi R0 tăng (chẳng hạn xác suất nhỏ hơn 0,2 khi R0>2) [1,3]. Do vậy, với số ca nhiễm bệnh đã có từ Vũ Hán (hình 3), dịch cục bộ có thể đã đang phát triển theo cấp số nhân ở nhiều thành phố lớn của Trung Quốc. Và do Bắc Kinh, Thượng Hải, Quảng Châu và Thâm Quyến chiếm hơn 50% lượng di chuyển hàng không từ Trung Quốc đi quốc tế, các nước khác cũng có nguy cơ có dịch Covid-19 trong nửa đầu năm 2020.

Hình 4: Dự báo dịch bệnh ở Vũ Hán và năm thành phố Trung Quốc khác trong các kịch bản khác nhau về giảm khả năng lây nhiễm và giao thông giữa các thành phố

  1. Thảo luận

Ưu tiên dịch tễ học quan trọng hàng đầu là thiết lập và công bố một danh sách các ca nghi ngờ, có thể, rất có thể và đã xác định nhiễm và những người tiếp xúc gần với họ; danh sách này cần được cập nhật hàng ngày và liên kết với các kết quả lâm sàng và kết quả xét nghiệm. Một danh sách tốt có vai trò cốt yếu để tìm ra các tham số dịch tễ học chính xác làm đầu vào cho các mô hình lây lan, để đưa ra cảnh báo theo tình huống và tối ưu hóa việc đối phó với dịch bệnh [6]. Ngoài ra, do mức độ lây lan và dư luận lo lắng mà Covid-19 đã gây ra, phổ lâm sàng và tính nghiêm trọng của nó cần nhanh chóng được tìm hiểu rõ bằng các phương pháp khách quan và đáng tin cậy trên những mẫu ngẫu nhiên của các ca nhiễm, đặc biệt là những ca có biểu hiện nhẹ hoặc cận lâm sàng.

Những kỹ thuật mô phỏng được sử dụng trong nghiên cứu này rất giống với những kỹ thuật được nhiều đồng nghiệp khác sử dụng với cùng mục đích mô tả sự phát triển của dịch Covid-19 (Zhanwei Du, Đại học Texas Austin, trao đổi cá nhân) [7, 8, 9, 10]. Sự thống nhất về phương pháp này ủng hộ tính đúng đắn của dự báo ngắn hạn và dài hạn của chúng tôi. Một điểm mạnh nữa của nghiên cứu này là các tham số của mô hình dựa trên những dữ liệu mới nhất của OAG và Tencent. Tuy nhiên, nghiên cứu vẫn có một số hạn chế. Thứ nhất, chúng tôi giả định rằng sự di chuyển không bị ảnh hưởng bởi dịch bệnh, và rằng mọi ca nhiễm sớm muộn đều biểu hiện triệu chứng (dù có thể rất nhẹ). Chúng tôi có thể đã đánh giá thấp quy mô bùng phát dịch ở vùng Vũ Hán, nếu những người có nguy cơ bị nhiễm cao lại ít đi ra thế giới hơn, hoặc nếu tỷ lệ các ca nhiễm không biểu hiện triệu chứng là đáng kể. Thứ hai, ước lượng khả năng lây nhiễm và quy mô bùng phát dịch của chúng tôi khá nhạy cảm với những giả định liên quan đến cơ chế lây nhiễm từ động vật dẫn đến dịch ở Vũ Hán.

———————-&&&———————–

Toán học trong Y tế công cộng Việt Nam

Toán học trong Y tế công cộng Việt Nam

(Nguồn: http://tiasang.com.vn/)

Trong số những đóng góp của toán học đối với Y tế công cộng, điều quan trọng nhất không đến từ một chuyên ngành cụ thể nào đó của toán học, cũng không đến từ một phương pháp toán học cụ thể nào đó, mà đến từ chính tư duy toán học.



Thông thường, ở các nước châu Âu và Mỹ, các giảng viên trình độ cao trong ngành Y tế công cộng luôn được đào tạo đại học cơ bản thật vững chắc.


Tư duy toán học

Đã 40 năm làm việc trong hệ thống Y tế công cộng Việt Nam trên nhiều cấp độ và với nhiều vai trò, nhưng thực sự tôi vẫn tự coi mình như một nhà toán học. Do vậy, khẳng định sau đã đến với tôi khá tự nhiên:


Trong số những đóng góp của toán học đối với Y tế công cộng, điều quan trọng nhất không đến từ một chuyên ngành cụ thể nào đó của toán học, cũng không đến từ một phương pháp toán học cụ thể nào đó, mà đến từ chính tư duy toán học.

Tư duy toán học đóng vai trò quan trọng trong việc thực hành các hoạt động Y tế công cộng theo hai cách:

– Định hình việc đào tạo thông qua việc xây dựng chương trình giảng dạy và nội dung của từng môn học một cách logic và có cấu trúc chặt chẽ.
– Giúp cho những người thực hành có khả năng nhận biết được bản chất vấn đề và hành động một cách thích hợp.

Ta hãy xem xét hai cách ảnh hưởng này, qua các ví dụ sau:

Để giảng dạy tốt, các khái niệm quan trọng cần được định nghĩa một cách chính xác. Định nghĩa do các nhà toán học đưa ra luôn chính xác, không mâu thuẫn, thật ngắn gọn và dễ nhớ, phù hợp với đề tài được đề cập và nói chung luôn được các đồng nghiệp cùng ngành chấp nhận. Nhưng trong khoa học y tế thì mọi người không như thế. Cụ thể, có đến vài định nghĩa về Y tế công cộng, mà thật khó phán quyết được các định nghĩa đó có dùng để chỉ cùng một thứ hay không. Định nghĩa do Tổ chức Y tế Thế giới (WHO) đưa ra, chẳng hạn, vừa không chính xác, dài dòng, lại chứa những mâu thuẫn và không thích hợp để giảng dạy môn này.

Ta đã nói rằng tư duy toán học có thể giúp người ta nhận biết được bản chất đúng đắn của các bài toán thực tế và nếu may mắn, người ta sẽ giải được các bài toán đó. Ta sẽ đề cập ngay ở đây một ví dụ nổi bật nhưng có lẽ không nhiều người biết, đó là giáo dục sức khỏe. Ở Việt Nam, Việc Giáo dục sức khỏe trong một cộng đồng nhỏ cũng như trong toàn bộ một tỉnh hoặc một vùng thường chỉ dựa vào một “nhận thức đúng đắn” cho tất cả các vấn đề về sức khỏe. Cũng có khi người xây dựng chương trình dựa vào một số lý thuyết sư phạm rất chung chung. Tuy nhiên các chương trình như vậy thường bỏ qua các tính chất đặc thù của những vấn đề sức khỏe khác nhau. Trong toán học, người ta có thể phát biểu về trường hợp này là: các giả thiết cơ bản của một bài toán chưa được chính xác. Các chương trình thành công phải được xây dựng cụ thể cho từng vấn đề sức khỏe. Hơn nữa, cấu trúc của chương trình giáo dục dành cho mỗi loại bệnh hoặc một vấn đề sức khỏe cũng phải khác nhau. Việc xác định cấu trúc đó và từ đấy chuyển thành các hành động được đảm bảo theo tinh thần toán học, mặc dù điều này ít khi được thực hiện hoặc nói đến. Chương trình giáo dục của nước Đức về bệnh dịch HIV là một ví dụ như vậy [1].


Giám đốc của Viện nghiên cứu Phòng bệnh và Dịch tễ học Leibniz (BIPS), Đức là một nhà toán học xác suất thống kê GS. Iris Pigeot.

Các công cụ toán học cụ thể

Trong Y tế công cộng, chuyên ngành toán học thường được sử dụng nhiều nhất chính là thống kê toán học.


Thống kê đề cập đến các dữ liệu số xét như các phần tử của một tập hoặc của một dãy hay của một sắp xếp khác nào đó các phần tử. Thống kê phân tích các dữ liệu đó một cách toàn bộ chứ không xử lý dữ liệu theo các phần tử riêng lẻ. Thống kê toán học sử dụng các phương pháp cao cấp hơn trong phân tích đó, vượt lên trên bốn phép toán số học cơ bản.


Đối chiếu định nghĩa của Y tế công cộng trong bài trước với định nghĩa về thống kê toán học trên đây, không ngạc nhiên tại sao thống kê toán học lại “thích hợp” với ngành Y tế công cộng đến thế. Đó là công cụ khoa học chính trong hầu hết các bộ môn Y tế công cộng và đóng một vai trò không thể thiếu trong các bộ môn còn lại. Nó xuất hiện trong thực hành Y tế công cộng hằng ngày từ tuyến cơ sở đến tuyến trung ương, từ các bệnh viện lớn đến các trung tâm y tế huyện và tỉnh. Nó cũng là xương sống của mọi nghiên cứu khoa học trong lĩnh vực này, áp dụng ở những điều tra đơn giản của các các trạm y tế xã đơn lẻ cho đến những nghiên cứu lớn do các trường đại học tiến hành.


Hầu như mọi khía cạnh của thống kê toán học đều được sử dụng trong lĩnh vực y tế công cộng. Chúng có thể đề cập đến những tập dữ liệu nhỏ, trung bình hoặc những tập dữ liệu rất lớn. Có thống kê thuần túy mô tả, không ngẫu nhiên, ví dụ như trong các tập Niên giám thống kê và Hệ thống thông tin y tế do các bộ phận quản lý y tế biên tập. Thống kê suy diễn, thường sử dụng các mô hình thống kê (xác suất), nhấn mạnh hầu như tất cả các nghiên cứu về các nhân tố nguy cơ (yếu tố quyết định) đối với các loại bệnh, bằng cách đó trang bị các nền tảng của dự phòng và của tư vấn chung, như trong lĩnh vực di truyền học dân cư. Các mô hình hồi quy tổng quát là những công cụ thường được sử dụng nhất.


Lý thuyết điều tra chọn mẫu
 [2] là nội dung cần thiết cho phần rất lớn của các nghiên cứu trong tất cả 14 lĩnh vực. Nhiều chuyên ngành khác, như lý thuyết chuỗi thời gian, cũng có một vai trò nhất định. Dân số học, một nội dung quan trọng của Y tế công cộng thực chất là một phân ngành của thống kê toán học với các phương pháp của chính nó, được định hướng chủ yếu bằng các bài toán dự báo [3]. Một trong các thủ tục cổ điển của nó, thủ tục qui chuẩn, cũng xuất hiện trong dịch tễ học dưới cái tên khác là hiệu chỉnh, nhưng nhiều nhà dân số học và nhiều nhà dịch tễ học không nhận thức được hai thủ tục đó chính là một.


Thống kê tất nhiên không phải là chuyên ngành toán học duy nhất được sử dụng trong Y tế công cộng. Mỗi bộ môn trong số 14 thành phần của Y tế công cộng được liệt kê trên đây đều sử dụng các mô hình toán học để biểu diễn và nghiên cứu các hiện tượng khác nhau [4]. Các phương pháp đó thực tế đến từ mọi bộ phận của toán học, đặc biệt là từ toán rời rạc, phương trình vi phân, tối ưu, lý thuyết xác suất, giải tích số và khoa học tính toán. Ta hãy nêu ra một vài ví dụ. 


Dịch tễ học, không còn nghi ngờ gì nữa là lĩnh vực mà mô hình hóa toán học được đưa vào trước tiên, cụ thể là ngay từ nửa cuối của Thế kỷ 18 [2]. Nó đã trở thành công cụ không thể thiếu để nghiên cứu và dự báo động lực học, tức là sự tiến triển, của bệnh lây truyền trong dân cư. Mô hình hóa toán học cũng là nền tảng của bộ môn được gọi là “Miễn dịch học quần thể”. Ngày nay không một chương trình tiêm phòng mới nào có thể lên kế hoạch một cách nghiêm ngặt mà thiếu công cụ đó. Hiện thời, việc mô hình hóa động lực của các bệnh không lây truyền đã có nhiều tiến bộ.


Phát triển hệ thống y tế và quản trị y tế sử dụng chủ yếu các mô hình rời rạc và các phương pháp tối ưu. Trong kinh tế y tế bao gồm bảo hiểm y tế người ta áp dụng trang bị cơ sở của toán kinh tế, cũng được gọi là kinh trắc. Các chủ đề mới như các mạng tất định hoặc ngẫu nhiên đóng một vai trò ngày càng lớn trong các lĩnh vực đó.

Các nhà toán học trong Y tế công cộng

Công việc cần làm trong Y tế công cộng ở “bậc cao” có ba dạng:


– Giảng dạy môn học trong trường đại học hoặc trường chuyên ngành.
– Nghiên cứu khoa học cao cấp.
– Thực hành.


Những người đảm nhiệm các vị trí thực hiện cả ba nhiệm vụ trên phải trải qua những điều kiện gì? Trước tiên, ta hãy xem câu hỏi tương tự cho y khoa thay cho Y tế công cộng. Tại Việt Nam một giảng viên ở một môn y khoa, chẳng hạn giải phẫu học hay nội khoa, phải theo học chương trình y khoa cơ sở 6 năm cộng thêm vài năm các học phần lý thuyết hoặc thực hành chuyên khoa. Đó cũng là những yêu cầu để một người tiến hành nghiên cứu y khoa độc lập. Cuối cùng, một giảng viên y khoa sẽ thường được khuyến khích tiếp tục thực hành, tức là trực tiếp điều trị bệnh nhân, thậm chí dù chỉ ở một mức độ thấp. Đến lúc đó anh ta (hoặc cô ta) mới được phép đảm nhiệm vai trò giảng viên, nghiên cứu viên hoặc bác sĩ y khoa.  


Điều đó hoàn toàn đối lập với tình hình của các giảng viên Y tế công cộng trong các trường đại học Việt Nam ngày nay. Nói chung, họ không hề được trải qua những điều kiện chặt chẽ tương tự như vậy. Họ thường không nhận được tập huấn bổ sung nào, một số chỉ phải yêu cầu có bằng cử nhân Y tế công cộng sau khi tốt nghiệp trường phổ thông. Nhiều người không đủ chuyên môn để tiến hành nghiên cứu nghiêm chỉnh. Để thấy điều đó chỉ cần nhìn vào các công bố của họ. Chẳng hạn, việc đánh giá thống kê thường bao gồm một số lượng lớn các xác suất ý nghĩa (p-values) phi lý. Rất ít giảng viên có đủ thời gian và cơ hội để theo đuổi đến cùng một công việc thực hành, nếu có.


Y tế công cộng là một ngành đặc thù đòi hỏi những giảng viên Y tế công cộng phải có kinh nghiệm và năng lực ở cả ba lĩnh vực nghiên cứu, giảng dạy và công tác thực hành. Nếu không, điều này sẽ đem lại hậu quả tồi tệ, không chỉ tới chất lượng của những bác sĩ Y tế công cộng mà cho cả bác bác sĩ Y khoa tương lai (bởi trong giáo trình đào tạo ngành Y cũng có nhiều môn về Y tế công cộng).


Ta hãy nhìn vào các điều kiện tương ứng ở nước ngoài, chẳng hạn ở các nước châu Âu như Đan Mạch, Hà Lan, Pháp hay Đức. Trước tiên ta có thể thấy giảng viên trình độ cao trong ngành Y tế công cộng luôn được đào tạo đại học cơ bản thật vững chắc. Tuy nhiên, họ từng tiếp nhận kiến thức từ một trong tập hợp rất phong phú các lĩnh vực. Nổi bật lên là các nhà toán học và các bác sỹ, song cũng có các nhà xã hội học; nhà kinh tế; nhà giáo dục; nhà dân số học và các loại chuyên gia khác nữa, rất hiếm những người chỉ được học Y tế công cộng. Điều đó phản ánh hiện thực là Y tế công cộng đòi hỏi một cách nhìn bao quát và nhiều mặt, trong khi sự chuyên môn hóa ít được nhấn mạnh hơn so với trong y khoa chẳng hạn.


Những người được đào tạo như vậy sẽ chiếm giữ nhiều vị trí cao cấp trong Y tế công cộng. Họ là giáo sư hoặc giảng viên của các trường đại học. Họ làm việc trong các viện nghiên cứu y tế. Họ có biên chế trong các bệnh viện lớn và các cơ quan quản lý y tế cao cấp. Họ tư vấn cho các cơ sở y tế và cơ quan hành chính các cấp. Họ tham gia lập kế hoạch cho các chương trình y tế công cộng nhiều loại khác nhau như vệ sinh công cộng; phòng bệnh ban đầu và phòng bệnh thứ cấp; chuẩn hóa điều trị trong dân cư; v.v. Họ chiếm giữ vai trò quan trọng trong các tổ chức y tế công cộng và tư nhân với mục tiêu giáo dục sức khỏe và tuyên truyền y tế. 


Trong số những người đó thường có mặt các nhà toán học. Lý do khá hiển nhiên, vì đã đưa ra một loạt các công cụ toán học liệt kê trên đây. Ví dụ về hai người đứng đầu các viện nghiên cứu:


Giám đốc của “Viện nghiên cứu Phòng bệnh và Dịch tễ học Leibniz (BIPS)” ở thành phố Bremen của Đức là một nhà toán học, công việc ban đầu của bà là nghiên cứu lý thuyết xác suất và thống kê toán học. Cơ quan BIPS là một viện nghiên cứu chính của Đức về dịch tễ học các bệnh không lây truyền và ứng dụng. Cơ quan này cũng có chức năng đào tạo quan trọng.


“Viện Sức khỏe và nghiên cứu y học quốc gia (INSERM)” của Pháp tiến hành phần lớn các nghiên cứu y tế cơ bản. Viện này được tổ chức dưới dạng 339 đơn vị nghiên cứu mà hầu hết đặt ngay trong các trường đại học hoặc các bệnh viện. Các đơn vị này thuộc vào một trong 9 bộ môn. Bảy trong số các bộ môn đó thực chất là sinh y, một là công nghệ y tế, và một dành cho Y tế công cộng. Nhiều nhà khoa học của viện này là các nhà toán học, đồng thời một nhà thống kê toán học là giám đốc khoa học của toàn bộ INSERM từ 1982 đến 1996.

Cơ hội của Toán học trong Y tế công cộng tại Việt Nam

Nói chung:


– Các giảng viên Y tế công cộng cần được đào tạo một cách bài bản.
– Ở một số nước châu Âu nhiều người trong số họ ban đầu được đào tạo theo một ngành của các lĩnh vực rất đa dạng và khác hẳn ngành Y tế công cộng, sau đó mới chuyển qua Y tế công cộng.


Biết trước cấu trúc đặc thù và vai trò của Y tế công cộng, đây chắc chắn cũng là con đường mà qua đó các chuyên gia cao cấp trong Y tế công cộng nên được đào tạo tại Việt Nam:


– Ở bậc đại học bình thường đầu tiên được học một chuyên môn cơ bản, đó có thể chính là môn Y tế công cộng mà có thể nâng cấp lên trình độ cao hơn, song cũng có thể là một chuyên môn khác;
– Tiếp đó là chuyên môn hóa ở trong ngành Y tế công cộng.


Ta đã thấy rằng trong số các “chuyên môn khác” đó, toán học là chuyên môn rất phù hợp. Ta hãy nhìn vào sự nghiệp bình thường của một cán bộ ngành toán đã tốt nghiệp một trường đại học ở Việt Nam. Có vẻ như trừ việc có được vị trí nghiên cứu toán học cho một số ít ngoại lệ, họ sẽ trở thành giáo viên dạy toán trong trường phổ thông. Điều đó khá lạ, vì đâu đó trên thế giới cán bộ toán vẫn được săn lùng rất nhiều. Họ có nhiều lựa chọn giữa các vị trí trong công nghiệp, nông nghiệp, thương mại, ngân hàng, bảo hiểm và các cơ quan kinh doanh khác, trong nghiên cứu, và tất nhiên trong Y tế công cộng. Ở Việt Nam cũng thế, có thể dễ dàng thu hút các cán bộ toán giỏi vào Y tế công cộng. Điều đó đồng thời sẽ mở rộng triển vọng thăng tiến cho các cán bộ ngành toán Việt Nam.


Đào tạo toán học tại các trường đại học Việt Nam có trình độ cao, là điều có thể hữu ích cho Y tế công cộng. Việc tập trung thêm vào các môn ứng dụng có thể đem lại hiệu quả. Nhân tiện, chuyển hướng dạy toán theo hướng ứng dụng cũng là điều nên làm trong các trường phổ thông. Để minh họa điều đó, hãy cho phép tôi mô tả công việc giảng dạy trước đây của chính mình tại trường Đại học Paris 5, nơi tôi đã về hưu năm 1998. Khoa toán của trường này ban đầu được thành lập định hướng cho các ngành nhân văn, nhưng sớm được mở rộng thành một khoa toán chung với quan điểm ứng dụng. Cùng với các học phần cơ sở nhấn mạnh tầm quan trọng của công cụ toán học trong ứng dụng, mỗi sinh viên phải chọn thêm một học phần nữa về một lĩnh vực ứng dụng cụ thể. Nhiều lĩnh vực ứng dụng như vậy đã được đề xuất. Từ 1986 đến 1998 tôi đã dạy một môn, là môn “Dịch tễ học và thử nghiệm lâm sàng”. Đó là một học phần lớn, 6 giờ mỗi tuần trong suốt một năm học, một nửa lý thuyết và một nửa thực hành. Nửa sau chủ yếu bao gồm việc sinh viên trình bày các bài báo khoa học đã công bố. Luôn có quãng hơn chục sinh viên, phần lớn là nữ (một năm chỉ có toàn nữ!). Sau khi tốt nghiệp, tất cả sinh viên đó đều nhanh chóng có vị trí trong hệ thống y tế của Pháp.


Tổ chức lại việc tuyển dụng và công việc của giảng viên Y tế công cộng ở các trường đại học Việt Nam theo phác thảo trên đây có thể giúp nâng cao uy tín của ngành Y tế công cộng và của các đại diện của ngành này trong công chúng nói chung. Việc đó có thể đóng góp đáng kể cho việc nâng cao sức khỏe của nhân dân.□

Đoàn Trung Cường – 
Viện Toán học dịch 

——————–&&&———————-