Học máy trong nghiên cứu ung thư vú

Posted on 19.08.2022 by Tuấn Lê

(Nguồn: https://towardsdatascience.com/)

Trong vài năm qua, đã có rất nhiều lời thổi phồng xung quanh việc máy học sẽ biến đổi nhiều ngành công nghiệp như thế nào. Một ngành được nhắc đến thường xuyên là chăm sóc sức khỏe. Trong bài đăng trên blog sau đây, chúng ta sẽ khám phá một loại tác động có thể được thực hiện. Chúng tôi sẽ làm điều này bằng cách kiểm tra một bài báo đã được xuất bản trên tạp chí Nature vào năm 2021. Tên bài báo là Morphological and molecular breast cancer profiling through explainable machine learning.

Bài đăng này sẽ có ba phần: Mục đích của nghiên cứu, Phương pháp / Kết quả của nghiên cứu và Tại sao điều này lại quan trọng đối với Ung thư học và chăm sóc sức khỏe.

&&&&&

Mục đích

Trong lịch sử, đã có sự thiếu tích hợp giữa các kỹ thuật lập hồ sơ khác nhau trong nghiên cứu ung thư học. Điều đó để lại một số kết nối liên quan đến dữ liệu phân tử và dữ liệu hình thái học cho các đặc tính của bệnh ung thư. Các nhà nghiên cứu trong nghiên cứu này đã đặt mục tiêu tạo ra một liên kết thông qua học máy để thu hẹp khoảng cách giữa hai loại kỹ thuật tạo hồ sơ này. Nếu thành công, cách tiếp cận này có thể giúp tạo ra giả thuyết cho các kết nối giữa các loại tế bào và đặc tính phân tử.

Phương pháp / Kết quả

Thuật toán học máy

Phương pháp học máy mà nghiên cứu đã sử dụng dựa trên một kỹ thuật được gọi là lan truyền mức độ liên quan theo lớp (layer-wise relevance propagation – LRP). Truyền bá mức độ liên quan khôn ngoan theo lớp là một loại thuật toán học máy có thể giải thích được. Thay vì chỉ đưa ra đầu ra cho một đầu vào cụ thể, cách tiếp cận có thể làm nổi bật các tính năng đầu vào quan trọng nhất được sử dụng cho đầu ra đã cho. Đối với các tình huống sử dụng hình ảnh, các tính năng được đánh dấu là pixel. Kết quả là một bản đồ nhiệt trên hình ảnh đầu vào cho thấy pixel nào có tác động cao nhất đến việc lắc đầu ra. Các điểm ảnh có cường độ màu cao tương quan với điểm số liên quan cao cho các điểm ảnh được phân loại.

LRP tính toán các thuộc tính giải thích tổng đóng góp của một đối tượng đầu vào hơn là độ nhạy đối với biến thể đầu vào mà bạn sẽ nhận được trong các bản đồ nhiệt chú ý. Để có giải thích kỹ thuật hơn về cách hoạt động của việc truyền mức độ liên quan theo lớp, vui lòng tham khảo bài báo sau: Layer-Wise Relevance Propagation An Overview. .

Ứng dụng của thuật toán

Bây giờ chúng ta đã thảo luận về tổng quan về cách thức hoạt động của sự lan truyền mức độ liên quan theo lớp, chúng ta sẽ khám phá cách nhóm nghiên cứu có thể sử dụng điều này với dữ liệu hình thái ung thư và phân tử ung thư vú.

Đầu tiên, nhóm nghiên cứu đã tạo ra một cơ sở dữ liệu hình ảnh (Berlin Cancer Image Base, B-CIB, B-CIB) với các bản vá dữ liệu hình ảnh hiển vi có chú thích. Sử dụng LRP, nhóm nghiên cứu có thể phân biệt tế bào ung thư với tế bào lympho thâm nhiễm khối u (TiL). TiL là các tế bào lympho có thể xâm nhập vào mô khối u và nhận biết và tiêu diệt các tế bào ung thư. Mật độ hiện diện của chúng có thể được sử dụng như một đặc điểm để dự đoán khả năng sống sót của bệnh nhân. LRP cho phép thể hiện trực quan mật độ của chúng.

Sau đó, các nhà nghiên cứu dự đoán các đặc điểm phân tử bằng cách sử dụng dữ liệu hình ảnh hình thái học làm đầu vào cho thuật toán. Về cơ bản, cố gắng thu thập thông tin chi tiết về các đặc tính phân tử của bệnh nhân bằng cách quét hình ảnh. Dữ liệu được sử dụng để đào tạo bao gồm việc kết hợp dữ liệu hình ảnh và dữ liệu phân tử. Với mục đích của phần này của nghiên cứu và thông tin có sẵn thông qua tập dữ liệu để đào tạo, chú thích không gian thủ công là không cần thiết. Họ có thể yêu cầu thuật toán xác định các mẫu trong hình ảnh bằng cách cung cấp cho nó dữ liệu phân tử và dữ liệu hình thái trong quá trình huấn luyện. Để giảm kích thước của nhiệm vụ phân loại, họ đã sử dụng cách tiếp cận phân loại cao so với thấp cho các đặc điểm phân tử khác nhau. Thuật toán đưa ra phân loại dựa trên dự đoán về việc liệu biểu hiện của một đặc điểm phân tử là cao hay thấp, đưa ra một hình ảnh hình thái học làm đầu vào. Hai gen đạt điểm cao về mức độ biểu hiện là CDH1 và TP53.

Nhóm nghiên cứu cũng đã thử nghiệm với việc dự đoán bản địa hóa không gian của các đặc điểm phân tử. Dự đoán này cho thấy các vùng không gian có liên quan về mặt thống kê với các biểu thức đặc điểm phân tử nhất định. Thông tin này có thể được sử dụng để tạo ra các giả thuyết về mức độ liên quan của các thành phần cụ thể của vi môi trường khối u đối với sự hiện diện của các đặc điểm cấu hình khối u phân tử — thúc đẩy việc khám phá các liên kết tiềm năng có thể tồn tại giữa các đặc điểm mô học của khối u được hiển thị trong hình ảnh và phân tử các tính năng có thể được thể hiện. Các liên kết này có thể dẫn đến danh sách ứng viên được tạo sẵn cho các tính năng phân tử. Những danh sách này sẽ bao gồm các đặc điểm phân tử liên quan đến ung thư vú.

Cuối cùng, phương pháp học máy đã tiết lộ các đặc điểm không gian và hình thái có liên quan về mặt thống kê với các biểu hiện của các đặc điểm phân tử khác nhau. Thông tin này được hiển thị thông qua bản đồ nhiệt hiển thị cách trong hầu hết các trường hợp, các đặc điểm phân tử có mối liên hệ cụ thể với các nhóm hình thái được thử nghiệm (tế bào ung thư, TiL và mô đệm (tế bào hỗ trợ)).

Để kiểm tra tính hợp lệ của các kết quả, nhóm đã sử dụng một kỹ thuật gọi là nhuộm hóa mô miễn dịch (immunohistochemical – IHC) để so sánh kết quả với các bản đồ nhiệt được tạo ra từ thuật toán học máy. Họ đã sử dụng một bài kiểm tra quadrat để chỉ ra mối liên hệ giữa hai loại. Phép thử quadrat có thể được sử dụng để đo độ ngẫu nhiên trong không gian cho một mẫu điểm. Phép thử góc phần tư đo tính ngẫu nhiên trong không gian bằng cách sử dụng phép thử chi bình phương. Nhìn chung, các mẫu IHC phản ánh các mẫu được dự đoán từ thuật toán học máy xác thực phương pháp học máy.

Tại sao

Nghiên cứu mà chúng ta xem xét ngày hôm nay là một ví dụ tuyệt vời về cách học máy có thể được sử dụng cho mục đích nghiên cứu ung thư. Nó không nhất thiết sẽ thay thế các công cụ đã có sẵn, nhưng nó có thể hoạt động bổ sung cho chúng. Một số trường hợp sử dụng cho nghiên cứu ung thư liên quan đến việc tạo giả thuyết thông qua các mẫu mới có thể xuất hiện từ cách tiếp cận dựa trên học máy. Ví dụ về các giả thuyết có thể được tạo ra từ nghiên cứu được khám phá trong bài viết này chủ yếu liên quan đến các mối quan hệ mới được phát hiện giữa các đặc điểm phân tử phi không gian và thông tin không gian. Những mối quan hệ này có thể giúp phân loại khối u tinh tế hơn và danh sách ứng cử viên mới cho các liệu pháp nhắm mục tiêu tiềm năng.

Trong một ngành công nghiệp mà nhận dạng mẫu là rất quan trọng, học máy có thể hoạt động như một ánh sáng hướng dẫn để thúc đẩy khám phá xa hơn.

Filed under: DS & ML & AI |

« Hội thảo: “Phân tích định lượng các vấn đề kinh tế và xã hội trong môi trường số – Lần thứ hai” Mô hình phát hiện cảm xúc khuôn mặt nhằm đánh giá mức độ “hài lòng” của sinh viên Học viện Ngân hàng khi tham gia học trực tuyến »

MFEDE

Chuyên mục

Thẻ

Bài & Trang được đáng chú ý

Bài viết mới