Machine Unlearning là gì?

Machine Unlearning là gì?

(Nguồn: https://www.allerin.com/blog/)

Tất cả chúng ta đều đã nghe nói về Machine Learning (học máy) và các ứng dụng đột phá của nó. Vì vậy, Machine Unlearning là gì và tại sao cần phải có nó? Vâng, trước tiên chúng ta hãy bắt đầu với sự hiểu biết cơ bản về ý nghĩa của nó. Học máy là một loại trí thông minh nhân tạo cho phép máy móc phân tích, học hỏi và thích ứng với môi trường xung quanh, điều này trước đó đã được thực hiện trên một tập dữ liệu hoàn toàn khác. Machine unlearning hoàn toàn ngược lại với nó. Thiết bị có thể giải phóng nội dung đã học bất cứ khi nào cần.

Machine Unlearning: SỰ CẦN THIẾT ĐỐI VỚI NÓ

Rất nhiều dữ liệu lớn bùng nổ trong các tổ chức và dữ liệu này giúp các thuật toán học máy học cách hoạt động trong môi trường mới. Tuy nhiên, đôi khi chúng tôi muốn hệ thống của mình không học các tài sản kỹ thuật số này vì một số lý do. Thứ nhất, việc lưu giữ dữ liệu liên tục dẫn đến các vấn đề về quyền riêng tư của dữ liệu. Tin tức gần đây trên Facebook đã nói lên tất cả – sự thay đổi trong chính sách quyền riêng tư để gửi thông tin của người dùng trên Web đã khiến người dùng mất lòng tin và cuối cùng họ đã xóa tài khoản của mình. Tương tự, sự cố Vi phạm dữ liệu iCloud đã khiến người dùng không hài lòng, khiến họ phải tìm kiếm các bài báo giảng dạy trực tuyến có thể giúp họ xóa dữ liệu của họ khỏi iCloud. Thứ hai, cùng với quyền riêng tư, việc đáp ứng ràng buộc bảo mật với việc học máy liên tục cũng là một thách thức lớn. Ví dụ: một hệ thống phát hiện bất thường, thường được dùng để phát hiện các cuộc xâm nhập, không thực hiện được công việc của nó với các kỹ thuật học máy. Hãy xem xét một tình huống mà kẻ tấn công đưa một số dữ liệu vào dữ liệu mẹ để gây ô nhiễm hệ thống. Điều gì sẽ xảy ra nếu hệ thống chấp nhận dữ liệu mới này làm dữ liệu của chính nó và thực hiện các tác vụ trong tương lai? Do đó, ở đây bảo mật không thành công. Trong trường hợp này, chúng tôi dường như muốn hệ thống quên dữ liệu bị ô nhiễm sau khi phát hiện và lấy lại bảo mật. Thứ ba, bạn có thể đã gặp phải tình huống Google gửi cho bạn tin tức hoặc cập nhật không quan trọng đối với bạn. Điều này xảy ra khi bạn hoặc bạn bè của bạn đã tìm kiếm chủ đề cụ thể đó và hệ thống biết rằng bạn quan tâm đến vấn đề cụ thể đó. Ở đây, chúng tôi muốn hệ thống không tìm hiểu và chỉ gửi tin tức hoặc khuyến nghị có liên quan cho bạn. Đây chỉ là một số lý do đã tạo ra nhu cầu về kỹ thuật Machine Unlearning.

Machine Unlearning: XÓA DỮ LIỆU KHÔNG MONG MUỐN NHANH CHÓNG

Các nhà nghiên cứu Yinzhi Cao và Junfeng Yang đã đề xuất một hệ thống có thể quên dữ liệu một cách hiệu quả. Mô hình dựa trên hai tiêu chí là tính đầy đủ và kịp thời. Tính đầy đủ có nghĩa là sự khác biệt giữa dữ liệu đào tạo và dữ liệu không được công bố, trong khi tính kịp thời liên quan đến việc hệ thống đã xóa sạch dữ liệu không cần thiết sớm như thế nào. Các nhà nghiên cứu đã thử nghiệm và chạy thành công mô hình này với các hệ thống học máy khác nhau. Sau thành công này, các nhà nghiên cứu hướng tới việc điều chỉnh kỹ thuật machine unlearning với các hệ thống khác và cuối cùng là xóa dữ liệu không mong muốn.

Không nghi ngờ gì nữa, các kỹ thuật học máy đã dẫn đến những đổi mới đáng kinh ngạc và đột phá nhưng chúng cũng dẫn đến một số vấn đề phải được giải quyết sớm nhất. Làm thế nào để sửa chữa chúng? Câu trả lời là machine unlearning.

Bình luận về bài viết này