Học sâu và ứng dụng phương pháp học sâu có đảm bảo tính riêng tư?

17:00 | 18/12/2023 | GP ATM

Ngày nay, Trí tuệ nhân tạo (AI) hiện diện trong mọi lĩnh vực của đời sống con người, từ kinh tế, giáo dục, y khoa cho đến những công việc nhà, giải trí hay thậm chí là trong quân sự. Học máy là một ứng dụng của trí tuệ nhân tạo cung cấp cho các hệ thống khả năng tự động học hỏi và cải thiện từ kinh nghiệm mà không cần lập trình rõ ràng. Học máy tập trung vào việc phát triển các chương trình máy tính có thể truy cập dữ liệu và sử dụng nó để tự học. Do đó, vấn đề đảm bảo tính riêng tư trong ứng dụng phương pháp học sâu đang là một vấn đề được quan tâm hiện nay.

Học sâu và ứng dụng phương pháp học sâu có đảm bảo tính riêng tư?

Lý thuyết về học sâu

Những năm gần đây, khi khả năng tính toán của các máy tính được nâng lên một tầm cao mới với lượng dữ liệu khổng lồ được thu thập thì học máy đã tiến thêm một bước dài, đẫn đến việc ra đời một lĩnh vực mới được gọi là học sâu.

Học sâu là một nhánh của ngành học máy dựa trên một tập hợp các thuật toán để cố gắng mô hình hóa dữ liệu trừu tượng ở mức cao, bằng cách sử dụng nhiều lớp xử lý với cấu trúc phức tạp, hoặc bằng cách khác bao gồm nhiều biến đổi phi tuyến, được lấy cảm hứng từ cấu trúc và chức năng của bộ não được gọi là mạng thần kinh nhân tạo.

Một mạng thần kinh nhân tạo bao gồm ba lớp chính, đó là: lớp đầu vào, lớp ẩn và lớp đầu ra với một số (Mạng nơ ron tích chập (Convolutional Neural Network - CNN) và Mạng nơ ron hồi quy (Recurrent Neural Network - RNN)).

Đảm bảo tính riêng tư cho học sâu

Bài toán bảo vệ tính riêng tư cho học máy đã được nghiên cứu rộng rãi bởi cộng đồng khai thác dữ liệu trong những năm gần đây. Để đảm bảo tính riêng tư cho học máy nói chung và cho mô hình học sâu phân tán nói riêng có thể thực hiện theo các phương pháp khác nhau, mỗi phương pháp sẽ có những ưu, nhược điểm riêng của nó.

Tuy nhiên, các phương pháp này luôn tồn tại một sự đánh đổi cố hữu giữa tính đúng đắn của tính toán, tính riêng tư của những dữ liệu nhạy cảm và tính hiệu quả của giải pháp. Việc lựa chọn phương pháp nào phù hợp sẽ phụ thuộc vào mục tiêu của bài toán cần xử lý. Các giải pháp học máy đảm bảo tính riêng tư dựa trên tính toán bảo mật nhiều thành viên thường đảm bảo được độ chính xác và bảo vệ được các thông tin riêng tư, nhạy cảm trong dữ liệu của mỗi người dùng [1].

Tính toán bảo mật nhiều thành viên

Tính toán bảo mật (Sercure Computation - SC), tính toán nhiều bên (Multi-party Computation - MPC) hay tính toán bảo mật nhiều thành viên (Secure Multi-party Computation - SMC) là một lĩnh vực của mật mã với mục tiêu tạo ra các phương thức cho phép các bên cùng tính toán một hàm dựa trên các giá trị đầu vào của họ mà vẫn của những giá trị đầu vào này.

Để thực hiện giao thức SMC chỉ cần mỗi bên tham gia có một máy tính đáng tin cậy để chạy phần giao thức của mình và cách (có thể không an toàn) để giao tiếp với các bên tham gia khác. Giao thức bao gồm một loạt các thông điệp được trao đổi giữa những bên tham gia và cuối cùng mỗi bên tham gia tìm hiểu đầu ra của giao thức. Bản thân giao thức là công khai, cho phép mỗi bên tham gia xác minh độc lập rằng phần mềm chạy trên máy của chính họ là hợp lệ [1].

Các giao thức tính toán bảo mật nhiều thành viên cho độ an toàn cao và đảm bảo được mức độ riêng tư mạnh. Tuy nhiên, những vấn đề về hiệu năng đang cản trở sự phát triển của các giao thức này.

Để làm rõ độ an toàn và mức độ đảm bảo riêng tư mạnh của phương pháp này, tác giả trình bày một giao thức học sâu có đảm bảo tính riêng tư hiệu quả dựa trên phương pháp tính toán bảo mật nhiều thành viên dựa trên giao thức tính tổng bảo mật cho bài toán an toàn thông tin phát hiện thư rác và tiến hành thử nghiệm.

Giao thức học sâu có đảm bảo tính riêng tư hiệu quả dựa trên tính toán bảo mật nhiều thành viên

Trong mô hình huấn luyện mạng học sâu phân tán, cần định nghĩa bài toán đảm bảo tính riêng tư cho mô hình này.

Có 𝑁 bên 𝒫 = {𝑃1, 𝑃2, . . . , 𝑃𝑁} tham gia huấn luyện mô hình, trong đó mỗi bên sở hữu một bộ dữ liệu huấn luyện riêng tư tương ứng 𝐷1, 𝐷2, . . ., 𝐷𝑁. Các bên này muốn kết hợp để thực hiện việc huấn luyện một mô hình chung tổng quát mà không tiết lộ các thông tin cục bộ của mình bao gồm:

Các thuộc tính của dữ liệu đầu vào;
Nhãn dữ liệu đầu ra hoặc phản hồi của mô hình với dữ liệu;
Kiến trúc chi tiết của mô hình bao gồm: kiến trúc mạng, tham số, các hàm mất mát;
Thông tin định danh về đóng góp của một bên dữ liệu đối với một bản ghi cụ thể.

Để làm được điều này, các bên cần xây dựng và thực thi một giao thức an toàn 𝜋. Trong bài toán đặt ra, tác giả trình bày giao thức huấn luyện mạng học sâu phân tán sử dụng giao thức tính tổng bảo mật an toàn.

Quý độc giả vui lòng đọc toàn văn bài báo

Tài liệu tham khảo

[1] Adi Shamir, Ronald L Rivest, and Leonard M Adleman. Mental poker. In The mathematical gardner, pages 37–43. Springer, 1981.

[2] Yann LeCun and Corinna Cortes. MNIST handwritten digit database. 2010.

[3] Tiago A Almeida, José María G Hidalgo, and Akebo Yamakami. Contributions to the study of sms spam filtering: new collection and results. In Proceedings of the 11th ACM symposium on Document engineering, pages 259–262, 2011.

[4] Yann LeCun, Léon Bottou, Yoshua Bengio, and Patrick Haffner. Gradient-based learning applied to document recognition. Proceedings of the IEEE,

86(11):2278–2324, 1998.

[5] Sepp Hochreiter and J¨urgen Schmidhuber. Long short-term memory. Neural computation, 9(8):1735–1780, 1997.

[6] Andreas Stein and Edlyn Teske. Optimized baby step-giant step methods. J. Ramanujan Math. Soc, 20(1):1–32, 2005.

Nguyễn Thị Hồng Hà, Học viện Kỹ thuật mật mã

‹ › ×

Tin liên quan

Phòng chống Ransomware hoàn hảo hơn với công nghệ học sâu đầu tiên trên thế giới

12:00 | 18/05/2022

Trong bối cảnh hiện nay, các cuộc tấn công mạng ngày càng trở nên tinh vi, phức tạp với nhiều chiến thuật, kỹ thuật nâng cao, các mã độc mới chưa có mẫu nhận diện. Hầu hết các nền tảng và giải pháp bảo mật nâng cao thường đang tập trung vào phát hiện (Detection), điều tra (Investigate) và xử lý, khắc phục (response) các sự cố an toàn thông tin đã xảy ra. Đây là phương pháp tiếp cận tốt, tuy nhiên vẫn còn thiếu sót trong chiến lược bảo mật hệ thống, đặc biệt là bảo vệ hệ thống trước một trong những mối đe dọa an ninh nâng cao như mã độc tống tiền mới.

Deep learning ứng dụng trong nghiệp vụ nhận dạng văn bản

17:00 | 15/04/2021

Lĩnh vực nhận dạng ký tự văn bản đang ngày càng phát triển nhờ những ứng dụng thực tiễn trong đời sống và nhờ việc ứng dụng trí tuệ nhân tạo, đang ngày càng chứng minh được tính ưu việt với tốc độ nhanh, độ chính xác cao. Để phân tích cách thức làm việc, các thuật toán sử dụng, mô hình học sâu, chúng tôi tập trung khai thác thư viện Tesseract 4 [4], là thư viện mã nguồn mở triển khai các thuật toán và mô hình học sâu trong lĩnh vực nhận dạng văn bản mang lại hiệu quả cao. Để chứng minh hiệu quả sử dụng đối với văn bản thường và văn bản có định dạng đặc thù riêng, chúng tôi tiến hành đánh giá kết quả nhận dạng đối với văn bản thông thường và văn bản có định dạng đặc thù riêng trong các trường hợp sử dụng. Kết quả cho thấy đối với văn bản thông thường, Tesseract 4 hoạt động rất tốt trong hầu hết các trường hợp.

Tấn công học máy đối nghịch trong mạng 5G và giải pháp

13:00 | 05/09/2022

Mạng 5G ngày càng trở nên phổ biến với các ứng dụng trong nhiều lĩnh vực như: hội nghị trực tuyến, xe tự lái, chăm sóc sức khỏe từ xa, máy bay không người lái, thực tế ảo.... Bằng cách tích hợp học máy vào công nghệ 5G với những ưu điểm nổi bật về tốc độ và kết nối, hệ thống liên lạc sẽ trở nên thông minh hơn với khả năng vô tuyến nhận thức được hỗ trợ bởi các mô hình học máy để thực hiện các nhiệm vụ quan trọng như cảm nhận và chia sẻ phổ tần. Tuy nhiên, điều đó cũng dẫn đến những nguy cơ mới từ các cuộc tấn công nhắm vào các ứng dụng học máy. Bài báo sau đây sẽ giới thiệu đến độc giả về kỹ thuật học máy đối nghịch và một số kịch bản tấn công sử dụng kỹ thuật này đối với mạng 5G cũng như một số giải pháp phòng chống.

Tin cùng chuyên mục

Cục An toàn thông tin phát động chiến dịch “Kỹ năng nhận diện và phòng chống lừa đảo trực tuyến”

10:00 | 18/10/2024

Nhằm trang bị cho người dân “vũ khí” chống lừa đảo trên không gian mạng, Cục An toàn thông tin (Bộ TT&TT) triển khai chiến dịch quốc gia với 5 nhóm kỹ năng thiết yếu, từ nhận biết dấu hiệu lừa đảo đến xử lý tình huống khi bị tấn công.

INFOGRAPHIC: Mẹo bảo vệ dữ liệu cá nhân trên Tiktok

14:00 | 09/09/2024

TikTok - thế giới giải trí đầy màu sắc nhưng cũng ẩn chứa những cạm bẫy rình rập thông tin cá nhân của người dùng. Đừng để niềm vui trở thành nỗi lo, hãy cùng khám phá những mẹo nhỏ mà hữu ích để bảo vệ dữ liệu trên TikTok, thỏa sức sáng tạo mà không lo sợ bị xâm phạm quyền riêng tư.

Tầm quan trọng của việc quản lý rủi ro chuỗi cung ứng

10:00 | 27/05/2024

Quản lý rủi ro chuỗi cung ứng (Supply Chain Risk Management - SCRM) là quá trình tìm kiếm và giải quyết các lỗ hổng tiềm ẩn trong chuỗi cung ứng của một doanh nghiệp. Mục đích của SCRM là nhằm giảm thiểu tác động của những rủi ro này đối với hoạt động, thương hiệu và hiệu quả tài chính của doanh nghiệp.

Thiết lập chính sách mật khẩu an toàn trên Linux

10:00 | 10/04/2024

Hiện nay, số lượng các cuộc tấn công mạng nhắm đến hệ điều hành Linux đang ngày càng gia tăng cả về số lượng lẫn mức độ tinh vi, đặc biệt là các sự cố liên quan đến việc lộ lọt mật khẩu. Thông thường, khi tạo tài khoản mới trên Linux, người dùng có thể sử dụng những mật khẩu tùy ý, kể cả những mật khẩu yếu, điều này có thể gây ra nhiều rủi ro bảo mật tiềm ẩn trong hệ thống mạng, các tác nhân đe dọa sẽ dễ dàng tấn công và xâm phạm tài khoản hơn. Do đó, cần phải thực thi các chính sách sử dụng mật khẩu đủ mạnh để bảo vệ tài khoản người dùng tránh bị tấn công. Trong bài viết này sẽ gửi đến độc giả hướng dẫn thiết lập cấu hình mật khẩu an toàn trên Linux với nền tảng Centos 7.

Tin được quan tâm

Rò rỉ kênh kề trên điện thoại thông minh khi thực hiện mã hóa RSA

14:00 | 11/09/2024|Công nghệ PKI
Giải pháp di động hóa ứng dụng sử dụng trong mạng chuyên dùng có yếu tố bảo mật

11:00 | 03/09/2024|GP ATM

Kỹ thuật DNS Tunneling

08:00 | 26/08/2024|GP ATM
Top 5 dịch vụ lưu trữ email tốt nhất năm 2024

10:00 | 19/08/2024|Tin tức sản phẩm

GP Mật mã

Rò rỉ kênh kề trên điện thoại thông minh khi thực hiện mã hóa RSA

Trong thời đại ngày nay, cùng với sự phát triển của khoa học kỹ thuật có ngày càng nhiều những cuộc tấn công vào phần cứng và gây ra nhiều hậu quả nghiêm trọng. So với các loại tấn công khác, tấn công qua kênh kề đang được nghiên cứu do khả năng khôi phục lại khóa bí mật trong khi hệ thống vẫn hoạt động bình thường mà không hề làm thay đổi phần cứng. Bài báo này sẽ trình bày một cách sơ lược về những kết quả cuộc tấn công kênh kề lên mã hóa RSA cài đặt trên điện thoại thông minh sử dụng hệ điều hành Android tại Viện Khoa học - Công nghệ mật mã. Nhóm tác giả đã tấn công khôi phục được một phần khóa bí mật của mã hóa RSA cài đặt trên điện thoại thông minh và chứng minh khả năng rò rỉ thông tin qua kênh kề.

14:00 | 11/09/2024
Khoa học mật mã Việt Nam: Khẳng định vị thế, vươn tầm quốc tế
Thừa Thiên Huế đẩy mạnh triển khai đồng bộ, toàn diện các giải pháp, sản phẩm bảo mật, an toàn thông tin
Một số khuyến nghị về việc sử dụng an toàn lược đồ ký số dựa trên đường cong Elliptic

Giải pháp khác

Các nhà mạng chạy đua thương mại hóa 5G

Trong cuộc đua 5G tại Việt Nam, Viettel đã vươn lên dẫn đầu khi trở thành nhà mạng đầu tiên chính thức tuyên bố khai trương mạng 5G. Trong khi đó, các nhà mạng khác cũng đang ráo riết chuẩn bị cho việc triển khai dịch vụ 5G, hứa hẹn một thị trường viễn thông sôi động và cạnh tranh trong thời gian tới.

09:00 | 29/10/2024
INFOGRAPHIC: Khám phá mô hình bảo mật Zero Trust
5G - Chìa khóa đi tới Công nghiệp 4.0
Ransomware: Phòng ngừa và giảm thiểu (Phần I)

Chuyên đề

Học sâu và ứng dụng phương pháp học sâu có đảm bảo tính riêng tư?

Lý thuyết về học sâu

Đảm bảo tính riêng tư cho học sâu

Giao thức học sâu có đảm bảo tính riêng tư hiệu quả dựa trên tính toán bảo mật nhiều thành viên

Tin liên quan

Phòng chống Ransomware hoàn hảo hơn với công nghệ học sâu đầu tiên trên thế giới

Deep learning ứng dụng trong nghiệp vụ nhận dạng văn bản

Tấn công học máy đối nghịch trong mạng 5G và giải pháp

Tin cùng chuyên mục

Cục An toàn thông tin phát động chiến dịch “Kỹ năng nhận diện và phòng chống lừa đảo trực tuyến”

INFOGRAPHIC: Mẹo bảo vệ dữ liệu cá nhân trên Tiktok

Tầm quan trọng của việc quản lý rủi ro chuỗi cung ứng

Thiết lập chính sách mật khẩu an toàn trên Linux

Tin được quan tâm

Ban Cơ yếu Chính phủ tổ chức diễn tập thực chiến bảo đảm an toàn thông tin mạng năm 2024

MasterTeck - Cơ hội nâng cao kỹ năng Blockchain và AI cho thị trường lao động công nghệ cao

Rò rỉ kênh kề trên điện thoại thông minh khi thực hiện mã hóa RSA

Giải pháp di động hóa ứng dụng sử dụng trong mạng chuyên dùng có yếu tố bảo mật

Kỹ thuật DNS Tunneling

Top 5 dịch vụ lưu trữ email tốt nhất năm 2024

Thực trạng và triển vọng hợp tác giữa Việt Nam và Liên minh châu Âu trong lĩnh vực an ninh mạng (Phần I)

Bảo đảm an ninh thông tin cơ sở hạ tầng quan trọng của Hoa Kỳ

Rò rỉ kênh kề trên điện thoại thông minh khi thực hiện mã hóa RSA

Khoa học mật mã Việt Nam: Khẳng định vị thế, vươn tầm quốc tế

Thừa Thiên Huế đẩy mạnh triển khai đồng bộ, toàn diện các giải pháp, sản phẩm bảo mật, an toàn thông tin

Một số khuyến nghị về việc sử dụng an toàn lược đồ ký số dựa trên đường cong Elliptic

Các nhà mạng chạy đua thương mại hóa 5G

INFOGRAPHIC: Khám phá mô hình bảo mật Zero Trust

5G - Chìa khóa đi tới Công nghiệp 4.0

Ransomware: Phòng ngừa và giảm thiểu (Phần I)