Một số người trong chúng ta nhớ một thời gian trước khi mã hóa internet được tiêu chuẩn hóa. Trước đó, thương mại trực tuyến là không thể bởi vì không ai muốn chia sẻ thông tin thẻ tín dụng của họ để có khả năng bị rình mò và đánh cắp. Đó chỉ là sự ra đời của Lớp cổng bảo mật (SSL), một giao thức bảo mật mã hóa do Netscape phát triển và quảng bá, giao thức này bảo vệ thông tin cá nhân của chúng ta và khiến việc mua sắm trực tuyến được chấp nhận rộng rãi.
Học máy, ngay bây giờ, là một hộp đen tương tự. Dữ liệu của bạn được đưa vào — nhưng điều gì xảy ra sau đó? Không có kiến thức có thể nâng cao AI/ML giống như cách SSL làm cho web dễ sử dụng hơn bằng cách cho phép chúng tôi cảm thấy thoải mái khi đưa thông tin riêng tư, mang tính cá nhân cao vào các mô hình này và nhận kết quả đầu ra được cá nhân hóa mà không phải lo lắng về việc tiết lộ dữ liệu đó cho bên thứ ba.
Chúng tôi đã khởi chạy Sáng kiến zkML để khuyến khích mọi người xây dựng nền tảng cho tương lai mới của máy học, một nền tảng an toàn, riêng tư và cá nhân hơn. Khi chúng tôi chuẩn bị chào đón những người đăng ký tham gia lớp học Phần một của chúng tôi, chúng tôi đã nói chuyện với Alex Pruden, Giám đốc điều hành của Aleo, về hy vọng của anh ấy đối với zkML và tương lai của toàn bộ máy học.
Tại sao zkML lại quan trọng đối với tương lai của máy học?
Học máy là một công nghệ tuyệt vời, mang tính cách mạng và kiến thức bằng không làm cho nó thậm chí còn tốt hơn từ góc độ con người. Thông qua các phương pháp như học tập liên kết, chúng tôi có thể huấn luyện các mô hình trên dữ liệu cá nhân được tổng hợp mà không tiết lộ dữ liệu cá nhân của một cá nhân nhưng vẫn chứng minh được tính hợp lệ của nó. Mô hình cuối cùng trở nên chính xác hơn vì mọi người sẽ sẵn sàng chia sẻ nhiều dữ liệu hơn trong tình huống đó. Điều này có nghĩa là bạn có thể đào tạo các mô hình trên các bộ dữ liệu chất lượng tốt hơn, sau đó mang lại các kết quả đầu ra hữu ích và được cá nhân hóa hơn.
Theo bạn, trường hợp sử dụng zkML thú vị nhất là gì?
Dữ liệu chăm sóc sức khỏe là một trường hợp sử dụng hấp dẫn, thú vị vì có quá nhiều quy định và sự nhạy cảm cá nhân (có thể hiểu được) xung quanh việc chia sẻ dữ liệu chăm sóc sức khỏe cá nhân của chúng ta. Những nỗ lực trước đây để giải quyết vấn đề này đã được đáp ứng với thành công hạn chế. Nhưng bằng cách sử dụng mật mã không kiến thức, chúng ta có thể tưởng tượng ra một hệ thống mà người dùng có thể chứng minh một số sự thật nhất định về bản thân họ mà không tiết lộ dữ liệu cơ bản. Người dùng cũng có thể chạy một mô hình trên dữ liệu của riêng họ và cung cấp đầu ra cho mô hình học tập được liên kết tổng hợp kết quả đầu ra riêng lẻ của mọi người.
Nếu bạn có thể xây dựng bất cứ thứ gì cho sáng kiến zkML, bạn sẽ xây dựng cái gì và tại sao nó lại quan trọng?
Tôi nghĩ rằng việc xây dựng một ứng dụng thể dục bằng zkML sẽ thực sự tuyệt vời. Bạn có thể đào tạo một người mẫu bằng cách sử dụng một loạt các chế độ đào tạo của mọi người, sau đó chứng minh rằng bạn đã đạt được một tiêu chuẩn nhất định mà không cần tiết lộ cách bạn đã làm được bằng cách sử dụng kiến thức bằng không.
Nhưng đối với mùa đầu tiên của sáng kiến zkML, điều quan trọng nhất là các khối xây dựng. Tôi rất muốn thấy các kết nối giữa Leo và các thư viện Python phổ biến nhất, chẳng hạn như SideKick hoặc TensorFlow. Điều này có thể cung cấp cho các nhà khoa học dữ liệu quyền truy cập vào kiến thức bằng không trong bộ công cụ của họ mà không phải thay đổi quy trình làm việc thông thường của họ.
Tại sao sáng kiến này cần phải xảy ra? Điều gì xảy ra nếu nó không?
Hiện đang có một cuộc chạy đua vũ trang khổng lồ với AI và tôi không nghĩ rằng các công ty AI nhất thiết phải quan tâm đến lợi ích tốt nhất của mọi người. Tôi nghĩ rằng điều quan trọng là người tiêu dùng của các mô hình ngôn ngữ lớn hiểu chi phí và tích cực ủng hộ một hệ thống bảo vệ dữ liệu của chúng tôi.
Nếu điều đó không xảy ra, tôi nghĩ rằng chúng ta có nguy cơ không còn sở hữu chính mình theo nghĩa kỹ thuật số. Thay vào đó, bạn thuộc sở hữu của một công ty. Họ không sở hữu bạn với tư cách là một con người, nhưng đối với mọi ý định và mục đích, phiên bản trực tuyến của “bạn” sẽ được sở hữu — và có khả năng bị kiểm soát — bởi người khác.
Hy vọng của bạn cho công nghệ này trong tương lai là gì?
Hy vọng của tôi là nó có thể sử dụng được nhiều hơn, hoạt động hiệu quả hơn và mọi người đầu tư thời gian, công sức để làm cho nó tốt hơn. Tôi nghĩ rằng đây là những ngày đầu và cũng giống như những ngày đầu của mã hóa trên web, nó có thể không thân thiện với người dùng như chúng ta mong đợi. Nhưng khi mọi người đầu tư nhiều thời gian và năng lượng hơn và tìm ra những kỹ thuật tốt hơn và phần cứng tốt hơn, mọi thứ trở nên dễ dàng hơn.
Quan tâm đến việc tạo nền tảng của zkML? Vẫn chưa quá muộn để đăng ký mùa đầu tiên của Sáng kiến zkML của chúng tôi, diễn ra từ ngày 12 đến ngày 14 tháng 5 năm 2023.