Giới thiệu về ZKML: ZKML (Zero Knowledge Machine Learning) là công nghệ học máy kết hợp các bằng chứng không có kiến thức và thuật toán học máy để giải quyết các vấn đề bảo vệ quyền riêng tư trong học máy.
Về sức mạnh tính toán phân tán: Sức mạnh tính toán phân tán đề cập đến việc phân tách một tác vụ tính toán thành nhiều tác vụ nhỏ và giao các tác vụ nhỏ này cho nhiều máy tính hoặc bộ xử lý để xử lý nhằm đạt được hiệu quả tính toán.

Tình hình hiện tại của AI và Web3: Đàn ong ngoài tầm kiểm soát và sự gia tăng Entropy
Trong cuốn sách “Out of Control: The New Biology of Machines, Society and the Economic”, Kevin Kelly từng đề xuất một hiện tượng: đàn ong sẽ đưa ra quyết định bầu cử theo nhóm nhảy theo sự quản lý phân tán, và toàn bộ đàn ong sẽ tuân theo nhóm này. khiêu vũ. Bầy đàn lớn nhất thế giới thống trị một sự kiện. Đây cũng chính là cái gọi là “linh hồn của đàn ong” được Maurice Maeterlinck nhắc đến - mỗi con ong có thể tự đưa ra quyết định và hướng dẫn những con ong khác xác nhận điều đó, và quyết định cuối cùng thực sự là của cả đàn.

Bản thân định luật tăng entropy và rối loạn tuân theo định luật nhiệt động lực học. Phương án lý thuyết trong vật lý là đặt một số lượng phân tử nhất định vào một hộp trống và đo cấu hình phân bố cuối cùng. Cụ thể đối với con người, đám đông do thuật toán tạo ra có thể hiển thị các quy tắc nhóm bất chấp sự khác biệt về suy nghĩ của từng cá nhân. Chúng thường bị giới hạn trong một ô trống do các yếu tố như thời gian và cuối cùng sẽ đưa ra quyết định đồng thuận.
Tất nhiên, các quy tắc của nhóm có thể không đúng, nhưng những người dẫn đầu dư luận có thể đại diện cho sự đồng thuận và có thể một mình xây dựng sự đồng thuận thì phải là những cá nhân siêu phàm. Nhưng trong hầu hết các trường hợp, sự đồng thuận không theo đuổi sự đồng thuận hoàn toàn và vô điều kiện của mọi người mà chỉ yêu cầu sự thừa nhận chung của cả nhóm.
Ở đây chúng ta không thảo luận về việc liệu AI có khiến con người lạc lối hay không. Trên thực tế, đã có rất nhiều cuộc thảo luận như vậy, liệu đó có phải là lượng rác lớn do các ứng dụng trí tuệ nhân tạo tạo ra đã làm ô nhiễm tính xác thực của dữ liệu mạng hay những sai sót trong quyết định nhóm hay không. -làm điều đó sẽ dẫn đến một số sự việc đã diễn biến theo chiều hướng nguy hiểm hơn.
Tình hình hiện tại của AI có tính độc quyền tự nhiên. Ví dụ, việc đào tạo và triển khai các mô hình lớn đòi hỏi một lượng lớn tài nguyên tính toán và dữ liệu, và chỉ một số ít doanh nghiệp và tổ chức có được những điều kiện này. Hàng tỷ dữ liệu này được mọi chủ sở hữu độc quyền coi là kho báu. Chưa kể việc chia sẻ nguồn mở, thậm chí việc truy cập lẫn nhau là không thể.
Điều này dẫn đến sự lãng phí dữ liệu rất lớn. Mọi dự án AI quy mô lớn đều yêu cầu thu thập dữ liệu người dùng nhiều lần, người chiến thắng sẽ có được tất cả - cho dù đó là sáp nhập và mua lại, bán hàng, mở rộng các dự án khổng lồ riêng lẻ hay Internet truyền thống. Logic của cuộc đua rodeo.
Nhiều người cho rằng AI và Web3 là hai thứ khác nhau và không có mối liên hệ nào cả. Nửa câu đầu thì đúng, nhưng nửa câu sau lại có vấn đề. Sự độc quyền của trí tuệ nhân tạo sẽ chấm dứt Và việc sử dụng công nghệ trí tuệ nhân tạo để thúc đẩy việc hình thành cơ chế đồng thuận phi tập trung đơn giản là điều đương nhiên.
Khấu trừ cấp độ thấp nhất: Hãy để AI hình thành cơ chế đồng thuận nhóm phân tán thực sự
Cốt lõi của trí tuệ nhân tạo vẫn nằm ở chính con người. Máy móc, mô hình chỉ là những suy đoán, bắt chước tư duy của con người. Cái gọi là nhóm thực ra rất khó tách khỏi nhóm, bởi vì những gì chúng ta thấy hàng ngày đều là những cá thể có thật. Nhưng mô hình sử dụng lượng dữ liệu khổng lồ để tìm hiểu và điều chỉnh, rồi cuối cùng mô phỏng hình dạng nhóm. Không cần thiết phải đánh giá kết quả của mô hình này, vì tội ác tập thể không xảy ra một, hai lần. Nhưng mô hình này thể hiện sự xuất hiện của cơ chế đồng thuận này.
Ví dụ, đối với một DAO cụ thể, nếu việc quản trị được thực hiện theo cơ chế thì chắc chắn sẽ ảnh hưởng đến hiệu quả. Nguyên nhân là do việc hình thành sự đồng thuận trong nhóm là một điều rắc rối, chưa kể đến việc bỏ phiếu, thống kê, v.v. hoạt động. Nếu việc quản trị DAO được thể hiện dưới dạng mô hình AI và tất cả việc thu thập dữ liệu đều xuất phát từ dữ liệu lời nói của mọi người trong DAO thì các quyết định đầu ra sẽ thực sự gần với sự đồng thuận của nhóm hơn.
Sự đồng thuận nhóm của một mô hình duy nhất có thể được sử dụng để huấn luyện mô hình theo sơ đồ trên, nhưng đối với những cá nhân này, xét cho cùng họ vẫn là những hòn đảo biệt lập. Nếu có một hệ thống trí tuệ tập thể để hình thành một AI nhóm, mỗi mô hình AI trong hệ thống này sẽ cộng tác với nhau để giải quyết các vấn đề phức tạp, điều này thực sự sẽ đóng vai trò lớn trong việc nâng cao mức độ đồng thuận.
Đối với các bộ sưu tập nhỏ, bạn có thể xây dựng một hệ sinh thái một cách độc lập hoặc bạn có thể thành lập một nhóm hợp tác với các bộ sưu tập khác để đáp ứng sức mạnh tính toán cực lớn hoặc giao dịch dữ liệu hiệu quả hơn và với chi phí thấp. Nhưng vấn đề lại xuất hiện.

Bộ não thông minh toàn cầu có thể tạo ra các mô hình thuật toán AI ban đầu độc lập với nhau và có các chức năng đơn lẻ hợp tác với nhau, đồng thời thực hiện các quy trình thuật toán thông minh phức tạp trong nội bộ, để liên tục hình thành mạng lưới đồng thuận nhóm phân tán. Đây cũng là ý nghĩa lớn nhất của việc AI trao quyền cho Web3.
Quyền riêng tư và độc quyền dữ liệu? Sự kết hợp giữa ZK và học máy
Con người phải thực hiện các biện pháp phòng ngừa có mục tiêu chống lại những hành động xấu xa của AI hoặc lo sợ độc quyền dữ liệu do bảo vệ quyền riêng tư. Vấn đề cốt lõi là chúng ta không biết làm thế nào để đạt được kết luận. Tương tự, những người vận hành mô hình không có ý định trả lời các câu hỏi về vấn đề này. Để tích hợp bộ não thông minh toàn cầu mà chúng tôi đã đề cập ở trên, vấn đề này cần phải được giải quyết nhiều hơn nữa, nếu không sẽ không có bên dữ liệu nào sẵn sàng chia sẻ cốt lõi của mình với bên khác.
ZKML (Zero Knowledge Machine Learning) là công nghệ sử dụng bằng chứng không có kiến thức cho machine learning. Bằng chứng không có kiến thức (ZKP) có nghĩa là người chứng minh có thể khiến người xác minh tin vào tính xác thực của dữ liệu mà không tiết lộ dữ liệu cụ thể.

Lấy các trường hợp lý thuyết làm hướng dẫn. Có một trò chơi Sudoku tiêu chuẩn 9×9 với điều kiện hoàn thành là điền vào chín ô các số từ 1 đến 9 sao cho mỗi số chỉ được xuất hiện một lần ở mỗi hàng, cột và lưới. Vậy làm thế nào người tạo ra câu đố này chứng minh cho người thách đấu rằng sudoku có lời giải mà không tiết lộ đáp án?

Chỉ cần che vùng điền câu trả lời, sau đó yêu cầu ngẫu nhiên người thách đấu chọn một vài hàng hoặc cột, xáo trộn tất cả các số và xác minh xem chúng có phải là từ một đến chín hay không. Đây là một cách thực hiện đơn giản của bằng chứng không có kiến thức.
Công nghệ chứng minh không có kiến thức có ba đặc điểm: tính đầy đủ, tính chính xác và không có kiến thức, nghĩa là nó chứng minh kết luận mà không tiết lộ bất kỳ chi tiết nào. Nguồn kỹ thuật của nó có thể phản ánh sự đơn giản trong bối cảnh mã hóa đồng cấu, độ khó của việc xác minh thấp hơn nhiều so với độ khó của việc tạo ra bằng chứng.
Machine Learning sử dụng các thuật toán và mô hình để cho phép hệ thống máy tính học hỏi và cải thiện từ dữ liệu. Bằng cách học hỏi kinh nghiệm theo cách tự động, hệ thống có thể tự động thực hiện các nhiệm vụ như dự đoán, phân loại, phân cụm và tối ưu hóa dựa trên dữ liệu và mô hình.
Về cốt lõi, học máy nằm trong việc xây dựng các mô hình học từ dữ liệu và tự động đưa ra dự đoán cũng như quyết định. Việc xây dựng các mô hình này thường đòi hỏi ba yếu tố chính: bộ dữ liệu, thuật toán và đánh giá mô hình. Bộ dữ liệu là nền tảng của học máy và chứa các mẫu dữ liệu được sử dụng để huấn luyện và kiểm tra các mô hình học máy. Thuật toán là cốt lõi của các mô hình học máy và xác định cách mô hình học và dự đoán từ dữ liệu. Đánh giá mô hình là một phần quan trọng của học máy, được sử dụng để đánh giá hiệu suất và độ chính xác của mô hình và quyết định xem mô hình có cần được tối ưu hóa và cải tiến hay không.

Trong machine learning truyền thống, các bộ dữ liệu thường cần được thu thập ở một nơi tập trung để đào tạo, nghĩa là chủ sở hữu dữ liệu phải chia sẻ dữ liệu với bên thứ ba, điều này có thể dẫn đến nguy cơ rò rỉ dữ liệu hoặc rò rỉ quyền riêng tư. Với ZKML, chủ sở hữu dữ liệu có thể chia sẻ tập dữ liệu với người khác mà không làm rò rỉ dữ liệu. Điều này đạt được bằng cách sử dụng bằng chứng không có kiến thức.
Khi bằng chứng không có kiến thức được sử dụng để trao quyền cho máy học, hiệu quả sẽ có thể dự đoán được. Điều này sẽ giải quyết các vấn đề tồn tại lâu dài về hộp đen quyền riêng tư và độc quyền dữ liệu: liệu bên dự án có thể thực hiện việc này mà không làm rò rỉ dữ liệu đầu vào của người dùng hoặc các chi tiết cụ thể của dữ liệu hay không. model. Sau khi hoàn thành bằng chứng và xác minh, mỗi bộ sưu tập có thể chia sẻ dữ liệu hoặc mô hình riêng của mình để hoạt động mà không bị rò rỉ dữ liệu riêng tư không? Tất nhiên, công nghệ hiện tại vẫn còn sơ khai và chắc chắn sẽ có nhiều vấn đề trong thực tế. Điều này không ngăn cản chúng ta tưởng tượng và nhiều đội đã đang phát triển nó.
Liệu tình trạng này có dẫn đến việc bán dâm miễn phí các cơ sở dữ liệu nhỏ chống lại các cơ sở dữ liệu lớn không? Khi nghĩ về các vấn đề quản trị, bạn sẽ quay lại suy nghĩ về Web3 của chúng tôi. Bản chất của Tiền điện tử là quản trị. Cho dù đó là thông qua việc sử dụng rộng rãi hay chia sẻ, nó đều phải nhận được những ưu đãi xứng đáng. Cho dù thông qua các cơ chế Pow, PoS ban đầu hay các cơ chế PoR (Bằng chứng danh tiếng) mới nhất khác nhau, hiệu quả khuyến khích vẫn được đảm bảo.

Sức mạnh tính toán phân tán: một câu chuyện đổi mới đan xen giữa dối trá và thực tế
Xét cho cùng, mạng sức mạnh tính toán phi tập trung luôn là một kịch bản phổ biến trong vòng tròn mã hóa, các mô hình AI lớn đòi hỏi sức mạnh tính toán đáng kinh ngạc và mạng sức mạnh tính toán tập trung sẽ không chỉ gây lãng phí tài nguyên mà còn hình thành sự độc quyền ảo - nếu so sánh với In. Cuối cùng, tất cả những gì quan trọng là số lượng GPU, quá nhàm chán.
Bản chất của mạng máy tính phi tập trung là tích hợp các tài nguyên máy tính nằm rải rác trên các vị trí và thiết bị khác nhau. Những ưu điểm chính mà mọi người thường nhắc đến là: cung cấp khả năng tính toán phân tán, giải quyết các vấn đề về quyền riêng tư, nâng cao độ tin cậy và độ tin cậy của các mô hình trí tuệ nhân tạo, hỗ trợ triển khai và vận hành nhanh chóng trong các tình huống ứng dụng khác nhau và cung cấp các giải pháp quản lý và lưu trữ phi tập trung. Đúng vậy, thông qua sức mạnh tính toán phi tập trung, bất kỳ ai cũng có thể chạy các mô hình AI và thử nghiệm chúng trên các tập dữ liệu thực tế trên chuỗi từ người dùng toàn cầu, để họ có thể tận hưởng các dịch vụ điện toán linh hoạt, hiệu quả và chi phí thấp hơn.

Đồng thời, sức mạnh tính toán phi tập trung có thể giải quyết các vấn đề về quyền riêng tư bằng cách tạo ra một khuôn khổ mạnh mẽ để bảo vệ tính bảo mật và quyền riêng tư của dữ liệu người dùng. Nó cũng cung cấp một quy trình tính toán minh bạch và có thể kiểm chứng, nâng cao độ tin cậy và độ tin cậy của các mô hình trí tuệ nhân tạo, đồng thời cung cấp các tài nguyên tính toán linh hoạt và có thể mở rộng để triển khai và vận hành nhanh chóng trong các tình huống ứng dụng khác nhau.
Chúng tôi xem xét việc đào tạo mô hình từ một bộ quy trình tính toán tập trung hoàn chỉnh. Các bước thường được chia thành: chuẩn bị dữ liệu, phân đoạn dữ liệu, truyền dữ liệu giữa các thiết bị, đào tạo song song, tổng hợp gradient, cập nhật tham số, đồng bộ hóa và đào tạo lặp lại. Trong quá trình này, ngay cả khi phòng máy tính tập trung sử dụng cụm thiết bị điện toán hiệu năng cao và chia sẻ nhiệm vụ điện toán thông qua kết nối mạng tốc độ cao, chi phí truyền thông cao đã trở thành một trong những hạn chế lớn nhất của mạng máy tính phi tập trung.
Do đó, mặc dù mạng điện toán phi tập trung có nhiều lợi thế và tiềm năng nhưng con đường phát triển vẫn còn quanh co theo chi phí truyền thông hiện tại và khó khăn vận hành thực tế. Trong thực tế, việc hiện thực hóa mạng điện toán phi tập trung đòi hỏi phải khắc phục nhiều vấn đề kỹ thuật thực tế, cho dù đó là cách đảm bảo độ tin cậy và bảo mật của các nút, cách quản lý và lên lịch hiệu quả các tài nguyên máy tính phân tán hoặc cách đạt được truyền tải và liên lạc dữ liệu hiệu quả, v.v. , có lẽ đều là những vấn đề lớn mà chúng ta gặp phải trong thực tế.
Đuôi: Kỳ vọng để lại cho những người duy tâm
Quay trở lại thực tế kinh doanh, câu chuyện về sự tích hợp sâu của AI và Web3 có vẻ rất hay, nhưng nguồn vốn và người dùng cho chúng ta biết bằng những hành động thiết thực hơn rằng đây được coi là một hành trình đổi mới cực kỳ khó khăn, trừ khi dự án có thể giống như OpenAI. tuy chúng ta mạnh, chúng ta nên nắm lấy một nhà tài trợ mạnh, nếu không, chi phí R&D không đáy và mô hình kinh doanh không rõ ràng sẽ hoàn toàn đè bẹp chúng ta.
Cả AI và Web3 hiện nay đều đang ở giai đoạn phát triển cực kỳ sớm, giống như bong bóng Internet vào cuối thế kỷ trước. Phải đến gần chục năm sau, thời kỳ hoàng kim thực sự mới chính thức mở ra. McCarthy từng mơ ước thiết kế trí tuệ nhân tạo với trí tuệ con người trong một kỳ nghỉ, nhưng phải đến gần bảy mươi năm sau, chúng ta mới thực sự thực hiện được một bước quan trọng đối với trí tuệ nhân tạo.
Điều này cũng đúng với Web3+AI. Chúng tôi đã xác định tính đúng đắn của hướng đi tiếp theo và phần còn lại sẽ được để lại theo thời gian.
Khi dòng thời gian dần rút đi, những con người và sự vật còn đứng vững đó chính là nền tảng cho hành trình của chúng ta từ khoa học viễn tưởng đến hiện thực.

