Làm cho AI chứng minh rằng nó không có gì để che giấu
Tương lai của AI đáng tin cậy bắt đầu với một kiến trúc bao gồm bằng chứng của chính nó, biến tính minh bạch và khả năng kiểm toán thành các tính năng cốt lõi thay vì những ý tưởng bổ sung.
Ý kiến của: Avinash Lakshman, Người sáng lập và CEO của Weilliptic
Văn hóa công nghệ ngày nay thích giải quyết phần thú vị trước — mô hình thông minh, các tính năng thu hút đám đông — và coi trách nhiệm giải trình và đạo đức là các bổ sung trong tương lai. Nhưng khi kiến trúc cơ bản của AI mờ ám, không có biện pháp khắc phục sau sự kiện nào có thể làm sáng tỏ và cải thiện cấu trúc cách mà đầu ra được tạo ra hoặc thao túng.
Đó là cách chúng ta có những trường hợp như Grok tự gọi mình là “Elon Musk giả mạo” và Claude Opus 4 của Anthropic sử dụng dối trá và tống tiền sau khi vô tình xóa mã nguồn của một công ty. Kể từ khi những tiêu đề này xuất hiện, các bình luận viên đã đổ lỗi cho kỹ thuật prompt, chính sách nội dung và văn hóa doanh nghiệp. Và trong khi tất cả các yếu tố này đều đóng vai trò, lỗi cơ bản là về kiến trúc.
Chúng ta đang yêu cầu các hệ thống không được thiết kế để kiểm tra hành xử như thể tính minh bạch là một tính năng sẵn có. Nếu chúng ta muốn AI mà mọi người có thể tin tưởng, chính cơ sở hạ tầng phải cung cấp bằng chứng, không phải lời hứa hẹn.
Khoảnh khắc tính minh bạch được tích hợp vào lớp cơ bản của AI, lòng tin trở thành một yếu tố thúc đẩy thay vì ràng buộc.
Đạo đức AI không thể là ý tưởng bổ sung
Đối với công nghệ tiêu dùng, các câu hỏi đạo đức thường được coi là các cân nhắc sau khi ra mắt để giải quyết sau khi sản phẩm đã mở rộng. Cách tiếp cận này giống như xây dựng một tòa tháp văn phòng ba mươi tầng trước khi thuê kỹ sư xác nhận nền tảng đáp ứng tiêu chuẩn. Bạn có thể may mắn một thời gian, nhưng rủi ro ẩn giấu tích tụ lặng lẽ cho đến khi có vấn đề xảy ra.
Các công cụ AI tập trung ngày nay cũng không khác gì. Khi một mô hình phê duyệt đơn xin tín dụng gian lận hoặc tưởng tượng một chẩn đoán y tế, các bên liên quan sẽ đòi hỏi, và xứng đáng, một dấu vết kiểm toán. Dữ liệu nào đã tạo ra câu trả lời này? Ai đã tinh chỉnh mô hình, và như thế nào? Lớp bảo vệ nào thất bại?
Hầu hết các nền tảng ngày nay chỉ có thể làm mờ và chuyển hướng trách nhiệm. Các giải pháp AI mà chúng dựa vào chưa bao giờ được thiết kế để lưu giữ các bản ghi như vậy, vì vậy không có bản ghi nào tồn tại hoặc có thể được tạo lại sau.
Cơ sở hạ tầng AI chứng minh chính nó
Tin tốt là các công cụ để làm cho AI đáng tin cậy và minh bạch đã tồn tại. Một cách để thực thi lòng tin trong các hệ thống AI là bắt đầu với một sandbox xác định.
Liên quan: Cypherpunk AI: Hướng dẫn về AI không bị kiểm duyệt, không thiên vị, ẩn danh trong năm 2025
Mỗi tác nhân AI chạy bên trong WebAssembly, vì vậy nếu bạn cung cấp cùng đầu vào vào ngày mai, bạn sẽ nhận được cùng đầu ra, điều này rất quan trọng khi cơ quan quản lý hỏi lý do cho một quyết định.
Mỗi khi sandbox thay đổi, trạng thái mới được băm mã hóa và ký bởi một quorum nhỏ các người xác thực. Những chữ ký đó và băm được ghi vào sổ cái blockchain mà không bên nào có thể viết lại. Sổ cái, do đó, trở thành một nhật ký bất biến: bất kỳ ai có quyền có thể phát lại chuỗi và xác nhận rằng mọi bước đều xảy ra chính xác như đã ghi.
Vì bộ nhớ làm việc của tác nhân được lưu trữ trên cùng sổ cái đó, nó tồn tại qua các sự cố hoặc di chuyển đám mây mà không cần cơ sở dữ liệu bổ sung thông thường. Các yếu tố đào tạo như dấu vân tay dữ liệu, trọng số mô hình và các tham số khác được cam kết tương tự, vì vậy dòng dõi chính xác của bất kỳ phiên bản mô hình nào là có thể chứng minh thay vì chỉ là giai thoại. Sau đó, khi tác nhân cần gọi một hệ thống bên ngoài như API thanh toán hoặc dịch vụ hồ sơ y tế, nó đi qua một động cơ chính sách đính kèm một phiếu chứng nhận mã hóa vào yêu cầu. Chứng chỉ vẫn bị khóa trong kho, và phiếu chứng nhận itself được ghi trên chuỗi cùng với chính sách cho phép nó.
Dưới kiến trúc hướng đến chứng minh này, sổ cái blockchain đảm bảo tính bất biến và xác minh độc lập, sandbox xác định loại bỏ hành vi không thể tái tạo, và động cơ chính sách giới hạn tác nhân vào các hành động được ủy quyền. Cùng nhau, chúng biến các yêu cầu đạo đức như khả năng truy vết và tuân thủ chính sách thành các bảo đảm có thể xác minh giúp thúc đẩy đổi mới nhanh hơn, an toàn hơn.
Xem xét một tác nhân quản lý vòng đời dữ liệu chụp ảnh cơ sở dữ liệu sản xuất, mã hóa và lưu trữ nó trên chuỗi, và xử lý yêu cầu quyền xóa của khách hàng vài tháng sau với ngữ cảnh này.
Mỗi băm ảnh chụp, vị trí lưu trữ và xác nhận xóa dữ liệu được viết vào sổ cái theo thời gian thực. Các đội IT và tuân thủ có thể xác minh rằng sao lưu đã chạy, dữ liệu vẫn được mã hóa và các xóa dữ liệu đúng đã hoàn thành bằng cách kiểm tra một quy trình có thể chứng minh thay vì sàng lọc qua các nhật ký phân tán, riêng lẻ hoặc dựa vào bảng điều khiển nhà cung cấp.
Đây chỉ là một trong vô số ví dụ về cách cơ sở hạ tầng AI tự động, hướng đến chứng minh có thể tối ưu hóa quy trình doanh nghiệp, bảo vệ doanh nghiệp và khách hàng của nó đồng thời mở khóa các hình thức tiết kiệm chi phí và tạo giá trị mới hoàn toàn.
AI nên được xây dựng dựa trên bằng chứng có thể xác minh
Các thất bại nổi bật gần đây của AI không tiết lộ nhược điểm của bất kỳ mô hình cá nhân nào. Thay vào đó, chúng là kết quả vô tình nhưng không thể tránh khỏi của một hệ thống “hộp đen” mà trách nhiệm giải trình chưa bao giờ là nguyên tắc hướng dẫn cốt lõi.
Một hệ thống mang theo bằng chứng của mình chuyển đổi cuộc trò chuyện từ “tin tôi đi” sang “kiểm tra cho chính bạn”. Sự thay đổi đó quan trọng đối với cơ quan quản lý, những người sử dụng AI cá nhân và chuyên nghiệp, và các giám đốc điều hành tên của họ xuất hiện trên thư tuân thủ.
Thế hệ phần mềm thông minh tiếp theo sẽ đưa ra các quyết định quan trọng với tốc độ máy móc.
Nếu những quyết định đó vẫn mờ ám, mọi mô hình mới là nguồn trách nhiệm mới.
Nếu tính minh bạch và khả năng kiểm toán là các thuộc tính sẵn có, được mã hóa cứng, sự tự chủ AI và trách nhiệm giải trình có thể tồn tại hài hòa thay vì xung đột.
Ý kiến của: Avinash Lakshman, Người sáng lập và CEO của Weilliptic.
Bài viết này dành cho mục đích thông tin chung và không nhằm là và không nên được coi là lời khuyên pháp lý hoặc đầu tư. Các quan điểm, suy nghĩ và ý kiến được thể hiện ở đây là của tác giả một mình và không nhất thiết phản ánh hoặc đại diện cho quan điểm và ý kiến của bất kỳ tổ chức nào.
Theo Cointelegraph