Tại sao Codatta xây dựng Arena AI Agent

Lâu trước khi nó trở thành một thuật ngữ hot, chúng tôi đã biết AI sẽ cần nhiều hơn là những mô hình lớn hơn. Nó sẽ cần đánh giá đáng tin cậy.

Dưới đây là cách nó hoạt động bên trong Codatta:

– Ghi nhận Không thay đổi: Mỗi lần chạy mô hình, mỗi phiếu bầu của con người, mỗi kết quả đều được ghi lại vĩnh viễn trên chuỗi.

– Sở thích của con người như là tín hiệu: Sự căn chỉnh được ghi lại ở quy mô lớn, không chỉ bao gồm độ chính xác mà còn cả các giá trị.

– Bản đồ Năng lực Minh bạch: Các mô hình được đo lường trong điều kiện công khai, có thể kiểm toán, không có các bài kiểm tra đóng và không có điểm số ẩn.

Arena không phải là một buổi ra mắt. Nó là xương sống của cách Codatta lọc tín hiệu từ tiếng ồn, xây dựng một bản đồ công khai về năng lực máy móc, và giữ cho việc đánh giá được đặt trong sự giám sát của con người.

Đó là lý do tại sao chúng tôi xây dựng nó, và tại sao nó quan trọng: để làm cho việc đánh giá AI trở nên mạnh mẽ, minh bạch, và bền bỉ như các mạng lưới mà nó hoạt động trên đó.