Tin tức, quan điểm và bài đăng #computeefficiency mới nhất hôm nay

Biến các Mô hình AI thành những Siêu Mô hình: Tại sao Fleek đang chơi ván bài Tính toán Thực sự

AI không chậm lại vì nó ngu ngốc.

Nó chậm lại vì chúng ta coi việc tính toán như việc lưu trữ, chứ không phải như một bài toán kỹ thuật.

Đó chính là nơi Fleek bước vào, và thực sự, họ đang nhắm đúng tầng lớp cốt lõi của hệ thống.

Hầu hết các nền tảng chỉ lo lắng về kích thước mô hình, số lượng GPU hay những bảng điểm ấn tượng. Fleek đi sâu hơn. Sâu hơn. Gần như cổ điển theo cách tốt nhất. Họ coi việc tính toán như một bài toán biên dịch và phối hợp phần cứng, chứ không phải chỉ là một lớp bao bọc API được làm đẹp.

Đây là điểm then chốt:

Không phải mọi tầng nào cũng cần độ chính xác như nhau.

Thông qua nghiên cứu, Fleek phát hiện ra rằng mật độ thông tin thay đổi tùy theo kiến trúc mô hình và từng tầng. Vì vậy, thay vì ép buộc độ chính xác đồng đều ở mọi nơi (điều đó thật sự thiếu suy nghĩ, hãy thành thật mà nói), Fleek đo lường lượng thông tin tại từng tầng và phân bổ độ chính xác một cách động.

Dịch nghĩa?

Bạn nhận được tốc độ tính toán nhanh gấp 3 lần, chi phí giảm 75%, và không mất chất lượng—không phải bằng cách cắt giảm, mà là bằng cách loại bỏ lãng phí.

Đây chính là lúc mọi thứ trở nên thú vị.

Bằng cách kiểm soát chặt chẽ độ chính xác, lịch trình và lựa chọn kernel, Fleek khai thác được những lợi thế hiệu suất mà hầu hết các khung tính toán đều bỏ qua về mặt cấu trúc. Không phải vì họ không thể, mà vì họ chưa bao giờ được thiết kế để suy nghĩ theo cách này.

Nếu cách tiếp cận này có thể mở rộng, thì đó không chỉ là một tối ưu hóa.

Mà là một bước chuyển trong cách xây dựng tính toán.

Chúng ta đã từng chồng các mô hình lớn lên trên các đường dẫn kém hiệu quả, hy vọng rằng phần cứng mạnh mẽ sẽ cứu rỗi. Fleek đảo ngược logic đó. Tối ưu hóa đường đi thực thi, và đột nhiên cùng một mô hình lại hoạt động như một siêu mô hình—nhẹ hơn, nhanh hơn, thông minh hơn.

Đôi khi tiến bộ không phải là làm nhiều hơn.

Mà là cuối cùng làm đúng cách.

#AIInference #ComputeEfficiency #FleekAI

computeefficiency

Chủ đề thịnh hành