Fractile lọt tầm ngắm Anthropic: chip AI inference hứa nhanh gấp 100 lần

Anthropic, công ty đứng sau Claude, được cho là đang quan tâm tới Fractile, startup tại Anh chuyên làm chip cho AI ở giai đoạn inference, tức lúc mô hình tạo câu trả lời cho người dùng. Điểm gây chú ý nằm ở lời hứa rất lớn: tăng tốc độ suy luận lên tới 100 lần và hạ chi phí xuống còn một phần mười so với một số giải pháp hiện nay. Nếu những con số đó tiến gần thực tế, dịch vụ AI có thể phản hồi nhanh hơn và rẻ hơn cho người dùng cuối. Vì thế, câu chuyện này đang được theo dõi rất sát. Với Anthropic, nếu Fractile chứng minh được công nghệ thật, hãng sẽ có thêm một cửa để hạ độ trễ dịch vụ mà không phải phụ thuộc hoàn toàn vào lộ trình của các nhà cung cấp chip lớn.

Vì sao Anthropic lại chú ý tới một startup còn rất sớm?

Theo báo cáo của Wccftech, Anthropic đang ở giai đoạn thảo luận ban đầu với Fractile để tiếp cận công nghệ tăng tốc inference. Chi tiết đáng chú ý là Anthropic hiện đã dựa vào nhiều nguồn chip khác nhau như NVIDIA, Google và Amazon, nên việc tìm thêm một hướng đi mới cho thấy áp lực hạ giá thành AI đang lớn tới mức nào.

Vì sao Anthropic lại chú ý tới một startup còn rất sớm?

Khác với giai đoạn huấn luyện mô hình, inference là phần tiêu tốn tiền vận hành mỗi ngày vì nó xảy ra liên tục mỗi khi người dùng đặt câu hỏi. Chỉ cần rút ngắn độ trễ hoặc giảm chi phí mỗi truy vấn, các hãng AI đã có thể tiết kiệm khoản tiền rất lớn khi quy mô phục vụ lên tới hàng tỷ lượt. Đó cũng là lý do cuộc đua hạ tầng AI đang nóng không kém cuộc đua mô hình. Anthropic hiểu khá rõ điều này vì càng nhiều người dùng Claude đặt câu hỏi, áp lực lên hạ tầng inference càng tăng theo cấp số lớn.

Với Anthropic, đây còn là bài toán chiến lược. Nếu tiếp tục phụ thuộc hoàn toàn vào chip mua ngoài, hãng sẽ khó kiểm soát giá, nguồn cung và tốc độ mở rộng dịch vụ. Một kiến trúc inference hiệu quả hơn cũng đặc biệt quan trọng khi doanh nghiệp ngày càng muốn đưa agent AI doanh nghiệp vào quy trình thật.

Công nghệ của Fractile hứa hẹn điều gì và còn rủi ro nào?

Fractile mô tả trên website chính thức rằng họ đang phát triển kiến trúc kết hợp chặt bộ nhớ và phần tính toán để giảm việc phải liên tục chuyển dữ liệu ra ngoài chip. Nói ngắn gọn, càng bớt chạy qua lại giữa bộ nhớ và khối xử lý, hệ thống càng giảm độ trễ và bớt tốn điện. Startup này đang công bố mục tiêu nhanh hơn tới 25 lần với chi phí bằng một phần mười, trong khi bài viết của Wccftech dẫn lại mức kỳ vọng còn tham vọng hơn khi so với hệ thống Groq. Nếu Fractile đạt được dù chỉ một phần của lời hứa đó, Anthropic cũng đã có lý do để theo đuổi công nghệ này sâu hơn.

Điểm chính Ý nghĩa
Thảo luận còn sớm Chưa có thỏa thuận chính thức.
Kiến trúc nhớ sát khối tính Giảm thời gian chờ dữ liệu.
Mục tiêu chi phí còn 1/10 AI có cơ hội rẻ hơn.
Tuyên bố 100x vẫn là mục tiêu Chưa phải benchmark độc lập.

Phần cần giữ tỉnh táo là Fractile vẫn chưa có chip thử nghiệm hoàn chỉnh để chứng minh mọi tuyên bố trong môi trường thương mại lớn. Nói cách khác, đây là một canh bạc công nghệ đúng nghĩa: ý tưởng rất đáng theo dõi, nhưng từ slide tham vọng tới rack máy chủ hoạt động ổn định vẫn là quãng đường dài.

Dù vậy, động thái của Anthropic vẫn là tín hiệu đáng chú ý cho toàn ngành. Nó cho thấy nút thắt của AI hiện nay không còn chỉ là làm ra mô hình thông minh hơn, mà là làm sao để mô hình đó trả lời nhanh, rẻ và đủ ổn định cho hàng triệu người dùng cùng lúc. Với Anthropic, bài toán này gần như gắn thẳng với khả năng mở rộng Claude trong giai đoạn nhu cầu doanh nghiệp tăng rất nhanh. Nếu thương vụ tiến lên, Anthropic AI inference có thể trở thành một mặt trận hạ tầng đáng theo dõi nhất năm nay. Sau những bài học từ sự cố AI agent ngoài thực tế, thị trường sẽ càng chú ý hơn tới phần hạ tầng phía sau trải nghiệm AI.

Viết một bình luận