NVIDIA vẫn là cái tên thống trị hạ tầng AI, nhưng lợi thế này không còn được nhìn chỉ bằng tốc độ xử lý hay lời hứa hiệu năng trên mỗi watt. Khi dịch vụ AI chuyển mạnh sang giai đoạn suy luận, các hyperscaler bắt đầu soi kỹ hơn số tiền phải trả cho điện, làm mát và từng token được tạo ra. Đó là lý do custom ASIC, tức chip thiết kế riêng cho một nhóm tác vụ AI, đang được nhắc đến nhiều hơn trong các cuộc họp mua sắm hạ tầng. GPU chưa biến mất khỏi cuộc chơi, nhưng thước đo chiến thắng đang đổi từ sức mạnh thuần sang bài toán kinh tế của cả hệ thống.
Vì sao custom ASIC bắt đầu hấp dẫn hơn với hyperscaler?
Trong bài phân tích ngày 20/5, WCCFtech dẫn lại nhận định của Evercore rằng nhiều kỹ sư AI không còn chỉ nhìn vào thông số hiệu năng trên mỗi watt khi đánh giá phần cứng. Với họ, một cụm máy AI đắt không chỉ nằm ở giá chip, mà còn ở tiền điện, hệ thống giải nhiệt, mật độ rack, mức sử dụng thực tế và chi phí vận hành kéo dài nhiều năm.

Điểm khác biệt của custom ASIC là nó không cố làm mọi việc như GPU. Hyperscaler như Google, Amazon hay Microsoft có thể đặt hàng chip riêng cho một số tác vụ cố định, đặc biệt là suy luận, nơi khối lượng truy vấn lớn nhưng kiểu xử lý lặp đi lặp lại. Khi tối ưu rất sâu cho đúng bài toán đó, chip riêng thường có lợi thế ở điện năng, lượng nhiệt tỏa ra và diện tích hạ tầng phải dành cho mỗi đơn vị công việc.
Cách nhìn này cũng ăn khớp với áp lực tài chính ngày càng rõ trong các dự án AI quy mô lớn. Ngay cả khi GPU của NVIDIA vẫn mạnh và có hệ sinh thái phần mềm tốt, bên mua giờ phải tính xem chi phí trên mỗi token có giảm đủ nhanh hay không, tương tự bài toán chi phí compute mà thị trường AI đang tranh luận suốt nhiều tuần qua.
NVIDIA sẽ bị ảnh hưởng ra sao nếu xu hướng này mạnh lên?
Rủi ro lớn nhất với NVIDIA không phải là mất thị phần chỉ sau một quý, mà là mất dần vị thế mặc định trong những đơn hàng AI mới. Nếu giai đoạn huấn luyện mô hình từng ưu tiên GPU đa dụng vì cần linh hoạt và thay đổi nhanh, thì giai đoạn suy luận quy mô lớn lại khác: khách hàng bắt đầu chấp nhận phần cứng “đủ tốt” miễn tổng chi phí thấp hơn, dễ làm mát hơn và tận dụng điện tốt hơn trong trung tâm dữ liệu.
| Tiêu chí | GPU AI phổ dụng | Custom ASIC | Tác động thực tế |
|---|---|---|---|
| Mức linh hoạt | Cao, chạy nhiều loại mô hình và framework | Thấp hơn, tối ưu cho tác vụ cụ thể | GPU hợp với môi trường thay đổi nhanh, ASIC hợp tải ổn định |
| Điện và tản nhiệt | Thường nặng hơn khi mở rộng số lượng lớn | Có thể tối ưu tốt hơn cho một luồng xử lý | ASIC giúp hyperscaler giảm áp lực điện và làm mát |
| Chi phí triển khai | Giá chip cao nhưng triển khai nhanh | Tốn thời gian thiết kế, bù lại có thể rẻ hơn khi chạy lâu dài | Bên mua phải cân bằng giữa tốc độ ra mắt và tổng chi phí sở hữu |
| Phần mềm | Hưởng lợi từ CUDA và hệ sinh thái sẵn có | Phụ thuộc nhiều vào stack nội bộ | NVIDIA vẫn mạnh ở phần mềm, nhưng lợi thế này không còn tuyệt đối |
Nếu xu hướng đó tăng tốc, NVIDIA sẽ chịu áp lực ở cả biên lợi nhuận lẫn quyền định giá với hyperscaler. Những công ty đang mở rộng AI data center có xu hướng tính rất kỹ công suất điện, đất, nước làm mát và khả năng mở rộng theo từng cụm, nên một giải pháp rẻ hơn ở cấp hệ thống sẽ có sức nặng lớn hơn những tuyên bố hiệu năng thuần.
Dù vậy, điều này chưa đủ để kết luận GPU AI của NVIDIA sắp hụt hơi. Các mô hình mới, các đợt huấn luyện lớn và những hệ thống cần triển khai nhanh vẫn cần nền tảng phần mềm lẫn phần cứng mà NVIDIA đã xây nhiều năm. Điều đang thay đổi là hyperscaler không còn muốn đặt toàn bộ tương lai AI vào một loại chip duy nhất, và custom ASIC đang trở thành công cụ mặc cả rất thực tế trong cuộc đua hạ tầng mới.