NVIDIA đang mất lợi thế trước làn sóng custom ASIC
NVIDIA đang chịu áp lực mới khi hyperscaler và kỹ sư AI bắt đầu ưu tiên custom ASIC để giảm điện, tản nhiệt và chi phí suy luận.
NVIDIA đang chịu áp lực mới khi hyperscaler và kỹ sư AI bắt đầu ưu tiên custom ASIC để giảm điện, tản nhiệt và chi phí suy luận.
Nvidia AI ngoài quỹ đạo cho thấy cuộc đua hạ tầng AI đang mở rộng lên quỹ đạo thấp, nơi điện, làm mát và mặt bằng có thể được tính lại từ đầu.
Chi phí AI Nvidia đã vượt khoản trả cho nhân sự trong một số nhóm nội bộ, cho thấy cuộc đua compute đang trở thành hóa đơn hạ tầng ngày càng nặng với cả thị trường.
Giao thức MRC của OpenAI kết nối AMD, NVIDIA, Intel, Microsoft và Broadcom để giảm nghẽn mạng, tận dụng cụm GPU lớn hiệu quả hơn.
Nemotron 3 Nano Omni là model open multimodal mới của NVIDIA, hứa hẹn tăng thông lượng agent AI gấp 9 lần và đã thu hút Foxconn, Oracle, Palantir tham gia đánh giá hoặc triển khai.
OpenAI đặt mục tiêu 30GW AI compute vào năm 2030. Con số này lớn cỡ nào, gây áp lực gì lên chip, điện, data center và cuộc đua hạ tầng AI?
Microsoft Fairwater AI Datacenter được cho là vận hành sớm với cụm Blackwell GPU hàng trăm nghìn chiếc, cho thấy cuộc đua AI giờ là bài toán hạ tầng, điện và làm mát.
Jensen Huang nói NVIDIA vẫn sẽ là công ty rất lớn dù không có AI, vì nền móng thật sự của hãng nằm ở GPU, CUDA và điện toán tăng tốc từ nhiều năm trước.
NVIDIA Ising lượng tử mở mô hình AI cho hiệu chỉnh qubit và sửa lỗi, giúp điện toán lượng tử tiến gần hơn tới mức dùng được trong thực tế.
GPU AI cho datacenter thường được nhìn như đỉnh hiệu năng tính toán, nhưng bài benchmark mới do Tom’s Hardware dẫn lại cho thấy một nghịch lý khá rõ. Khi chuyển sang bài test khôi phục mật khẩu từ hash, những mẫu tăng tốc vốn phục vụ AI như Nvidia …