AMD hỗ trợ Gemma 4 từ ngày đầu trên Radeon và Ryzen AI

AMD vừa xác nhận hỗ trợ Gemma 4 ngay từ ngày đầu phát hành trên toàn bộ dải phần cứng AI quan trọng của hãng, từ Radeon, Ryzen AI đến Instinct. Điểm đáng chú ý là phạm vi này không dừng ở một nhóm thiết bị riêng lẻ mà trải dài từ AI PC, máy trạm cho tới hạ tầng datacenter. Với người dùng thích chạy mô hình tại chỗ, đây là tín hiệu rõ ràng rằng Gemma 4 đang được AMD đẩy mạnh theo hướng thực dụng. Với nhà phát triển, lợi ích lớn nhất là có thể thử Gemma 4 trên máy cá nhân rồi mở rộng lên ROCm và Instinct khi workload tăng.

AMD phủ Gemma 4 trên Radeon, Ryzen AI và Instinct ngay từ ngày đầu

Trong bài kỹ thuật do AMD đăng ngày 02/04/2026, hãng cho biết hỗ trợ Day Zero cho toàn bộ họ model mới của Google trên ba nhóm phần cứng chính: Radeon GPU cho workstation, Ryzen AI processor cho AI PC và Instinct GPU cho datacenter. WCCFtech sau đó nhấn mạnh đây là một trong số ít thông báo mà AMD phủ cùng lúc cả thiết bị cá nhân lẫn máy chủ thay vì tách riêng từng mảng. Cách làm này quan trọng vì nó rút ngắn thời gian mang mô hình từ giai đoạn thử nghiệm sang triển khai thật. Một workflow có thể bắt đầu ở máy dùng Ryzen AI Max hoặc Radeon rồi chuyển thẳng sang cụm Instinct khi cần dung lượng bộ nhớ và băng thông lớn hơn. Với thị trường AI PC, hướng đi đó đáng chú ý không kém các tin tức về Apple Intelligence trên iOS 18.5 hay laptop dùng Ryzen AI thế hệ mới.

Ryzen AI và ROCm mở ra góc nhìn local AI thực tế hơn

AMD cũng liệt kê khá rõ hệ sinh thái phần mềm đã có hỗ trợ, gồm LM Studio, vLLM, SGLang, llama.cpp, Ollama và Lemonade. Chi tiết này quan trọng hơn bảng thông số vì người dùng local AI thường quan tâm cài được gì ngay hôm nay, không phải lời hứa cho quý sau. Trên phía máy chủ, AMD cho biết nhiều model trong họ Gemma 4 đã sẵn sàng cho vLLM và SGLang, còn trên máy cá nhân thì LM Studio, llama.cpp và Ollama giúp rút ngắn đáng kể thời gian thử nghiệm. Ở bài kỹ thuật gốc, hãng còn nhắc tới khả năng chạy cấu hình lớn trên Instinct MI300X 192GB HBM ở thiết lập TP=1. Thông tin nền tảng hiện đã có trên AMD Developer và bộ tài liệu ROCm cho Radeon và Ryzen.

Ryzen AI và ROCm mở ra góc nhìn local AI thực tế hơn

Điểm AMD muốn nhấn mạnh không chỉ là tương thích model mà là con đường phát triển AI liền mạch từ local lên datacenter. Với Ryzen AI, Ryzen AI Max và Radeon, người dùng có thể chạy Gemma 4 trực tiếp trên máy cá nhân qua llama.cpp hoặc LM Studio, phù hợp cho việc thử prompt, đo độ trễ, kiểm tra ngữ cảnh và đánh giá mức tiêu thụ bộ nhớ. Đây là lợi thế thực tế với nhóm phát triển ứng dụng nội bộ, xử lý dữ liệu nhạy cảm hoặc muốn giảm chi phí cloud ở giai đoạn thử nghiệm sớm. Lemonade cũng được AMD đưa vào danh sách hỗ trợ, nghĩa là hãng đang muốn xây thêm cầu nối giữa local inference và cách gọi API quen thuộc. Nếu ROCm tiếp tục được cập nhật đều trên Radeon và Ryzen AI, Gemma 4 có thể trở thành lý do mua máy rõ ràng hơn trước.

Từ góc nhìn cạnh tranh, động thái này giúp AMD có thêm câu chuyện hoàn chỉnh ở cả hai đầu thị trường. Ở phân khúc thiết bị cá nhân, hãng có thể gắn local AI với trải nghiệm thực dụng hơn như chạy mô hình tại chỗ, phản hồi nhanh và giữ dữ liệu ở máy. Ở phân khúc doanh nghiệp, việc dùng chung tư duy phần mềm từ máy thử nghiệm tới Instinct giúp giảm ma sát khi scale hệ thống. Dĩ nhiên, hỗ trợ Day Zero chưa đồng nghĩa hiệu năng tối ưu tuyệt đối ngay lập tức vì kết quả còn phụ thuộc driver, backend và tốc độ cập nhật từng framework. Nhưng việc AMD đưa Gemma 4 lên Radeon, Ryzen AI và Instinct cùng lúc cho thấy hãng đang cạnh tranh đúng chỗ: phần mềm, workflow và khả năng triển khai thực tế chứ không chỉ riêng phần cứng.

Nguồn: WCCFtech

Viết một bình luận