Trung Quốc bán RTX 5080 bản độ 32GB VRAM phục vụ cơn sốt AI

Thị trường công nghệ tại Trung Quốc đang chứng kiến một xu hướng đầy táo bạo khi các phiên bản sửa đổi (mod) của dòng card đồ họa GeForce RTX 5080 bắt đầu được bày bán công khai. Những chiếc card này sở hữu dung lượng bộ nhớ gấp đôi so với thông số kỹ thuật ban đầu của nhà sản xuất, nhằm giải quyết cơn khát sức mạnh tính toán cho các ứng dụng trí tuệ nhân tạo (AI) trong bối cảnh nguồn cung phần cứng chuyên dụng đang trở nên khan hiếm. Đây được xem là giải pháp tình thế nhưng cực kỳ hiệu quả của giới công nghệ nước này để thích nghi với nhu cầu ngày càng cao của các mô hình học máy.

Nâng cấp bộ nhớ VRAM RTX 5080 và thiết kế tản nhiệt lồng sóc

Để hiểu rõ lý do tại sao hiện tượng này lại xảy ra, chúng ta cần nhìn vào thực tế rằng ngành công nghiệp AI của Trung Quốc đang khao khát tiếp cận nguồn sức mạnh tính toán đến mức nào. Một trong những cách mà các cơ sở AI tại địa phương xoay sở để đáp ứng nhu cầu của họ là tận dụng các dòng card đồ họa tiêu dùng (vốn dành cho game thủ) đã được sửa đổi, đặc biệt là các sản phẩm đến từ Nvidia. Do các khối lượng công việc liên quan đến AI luôn đòi hỏi dung lượng bộ nhớ tích hợp trên bo mạch (VRAM) rất lớn để xử lý dữ liệu, các thợ độ phần cứng tại Trung Quốc đã tìm cách can thiệp và điều chỉnh cấu hình của GPU. Chúng ta đã từng thấy một xu hướng tương tự diễn ra trước đây với dòng card Nvidia RTX GeForce 4090, và giờ đây, theo nguồn tin từ tài khoản công nghệ uy tín @unikoshardware, các mẫu GPU Nvidia RTX 5080 đang được bán ra với bộ nhớ GDDR7 lên tới 32GB, được thiết kế lại theo hướng chuyên dụng cho máy trạm (workstation).

Trung Quốc bán RTX 5080 bản độ 32GB VRAM phục vụ cơn sốt AI

Việc gắn được tới 32GB bộ nhớ lên một chiếc GeForce RTX 5080 đòi hỏi một kỹ thuật phức tạp, đó là tích hợp các mô-đun bộ nhớ GDDR7 dung lượng 3GB. Giới chuyên môn vốn dự đoán rằng loại mô-đun này sẽ chỉ xuất hiện chính thức trên phiên bản RTX 5080 SUPER trong tương lai, nhưng có vẻ như các thợ độ tại Trung Quốc đã đi trước một bước so với lộ trình của hãng. Nguồn tin cũng đề cập rằng những chiếc card này đang được bán với phong cách thiết kế “turbo”. Đối với những độc giả chưa quen thuộc, đây là kiểu thiết kế sử dụng quạt tản nhiệt lồng sóc (blower-fan), tương tự như những gì đã thấy trên các bản độ của RTX 4090. Kiểu thiết kế này cho phép tản nhiệt hiệu quả hơn nhiều khi xếp nhiều card nằm sát nhau trong các hệ thống máy chủ, một điều kiện bắt buộc phải có đối với những đơn vị phần cứng đã được “bơm” thêm lượng VRAM khổng lồ như thế này.

Rủi ro về độ bền và cơn khát linh kiện cho AI

Những chiếc GPU độ chế này đang được sử dụng rộng rãi cho các khối lượng công việc AI tại địa phương, bởi khách hàng Trung Quốc vẫn có thể tiếp cận được các dòng GPU tiêu dùng của Nvidia. Bằng cách tháo dỡ lớp vỏ nguyên bản và nạp thêm bộ nhớ bổ sung vào bo mạch, những chiếc GPU này được biến đổi để phù hợp (tailored) cho các môi trường huấn luyện và suy luận AI ở phân khúc tầm trung. Khi cộng đồng độ chế phần cứng đang ngày càng phát triển mạnh mẽ và thu hút sự chú ý tại Trung Quốc, nguồn tin từ Uniko’s Hardware dự đoán rằng các mẫu card như vậy có thể sẽ sớm rơi vào tình trạng thiếu hụt trầm trọng một khi ngành công nghiệp AI nội địa ồ ạt chuyển sang sử dụng các GPU có dung lượng VRAM nâng cấp này.

Tuy nhiên, một khía cạnh thú vị và cũng đáng lo ngại cần quan sát ở đây là độ bền thực tế của các cấu hình đã qua chỉnh sửa này. Để vận hành lượng bộ nhớ lớn hơn, định mức công suất nguồn điện thường được điều chỉnh cao hơn so với tiêu chuẩn xuất xưởng của nhà máy, điều này tự thân nó đã mang lại những rủi ro về quá nhiệt hoặc giảm tuổi thọ linh kiện. Mặc dù vậy, đối với ngành công nghiệp AI của Trung Quốc trong giai đoạn hiện tại, việc sở hữu được khả năng tính toán có lẽ quan trọng hơn bất cứ điều gì khác. Do đó, vấn đề về độ bền lâu dài có thể không phải là mối bận tâm hàng đầu của họ, miễn là thiết bị có thể vận hành và xử lý dữ liệu ngay lập tức.

Viết một bình luận