Startup Hàn Quốc tạo máy chủ AI 'hiệu quả hơn Nvidia H100'

Tóm tắt: FuriosaAI ra mắt máy chủ RNGD Server, tiết kiệm năng lượng (3kW so với >10kW của Nvidia DGX H100) và hiệu quả sử dụng không gian (5 máy chủ RNGD/rack so với 1 DGX H100). Giải pháp này giúp doanh nghiệp giảm chi phí hạ tầng AI, tương thích API OpenAI. Startup Hàn Quốc này đã gọi vốn 125 triệu USD và hợp tác với LG AI Research. RNGD Server dự kiến đặt hàng đầu năm 2026.

Theo FuriosaAI, mỗi hệ thống RNGD Server có sức mạnh tính toán 4 petaflop (triệu tỷ phép tính mỗi giây) và 384 GB bộ nhớ HBM3, nhưng chỉ tiêu thụ 3 kW khi hoạt động. Trong khi đó, máy chủ Nvidia DGX H100 có thể tiêu thụ hơn 10 kW cho cùng mức hiệu năng. Có nghĩa, một rack trung tâm dữ liệu tiêu chuẩn, thường giới hạn ở mức 15 kW, có thể chứa 5 máy chủ RNGD, trong khi chỉ có thể lắp vừa một máy chủ DGX H100.

FuriosaAI cho biết thiết kế này khắc phục một rào cản lớn đối với doanh nghiệp, vì hầu hết trung tâm dữ liệu hiện đều giới hạn ở mức 8 kW điện năng mỗi rack hoặc ít hơn, do đòi hỏi hệ thống làm mát và cấp điện phức tạp. Công ty tuyên bố việc áp dụng RNGD Server cho phép doanh nghiệp mở rộng quy mô hiệu quả, đồng thời duy trì khả năng tương thích với API của OpenAI.

Chip RNGD dùng trên máy chủ AI của FuriosaAI. Ảnh: Servethehome

Chip RNGD dùng trên máy chủ AI của FuriosaAI. Ảnh: Servethehome

Startup của Hàn Quốc FuriosaAI, nổi tiếng vì từng từ chối lời đề nghị mua lại với giá 800 triệu USD từ Meta, được đánh giá đang tạo ra bước đột phá trong bối cảnh nhu cầu về cơ sở hạ tầng AI tăng cao. Công ty đặt mục tiêu cung cấp cho doanh nghiệp giải pháp phần cứng có thể chạy mô hình ngôn ngữ lớn mà không phải chịu chi phí nâng cấp trung tâm dữ liệu tốn kém hay hóa đơn năng lượng khổng lồ.

FuriosaAI cũng vừa hoàn thành vòng gọi vốn series C trị giá 125 triệu USD và mở rộng quan hệ đối tác với LG AI Research. LG sử dụng phần cứng RNGD để chạy mô hình Exaone của mình và cho biết đạt được hiệu suất suy luận trên mỗi watt cao hơn gấp đôi so với GPU truyền thống. Trước đó, FuriosaAI cũng hợp tác với OpenAI trình diễn chatbot mã nguồn mở gpt-oss 120B chạy theo thời gian thực chỉ trên hai bộ tăng tốc RNGD.

Máy chủ RNGD đang được các khách hàng thử nghiệm và dự kiến cho đặt hàng đầu năm 2026.

Huy Đức (theo TechRadar)



Nguồn: vnexpress.vn
Nếu bạn quan tâm về ứng dụng quản lý trẻ em trên ứng dụng di động, hãy đến với esafe.vn

Bình luận

0
Để lại bình luận
Chưa có bình luận nào

Hãy là người đầu tiên bình luận về bài viết này!

Thống kê bài viết

3

Lượt xem

0

Bình luận
Bài viết liên quan