
GPU BMG-G21
Trái tim của Intel Arc B580 là vi xử lý đồ họa (GPU) BMG-G21, sản xuất trên tiến trình N5 (5 nm) của TSMC, chứa 19.6 tỷ bán dẫn trên 1 die nguyên khối (monolithic) có diện tích 272 mm². Mặc dù mật độ bán dẫn đã được cải thiện so với thế hệ Alchemist, ở mức 72.1 triệu/mm², Battlemage vẫn thấp hơn so với các kiến trúc cạnh tranh như Ada Lovelace của NVIDIA và RDNA 3 của AMD. Điều này phần nào lý giải tại sao B580 có mức tiêu thụ điện năng (TBP 190 W) tương đối cao so với hiệu năng mà nó mang lại.
Về mặt cấu trúc, GPU BMG-G21 được tổ chức lại khoa học hơn với Global Dispatch (bộ điều phối toàn cục) chịu trách nhiệm phân chia công việc cho 5 Render Slice. Các Slice này giao tiếp với nhau và với hệ thống bộ nhớ thông qua bộ đệm L2 Cache chung có dung lượng 18 MB.
Xe Core thế hệ 2
Đơn vị xử lý trung tâm của kiến trúc Battlemage là Xe Core thế hệ 2, được thiết kế lại hoàn toàn để tối ưu hóa hiệu năng và hiệu quả năng lượng. Toàn bộ GPU B580 chứa 20 Xe Core. Mỗi Xe Core chứa 8 Vector Engines (XVE) 512 bit, nâng tổng số XVE lên 160. Cải tiến nền tảng quan trọng nhất là việc các XVE này giờ đây hỗ trợ native (gốc) cho tập lệnh SIMD16, thay vì SIMD8 trên Alchemist, giúp tăng cường khả năng xử lý song song và tương thích tốt hơn với các game engine hiện đại.
Nhờ những cải tiến này, Intel tuyên bố hiệu năng trên mỗi Xe Core đã tăng đến 70% và hiệu quả năng lượng tăng 50% so với thế hệ trước. Bước tiến này không chỉ nhờ tăng xung hoạt động mà còn từ việc tối ưu hóa IPC (số lệnh trên mỗi chu kỳ), giảm độ trễ và loại bỏ các điểm nghẽn trong pipeline xử lý. Bên cạnh đó, mỗi Xe Core còn tích hợp 8 XMX Engine, chuyên dụng cho các tác vụ trí tuệ nhân tạo (AI). Với tổng cộng 160 XMX Engine, Arc B580 có khả năng cung cấp sức mạnh tính toán INT8 lên tới 233 TOPS, đóng vai trò then chốt cho công nghệ nâng cấp hình ảnh XeSS và các ứng dụng AI khác.
Nâng cấp phần cứng chuyên dụng
Thế hệ Alchemist có những hạn chế về phần cứng, cụ thể là nằm trong thiết kế silicon, vì vậy Intel Arc A Series đã gặp những vấn đề hiệu năng nhưng thường bị quy cho driver chưa hoàn thiện. Nếu như trước đây Alchemist phải giả lập bằng phần mềm cho 1 số lệnh đồ họa, Battlemage đã xử lý chúng bằng phần cứng. Các lệnh như Execute Indirect (thường sử dụng trong Unreal Engine 5) được xử lý trực tiếp bằng phần cứng trên Battlemage, tăng tốc độ lên tới 12.5 lần. Tương tự như vậy, lệnh Fast Clear cũng có hiệu quả tốt hơn. Thay đổi của Battlemage giúp giảm tải cho CPU và driver (vấn đề CPU Overhead hay Driver Overhead), cải thiện hiệu năng đồ họa nhất là đối với game hiện đại.
Các đơn vị phần cứng chuyên dụng khác cũng được nâng cấp, như Ray Tracing Unit (RTU) thế hệ 2. Mỗi RTU giờ đây có 3 Traversal Pipeline (tăng 50% hiệu năng) và 2 đơn vị triangle intersection (gấp đôi hiệu năng). Kích thước bộ đệm BVH cũng tăng gấp đôi lên 16 KB. Những cải tiến này giúp tăng tốc đáng kể các tác vụ ray tracing. Còn đối với Geometry Engine và Sampler, hiệu năng xử lý Mesh Shading và Vertex Fetch tăng gấp 3 lần, trong khi hiệu năng lấy mẫu không lọc (non-filtered texturing) và blending tăng gấp đôi.
Bộ nhớ đồ họa
Nhằm đáp ứng cho nhu cầu của các đơn vị phần cứng mới mạnh hơn, Arc B580 trang bị bộ nhớ đồ họa GDDR6 dung lượng 12 GB. VRAM hoạt động ở tốc độ 19 Gbps với độ rộng bus 192 bit, cung cấp tổng băng thông bộ nhớ đồ họa tới 456 GBps. So với Arc A580 vốn có độ rộng bus tới 256 bit, thế hệ Battlemage bù đắp bằng tốc độ bộ nhớ cao hơn, đảm bảo cung cấp đủ dữ liệu cho GPU, đặc biệt là ở độ phân giải 1440p.
Intel Arc B580 sử dụng chuẩn PCI-Express 4.0 với 8 làn (x8). Mặc dù về lý thuyết chỉ bằng 1/2 số làn của giao tiếp x16 đầy đủ, băng thông của PCIe 4.0 x8 là hoàn toàn đủ cho 1 lựa chọn GPU ở phân khúc phổ thông, không gây ra hiện tượng nghẽn cổ chai đáng kể trong các nhu cầu sử dụng thông thường.
Intel XeSS 2
Intel Xe Super Sampling thế hệ 2 hay XeSS 2 không chỉ đơn thuần là công nghệ nâng cấp hình ảnh như tên gọi, mà chính xác hơn, nó là bộ giải pháp gồm 3 thành phần: XeSS Super Resolution (SR), XeSS Frame Generation (FG) và Xe Low Latency (LL).
Quảng cáo
XeSS Frame Generation (FG) và Xe Low Latency (LL) hoạt động tương tự như các công nghệ của đối thủ. XeSS FG sử dụng các vector chuyển động và optical flow để tạo ra các khung hình hoàn toàn mới và chèn chúng vào giữa các khung hình được render truyền thống, giúp tăng đáng kể tốc độ khung hình (FPS – frame per second). Còn với tác dụng phụ của việc tạo khung hình – độ trễ đầu vào (input lag) – công nghệ Intel Xe Low Latency (LL) giúp tối ưu hóa hàng đợi render, giảm thời gian từ khi người dùng thực hiện hành động đến khi nó được hiển thị trên màn hình.
Tính đến giữa năm 2025, XeSS đã được hỗ trợ trong hơn 200 tựa game. Tuy nhiên, số lượng game hỗ trợ bộ tính năng đầy đủ của XeSS 2, đặc biệt là Frame Generation, vẫn còn hạn chế nhưng đang phát triển nhanh chóng. Nhiều tựa game lớn đã và sẽ hỗ trợ XeSS 2, như Diablo IV, Assassin’s Creed Shadows, Black Myth: Wukong và Civilization VII, cho thấy các nhà phát triển đang ngày càng chấp nhận rộng rãi hơn.
Xe Media Engine
Intel Arc B580 trang bị 2 engine đa định dạng (MFX – multi-format transcoder), cung cấp khả năng mã hóa (encode) và giải mã (decode) phần cứng cho các codec video phổ biến nhất hiện nay như AV1, H.265 (HEVC), H.264 và VP9. Điểm đặc biệt tạo nên lợi thế cạnh tranh cho Arc B580 trong lĩnh vực sáng tạo nội dung là khả năng giải mã phần cứng cho codec HEVC 4:2:2 10-bit. Đây là định dạng phổ biến trong quy trình làm việc chuyên nghiệp, nhưng thường không được hỗ trợ tăng tốc phần cứng trên các card đồ họa phổ thông của đối thủ.
Khi thử nghiệm thực tế, bộ mã hóa AV1 của Intel cung cấp chất lượng hình ảnh tốt hơn so với bộ mã hóa H.264 (NVENC của NVIDIA và VCN của AMD) ở cùng mức bitrate, đặc biệt hiệu quả khi streaming ở các bitrate thấp. Điều này giúp giảm yêu cầu về băng thông mạng mà vẫn duy trì chất lượng hình ảnh tốt. Tuy nhiên, đôi khi vẫn có trường hợp hiệu năng không ổn định khi streaming bằng codec H.264 cũ hơn qua các ứng dụng như Discord.
Cải thiện driver
Quảng cáo
Có 1 vấn đề vẫn tồn tại cho tới hiện nay là CPU Overhead hay Driver Overhead như đã nhắc tới ở trên. Đây là hiện tượng hiệu năng của GPU bị phụ thuộc nhiều vào tốc độ xử lý của CPU. Nguyên nhân là do driver của Intel yêu cầu CPU phải xử lý khối lượng lớn các lệnh draw call trước khi gửi chúng đến GPU. Hiện tượng này có tác động rõ nhất khi Arc B580 chạy với các CPU đời cũ (Ryzen 3000/5000 Series, Intel Core thế hệ 11 trở về trước) hoặc khi chơi game ở độ phân giải thấp như 1080p. Trong những trường hợp này, hiệu năng của Arc B580 có thể giảm từ 15% đến 40% so với khi sử dụng trên nền tảng CPU cao cấp. Để khai thác tối đa Arc B580, cũng như Alchemist, hệ thống của bạn cần hỗ trợ Resizable BAR, nếu không, chúng ta đã vô tình hạn chế sức mạnh từ Battlemage.
Nguồn: Tinhte.vn