News Cấu hình xem thêm các máy chủ Supermicro đc chứng nhận cho GPU NVIDIA A100 PCIe

Thảo luận trong 'Tin công nghệ' bắt đầu bởi minhduongpro, 1/11/21.

  1. minhduongpro PageRank 2 Member

    Tham gia ngày:
    21/7/17
    Sau event công bố của kiến trúc Ampere và GPU bức tốc AI A100 mới, NVIDIA cũng từng chào làng bản PCIe của bộ bức tốc này để bước đầu cho sự kiện ảo ISC Digital. GPU A100 PCIe đc ra mắt hồi tháng 6 năm 2020, thiết kế bên trên tiến trình 7nm và dựa trên bộ xử lý đồ họa GA100, card không giúp DirectX buộc phải nó thậm chí không chạy được toàn bộ các trò chơi mới nhất. A100 GPU mang 432 lõi tensor giúp nâng cấp vận tốc của những ứng dụng học máy. NVIDIA đã ghép nối bộ lưu trữ HBM2e 40GB mang A100 PCIe, được kết nối bằng giao diện bộ lưu trữ 5120-bit. GPU đang làm việc ở tần số 765 MHz, mà thậm chí được boost lên 1410 MHz, bộ lưu trữ hoạt động ở tần số 1215 MHz, mang đến hiệu suất đo lường và thống kê đa nhiệm khỏe khoắn hơn.

    1 trong GPU sở hữu form size 2 khe cắm (double-width), NVIDIA A100 PCIe bắt buộc hỗ trợ nguồn điện là 1 trong những nguồn EPS 8 chân duy nhất, sở hữu mức tiêu thụ điện năng tối đa là 250W. GPU này không tồn tại cổng screen, vì nó không được thiết kế theo phong cách để có màn hình hiển thị kết nối. A100 PCIe được kết nối sở hữu phần còn sót lại của hệ thống bằng giao diện PCI-Express 4.0 x16. Card có chiều dài 267mm và tiếp xúc PCIe cổ xưa, giúp cung ứng những khách hàng chỉ việc cắm vào sever thiết kế tiêu chuẩn. Nhìn bao quát, A100 PCIe cung cấp hiệu năng tối đa cũng giống như SXM4 A100, cung cấp khoảng 90% hiệu suất đối với phiên bản SXM4 bên trên workload GPU đơn, do TDP giảm mạnh. Điều này giúp cho A100 PCIe thích nghi hơn có các hệ thống AI trong Data Center mật độ cao nhưng tiết kiệm ngân sách và chi phí hơn về TCO.

    >>> Xem thêm: bán máy r940



    NVIDIA GPU A100 PCIe chính là phong cách thiết kế A100 hoàn chỉnh, chỉ khác là nằm trong một form-factor PCIe & có TDP thích nghi hơn. Về hiệu năng, A100 PCIe cũng sẽ nhanh chóng tương đồng phiên bản SXM4. Do đó, bản PCIe sở hữu toàn bộ hầu hết đồ vật mà A100 hỗ trợ vào bên phía trong nó, có cùng trọng tâm tập trung vào các phép toán tensor, bao hàm những chuẩn chỉnh FP32 và FP64 sở hữu độ đúng mực cao hơn, cũng như suy luận số nguyên mau hơn.NVIDIA Ampere A100 PCIe GPU Accelerator_Specs

    cách khắc phục hạ tầng

    Bảng so sánh cấu hình những bộ tăng tốc NVIDIA

    A100

    (PCIe) A100

    (SXM4) V100

    (PCIe) P100

    (PCIe)

    FP32 CUDA Cores 6912 6912 5120 3584

    Boost Clock 1.41GHz 1.41GHz 1.38GHz 1.3GHz

    Memory Clock 2.4Gbps HBM2 2.4Gbps HBM2 1.75Gbps HBM2 1.4Gbps HBM2

    Memory Bus Width 5120-bit 5120-bit 4096-bit 4096-bit

    Memory Bandwidth 1.6TB/sec 1.6TB/sec 900GB/sec 720GB/sec

    VRAM 40GB 40GB 16GB/32GB 16GB

    Single Precision 19.5 TFLOPs 19.5 TFLOPs 14.1 TFLOPs 9.3 TFLOPs

    Double Precision 9.7 TFLOPs

    (1/2 FP32 rate) 9.7 TFLOPs

    (1/2 FP32 rate) 7 TFLOPs

    (1/2 FP32 rate) 4.7 TFLOPs

    (1/2 FP32 rate)

    >>> Xem thêm: mua máy chủ dell r740



    INT8 Tensor 624 TOPs 624 TOPs N/A N/A

    FP16 Tensor 312 TFLOPs 312 TFLOPs 112 TFLOPs N/A

    TF32 Tensor 156 TFLOPs 156 TFLOPs N/A N/A

    Relative Performance (SXM Version) 90% 100% N/A N/A

    Interconnect NVLink 3

    6 Links? (300GB/sec?) NVLink 3

    12 liên kết (600GB/sec) NVLink 2

    4 link (200GB/sec) NVLink 1

    4 link (160GB/sec)

    GPU GA100

    (826mm2) GA100

    (826mm2) GV100

    (815mm2) GP100

    (610mm2)

    Transistor Count 54.2B 54.2B 21.1B 15.3B

    TDP 250W 400W 250W 300W

    Manufacturing Process TSMC 7N TSMC 7N TSMC 12nm FFN TSMC 16nm FinFET

    Interface PCIe 4.0 SXM4 PCIe 3.0 SXM

    Architecture Ampere Ampere Volta Pascal

    ko kể sự chuyển đổi ở form-factor & TDP, khác hoàn toàn đáng chú ý ở A100 PCIe so với bạn dạng SXM là thời gian làm việc kết nối NVLink. Đối với card PCIe , NVIDIA một lần tiếp nữa lạm dụng quá các cầu nối NVLink để kết nối qua trên đây của những card A100, chất nhận được hai (và chỉ hai) card đc link sở hữu nhau qua NVlink Brigde. Với NVlink Brigde, A100 PCIe và 3 NVLink connector của nó mà thậm chí đạt tốc độ NVLink bandwidth lên tới mức 600GB/s, giúp khối hệ thống AI của công ty dễ dàng bức tốc và cải thiện hiệu suất của những ứng dụng và workloads trực tiếp.

    >>> Xem thêm: mua server dell r740xd
     
    #1

Chia sẻ trang này