News GPU & CPU? Hiểu bí quyết sắm bộ cách xử lý thích ứng cho trọng lượng quá trình của người tiêu dùng

Thảo luận trong 'Tin công nghệ' bắt đầu bởi minhduongpro, 30/10/21.

  1. minhduongpro PageRank 2 Member

    Tham gia ngày:
    21/7/17
    các doanh nghiệp đang khởi phát khối hệ thống để chạy cân nặng quá trình AI cường độ cao mang hai lựa chọn để triển khai công việc nặng nhọc: kiến trúc CPU (đơn vị xử lý trung tâm) cổ điển hoặc GPU pipeline chuyên biệt. Phần đông mọi cá nhân đều hiểu rằng trong bối cảnh của công ty văn minh, chạy tuy vậy song phổ biến trọng lượng các bước học sâu là vấn đề mấu chốt của GPU. Mặc dù vậy, điều mật thiết là cần hiểu rõ mức độ không thiếu thốn của những ứng dụng AI / học sâu & bí quyết tậu loại bộ cách xử trí phù hợp cho 1 khối lượng các bước nhất định.

    CPU và GPU: phương pháp chúng chuyển động

    CPU có thiết kế để ưu ái vận tốc chuyển động cho các giám sát và đo lường tuần tự, điều này được cho phép chúng thực hiện các tập lệnh đa dạng. Khi đc giao đúng nghĩa vụ, CPU sẽ triển khai mang tốc độ nhanh chóng nổi bật, được đo bằng vận tốc xung nhịp. Ngày nay, CPU vẫn là phần cốt lõi của bất kỳ dòng thiết bị máy tính nào. Nó cách xử trí những hướng dẫn chủ yếu và phân phối những tác vụ phức tạp hơn cho những chip chi tiết khác bên trên bo mạch chủ. Lưu ý rằng GPU không thể sửa chữa cho CPU.

    >>> Xem thêm: bán máy trạm HP Z640 tại Hà Nội



    GPU được lạm dụng quá lúc nào?

    GPU hoàn hảo để cách xử lý song song & đã biết thành được ưu ái để huấn luyện và đào tạo những loại hình AI: chúng trọn vẹn hợp với nhu yếu của một quy trình đòi hỏi những chuyển động gần như tương đồng nhau đc tiến hành đồng thời cùng lúc trên tất cả những loại hung ác liệu. Form size tập hung tàn liệu đang tăng toàn bộ theo cấp số nhân & sự song song lớn được hỗ trợ bởi GPU kéo theo việc triển khai các tác vụ này một cách nhanh hơn.

    GPU có phong cách thiết kế để vượt trội trong số phần mềm yêu cầu giải pháp xử lý đa dạng phép tính tuy vậy tuy vậy, này là mật độ áp đảo của những phần mềm AI doanh nghiệp:

    • Học sâu đc tăng tốc và những hoạt động AI với đầu vào hung liệu song song lớn
    • những thuật toán suy luận và huấn luyện và đào tạo AI cổ xưa
    • Mạng nơ-ron truyền thống
    nói tóm gọn, lúc yêu cầu sức khỏe đo lường và thống kê thô để xử trí hung tàn liệu không có kết cấu hoặc đa số giống hệt nhau, thì GPU là giải pháp được ưu tiên.

    Lấy ví dụ như GPU A100 mới của Nvidia. A100 mang GPU 7nm trước tiên của NVIDIA, GA100. GPU này đc đồ vật 6912 nhân CUDA & 40GB bộ lưu trữ HBM2. GPU này cũng nằm bên trên thẻ trước nhất với giao diện PCIe 4.0 ngoại trừ form factor SXM4 chuyên biệt & nó cũng thời gian nhanh không kém. Vì bạn dạng PCIe mang mức tiêu thụ điện năng tốt hơn (250W đối với 400W trong phiên bản SXM4), phải hiệu suất sẽ giảm bớt 10%. Dẫu thế, điều đó kịp thời và nhanh chóng đc thu lại nhờ tiền bạc điện năng & làm giảm nhiệt độ phải chăng hơn. Bộ xử trí đồ họa GA100 là một trong những chip lớn mang diện tích S khuôn 826 mm² & 54,2 tỷ bóng bán dẫn. Nó với 6912 đơn vị tô bóng, 432 đơn vị ánh xạ hình tiết và 160 ROP. Mặt khác còn có 432 lõi tensor, giúp nâng cao vận tốc của các phần mềm học máy. NVIDIA đã ghép nối bộ lưu trữ HBM2E 40 GB sở hữu A100 SXM4, đc kết nối bằng giao diện bộ nhớ 5120-bit. GPU vận động ở tần số 1410 MHz & bộ nhớ lưu trữ chạy ở tần số 1215 MHz. A100 được nổi bật hóa cho những vận động tensor, bao gồm các định dạng TF32 và FP64 mới mang độ đúng chuẩn cao hơn & những phép tính 8-bit mang độ chính xác phải chăng hơn để suy luận.

    GPU A100 nhận đc lợi thế 250% so với GPU Volta 12nm trước đấy của nó ở hiệu suất dấu chấm động đúng mực kép cao nhất. Trong trọng lượng công việc của HPC, tốc độ thực hiện dao động trong khoảng 1,5 lần đến 2,1 lần so với bản nhiệm kỳ trước.

    GPU đã phát triển đáng chú ý so với 30 năm kia, khi chúng đc lạm dụng cơ bản trong laptop cá nhân. Khi hiệu suất & tỷ lệ không giảm giảm xuống, nó đã biến hóa thành các máy trạm chuyên nghiệp hóa, tiếp đến tới các máy chủ và hiện giờ thành các rét đỡ cơ sở dữ liệu. Khi ngày càng có tương đối nhiều ứng dụng chạy trên đám mây và cơ sở độc ác liệu, thì GPU sẽ trở thành một yếu tố cần thiết của kiến trúc & hệ thống. Sức mạnh GPU ngày càng tăng được thể hiện qua GPU Nvidia A100, có thể được chia thành 7 phiên bản hiếm hoi (GPU đa phiên bản) để mà thậm chí đẩy mạnh việc lạm dụng xử trí GPU đc nâng cao và cung cấp rộng rãi cân nặng quá trình khác nhau trong trung tâm hung liệu.

    >>> Xem thêm: bán bo mạch chủ ibm x3650 m4



    CPU đc lạm dụng quá khi nào?

    tình huống sử dụng quá cho những CPU trong tầm quan trọng AI doanh nghiệp hẹp hơn và chuyên biệt hơn. Các tác vụ có không ít thuật toán khó chạy tuy nhiên song thậm chí thích ứng hơn với CPU, bao gồm:

    • huấn luyện & suy luận những hệ thống gợi nhắc sở hữu nhu cầu bộ nhớ to hơn cho nhiều layers phía bên trong.
    • Máy học & các thuật toán suy luận thời gian thực không dễ ợt song song hóa
    • Mạng nơ-ron lặp lại dựa trên ác ôn liệu tuần tự
    • các mô hình mẫu ác ôn liệu kích thước to, bao gồm Ác liệu 3D để huấn luyện và giảng dạy và suy luận
    CPU thích nghi hơn mang các tác vụ lạm dụng quá những thuật toán tuần tự và để tiến hành các phép tính hoạch toán tinh vi, mặc dù thế các cái tác vụ này ít phổ cập hơn trong các ứng dụng AI nhà hàng ngày này. Phần lớn những công ty thích tốc độ và công dụng của GPU hơn là sự trình độ hóa của CPU. Mặc dù vậy, sở hữu những nhà khoa học dữ liệu đang quan tâm đến lại về phong thái các thuật toán AI được khởi phát, có tác dụng dựa vào xúc tích (xử lý nối tiếp) hơn là giám sát hoạch toán.

    CPU là phần tử dẫn dắt của toàn khối hệ thống, được thiết kế với đặc biệt quan trọng để chất nhận được nó lập kế hoạch và thực thi lập lịch cho cả các thành phần khối hệ thống và vận tốc xung nhịp của các core. Điều đó giúp chúng tiến hành tốt những bài toán đơn, phức tạp trong khoảng time ngắn. Khi tiến hành rất nhiều tác vụ nhỏ tuổi cộng một lúc, chẳng hạn như hiển thị 300.000 hình tam giác và tự động hóa biến đổi chúng theo nhu cầu, những CPU bước đầu thể hiện những hạn chế của chúng, đặc biệt là trong các đo lường mạng nơ-ron ResNet.

    con số lõi trong một bộ xử lý đang tăng lên. Những bộ xử lý này trong một bộ xử lý mang từ 2 tới 64 lõi. AMD Ryzen Threadripper 3970X với 32 lõi có công dụng xử trí 64 luồng. AMD Epyc 7702 có 64 lõi và 128 luồng. Tiện ích của việc có khá nhiều lõi là hệ thống có thể xử trí nhiều luồng ác nghiệt liệu hoặc luồng riêng biệt chạy độc lập có nhau. Phong cách thiết kế này làm tăng trưởng đáng chú ý tài nguyên và hiệu suất của một hệ thống đang chạy những phần mềm đồng thời cùng lúc & đa dạng tác vụ trong trung tâm hung liệu. Ngày càng có không ít nhà khởi phát tìm hiểu sự phức hợp của việc viết mã để thực hiện trong những môi trường thiên nhiên điện toán đa luồng, ảo hóa và chứa trong môi trường xung quanh tuy nhiên tuy nhiên.

    >>> Xem thêm: mua may chu supermicro2029u
     
    #1

Chia sẻ trang này