پلتفرم NVIDIA HGX Platform

پلتفرم NVIDIA HGX
پلتفرم NVIDIA HGX  درواقع به‌عنوان یک معماری سخت‌افزاری بسیار قدرتمند و قابل‌توسعه شناخته می‌شود که توسط کمپانی NVIDIA معرفی شده است. از این پلتفرم در زمینه‌های مختلفی استفاده می‌شود که یکی از مهم‌ترین کاربردهای آن ساخت سرورهای قدرتمند است که بارهای کاری سنگین را انجام می‌دهند. به‌صورت کلی از پلتفرم NVIDIA HGX برای محاسبات HPC، هوش مصنوعی و دیتاسنترهای ابری استفاده می‌شود. لازم به ذکر است که NVIDIA HGX مخفف عبارت Hyperscale GPU Accelerated Platform است و از ویژگی‌های خاصی برخوردار است که در مجموعه "مکسا" به بررسی این پلتفرم و ویژگی‌های آن خواهیم پرداخت. 

راهنمای مطالعه

پلتفرم NVIDIA HGX تحول عظیمی در دنیای دیجیتالی عصر حاضر ایجاد کرده است. این پلتفرم که مجموعه‌ای از کارت‌های گرافیکی است به‌عنوان ستون فقرات ابرکامپیوترها و دیتاسنترهای نسل جدید شناخته می‌شود. از طریق پلتفرم NVIDIA HGX شرایطی ایجاد می‌شود که داده‌ها با سرعت زیاد و بدون وقفه اجرا شوند. بااین‌وجود سازمان‌های مختلف می‌توانند چالش‌های بزرگ را به بهترین شکل پاسخ دهند. به‌عبارت‌دیگر، HGX موجب می‌شود که بالاترین عملکرد برنامه ارائه داده شود و قدرت پردازنده‌های گرافیکی بهینه‌سازی شود.

بیشتر بخوانید: خرید انواع سرور از برندهای مختلف

پلتفرم NVIDIA HGX B300 | پلتفرم شتاب‌یافته و بی‌رقیب

HGX B300 نسل جدید GPUهای NVIDIA است که عملکرد آن در مقایسه با پردازش‌های AL به میزان 11 برابر بیشتر است. اتصال بین GPUها از طریق این پلتفرم به‌صورت فوق سریع انجام می‌شود و میزان تاخیر آن بسیار کم است. HGX B300 دیتاسنترها را وارد نسل جدیدی از محاسبات شتاب‌یافته و هوش مصنوعی کرده است. در واقع عملکرد پلتفرم HGX B300 نسبت به نسل‌های قبلی کاملا بی رغیب است و برای اجرای وظایف سنگین می‌توان بیشترین استفاده را از آن برد.

HGX B300 از شبکه‌سازی‌های بسیار پیشرفته که سرعت 800 گیگابایت در ثانیه دارند، پشتیبانی می‌کند. علاوه‌برآن، فناوری‌های InfiniBand Quantum-X800 و Spectrum-X Ethernet نیز توسط این پلتفرم پشتیبانی می شوند. HGX به پردازشگرهای شبکه‌ای BlueField-3 نیز مجهز است که از طریق آن می‌توان شبکه های ابری ایجاد کرد یا ذخیره سازی پیشرفته انجام داد. پردازشگرهای شبکه‌ای BlueField-3 مانند هسته دوم در کنار GPU عمل می‌کنند و در امنیت و مدیریت شبکه تاثیرات بسیار مثبتی دارند. 

پلتفرم NVIDIA HGX B300 | پلتفرم شتاب‌یافته و بی‌رقیب

پلتفرم NVIDIA HGX B300 | پلتفرم شتاب‌یافته و بی‌رقیب

HGX B300 و استنتاج مدل زبان بزرگ و بلادرنگ

پلتفرم HGX B300 از 11 برابر قدرت استنتاج بیشتر در مقایسه با نسل‌های قبلی NVIDIA HOPPER  و مدل‌های LIAMA 3.1 405B برخوردار است. نسل دوم Transformer Engine در قلب این پیشرفت قرار گرفته است که از هسته های محاسباتی پیشرفته Blackwell Tensor CORE بهره برده است. این هسته ها با فناوری TENSOR RT  LLM ترکیب شده اند و استنتاج مدل‌های زبانی را سریع تر، بهینه تر و با کارایی بیشتر انجام می‌دهند. 

شتاب‌دهی و تسریع HGX و ترکیب آن با فناوری‌های شبکه NVIDIA

ترکیب‌شدن HGX با فناوری‌های شبکه NVIDI، عملکرد و بهره‌وری بسیار بی‌نظیری را به کاربران پلتفرم NVIDIA HGX ارائه داده است که به‌موجب آن می‌توان از منابع محاسباتی استفاده کامل کرد. همکاری HGX و پلتفرم شبکه‌ای NVIDIA Spectrum-X برای دیتاسنترهای ابری هوش مصنوعی که از اترنت استفاده می‌کنند، بهترین انتخاب است. استفاده از سوئیچ‌های Spectrum-X و کارت‌های قدرتمند شبکه NVIDIA SuperNIC باعث بهینه شدن بهره‌وری منابع شده است و عملکرد قابل‌پیش‌بینی و پایدار را برای هزاران وظیفه هم‌زمان هوش مصنوعی در هر مقیاسی، تضمین می‌کند.

لازم به ذکر است که NVIDIA Spectrum-X قابلیت‌های پیشرفته مانند “امنیت بدون اعتماد” یا zero-trust security را فراهم می‌آورد. طراحی سیستم ISRAEL-1 توسط شرکت NVIDIA به‌عنوان نمونه‌ای از کاربرد این فناوری‌ها در نظر گرفته می‌شود. ISRAEL-1 یک ابررایانه عظیم برای هوش مصنوعی مولد است که با سرورهای Dell PowerEdge XE9680 ساخته شده است. علاوه‌برآن، پلتفرم HGX با 8 کارت گرافیکی از نوع  BlueField-3 SuperNIC و سوئیچ‌های  Spectrum-4نیز در این سیستم به کار رفته اند. 

بیشتر بخوانید: خرید دستگاه ذخیره ساز Storage

پلتفرم HGX و عملکرد فراتر از نسل‌های قبل در آموزش مدل‌های هوش مصنوعی

نسخه‌های بسیار جدید پلتفرم NVIDIA HGX از جمله HGX B300 مجهز به موتور ترانسفورماتور نسل دوم هستند که به آن SECOND GENERATION TRANSFORMER ENGINE نیز می‌گویند. در واقع موتور ترانسفورماتور نسل دوم یکی از بخش‌های کلیدی معماری سخت‌افزاری و نرم‌افزاری پلتفرم HGX برای افزایش سرعت و کارایی مدل‌های هوش مصنوعی است.

 موتور ترانسفورماتور نسل دوم از فناوری‌های بسیار پیشرفته مانند FP8 یا اعداد اعشاری 8 بیتی برخوردار است که هسته تخصصی آن Blackwell Tensor Core نامیده می‌شود. این فناوری موجب می‌شود که مدل‌های هوش مصنوعی پیچیده از سرعت 4 برابر بیشتر برای آموزش بهره ببرند؛ درحالی که مصرف انرژی و منابع سخت‌افزاری بهینه تر می گردد. در نتیجه با وجود پلتفرم HGX و فناوری‌های بسیار پیشرفته آن، سازمان ها و دیتاسنترهای بزرگ می توانند از مقیاس پذیری بی وقفه بهره ببرند و بیشترین میزان استفاده از توان GPU ها را تجربه کنند. 

پلتفرم HGX و عملکرد فراتر از نسل‌های قبل در آموزش مدل‌های هوش مصنوعی

پلتفرم HGX و عملکرد فراتر از نسل‌های قبل در آموزش مدل‌های هوش مصنوعی

پلتفرم NVIDIA HGX و مدل‌های مختلف آن به همراه جدول مشخصات فنی

پلتفرم NVIDIA HGX در قالب بردهای پایه (Baseboard) با پیکربندی‌های مختلف عرضه می‌شود؛ از جمله مدل‌هایی با ۴ یا ۸ ماژول Hopper SXM و همچنین مدل‌هایی با ۸ ماژول NVIDIA Blackwell یا Blackwell Ultra SXM . ترکیب این سخت‌افزارهای قدرتمند با نرم‌افزارهای تخصصی NVIDIA، بستری را فراهم می‌سازد که ابررایانه‌های هوش مصنوعی، عملکردی بی‌سابقه در پردازش‌های هوشمند و محاسباتی ارائه دهند.

معماری BlackWellHGX B200HGX B300
Form Factor8 x NVIDIA Blackwell SXM8 x NVIDIA Blackwell Ultra SXM
FP4 Tensor Core144 PFLOPS | 72 PFLOPS144 PFLOPS | 105 PFLOPS
FP8/FP6 Tensor Core72 PFLOPSPFLOPS72
INT8 Tensor Core72 POPS2 POPS
FP16/BF16 Tensor Core36 PFLOPS36 PFLOPS
TF32 Tensor Core18 PFLOPS18 PFLOPS
FP 32600 TFLOPS600 TFLOPS
FP64/FP64 Tensor Core296 TFLOPS10 TFLOPS
Total Memory1.4 TBUP TO 2.3 TB
NVLINKFifth generationFifth generation
NVIDIA NVSwitchNVLink 5 SwitchNVLink 5 Switch
NVSwitch GPU-to-GPU Bandwidth1.8 TB/S1.8 TB/S
Total NVLink Bandwidth14.4 TB/S14.4 TB/S
Networking Bandwidth0.8 TB/S1.6 TB/S
Attention Performance1X2X

معماری hooper در HGX H200

 8GPU 4GPU
Form Factor8 x NVIDIA H200 SXM4 x NVIDIA H200 SXM
FP8 Tensor Core32PFLOPS16 PFLOPS
INT8 Tensor Core32 POPS16 POPS
FP16/BF16 Tensor Core16 PFLOPS8 PFLOPS
TF32 Tensor Core8 PFLOPS4 PFLOPS
FP32540 TFLOPS270 TFLOPS
FP64270 TFLOPS140 TFLOPS
FP64 Tensor Core540 TFLOPS270 TFLOPS
Total Memory1.1 TB HBM3564 GB HBM3
GPU Aggregate Bandwidth38 GB/S19 GB/S
NVLinkFourth generationFourth generation
NVSwitchNVLink 4 SwitchN/A
NVSwitch GPU-to-GPU Bandwidth900 GB/SN/A
Total Aggregate Bandwidth7.2 TB/S3.6 TB/S
Networking Bandwidth0.8 TB/S0.4 TB/S

معماری hooper در HGX H100

8GPU4GPU
Form Factor8 x NVIDIA H100 SXM4 x NVIDIA H100 SXM
FP8 Tensor Core32 PFLOPS16 PFLOPS
INT8 Tensor Core32 POPS16 POPS
FP16/BF16 Tensor Core16 PFLOPS8 PFLOPS
TF32 Tensor Core8 PFLOPS4 PFLOPS
FP32540 TFLOPS270 TFLOPS
FP64270 TFLOPS140 TFLOPS
FP64 Tensor Core540 TFLOPS270 TFLOPS
Total Memory640 GB HBM3320 GB HBM3
GPU Aggregate Bandwidth27 GB/S13 GB/S
NVLinkFourth generationFourth generation
NVSwitchNVLink 4 SwitchN/A
NVSwitch GPU-to-GPU Bandwidth900 GB/SN/A
Total Aggregate Bandwidth7.2 TB/S3.6 TB/S
Networking Bandwidth0.8 TB/S0.4 TB/S

سوالات متداول

معماری HOPPER در پلتفرم NVIDIA HGX چگونه است؟

معماری Hopper نسل قبلی واحدهای پردازش گرافیکی (GPU) شرکت NVIDIA است که پیش از معماری Blackwell معرفی شده بود. این معماری مخصوص پردازش‌های پیشرفته هوش مصنوعی، یادگیری عمیق، و محاسبات با عملکرد بالا (HPC) طراحی شده و برای اولین‌بار در GPUهای NVIDIA H100 به کار گرفته شد. 

معماری BLACKWELL در پلتفرم NVIDIA HGX چگونه است؟

معماری BLACKWELL به‌عنوان نسل جدید واحدهای پردازش گرافیکی GPU مخصوص شرکت NVIDIA شناخته می‌شود. BLACKWELL نسبت به HOPPER جدیدتر است و جایگزین آن شده است. ازاین‌رو برای پردازش‌های سنگین هوش مصنوعی، مدل‌های زبان بزرگ LLM و محاسبات با عملکرد بالا بهینه‌سازی شده است. 

در HGX B300 از کدام معماری استفاده شده است؟

پلتفرم HGX B300 دارای معماری BLACK WELL و BLACKWELL ULTRA است که به‌صورت ماژول‌های SXM و با پیکربندی 8GPU در یک برد پایه نصب شده است. این GPUها در مقایسه با نسل‌های قبلی از عملکرد و بهره‌وری بسیار زیادی برخوردار هستند. 

مهم‌ترین ویژگی‌های معماری BLACKWELL در پلتفرم NVIDIA HGX چیست؟
  •       عملکرد فوق‌العاده در هوش مصنوعی مولد
  •       پشتیبانی از دقت FP8 و موتور ترانسفورماتور نسل دوم
  •       یکپارچگی با فناوری‌های شبکه و ذخیره‌سازی NVIDIA
چگونه می‌توان پلتفرم NVIDIA HGX را در ایران خریداری کرد؟

شرکت مکسا که در زمینه تجهیزات امنیتی و شبکه فعالیت دارد، پلتفرم NVIDIA HGX را در اختیار متقاضیان عزیز قرار می‌دهد. پلتفرم NVIDIA HGX در شرکت مکسا باقیمت مناسب عرضه می‌شود. همچنین از این مجموعه می‌توانید سایر تجهیزات موردنیاز برای شبکه مانند کارت گرافیکی، سرور و… را نیز تهیه کنید. برای کسب اطلاع از قیمت پلتفرم NVIDIA HGX با ما تماس بگیرید.

مطالب مرتبط

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

برای دیدن نوشته هایی که دنبال آن هستید تایپ کنید.
خانه
فروشگاه