پلتفرم NVIDIA HGX تحول عظیمی در دنیای دیجیتالی عصر حاضر ایجاد کرده است. این پلتفرم که مجموعهای از کارتهای گرافیکی است بهعنوان ستون فقرات ابرکامپیوترها و دیتاسنترهای نسل جدید شناخته میشود. از طریق پلتفرم NVIDIA HGX شرایطی ایجاد میشود که دادهها با سرعت زیاد و بدون وقفه اجرا شوند. بااینوجود سازمانهای مختلف میتوانند چالشهای بزرگ را به بهترین شکل پاسخ دهند. بهعبارتدیگر، HGX موجب میشود که بالاترین عملکرد برنامه ارائه داده شود و قدرت پردازندههای گرافیکی بهینهسازی شود.
بیشتر بخوانید: خرید انواع سرور از برندهای مختلف
پلتفرم NVIDIA HGX B300 | پلتفرم شتابیافته و بیرقیب
HGX B300 نسل جدید GPUهای NVIDIA است که عملکرد آن در مقایسه با پردازشهای AL به میزان 11 برابر بیشتر است. اتصال بین GPUها از طریق این پلتفرم بهصورت فوق سریع انجام میشود و میزان تاخیر آن بسیار کم است. HGX B300 دیتاسنترها را وارد نسل جدیدی از محاسبات شتابیافته و هوش مصنوعی کرده است. در واقع عملکرد پلتفرم HGX B300 نسبت به نسلهای قبلی کاملا بی رغیب است و برای اجرای وظایف سنگین میتوان بیشترین استفاده را از آن برد.
HGX B300 از شبکهسازیهای بسیار پیشرفته که سرعت 800 گیگابایت در ثانیه دارند، پشتیبانی میکند. علاوهبرآن، فناوریهای InfiniBand Quantum-X800 و Spectrum-X Ethernet نیز توسط این پلتفرم پشتیبانی می شوند. HGX به پردازشگرهای شبکهای BlueField-3 نیز مجهز است که از طریق آن میتوان شبکه های ابری ایجاد کرد یا ذخیره سازی پیشرفته انجام داد. پردازشگرهای شبکهای BlueField-3 مانند هسته دوم در کنار GPU عمل میکنند و در امنیت و مدیریت شبکه تاثیرات بسیار مثبتی دارند.

پلتفرم NVIDIA HGX B300 | پلتفرم شتابیافته و بیرقیب
HGX B300 و استنتاج مدل زبان بزرگ و بلادرنگ
پلتفرم HGX B300 از 11 برابر قدرت استنتاج بیشتر در مقایسه با نسلهای قبلی NVIDIA HOPPER و مدلهای LIAMA 3.1 405B برخوردار است. نسل دوم Transformer Engine در قلب این پیشرفت قرار گرفته است که از هسته های محاسباتی پیشرفته Blackwell Tensor CORE بهره برده است. این هسته ها با فناوری TENSOR RT LLM ترکیب شده اند و استنتاج مدلهای زبانی را سریع تر، بهینه تر و با کارایی بیشتر انجام میدهند.
شتابدهی و تسریع HGX و ترکیب آن با فناوریهای شبکه NVIDIA
ترکیبشدن HGX با فناوریهای شبکه NVIDI، عملکرد و بهرهوری بسیار بینظیری را به کاربران پلتفرم NVIDIA HGX ارائه داده است که بهموجب آن میتوان از منابع محاسباتی استفاده کامل کرد. همکاری HGX و پلتفرم شبکهای NVIDIA Spectrum-X برای دیتاسنترهای ابری هوش مصنوعی که از اترنت استفاده میکنند، بهترین انتخاب است. استفاده از سوئیچهای Spectrum-X و کارتهای قدرتمند شبکه NVIDIA SuperNIC باعث بهینه شدن بهرهوری منابع شده است و عملکرد قابلپیشبینی و پایدار را برای هزاران وظیفه همزمان هوش مصنوعی در هر مقیاسی، تضمین میکند.
لازم به ذکر است که NVIDIA Spectrum-X قابلیتهای پیشرفته مانند “امنیت بدون اعتماد” یا zero-trust security را فراهم میآورد. طراحی سیستم ISRAEL-1 توسط شرکت NVIDIA بهعنوان نمونهای از کاربرد این فناوریها در نظر گرفته میشود. ISRAEL-1 یک ابررایانه عظیم برای هوش مصنوعی مولد است که با سرورهای Dell PowerEdge XE9680 ساخته شده است. علاوهبرآن، پلتفرم HGX با 8 کارت گرافیکی از نوع BlueField-3 SuperNIC و سوئیچهای Spectrum-4نیز در این سیستم به کار رفته اند.
بیشتر بخوانید: خرید دستگاه ذخیره ساز Storage
پلتفرم HGX و عملکرد فراتر از نسلهای قبل در آموزش مدلهای هوش مصنوعی
نسخههای بسیار جدید پلتفرم NVIDIA HGX از جمله HGX B300 مجهز به موتور ترانسفورماتور نسل دوم هستند که به آن SECOND GENERATION TRANSFORMER ENGINE نیز میگویند. در واقع موتور ترانسفورماتور نسل دوم یکی از بخشهای کلیدی معماری سختافزاری و نرمافزاری پلتفرم HGX برای افزایش سرعت و کارایی مدلهای هوش مصنوعی است.
موتور ترانسفورماتور نسل دوم از فناوریهای بسیار پیشرفته مانند FP8 یا اعداد اعشاری 8 بیتی برخوردار است که هسته تخصصی آن Blackwell Tensor Core نامیده میشود. این فناوری موجب میشود که مدلهای هوش مصنوعی پیچیده از سرعت 4 برابر بیشتر برای آموزش بهره ببرند؛ درحالی که مصرف انرژی و منابع سختافزاری بهینه تر می گردد. در نتیجه با وجود پلتفرم HGX و فناوریهای بسیار پیشرفته آن، سازمان ها و دیتاسنترهای بزرگ می توانند از مقیاس پذیری بی وقفه بهره ببرند و بیشترین میزان استفاده از توان GPU ها را تجربه کنند.

پلتفرم HGX و عملکرد فراتر از نسلهای قبل در آموزش مدلهای هوش مصنوعی
پلتفرم NVIDIA HGX و مدلهای مختلف آن به همراه جدول مشخصات فنی
پلتفرم NVIDIA HGX در قالب بردهای پایه (Baseboard) با پیکربندیهای مختلف عرضه میشود؛ از جمله مدلهایی با ۴ یا ۸ ماژول Hopper SXM و همچنین مدلهایی با ۸ ماژول NVIDIA Blackwell یا Blackwell Ultra SXM . ترکیب این سختافزارهای قدرتمند با نرمافزارهای تخصصی NVIDIA، بستری را فراهم میسازد که ابررایانههای هوش مصنوعی، عملکردی بیسابقه در پردازشهای هوشمند و محاسباتی ارائه دهند.
معماری BlackWell | HGX B200 | HGX B300 |
Form Factor | 8 x NVIDIA Blackwell SXM | 8 x NVIDIA Blackwell Ultra SXM |
FP4 Tensor Core | 144 PFLOPS | 72 PFLOPS | 144 PFLOPS | 105 PFLOPS |
FP8/FP6 Tensor Core | 72 PFLOPS | PFLOPS72 |
INT8 Tensor Core | 72 POPS | 2 POPS |
FP16/BF16 Tensor Core | 36 PFLOPS | 36 PFLOPS |
TF32 Tensor Core | 18 PFLOPS | 18 PFLOPS |
FP 32 | 600 TFLOPS | 600 TFLOPS |
FP64/FP64 Tensor Core | 296 TFLOPS | 10 TFLOPS |
Total Memory | 1.4 TB | UP TO 2.3 TB |
NVLINK | Fifth generation | Fifth generation |
NVIDIA NVSwitch | NVLink 5 Switch | NVLink 5 Switch |
NVSwitch GPU-to-GPU Bandwidth | 1.8 TB/S | 1.8 TB/S |
Total NVLink Bandwidth | 14.4 TB/S | 14.4 TB/S |
Networking Bandwidth | 0.8 TB/S | 1.6 TB/S |
Attention Performance | 1X | 2X |
معماری hooper در HGX H200
8GPU | 4GPU | |
Form Factor | 8 x NVIDIA H200 SXM | 4 x NVIDIA H200 SXM |
FP8 Tensor Core | 32PFLOPS | 16 PFLOPS |
INT8 Tensor Core | 32 POPS | 16 POPS |
FP16/BF16 Tensor Core | 16 PFLOPS | 8 PFLOPS |
TF32 Tensor Core | 8 PFLOPS | 4 PFLOPS |
FP32 | 540 TFLOPS | 270 TFLOPS |
FP64 | 270 TFLOPS | 140 TFLOPS |
FP64 Tensor Core | 540 TFLOPS | 270 TFLOPS |
Total Memory | 1.1 TB HBM3 | 564 GB HBM3 |
GPU Aggregate Bandwidth | 38 GB/S | 19 GB/S |
NVLink | Fourth generation | Fourth generation |
NVSwitch | NVLink 4 Switch | N/A |
NVSwitch GPU-to-GPU Bandwidth | 900 GB/S | N/A |
Total Aggregate Bandwidth | 7.2 TB/S | 3.6 TB/S |
Networking Bandwidth | 0.8 TB/S | 0.4 TB/S |
معماری hooper در HGX H100
8GPU | 4GPU | |
Form Factor | 8 x NVIDIA H100 SXM | 4 x NVIDIA H100 SXM |
FP8 Tensor Core | 32 PFLOPS | 16 PFLOPS |
INT8 Tensor Core | 32 POPS | 16 POPS |
FP16/BF16 Tensor Core | 16 PFLOPS | 8 PFLOPS |
TF32 Tensor Core | 8 PFLOPS | 4 PFLOPS |
FP32 | 540 TFLOPS | 270 TFLOPS |
FP64 | 270 TFLOPS | 140 TFLOPS |
FP64 Tensor Core | 540 TFLOPS | 270 TFLOPS |
Total Memory | 640 GB HBM3 | 320 GB HBM3 |
GPU Aggregate Bandwidth | 27 GB/S | 13 GB/S |
NVLink | Fourth generation | Fourth generation |
NVSwitch | NVLink 4 Switch | N/A |
NVSwitch GPU-to-GPU Bandwidth | 900 GB/S | N/A |
Total Aggregate Bandwidth | 7.2 TB/S | 3.6 TB/S |
Networking Bandwidth | 0.8 TB/S | 0.4 TB/S |
سوالات متداول
معماری HOPPER در پلتفرم NVIDIA HGX چگونه است؟
معماری Hopper نسل قبلی واحدهای پردازش گرافیکی (GPU) شرکت NVIDIA است که پیش از معماری Blackwell معرفی شده بود. این معماری مخصوص پردازشهای پیشرفته هوش مصنوعی، یادگیری عمیق، و محاسبات با عملکرد بالا (HPC) طراحی شده و برای اولینبار در GPUهای NVIDIA H100 به کار گرفته شد.
معماری BLACKWELL در پلتفرم NVIDIA HGX چگونه است؟
معماری BLACKWELL بهعنوان نسل جدید واحدهای پردازش گرافیکی GPU مخصوص شرکت NVIDIA شناخته میشود. BLACKWELL نسبت به HOPPER جدیدتر است و جایگزین آن شده است. ازاینرو برای پردازشهای سنگین هوش مصنوعی، مدلهای زبان بزرگ LLM و محاسبات با عملکرد بالا بهینهسازی شده است.
در HGX B300 از کدام معماری استفاده شده است؟
پلتفرم HGX B300 دارای معماری BLACK WELL و BLACKWELL ULTRA است که بهصورت ماژولهای SXM و با پیکربندی 8GPU در یک برد پایه نصب شده است. این GPUها در مقایسه با نسلهای قبلی از عملکرد و بهرهوری بسیار زیادی برخوردار هستند.
مهمترین ویژگیهای معماری BLACKWELL در پلتفرم NVIDIA HGX چیست؟
- عملکرد فوقالعاده در هوش مصنوعی مولد
- پشتیبانی از دقت FP8 و موتور ترانسفورماتور نسل دوم
- یکپارچگی با فناوریهای شبکه و ذخیرهسازی NVIDIA
چگونه میتوان پلتفرم NVIDIA HGX را در ایران خریداری کرد؟
شرکت مکسا که در زمینه تجهیزات امنیتی و شبکه فعالیت دارد، پلتفرم NVIDIA HGX را در اختیار متقاضیان عزیز قرار میدهد. پلتفرم NVIDIA HGX در شرکت مکسا باقیمت مناسب عرضه میشود. همچنین از این مجموعه میتوانید سایر تجهیزات موردنیاز برای شبکه مانند کارت گرافیکی، سرور و… را نیز تهیه کنید. برای کسب اطلاع از قیمت پلتفرم NVIDIA HGX با ما تماس بگیرید.