PDF

پلتفرم NVIDIA HGX Platform

پلتفرم NVIDIA HGX درواقع به‌عنوان یک معماری سخت‌افزاری بسیار قدرتمند و قابل‌توسعه شناخته می‌شود که توسط کمپانی NVIDIA معرفی شده است. از این پلتفرم در زمینه‌های مختلفی استفاده می‌شود که یکی از مهم‌ترین کاربردهای آن ساخت سرورهای قدرتمند است که بارهای کاری سنگین را انجام می‌دهند. به‌صورت کلی از پلتفرم NVIDIA HGX برای محاسبات HPC، هوش مصنوعی و دیتاسنترهای ابری استفاده می‌شود. لازم به ذکر است که NVIDIA HGX مخفف عبارت Hyperscale GPU Accelerated Platform است و از ویژگی‌های خاصی برخوردار است که در مجموعه "مکسا" به بررسی این پلتفرم و ویژگی‌های آن خواهیم پرداخت.

انواع سخت افزارها, تکنولوژی, شبکه و تجهیزات, مقالات تخصصی سرور, هوش مصنوعی AI

خرداد 24, 1404
بدون نظر
زمان مطالعه: 5 دقیقه

پلتفرم NVIDIA HGX تحول عظیمی در دنیای دیجیتالی عصر حاضر ایجاد کرده است. این پلتفرم که مجموعه‌ای از کارت‌های گرافیکی است به‌عنوان ستون فقرات ابرکامپیوترها و دیتاسنترهای نسل جدید شناخته می‌شود. از طریق پلتفرم NVIDIA HGX شرایطی ایجاد می‌شود که داده‌ها با سرعت زیاد و بدون وقفه اجرا شوند. بااین‌وجود سازمان‌های مختلف می‌توانند چالش‌های بزرگ را به بهترین شکل پاسخ دهند. به‌عبارت‌دیگر، HGX موجب می‌شود که بالاترین عملکرد برنامه ارائه داده شود و قدرت پردازنده‌های گرافیکی بهینه‌سازی شود.

بیشتر بخوانید: خرید انواع سرور از برندهای مختلف

پلتفرم NVIDIA HGX B300 | پلتفرم شتاب‌یافته و بی‌رقیب

HGX B300 نسل جدید GPUهای NVIDIA است که عملکرد آن در مقایسه با پردازش‌های AL به میزان 11 برابر بیشتر است. اتصال بین GPUها از طریق این پلتفرم به‌صورت فوق سریع انجام می‌شود و میزان تاخیر آن بسیار کم است. HGX B300 دیتاسنترها را وارد نسل جدیدی از محاسبات شتاب‌یافته و هوش مصنوعی کرده است. در واقع عملکرد پلتفرم HGX B300 نسبت به نسل‌های قبلی کاملا بی رغیب است و برای اجرای وظایف سنگین می‌توان بیشترین استفاده را از آن برد.

HGX B300 از شبکه‌سازی‌های بسیار پیشرفته که سرعت 800 گیگابایت در ثانیه دارند، پشتیبانی می‌کند. علاوه‌برآن، فناوری‌های InfiniBand Quantum-X800 و Spectrum-X Ethernet نیز توسط این پلتفرم پشتیبانی می شوند. HGX به پردازشگرهای شبکه‌ای BlueField-3 نیز مجهز است که از طریق آن می‌توان شبکه های ابری ایجاد کرد یا ذخیره سازی پیشرفته انجام داد. پردازشگرهای شبکه‌ای BlueField-3 مانند هسته دوم در کنار GPU عمل می‌کنند و در امنیت و مدیریت شبکه تاثیرات بسیار مثبتی دارند.

بیشتر بخوانید: خرید سخت افزارهای انویدیا Nvidia

سرور گرافیکی انویدیا NVIDIA DGX H100 8-GPU

سرور گرافیکی انویدیا NVIDIA DGX H200 8-GPU

کارت گرافیکی انویدیا NVIDIA H200 Tensor Core GPU

کارت گرافیک انویدیا NVIDIA H100 80GB PCIe

HGX B300 و استنتاج مدل زبان بزرگ و بلادرنگ

پلتفرم HGX B300 از 11 برابر قدرت استنتاج بیشتر در مقایسه با نسل‌های قبلی NVIDIA HOPPER و مدل‌های LIAMA 3.1 405B برخوردار است. نسل دوم Transformer Engine در قلب این پیشرفت قرار گرفته است که از هسته های محاسباتی پیشرفته Blackwell Tensor CORE بهره برده است. این هسته ها با فناوری TENSOR RT LLM ترکیب شده اند و استنتاج مدل‌های زبانی را سریع تر، بهینه تر و با کارایی بیشتر انجام می‌دهند.

شتاب‌دهی و تسریع HGX و ترکیب آن با فناوری‌های شبکه NVIDIA

ترکیب‌شدن HGX با فناوری‌های شبکه NVIDI، عملکرد و بهره‌وری بسیار بی‌نظیری را به کاربران پلتفرم NVIDIA HGX ارائه داده است که به‌موجب آن می‌توان از منابع محاسباتی استفاده کامل کرد. همکاری HGX و پلتفرم شبکه‌ای NVIDIA Spectrum-X برای دیتاسنترهای ابری هوش مصنوعی که از اترنت استفاده می‌کنند، بهترین انتخاب است. استفاده از سوئیچ‌های Spectrum-X و کارت‌های قدرتمند شبکه NVIDIA SuperNIC باعث بهینه شدن بهره‌وری منابع شده است و عملکرد قابل‌پیش‌بینی و پایدار را برای هزاران وظیفه هم‌زمان هوش مصنوعی در هر مقیاسی، تضمین می‌کند.

لازم به ذکر است که NVIDIA Spectrum-X قابلیت‌های پیشرفته مانند “امنیت بدون اعتماد” یا zero-trust security را فراهم می‌آورد. طراحی سیستم ISRAEL-1 توسط شرکت NVIDIA به‌عنوان نمونه‌ای از کاربرد این فناوری‌ها در نظر گرفته می‌شود. ISRAEL-1 یک ابررایانه عظیم برای هوش مصنوعی مولد است که با سرورهای Dell PowerEdge XE9680 ساخته شده است. علاوه‌برآن، پلتفرم HGX با 8 کارت گرافیکی از نوع BlueField-3 SuperNIC و سوئیچ‌های Spectrum-4نیز در این سیستم به کار رفته اند.

بیشتر بخوانید: خرید دستگاه ذخیره ساز Storage

کارت گرافیک Workstation

ابر کامپیوتر NVIDIA DGX SPARK

کارت گرافیک NVIDIA H100

کارت گرافیکی انویدیا NVIDIA L40 و NVIDIA L40s

کارت گرافیک انویدیا NVIDIA L40 و NVIDIA L40s

کارت گرافیک NVIDIA H200

کارت گرافیک انویدیا NVIDIA A100

پلتفرم HGX و عملکرد فراتر از نسل‌های قبل در آموزش مدل‌های هوش مصنوعی

نسخه‌های بسیار جدید پلتفرم NVIDIA HGX از جمله HGX B300 مجهز به موتور ترانسفورماتور نسل دوم هستند که به آن SECOND GENERATION TRANSFORMER ENGINE نیز می‌گویند. در واقع موتور ترانسفورماتور نسل دوم یکی از بخش‌های کلیدی معماری سخت‌افزاری و نرم‌افزاری پلتفرم HGX برای افزایش سرعت و کارایی مدل‌های هوش مصنوعی است.

موتور ترانسفورماتور نسل دوم از فناوری‌های بسیار پیشرفته مانند FP8 یا اعداد اعشاری 8 بیتی برخوردار است که هسته تخصصی آن Blackwell Tensor Core نامیده می‌شود. این فناوری موجب می‌شود که مدل‌های هوش مصنوعی پیچیده از سرعت 4 برابر بیشتر برای آموزش بهره ببرند؛ درحالی که مصرف انرژی و منابع سخت‌افزاری بهینه تر می گردد. در نتیجه با وجود پلتفرم HGX و فناوری‌های بسیار پیشرفته آن، سازمان ها و دیتاسنترهای بزرگ می توانند از مقیاس پذیری بی وقفه بهره ببرند و بیشترین میزان استفاده از توان GPU ها را تجربه کنند.

پلتفرم HGX و عملکرد فراتر از نسل‌های قبل در آموزش مدل‌های هوش مصنوعی

پلتفرم NVIDIA HGX و مدل‌های مختلف آن به همراه جدول مشخصات فنی

پلتفرم NVIDIA HGX در قالب بردهای پایه (Baseboard) با پیکربندی‌های مختلف عرضه می‌شود؛ از جمله مدل‌هایی با ۴ یا ۸ ماژول Hopper SXM و همچنین مدل‌هایی با ۸ ماژول NVIDIA Blackwell یا Blackwell Ultra SXM . ترکیب این سخت‌افزارهای قدرتمند با نرم‌افزارهای تخصصی NVIDIA، بستری را فراهم می‌سازد که ابررایانه‌های هوش مصنوعی، عملکردی بی‌سابقه در پردازش‌های هوشمند و محاسباتی ارائه دهند.

HGX B200	HGX B300	معماری BlackWell
8 x NVIDIA Blackwell SXM	8 x NVIDIA Blackwell Ultra SXM	Form Factor
144 PFLOPS \| 72 PFLOPS	144 PFLOPS \| 105 PFLOPS	FP4 Tensor Core
72 PFLOPS	PFLOPS72	FP8/FP6 Tensor Core
72 POPS	2 POPS	INT8 Tensor Core
36 PFLOPS	36 PFLOPS	FP16/BF16 Tensor Core
18 PFLOPS	18 PFLOPS	TF32 Tensor Core
600 TFLOPS	600 TFLOPS	FP 32
296 TFLOPS	10 TFLOPS	FP64/FP64 Tensor Core
1.4 TB	UP TO 2.3 TB	Total Memory
Fifth generation	Fifth generation	NVLINK
NVLink 5 Switch	NVLink 5 Switch	NVIDIA NVSwitch
1.8 TB/S	1.8 TB/S	NVSwitch GPU-to-GPU Bandwidth
14.4 TB/S	14.4 TB/S	Total NVLink Bandwidth
0.8 TB/S	1.6 TB/S	Networking Bandwidth
1X	2X	Attention Performance

معماری hooper در HGX H200

8GPU	4GPU
8 x NVIDIA H200 SXM	4 x NVIDIA H200 SXM	Form Factor
32PFLOPS	16 PFLOPS	FP8 Tensor Core
32 POPS	16 POPS	INT8 Tensor Core
16 PFLOPS	8 PFLOPS	FP16/BF16 Tensor Core
8 PFLOPS	4 PFLOPS	TF32 Tensor Core
540 TFLOPS	270 TFLOPS	FP32
270 TFLOPS	140 TFLOPS	FP64
540 TFLOPS	270 TFLOPS	FP64 Tensor Core
1.1 TB HBM3	564 GB HBM3	Total Memory
38 GB/S	19 GB/S	GPU Aggregate Bandwidth
Fourth generation	Fourth generation	NVLink
NVLink 4 Switch	N/A	NVSwitch
900 GB/S	N/A	NVSwitch GPU-to-GPU Bandwidth
7.2 TB/S	3.6 TB/S	Total Aggregate Bandwidth
0.8 TB/S	0.4 TB/S	Networking Bandwidth

معماری hooper در HGX H100

8GPU	4GPU
8 x NVIDIA H100 SXM	4 x NVIDIA H100 SXM	Form Factor
32 PFLOPS	16 PFLOPS	FP8 Tensor Core
32 POPS	16 POPS	INT8 Tensor Core
16 PFLOPS	8 PFLOPS	FP16/BF16 Tensor Core
8 PFLOPS	4 PFLOPS	TF32 Tensor Core
540 TFLOPS	270 TFLOPS	FP32
270 TFLOPS	140 TFLOPS	FP64
540 TFLOPS	270 TFLOPS	FP64 Tensor Core
640 GB HBM3	320 GB HBM3	Total Memory
27 GB/S	13 GB/S	GPU Aggregate Bandwidth
Fourth generation	Fourth generation	NVLink
NVLink 4 Switch	N/A	NVSwitch
900 GB/S	N/A	NVSwitch GPU-to-GPU Bandwidth
7.2 TB/S	3.6 TB/S	Total Aggregate Bandwidth
0.8 TB/S	0.4 TB/S	Networking Bandwidth

سوالات متداول

معماری HOPPER در پلتفرم NVIDIA HGX چگونه است؟

معماری Hopper نسل قبلی واحدهای پردازش گرافیکی (GPU) شرکت NVIDIA است که پیش از معماری Blackwell معرفی شده بود. این معماری مخصوص پردازش‌های پیشرفته هوش مصنوعی، یادگیری عمیق، و محاسبات با عملکرد بالا (HPC) طراحی شده و برای اولین‌بار در GPUهای NVIDIA H100 به کار گرفته شد.

معماری BLACKWELL در پلتفرم NVIDIA HGX چگونه است؟

معماری BLACKWELL به‌عنوان نسل جدید واحدهای پردازش گرافیکی GPU مخصوص شرکت NVIDIA شناخته می‌شود. BLACKWELL نسبت به HOPPER جدیدتر است و جایگزین آن شده است. ازاین‌رو برای پردازش‌های سنگین هوش مصنوعی، مدل‌های زبان بزرگ LLM و محاسبات با عملکرد بالا بهینه‌سازی شده است.

در HGX B300 از کدام معماری استفاده شده است؟

پلتفرم HGX B300 دارای معماری BLACK WELL و BLACKWELL ULTRA است که به‌صورت ماژول‌های SXM و با پیکربندی 8GPU در یک برد پایه نصب شده است. این GPUها در مقایسه با نسل‌های قبلی از عملکرد و بهره‌وری بسیار زیادی برخوردار هستند.

مهم‌ترین ویژگی‌های معماری BLACKWELL در پلتفرم NVIDIA HGX چیست؟

عملکرد فوق‌العاده در هوش مصنوعی مولد
پشتیبانی از دقت FP8 و موتور ترانسفورماتور نسل دوم
یکپارچگی با فناوری‌های شبکه و ذخیره‌سازی NVIDIA

چگونه می‌توان پلتفرم NVIDIA HGX را در ایران خریداری کرد؟

شرکت مکسا که در زمینه تجهیزات امنیتی و شبکه فعالیت دارد، پلتفرم NVIDIA HGX را در اختیار متقاضیان عزیز قرار می‌دهد. پلتفرم NVIDIA HGX در شرکت مکسا باقیمت مناسب عرضه می‌شود. همچنین از این مجموعه می‌توانید سایر تجهیزات موردنیاز برای شبکه مانند کارت گرافیکی، سرور و… را نیز تهیه کنید. برای کسب اطلاع از قیمت پلتفرم NVIDIA HGX با ما تماس بگیرید.

مطالب مرتبط