پردازنده گرافیکی A100 انویدیا با ۸۰ گیگابایت حافظه معرفی شد

پردازنده گرافیکی A100 انویدیا با ۸۰ گیگابایت حافظه معرفی شد

تنها ۶ ماه از رونمایی اولیه‌ی معماری امپر انویدیا (Nvidia Ampere) می‌گذرد و تیم سبز به‌تازگی تصمیم گرفته است پرچم‌دار جدیدی برای این خانواده از تراشه‌های گرافیکی معرفی کند. جدیدترین مدل از تراشه‌های گرافیکی امپر مدل بهبودیافته‌ی پرچم‌دار پیشین محسوب می‌شود و حافظه‌ی گرافیکی (VRAM) بیشتر دارد و پهنای باندش به‌طور درخورتوجهی افزایش پیدا کرده است.

مدل جدید تراشه‌ی A100 امپر این بار ۸۰ گیگابایت حافظه‌ی گرافیکی دارد و از بسیاری از جوانب درمقایسه‌با مدل ۴۰ گیگابایتی بدون تغییر باقی مانده است. بدین‌ترتیب A100 هشتادگیگابایتی همچون A100 چهل‌گیگابایتی از سرعت کلاک بوست (تقویت‌شده) ۱٫۴۱ گیگاهرتز، باس حافظه‌ی ۵،۱۲۰ بیت، قدرت پردازشی دقت تکی ۱۹٫۵ ترافلاپس (TFLOPS) و توان طراحی حرارتی ۴۰۰ وات استفاده می‌کند و از NVLink 3 پشتیبانی می‌کند. هر دو تراشه به ۶،۱۹۲ هسته‌ی گرافیکی مجهز هستند.

اصلی‌ترین تفاوت بین تراشه‌های پرچم‌دار خانواده‌ی امپر، حداکثر حافظه‌ی گرافیکی آن‌ها است که در مدل جدید از ۴۰ گیگابایت به ۸۰ گیگابایت افزایش پیدا کرده است. مدل جدید مجموع پهنای باند حافظه‌ی بیشتری نیز دارد. بر‌اساس اعلام رسمی، پهنای باند مدل ۸۰ گیگابایتی معادل ۳٫۲ گیگابیت‌برثانیه HBMe است؛ درحالی‌که مدل ۴۰ گیگابایت پهنای باند ۲٫۴ گیگابیت‌برثانیه‌ای HBMe ارائه می‌داد.

پهنای باند در سراسر آرایه‌ی HBM2 دو ترابایت‌برثانیه است؛ درحالی‌که این مقدار در مدل ۴۰ گیگابایتی A100 معادل ۱٫۶ ترابایت‌برثانیه بود. آنچه گفتیم، به‌وضوح نشان می‌دهد مدل ۸۰ گیگابایتی A100 بهبودهای محسوسی تجربه کرده است. اگر انویدیا به‌منظور دستیابی به دو برابر ظرفیت بیشتر پهنای باند حافظه‌ی آرایه‌ی HBM2 را کاهش می‌داد، به‌هیچ‌وجه تعجب نمی‌کردیم. بااین‌حال، تیم سبز ترجیح داده است مجموع پهنای باند را نیز ۱٫۲۵ برابر افزایش دهد.

مشخصات فنی پردازنده گرافیکی امپر Nvidia Ampere A100 مدل 80 گیگابایتی

همان‌طور‌که در تصویر بالا مشاهده می‌کنید، تراشه‌ی جدید A100 از ۶ بسته‌ی HBM2 تشکیل شده است. باوجوداین، انویدیا یکی از این بسته‌ها را غیرفعال کرده تا بازده‌ی نهایی تراشه بهبود یابد. هر‌یک از پنج بسته‌ی باقی‌مانده باس حافظه‌ی ۱،۰۲۴ بیتی دارند و همین موضوع باعث شده مجموع باس حافظه‌ی تراشه برابر با ۵،۱۲۰ بیت باشد.

انویدیا در مدل ۸۰ گیگابایتی تراشه‌ی A100 از بسته‌ی HBM2E به‌جای HBM2 استفاده کرده است تا بتواند مشخصه‌های پایه‌ای تراشه را به‌‌طور اساسی ارتقا‌ دهد. مدل ۸۰ گیگابایت تراشه‌ی A100 انویدیا مخصوص آن‌ دسته از وظایف کاری است که به ظرفیت و پهنای باند بیشتر نیاز دارند.

مقاله‌ی مرتبط:

مدل ۸۰ گیگابایتی همچون مدل ۴۰ گیگابایتی می‌تواند حداکثر از هفت دستگاه پشتیبانی کند و به هر‌یک از آن‌ها ۱۰ گیگابایت حافظه‌ی گرافیکی اختصاص دهد. انویدیا قصد دارد پردازنده‌ی گرافیکی جدید خود را در قالب کارت‌های گرافیک تکی Mezzanine Modular و با پیکربندی HGX یا DGX عرضه کند.

علاقه‌مندان به خرید پردازنده‌ی گرافیکی A100 را در قالب کارت گرافیک PCIe همچنان باید به مدل ۴۰ گیگابایتی فکر کنند؛ زیرا انویدیا فعلا مدل ۸۰ گیگابایتی را در کارت‌های PCIe قرار نداده است. با‌این‌حال احتمالا این وضعیت در آینده دستخوش تغییر می‌شود. 

مقایسه‌ی تراشه‌های گرافیکی رده‌بالای انویدیا
(A100 (80GB (A100 (40GB V100
هسته‌های کودای FP32  ۶،۹۱۲ ۶،۹۱۲ ۵،۱۲۰
سرعت کلاک بوست ۱،۴۱۰ مگاهرتز ۱،۴۱۰ مگاهرتز  ۱،۵۳۰ مگاهرتز
سرعت کلاک حافظه ۳٫۲ گیگابیت‌برثانیه HBM2e ۲٫۴ گیگابیت‌برثانیه HBM2 ۱٫۷۵ گیگابیت‌برثانیه HBM2
پهنای باس حافظه ۵،۱۲۰ بیت ۵،۱۲۰ بیت ۴،۰۹۶ بیت
پهنای باند حافظه ۲٫۰ ترابایت‌برثانیه ۱٫۶ ترابایت‌برثانیه ۹۰۰ گیگابایت‌برثانیه
حافظه‌ی گرافیکی ۸۰ گیگابایت ۴۰ گیگابایت ۱۶ یا ۳۲ گیگابایت
قدرت پردازشی دقت یگانه ۱۹٫۵ ترافلاپس ۱۹٫۵ ترافلاپس ۱۵٫۷ ترافلاپس
قدرت پردازشی دقت دوگانه ۹٫۷ ترافلاپس (یک‌دوم نرخ FP32) ۹٫۷ ترافلاپس (یک‌دوم نرخ FP32) ۷٫۸ ترافلاپس (یک‌دوم نرخ FP32)
تنسور INT8  ۶۲۴ تاپس ۶۲۴ تاپس نامشخص
تنسور FP16 ۳۱۲ ترافلاپس ۳۱۲ ترافلاپس ۱۲۵ ترافلاپس
تنسور TF32  ۱۵۶ ترافلاپس ۱۵۶ ترافلاپس نامشخص
اینترکانکت

NVLink 3

۱۲ لینک (۶۰۰ گیگابایت‌برثانیه)

NVLink 3

۱۲ لینک (۶۰۰ گیگابایت‌برثانیه)

NVLink 2

۶ لینک (۳۰۰ گیگابایت‌برثانیه)

پردازنده‌ی گرافیکی

GA100 با مساحت ۸۲۵ میلی‌مترمربع

GA100 با مساحت ۸۲۶ میلی‌مترمربع

GV100 با مساحت ۸۱۵ میلی‌مترمربع

تعداد ترانزیستور

۵۴٫۲ میلیارد

۵۴٫۲ میلیارد

۲۱٫۱ میلیارد

توان طراحی حرارتی

۴۰۰ وات

۴۰۰ وات

۳۰۰ یا ۳۵۰ وات

لیتوگرافی 

۷ نانومتری TSMC

۷ نانومتری TSMC

۱۲ نانومتری TSMC

رابط

SXM4

SXM4

SXM2 یا SXM3

معماری امپر (Ampere)

امپر (Ampere)

ولتا (Volta)

برچسب قیمت سرور پر از پردازنده‌های گرافیکی ۸۰ گیگابایتی A100 انویدیا بسیار گران خواهد بود. با‌این‌حال، شرکت‌هایی که به‌طور جدی مشغول کار روی هوش مصنوعی و پردازش‌های سنگین مرتبط ‌به آن هستند، به‌احتمال زیاد درصورت داشتن منابع مالی کافی، حاضر خواهند بود هزینه‌های هنگفتی برای تهیه‌ی سرورهای حاوی پردازنده‌ی گرافیکی جدید انویدیا بپردازند. افزایش حافظه‌ی گرافیکی تراشه‌ی A100 به محققان امکان می‌دهد پیچیدگی مدل‌های هوش مصنوعی خود را افزایش دهند و مشکلاتی را برطرف کنند که مدل ۴۰ گیگابایتی با آن‌ها مواجه بود. 

درباره محمد حسینی راد

چند سالی هست که در دنیای دیجیتال مشغول فعالیتم. کارشناسی ارشد نرم افزار خوندم و از اینکه دارم مطالب مرتبط با زمینه کاری خودم را انتشار می دهم بسیار خرسندم.

نظر بدهید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *