ابررایانه تسلا مجهز به 7360 پردازنده گرافیکی A100 انویدیا رونمایی شد

تسلا ابررایانه هوش مصنوعی خود را ارتقا داده و به هزاران پردازنده گرافیکی Nvidia A100 مجهز کرده است. ابررایانه این شرکت اکنون به یکی از ۷ سوپرکامپیوترهای جهان از نظر تعداد GPU‌های به‌کار رفته در آن با ۷۳۶۰ پردازنده گرافیکی A100 محسوب می‌شود.

پردازنده گرافیکی A100 انویدیا یک راه حل قدرتمند مبتنی بر معماری Ampere برای مراکز داده محسوب می‌شود. پردازنده گرافیکی A100 با ۸۰ گیگابایت حافظه HBM2e، پهنای باندی معادل ۲ ترابایت بر ثانیه ارائه داده و توان مصرفی آن به ۴۰۰ وات می‌رسد. 

DGX A100 اولین غول گرافیکی انویدیا محسوب می‌شود که از هشت پردازنده گرافیکی A100 بهره برده و پهنای باند ۴.۸ ترابایت بر ثانیه را ارائه می‌دهد و ابررایانه هوش مصنوعی تسلا اکنون دارای ۷۳۶۰ عدد از این پردازنده ها است.

تسلا قدرت ابررایانه هوش مصنوعی خود را به طور عمومی محک نزده است. اما HPC Wire با استفاده از داده‌های سایر ابررایانه‌های مجهز به جی پی یو A100 تخمین زده که ابررایانه هوش مصنوعی Tesla به توان پردازشی حدود ۱۰۰ پتافلاپ دست خواهد یافت.

البته تسلا قصد ندارد به استفاده از پردازنده‌های انویدیا برای ابررایانه های هوش مصنوعی خود ادامه دهد. این شرکت در حال توسعه قوی ترین پردازنده هوش مصنوعی خود با نام Tesla D1 Dojo است که یک سال پیش معرفی شده بود.

این پردازنده توسط شرکت TSMC و با لیتوگرافی ۷ نانومتری ساخته شده و چیزی بیش از ۵۰ میلیارد ترانزیستور را درون خود جای داده و ابعاد آن برابر ۶۴۵ میلی‌متر مربع است.

تراشه D1 حرف‌های زیادی برای گفتن دارد و می‌تواند تا ۳۶۲ ترافلاپس وظیفه را با دقت FP16/CFP8 یا حدود ۲۲٫۵ ترافلاپس وظیفه با دقت FP32 به انجام برساند. در صورتی‌که این ادعا درست باشد، تراشه جدید تسلا، قدرتمندترین تراشه انویدیا را پشت سر خواهد گذاشت. در حال حاضر پردازنده گرافیکی A100 Ampere انویدیا می‌تواند ۳۱۲ ترافلاپس وظیفه با دقت FP16 را به انجام برساند.

با نگاهی به سطح سیلیکونی می‌توان دریافت که تسلا یک شبکه متشکل از واحدهای عملکرد یا همان FU طراحی کرده که به هم متصل شده‌اند تا این پردازنده بزرگ را تشکیل بدهند.

البته هر کدام از این واحدهای عملکرد دارای یک پردازنده ۶۴ بیتی با ۱.۲۵ مگابایت حافظه محلی SRAM بوده که برای انتقال، جمع‌آوری و پخش و ارتباط پیمایش‌ها طراحی شده است.

هر FU می‌تواند در محاسبات BF16 یا CFP8 قدرتی برابر ۱ ترافلاپس و برای محاسبات FP32 قدرتی برابر ۶۴ گیگافلاپس داشته باشد. پهنای باند آن هم در هر جهت به ۵۱۲ گیگابایت بر ثانیه می‌رسد. در حالت کلی طراحی آن به گونه‌ای است که تاخیر را کاهش و عملکرد را افزایش می‌دهد.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *