برخلاف واحدهای پردازش مرکزی (CPU) و واحدهای پردازش گرافیکی (GPU) که برای کارهای عمومی طراحی شدهاند، NPUها به طور ویژه برای تسریع وظایف مرتبط با هوش مصنوعی توسعه یافتهاند. NPUها محاسبات مربوط به لایههای شبکه عصبی، شامل عملیات ریاضی اسکالر، برداری و تانسوری را بهینه و پردازش میکنند.
NPU که با نامهایی مانند تراشه هوش مصنوعی (AI chip) یا شتابدهنده هوش مصنوعی (AI accelerator) نیز شناخته میشود، معمولاً در معماریهای پردازشی ناهمگن برای ترکیب چندین پردازنده عمومی CPU و GPU مورد استفاده قرار میگیرد. در مراکز داده بزرگ، از NPUهای مستقل که مستقیماً به مادربرد سیستم متصل میشوند، استفاده میشود. اما در کاربردهای مصرفی مانند تلفنهای هوشمند، دستگاههای همراه و لپتاپها، NPUها معمولاً همراه با سایر پردازندههای کمکی بر روی یک ریزتراشه نیمهرسانا، معروف به سیستم روی تراشه (SoC)، یکپارچه میشوند.
با ادغام یک NPU اختصاصی، تولیدکنندگان میتوانند برنامههای هوش مصنوعی مولد را که قادر به پردازش real time برنامههای هوش مصنوعی و الگوریتمهای یادگیری ماشین با مصرف توان کم و بازدهی بالا هستند، درون دستگاهها ارائه دهند و دستگاههایی با عملکرد عالی طراحی کنند.
نحوه عملکرد NPUها
واحدهای پردازش عصبی (NPU) بر اساس شبکههای عصبی مغز طراحی شدهاند و با شبیهسازی رفتار نورونها و سیناپسهای انسانی در سطح مدار، پردازش دادهها را انجام میدهند. این ویژگی امکان اجرای مجموعهای از دستورالعملهای یادگیری عمیق را فراهم میکند، بهگونهای که یک دستورالعمل میتواند پردازش گروهی از نورونهای مجازی را به پایان برساند.

برخلاف پردازندههای سنتی که برای محاسبات دقیق طراحی شدهاند، NPUها برای به دست آوردن راهحل مسائل، بهینهسازی شدهاند و بهمرور زمان، با یادگیری از انواع دادهها و ورودیها، عملکردشان را بهبود میبخشند. با بهرهگیری از یادگیری ماشین، سیستمهای هوش مصنوعی مجهز به NPUها میتوانند راهکارهای سفارشی را بدون نیاز به برنامهنویسی دستی گسترده، با سرعت بیشتری ارائه دهند.
یکی از ویژگیهای برجسته NPUها، توانایی پردازش موازی در سطح بالا است. این پردازندهها با بهرهگیری از هستههای ساده اما قدرتمند، عملیات هوش مصنوعی را با سرعت بالا انجام میدهند. برخلاف پردازندههای چندمنظوره، NPUها وظایف مشخصی را بدون نیاز به مدیریت همزمان چندین فرآیند پیچیده، به صورت بهینه و کارآمد اجرا میکنند. یک NPU شامل ماژولهای اختصاصی برای عملیات محاسباتی، توابع فعالسازی، پردازش دادههای دوبعدی و فشردهسازی دادهها است. ماژول محاسباتی اختصاصی موجود در NPU، برای پردازش شبکههای عصبی طراحی شده و عملیات مهمی مانند ضرب و جمع ماتریسی، کانولوشن (Convolution)، ضرب داخلی و سایر پردازشهای مرتبط را انجام میدهد.
در حالی که پردازندههای سنتی برای انجام چنین پردازشهایی به هزاران دستورالعمل نیاز دارند، یک NPU میتواند همان عملیات را تنها با یک دستورالعمل به پایان برساند. همچنین، NPUها با یکپارچهسازی ذخیرهسازی و محاسبات از طریق وزنهای سیناپسی که با اختصاص یک متغیر محاسباتی پویا به گرههای شبکه، احتمال دستیابی به نتیجه "درست" یا "مطلوب" را مشخص میکنند، کارایی عملیاتی را افزایش میدهند. این وزنها قابلیت تنظیم و یادگیری دارند که به بهبود عملکرد NPU در طول زمان کمک میکنند.
اگرچه NPUها همچنان در حال بهبود هستند، آزمایشها نشان دادهاند که برخی از NPUها میتوانند عملکردی بیش از ۱۰۰ برابر بهتر از یک GPU مشابه داشته باشند، در حالی که مصرف توان آنها تغییری نکرده است.
مزایای کلیدی NPUها
واحدهای پردازش عصبی (NPU) برای جایگزینی پردازندههای سنتی مانند CPU و GPU طراحی نشدهاند و انتظار نمیرود که این کار را انجام دهند. با این حال، معماری NPUها نسبت به هر دو نوع پردازنده بهبود یافته است تا پردازش موازی و یادگیری ماشینی را با کارایی بینظیر ارائه دهد. NPUها به طور کلی میتوانند عملکرد سیستم را بهبود بخشند، اما برای برخی وظایف خاص این قطعات بیشترین بهرهوری را ارائه میدهند. هنگامی که در کنار CPU و GPU استفاده شوند، مزایای ارزشمندی را نسبت به سیستمهای سنتی فراهم میکنند. این مزایای کلیدی عبارتند از:

پردازش موازی
NPUها میتوانند مسائل بزرگ را به بخشهای کوچکتر تقسیم کرده و آنها را بهصورت چندوظیفهای پردازش کنند. اگرچه پردازندههای گرافیکی (GPU) نیز در پردازش موازی عملکرد بالایی دارند، اما ساختار منحصربهفرد NPUها باعث میشود که نسبت به یک GPU معادل، با صرف انرژی کمتر و همچنین با داشتن ابعاد فیزیکی کوچکتر عملکرد بهتری ارائه دهند.
افزایش بهرهوری
در حالی که GPUها معمولاً برای محاسبات با عملکرد بالا و پردازش وظایف هوش مصنوعی استفاده میشوند، NPUها میتوانند پردازش موازی مشابهی را با بهرهوری انرژی بسیار بالاتر انجام دهند. با افزایش تقاضا برای هوش مصنوعی و محاسبات سنگین که نیازمند توان پردازشی بالایی هستند، NPUها راهکاری مؤثر برای کاهش مصرف انرژی ارائه میدهند.
پردازش بلادرنگ (real time) دادههای چندرسانهای
NPUها بهگونهای طراحی شدهاند که بتوانند طیف وسیعی از ورودیهای داده، از جمله تصویر، ویدئو و صوت را با سرعت و دقت بالا پردازش کنند. یکپارچهسازی NPUها در کاربردهایی مانند رباتیک، دستگاههای اینترنت اشیا (IoT) و تجهیزات پوشیدنی، امکان دریافت بازخورد لحظهای را فراهم میکند، که باعث کاهش تأخیر عملیاتی شده و در مواقع حساس، پاسخهای سریع و کارآمد ارائه میدهد.
مقایسه NPU با GPU و CPU
در دنیای سنتی علوم کامپیوتر، واحد پردازش مرکزی (CPU) بهعنوان «مغز» رایانه شناخته میشود. CPU وظیفه پردازش اکثر فرایندهای محاسبات سنتی را بر عهده دارد و طیف گستردهای از برنامههای کاربردی را مدیریت میکند. حدود 70 درصد از ترانزیستورهای داخلی CPU به حافظه کش اختصاص داده میشود که به بهبود سرعت پردازش کمک میکند. مزیت اصلی CPUها کنترل منطقی دقیق و اجرای طیف گستردهای از وظایف است. با این حال، در بیشتر موارد، CPUها عملیات را بهصورت خطی انجام داده و درخواستها را به ترتیب دریافت، پردازش میکنند. به این ترتیب میتوان گفت به دلیل داشتن تعداد هستههای کمتر و معماری سریالی، در پردازشهای سنگین و موازی عملکرد محدودی ارائه میدهند.
با ظهور بازیهای رایانهای و طراحی به کمک کامپیوتر (CAD)، نیاز به راهکاری سریعتر و کارآمدتر برای پردازش گرافیکی احساس شد. واحد پردازش گرافیکی (GPU) برای پردازشهای تصویری پیچیده طراحی شد تا بار پردازشی مربوط به گرافیک را از CPU کاهش دهد. برخلاف CPU که از تعداد محدودی هسته برای اجرای عملیات خطی استفاده میکند، GPUها از صدها تا هزاران هسته بهره میبرند که قادر به پردازش موازی هستند. این ویژگی بهGPUها اجازه میدهد تا وظایف بزرگ را به بخشهای کوچکتر تقسیم کرده و بهطور همزمان توسط پردازندههای مختلف اجرا کنند.
اگرچه هدف اولیه از طراحی GPU، پردازش ویدئو و تصویر بود، اما توانایی آن در پردازش موازی باعث شد که برای کاربردهای محاسباتی سنگین مانند بلاکچین و هوش مصنوعی نیز مورد استفاده قرار گیرد. با این حال، یکی از محدودیتهای GPU مصرف بالای انرژی در پردازشهای پیچیده است که منجر به الزام استفاده از سیستمهای خنککننده قوی در مدار شده و به این ترتیب هزینههای انرژی را افزایش میدهد.
واحدهای پردازش عصبی (NPU) بهعنوان نسل جدیدی از پردازندههای تخصصی، بهینهسازیهای قابل توجهی در پردازش موازی ارائه دادند. برخلاف GPU که بهطور کلی برای پردازشهای گرافیکی طراحی شده بود، NPUها از ابتدا برای انجام عملیات هوش مصنوعی و یادگیری ماشین توسعه یافتند. این پردازندهها عملکرد بالایی را با مصرف انرژی کمتر و ابعاد فیزیکی کوچکتر ارائه میدهند، که آنها را به گزینهای ایدهآل برای اجرای مدلهای هوش مصنوعی در دستگاههای مدرن تبدیل کرده است. با این حال باید توجه داشت که NPUها در برخی پردازشها دقت کمتری دارند و همچنین به الگوریتمهای یادگیری ماشین وابسته هستند.

کاربردهای واحد پردازش عصبی (NPU)
با توجه به اینکه واحدهای پردازش عصبی (NPUs) از فناوریهای نوظهور در دنیای الکترونیک و علوم کامپیوتر هستند، مورد توجه شرکتهای پیشرو در صنعت سختافزار و کامپیوتر، از جمله مایکروسافت، اینتل، انویدیا، کوالکام و سامسونگ قرار گرفتهاند. این شرکتها نسخههای مستقل یا ترکیبی از NPUها را ارائه میدهند.
با ادغام NPUها در محصولات الکترونیکی مصرفی، بهبود تشخیص تصویر، پردازش ویدئو و بهینهسازی عملکرد هوش مصنوعی، مانند تار کردن پسزمینه تماسهای ویدیویی، امکانپذیر میشود. برخی دیگر از کاربردهای NPU شامل موارد زیر است:
هوش مصنوعی و مدلهای Large Language
بهعنوان یک تسریعکننده پردازش هوش مصنوعی (AI Accelerator)، NPUها برای بهبود عملکرد یادگیری ماشین (ML) و شبکههای عصبی طراحی شدهاند. پردازش موازی پیشرفته NPUها در مدلهای Large Language، مانند چتباتها و سیستمهای تولید تصویر و ویدئو مبتنی بر هوش مصنوعی، باعث کاهش تأخیر و افزایش تطبیقپذیری در پردازش سیگنالهای چندرسانهای و تشخیص گفتار میشود.
اینترنت اشیا (IoT)
پردازندههای عصبی (NPU) به دلیل برخورداری از توان پردازش موازی بسیار بالا و قابلیت یادگیری خودکار (Self-learning)، گزینهای ایدهآل برای بهکارگیری در دستگاههای متصل به اینترنت اشیا (IoT) محسوب میشوند. این ویژگیها به آنها اجازه میدهد تا پردازشهای پیچیده مبتنی بر هوش مصنوعی را بهصورت سریع و با مصرف انرژی کم انجام دهند. از جمله کاربردهای رایج NPUها در حوزه IoT میتوان به ساعتهای هوشمند، دستیارهای صوتی، دوربینهای امنیتی، ترموستاتهای هوشمند و سایر لوازم خانگی هوشمند اشاره کرد.
مراکز داده (Data Centers)
با رشد روزافزون کاربردهای هوش مصنوعی، مراکز داده به یکی از ارکان اصلی زیرساختهای فناوری اطلاعات تبدیل شدهاند. مصرف بالای انرژی در این مراکز، نیاز به راهکارهای هوشمند برای بهینهسازی منابع را دوچندان کرده است. در این راستا، پردازندههای عصبی (NPU) با معماری مبتنی بر پردازش موازی و توان بالا، اجرای سریع و بهینه مدلهای یادگیری ماشین را امکانپذیر میسازند. استفاده از NPUها در محیطهای محاسبات ابری منجر به کاهش تأخیر، افزایش بهرهوری و تخصیص بهینه منابع پردازشی میشود. همچنین، ترکیب این پردازندهها با الگوریتمهای یادگیری ماشین میتواند فرآیندهایی مانند مدیریت انرژی و توزیع بار کاری را بهصورت خودکار و هوشمند انجام دهد.
وسایل نقلیه خودران (Autonomous Vehicles)
وسایل نقلیه خودران، مانند پهپادها، خودروهای بدون راننده و کامیونهای خودران، برای پردازش دادههای چندرسانهای در لحظه و تصمیمگیری سریع به NPUها وابستهاند. این واحدها با پردازش همزمان دادههای حسگرها، تحلیل علائم راهنمایی و بررسی موانع پیشبینینشده، عملکرد خودروهای خودران را بهبود میبخشند.

محاسبات لبهای و هوش مصنوعی در لبه (Edge Computing & Edge AI)
محاسبات ابری، دادهها را در مراکز داده دور از کاربر پردازش میکند، اما محاسبات لبهای (Edge Computing) دادهها را نزدیک به کاربر نگه میدارد. این روش باعث کاهش تأخیر، کاهش مصرف انرژی و افزایش امنیت اطلاعات میشود. به دلیل مصرف انرژی کمتر و اندازه فیزیکی کوچکتر، NPUها نقش مهمی در محاسبات لبهای و هوش مصنوعی On-Device ایفا میکنند.
رباتیک (Robotics)
رباتهای مبتنی بر هوش مصنوعی، از دستیارهای خانگی گرفته تا ابزارهای جراحی خودکار، به NPUها برای Computer vision، یادگیری ماشین و تعامل با محیط اطراف وابسته هستند. این ویژگی به آنها امکان میدهد که اجسام را تشخیص دهند، از تجربهها بیاموزند و به تغییرات محیطی واکنش مناسب نشان دهند.