شرکت IBM یکی از پیشگامان در حوزه محاسبات نورومورفیک است؛ رویکردی که با الهام از ساختار مغز انسان، حافظه و پردازش را در هم ادغام می‌کند تا عملکردی مشابه با کارایی مغز به وجود آورد. دو پروژه‌ شاخص از IBM به نام‌های TrueNorth و نسخه‌ تکامل‌یافته‌ آن یعنی NorthPole نشان‌دهنده پیشرفت‌های چشمگیر در این حوزه هستند. تمرکز اصلی این دو تراشه بر بهره‌وری انرژی، پردازش موازی و کاهش تأخیر در اجرای هوش مصنوعی است.

آغاز TrueNorth

در سال 2014 شرکت IBM از تراشه‌ نورومورفیک TrueNorth رونمایی کرد. این تراشه که با هدف شبیه‌سازی ساختار و عملکرد مغز پستانداران طراحی شده بود، در چارچوب برنامه‌ SyNAPSE متعلق به DARPA ساخته شد و با معماری مرسوم فون‌نویمان تفاوت اساسی داشت. تراشه TrueNorth از 4096 هسته‌ نوروسیناپتیک پشتیبانی می‌کند که هر کدام شامل پردازنده، حافظه و زیرساخت ارتباطی هستند. این تراشه توانایی شبیه‌سازی حدود یک میلیون نورون دیجیتال و 256 میلیون سیناپس را دارد و از «اسپایک»ها به عنوان واحد انتقال داده‌های عصبی استفاده می‌کند.

یکی از ویژگی‌های منحصربه‌فرد TrueNorth، معماری رویدادمحور آن است. این تراشه از طراحی Globally Asynchronous Locally Synchronous (GALS) بهره می‌برد که در آن اجزای پردازشی، مشابه نحوه عملکرد نورون‌های مغز، تنها در صورت دریافت اسپایک فعال می‌شوند. همین ویژگی موجب مصرف انرژی فوق‌العاده پایین (کمتر از ۷۰ میلی‌وات) و بهره‌وری انرژی حدود ۴۶ میلیارد عملیات سیناپسی در ثانیه به ازای هر وات شده است.

گرچه TrueNorth توانایی یادگیری در زمان واقعی را ندارد، اما کاملاً قابل برنامه‌ریزی است. IBM ابزارهایی نظیر Corelet و چارچوب Compass را برای برنامه‌نویسی و پیاده‌سازی مدل‌های شبکه عصبی بر روی این تراشه توسعه داده است.

سیستم DARPA که از 16 تراشه TrueNorth تشکیل شده است

میراث و تأثیر TrueNorth

پس از عرضه، گروه‌های پژوهشی متعددی کارایی و دقت TrueNorth را مورد آزمایش قرار دادند. در یکی از کاربردها، این تراشه با حسگر تصویری پویا (Dynamic Vision Sensor) شرکت سامسونگ ترکیب شد و توانست ویدئوی رویدادمحور را با نرخ ۲۰۰۰ فریم بر ثانیه پردازش کند. این امر در حوزه بینایی ماشینی بسیار پیشرفته محسوب می‌شود. هرچند TrueNorth عمدتاً یک نمونه‌ پژوهشی بود، اما طراحی آن الهام‌بخش نسل‌های بعدی سخت‌افزار و الگوریتم‌های نورومورفیک شده است.

معرفی NorthPole: نورومورفیک نسل دوم IBM

حدود یک دهه پس از TrueNorth، شرکت IBM از پروژه‌ NorthPole رونمایی کرد. این پروژه جدید تحولی اساسی در طراحی سخت‌افزار هوش مصنوعی نورومورفیک به شمار می‌رود. این تراشه با فرآیند ۱۲ نانومتری ساخته شده و دارای ۲۲ میلیارد ترانزیستور در سطح ۸۰۰ میلی‌متر مربع است. NorthPole با هدف اجرای وظایف پیشرفته‌ استنتاج هوش مصنوعی (AI inference) با انرژی و سرعتی بی‌نظیر طراحی شده است.

NorthPole از ابتدا با هدف حذف گلوگاه فون‌نویمان ساخته شده است. تمام حافظه‌ مورد نیاز آن درون تراشه تعبیه شده تا بتواند شبکه‌های عصبی پیچیده‌ای مانند ResNet-50 و YOLOv4 را با تأخیر کم و مصرف انرژی بسیار پایین اجرا کند. در آزمایش‌های عملکرد، NorthPole تا ۲۵ برابر بهره‌وری انرژی بیشتر و ۲۲ برابر سرعت بیشتر نسبت به GPUهای رقیب، آن هم با استفاده از دقت‌های عددی ترکیبی (۲، ۴ و ۸ بیتی) را نشان داده است.

تراشه نورومورفیک NorthPole

مزایای NorthPole

برخلاف طراحی تحقیق‌محور TrueNorth، تراشه NorthPole برای کاربردهای واقعی و عملیاتی استنتاج طراحی شده است. این تراشه بدون انشعابات وابسته به داده کار کرده و تنها توالی‌های از پیش تعریف‌شده‌ شبکه عصبی را اجرا می‌کند. این امر سبب شده که NorthPole برای پردازش تولیدی بسیار بهینه باشد. آزمایش‌هایی که روی عملکرد آن در پردازش مدل‌های زبانی بزرگ (LLM) انجام شده‌اند، نشان داده‌اند که NorthPole می‌تواند با کمتر از یک میلی‌ثانیه تأخیر به ازای هر توکن و بیش از ۴۶ برابر بهره‌وری انرژی نسبت به GPUها عمل کند.

معماری کاملاً دیجیتال و ویژه‌ استنتاج این تراشه، از یادگیری درون‌تراشه‌ای پشتیبانی نمی‌کند، اما به‌صورت قابل‌توجهی مصرف انرژی و زمان تأخیر را برای کاربردهایی چون هوش مصنوعی لبه (Edge AI)، رباتیک، وسایل نقلیه‌ خودران و مراکز داده کاهش می‌دهد. بسیاری از پژوهشگران، NorthPole را «گامی شگفت‌انگیز» در جهت تلفیق الهام از مغز انسان و نیازهای واقعی AI می‌دانند.

افق تازه‌ای برای طراحی نورومورفیک

از معماری میلیون‌نورونی TrueNorth تا پردازنده‌ استنتاجی چندمیلیارد ترانزیستوری NorthPole، شرکت IBM نشان داده که در حال حرکت از نمونه‌های مفهومی نورومورفیک به سخت‌افزارهای عملیاتی و تولیدی در حوزه‌ هوش مصنوعی است. این دو پروژه به‌خوبی اثبات می‌کنند که ترکیب نزدیک حافظه و پردازش و استفاده از مدل‌های رویدادمحور می‌تواند به پیشرفت‌هایی چشمگیر در بهره‌وری انرژی و سرعت بیانجامد.

گرچه هنوز هیچ‌یک از این تراشه‌ها به‌صورت تجاری در دسترس نیستند، اما دستاوردهای آن‌ها زمینه‌ساز نسل‌های آینده شتاب‌دهنده‌های هوش مصنوعی خواهد بود. با گسترش سریع پردازش مرزی و چالش‌های مربوط به مصرف انرژی، اهمیت طراحی‌های بهینه بیش از پیش احساس می‌شود. درس‌هایی که از معماری‌های TrueNorth و NorthPole گرفته شده‌اند، به‌احتمال زیاد نقشی کلیدی در توسعه سخت‌افزارهای هوش مصنوعی آینده ایفا خواهند کرد.