بهینه سازی مدل TensorFlow

جعبه ابزار بهینه سازی مدل TensorFlow پیچیدگی بهینه سازی استنتاج یادگیری ماشین را به حداقل می رساند.

کارایی استنتاج به دلیل تأخیر، استفاده از حافظه و در بسیاری از موارد مصرف انرژی، هنگام استقرار مدل‌های یادگیری ماشین، یک نگرانی مهم است. به ویژه در دستگاه‌های لبه‌ای، مانند موبایل و اینترنت اشیا (IoT)، منابع محدودتر می‌شوند و اندازه مدل و کارایی محاسبات به یک نگرانی اصلی تبدیل می‌شود.

تقاضای محاسباتی برای آموزش با تعداد مدل های آموزش داده شده در معماری های مختلف افزایش می یابد، در حالی که تقاضای محاسباتی برای استنتاج متناسب با تعداد کاربران افزایش می یابد.

موارد استفاده کنید

بهینه سازی مدل از جمله موارد زیر مفید است:

  • کاهش تأخیر و هزینه استنتاج هم برای دستگاه های ابری و هم برای دستگاه های لبه (مانند موبایل، اینترنت اشیا).
  • استقرار مدل‌ها در دستگاه‌های لبه با محدودیت‌هایی در پردازش، حافظه و/یا مصرف انرژی.
  • کاهش حجم محموله برای به‌روزرسانی مدل‌های هوایی.
  • فعال کردن اجرا بر روی سخت افزار محدود شده یا بهینه شده برای عملیات نقطه ثابت.
  • بهینه سازی مدل ها برای شتاب دهنده های سخت افزاری با هدف خاص.

تکنیک های بهینه سازی

حوزه بهینه سازی مدل می تواند شامل تکنیک های مختلفی باشد:

  • با هرس و هرس ساختاری تعداد پارامترها را کاهش دهید.
  • کاهش دقت نمایش با کوانتیزاسیون.
  • توپولوژی مدل اصلی را به یک توپولوژی کارآمدتر با پارامترهای کاهش یافته یا اجرای سریعتر به روز کنید. به عنوان مثال، روش های تجزیه تانسور و تقطیر

جعبه ابزار ما از کوانتیزاسیون پس از آموزش ، آموزش آگاهانه کوانتیشن ، هرس و خوشه بندی پشتیبانی می کند. این جعبه ابزار همچنین پشتیبانی آزمایشی را برای بهینه‌سازی مشارکتی برای ترکیب تکنیک‌های مختلف فراهم می‌کند.

کوانتیزاسیون

مدل‌های کوانتیزه مدل‌هایی هستند که در آنها مدل‌ها را با دقت کمتری نشان می‌دهیم، مانند اعداد صحیح 8 بیتی در مقابل شناور 32 بیتی. دقت کمتر لازمه استفاده از سخت افزار خاص است.

پراکندگی و هرس

مدل‌های پراکنده آن‌هایی هستند که در آن اتصالات بین اپراتورها (به عنوان مثال لایه‌های شبکه عصبی) قطع شده‌اند و صفرها را به تانسورهای پارامتر وارد می‌کنند.

خوشه بندی

مدل های خوشه ای مدل هایی هستند که در آن پارامترهای مدل اصلی با تعداد کمتری از مقادیر منحصر به فرد جایگزین می شوند.

بهینه سازی مشارکتی

این جعبه ابزار پشتیبانی آزمایشی را برای بهینه‌سازی مشارکتی فراهم می‌کند. این به شما امکان می دهد از ترکیب چندین تکنیک فشرده سازی مدل بهره مند شوید و به طور همزمان از طریق آموزش آگاهی از کوانتیزاسیون به دقت بهبود یافته دست یابید.