
به گزارش دیجیاتو، این مدل با نام DiffuCode- 7B- cpGRPO نه تنها قابلیت تولید سریعتر را دارد، بلکه میتواند بطور همزمان چند بخش از کد را بهبود داده و ساختاری منسجم و قابل رقابت با برترین مدل های متن باز ارائه کند.
اپل مدل DiffuCode- 7B- cpGRPO را با تکیه بر مقاله ای تحت عنوان DiffuCoder:Understanding and Improving Masked Diffusion Models for Code Generation توسعه داده است. نکته ی جالب اینکه این مدل با تغییر دما می تواند بین حالت خودبازگشتی و غیرترتیبی سوییچ کند. دمای بالا آزادی بیشتری در ترتیب تولید توکن ها می دهد و در نتیجه مدل میتواند بخش های مختلف کد را به صورت غیرخطی تولید کند.
قابلیت های مدل اپل
همچنین اپل (Apple) با اضافه کردن یک مرحله آموزشی تحت عنوان coupled- GRPO موفق شده کیفیت تولید کد را در این مدل به شکل محسوسی ارتقاء دهد. به طورکلی ، DiffuCode- 7B- cpGRPO مدلی است با سرعت بالا، انسجام ساختاری بالا، و عملکردی قابل رقابت با بهترین مدل های برنامه نویسی متن باز.
جالب تر اینکه مدل اپل بر پایه Qwen2.5- 7B توسعه یافته؛ مدل بنیادین متن بازی که توسط علی بابا ساخته شده است. علی بابا ابتدا این مدل را برای تولید کد بهینه سازی کرده (با نام Qwen2.5‑Coder‑7B) و سپس اپل نسخه ی اختصاصی خود را بر اساس آن طراحی و بازآموزی کرد.

اپل مدل جدید را با یک رمزگشا (Decoder) مبتنی بر انتشار طراحی کرد و پس از آن با بیش از ۲۰ هزار نمونه کدنویسی باکیفیت آنرا آموزش داد. این فرآیند منجر به بهبود ۴.۴ درصدی عملکرد مدل در یک بنچمارک مطرح برنامه نویسی شد.
مدل های زبانی معمول مانند GPT معمولاً از روش خودبازگشتی استفاده می کنند. در این روش، مدل پاسخ را به صورت ترتیبی، توکن به توکن، و از چپ به راست تولید می کند. هر توکن جدید براساس بازپردازش کل ورودی و توکن های قبلی پیش بینی می شود.
همچنین در مدل های زبانی، پارامتر« دما» میزان تصادفی بودن پاسخ را کنترل می کند. دمای پایین باعث می شود مدل محتمل ترین گزینه ها را انتخاب کند، در حالیکه دمای بالا آزادی بیشتری برای انتخاب گزینه های کمتر محتمل فراهم می کند.
در مقابل، مدل های انتشاری( که در مدل های تولید تصویر مانند Stable Diffusion استفاده می شوند ) از یک ورودی نویزدار شروع کرده و آن را مرحله به مرحله به خروجی مطلوب تبدیل می کنند. این روش اخیراً در تولید متن نیز به کار گرفته شده و نتایج امیدوارکننده ای داشته است.

مزیت اصلی این رویکرد در تولید کد آن است که مدل میتواند به جای تولید خطی، ساختار کلی کد را در چند مرحله و به صورت موازی اصلاح کند — قابلیتی که در برنامه نویسی بسیار ارزشمند است.
گرچه هنوز DiffuCoder به سطح مدل هایی مانند GPT- 4 یا Gemini Diffusion نرسیده، ولی این حرکت نشانه ای روشن از تلاش اپل برای ورود جدی به عرصه هوش مصنوعی (Artificial Intelligence) مولد است. این شرکت با روش هایی نوآورانه و متفاوت، در حال پایه گذاری نسل بعدی مدل های زبانی خود است.
اینکه آیا این مدل ها در آینده به محصولات واقعی اپل راه پیدا می کنند یا خیر، هنوز مشخص نیست؛ ولی روشن است که اپل بی سروصدا و با دقت، در حال حرکت بسوی آینده ای متفاوت در هوش مصنوعی است.
- 10
- 1