هوش مصنوعی بومی اپل؛ دستیار اپلیکیشنها بدون نیاز به اینترنت
Ferret‑UI Lite یک «عامل انتهابهانتها» برای کار با رابطهای گرافیکی (GUI) است؛ عاملی که قادر است صفحهٔ اپلیکیشنها را تحلیل کند، عناصر بصری را بشناسد و اقدامات لازم را انجام دهد. نکتهٔ مهم اینجاست که این مدل برای محیطهای مختلف از جمله موبایل، وب و دسکتاپ طراحی شده و تمرکز آن فقط روی یک پلتفرم خاص نیست.
اپل در تازهترین پژوهش خود روی حوزهٔ هوش مصنوعی، به سراغ یکی از چالشهای مهم دنیای نرمافزار رفته است: تعامل هوشمند با رابطهای کاربری بدون وابستگی به اینترنت. این شرکت با معرفی مدلی سبک به نام Ferret‑UI Lite نشان میدهد که آیندهٔ دستیارهای هوشمند الزاماً به سرورهای ابری گره نخورده و میتواند مستقیماً روی خود دستگاه شکل بگیرد.
طبق توضیحات منتشرشده در منبع رسمی اپل، Ferret‑UI Lite یک «عامل انتهابهانتها» برای کار با رابطهای گرافیکی (GUI) است؛ عاملی که قادر است صفحهٔ اپلیکیشنها را تحلیل کند، عناصر بصری را بشناسد و اقدامات لازم را انجام دهد. نکتهٔ مهم اینجاست که این مدل برای محیطهای مختلف از جمله موبایل، وب و دسکتاپ طراحی شده و تمرکز آن فقط روی یک پلتفرم خاص نیست.
از نظر فنی، این مدل تنها حدود ۳ میلیارد پارامتر دارد و در دستهٔ مدلهای سبک قرار میگیرد؛ اما اپل برای افزایش کارایی آن، از ترکیبی هوشمندانه از دادههای واقعی و دادههای مصنوعی رابط کاربری استفاده کرده است. این روش باعث شده مدل بتواند با سناریوهای متنوعتری از چیدمانها، دکمهها و ساختارهای گرافیکی اپلیکیشنها سازگار شود.
اپل همچنین برای بهبود کیفیت تصمیمگیری مدل در زمان اجرا، از تکنیکهایی مانند زنجیرهٔ استدلال (Chain‑of‑Thought) و ابزارمحوری بصری (Visual Tool‑Use) بهره گرفته است. به این ترتیب، Ferret‑UI Lite تنها به تشخیص عناصر بسنده نمیکند، بلکه میتواند مسیر منطقی انجام یک کار را مرحلهبهمرحله تحلیل کرده و دقیقتر عمل کند.
در بخش آموزش پیشرفتهتر، پژوهشگران اپل از یادگیری تقویتی با پاداشهای طراحیشده استفاده کردهاند. این رویکرد کمک میکند مدل بهجای پاسخهای سطحی، روی موفقیت واقعی در انجام وظایف تمرکز کند؛ مثلاً رسیدن به صفحهٔ درست یا اجرای صحیح یک فرمان در اپلیکیشن، درست مشابه رفتار یک کاربر واقعی.
در نهایت، نتایج بنچمارکها نشان میدهد Ferret‑UI Lite با وجود اندازهٔ کوچک، عملکرد رقابتی قابلتوجهی دارد. این مدل در معیارهای مختلف GUI امتیازهای بالایی ثبت کرده و در مسیری حرکت میکند که میتواند زمینهساز نسل جدیدی از هوش مصنوعی بومی، سریع و حافظ حریم خصوصی روی دستگاههای اپل باشد؛ مسیری که وابستگی به پردازش ابری را بهطور جدی کاهش میدهد.