چشمان هوشمند اپل؛ مدل «فرت» چگونه برنامههای آیفون را کنترل میکند؟
اپل با مدل هوش مصنوعی Ferret-UI Lite به سیری قدرت میدهد تا صفحه آیفون را ببیند، اجزای برنامهها را درک کرده و دستورات را به صورت خودکار اجرا کند.

- اپل با انتشار مقاله پژوهشی جدیدی از مدل هوش مصنوعی «فرت یوآی لایت» پرده برداشت. این مدل که دارای ۳ میلیارد پارامتر است، به طور خاص برای درک رابط کاربری موبایل طراحی شده و قادر است آیکونها، متنها و ویجتهای روی صفحه را با دقت بالا تشخیص دهد. هدف اپل از این پروژه، توانمندسازی سیری برای انجام کارهای خودکار درون برنامهها (مانند رزرو بلیت یا ویرایش عکس) تنها با فرمان صوتی است. این مدل به صورت آفلاین روی دستگاه اجرا میشود تا امنیت اطلاعات کاربر حفظ شود و انتظار میرود تحولی بزرگ در آیاواس ۲۶ ایجاد کند.
اپل با معرفی نسل جدید مدل هوش مصنوعی خود، گام بلندی برای تبدیل «سیری» به یک دستیار همه فن حریف برداشته است. طبق گزارشهای اپل اینسایدر، محققان این شرکت از مدل زبانی-تصویری جدیدی به نام «فرت یوآی لایت» (Ferret-UI Lite) پردهبرداری کردهاند.
این مدل که برای اجرا روی سختافزار داخلی آیفون بهینهسازی شده، به دستیار صوتی اپل اجازه میدهد تا محتویات صفحه نمایش را درست مانند یک انسان «ببیند»، اجزای آن را درک کند و به جای کاربر، دستورات پیچیده را درون برنامهها اجرا نماید. این تحول، نقطه پایانی بر دوران سیری به عنوان یک ابزار پاسخدهنده ساده و آغاز عصر «دستیارهای کنشگر» است.
کالبدشکافی مدل «لایت»؛ قدرت بیکران در کالبدی کوچک و محلی
تفاوت اصلی مدل «فرت یوآی لایت» با نسخههای قبلی، تمرکز آن بر «حریم خصوصی» و «سرعت» است. برخلاف مدلهای غولآسای ابری، این هوش مصنوعی تنها با ۳ میلیارد پارامتر طراحی شده تا بتواند به صورت مستقیم روی «واحد پردازش عصبی» (NPU) تراشههای سری «ای» (A-series) آیفون اجرا شود.
اپل در این مدل از تکنیکی به نام «زوم هوشمند» استفاده کرده است؛ به این صورت که مدل ابتدا یک نگاه کلی به صفحه میاندازد، ناحیه مورد نظر را شناسایی کرده و سپس روی آن بخش کوچک «بزرگنمایی» میکند تا جزئیات دقیقی مثل آیکونهای کوچک یا متنهای ریز را تشخیص دهد.
این قابلیت به سیری اجازه میدهد تا کارهای دشواری مثل «پیدا کردن تنظیمات خاص در یک برنامه پیچیده» یا «کلیک روی دکمههای کوچک در صفحات وب» را بدون نیاز به ارسال اطلاعات به سرورهای خارجی انجام دهد.
از درک تصویر تا کنترل لمسی؛ سیری همسفر هوشمند شما میشود
هدف نهایی اپل از توسعه این فناوری، ادغام آن با نسخه بعدی سیستمعامل، یعنی «آیاواس ۲۶.۴» است که انتظار میرود در اواخر سال جاری خورشیدی معرفی شود. طبق تحلیلهای منتشر شده در ZDNET، با استفاده از مدل «فرت»، کاربر میتواند دستوراتی مثل «این عکس را برش بزن و برای علی بفرست» یا «در برنامه دیوار، ارزانترین خانهها را برایم پیدا کن» صادر کند.
هوش مصنوعی اپل با تحلیل «رابط کاربری» (UI)، مسیر حرکت میان صفحات را پیدا کرده و به صورت خودکار مراحل را طی میکند. این ویژگی نه تنها برای کاربران عادی لذتبخش است، بلکه یک انقلاب بزرگ در زمینه «دسترسیپذیری» (Accessibility) برای افراد دارای ناتوانیهای جسمی یا بینایی محسوب میشود، چرا که سیری میتواند تمام اتفاقات روی صفحه را برای آنها شرح داده و به نیابت از آنها با گوشی تعامل کند.
لینکهای بیشتر:
- وداع با دستبند محبوب؛ سامسونگ پشتیبانی از سری گلکسی فیت را متوقف کرد
- حراج قرن سامسونگ؛ سقوط قیمت تلویزیون S85F به زیر هزار دلار
- پرچمدار در لباس میانرده؛ ویوو V70 الیت با باتری ۶۵۰۰ میلیآمپری معرفی شد





