فناوری
موضوعات داغ

چشمان هوشمند اپل؛ مدل «فرت» چگونه برنامه‌های آیفون را کنترل می‌کند؟

اپل با مدل هوش مصنوعی Ferret-UI Lite به سیری قدرت می‌دهد تا صفحه آیفون را ببیند، اجزای برنامه‌ها را درک کرده و دستورات را به صورت خودکار اجرا کند.

خلاصه خبر
  • اپل با انتشار مقاله پژوهشی جدیدی از مدل هوش مصنوعی «فرت یو‌آی لایت» پرده برداشت. این مدل که دارای ۳ میلیارد پارامتر است، به طور خاص برای درک رابط کاربری موبایل طراحی شده و قادر است آیکون‌ها، متن‌ها و ویجت‌های روی صفحه را با دقت بالا تشخیص دهد. هدف اپل از این پروژه، توانمندسازی سیری برای انجام کارهای خودکار درون برنامه‌ها (مانند رزرو بلیت یا ویرایش عکس) تنها با فرمان صوتی است. این مدل به صورت آفلاین روی دستگاه اجرا می‌شود تا امنیت اطلاعات کاربر حفظ شود و انتظار می‌رود تحولی بزرگ در آی‌او‌اس ۲۶ ایجاد کند.

اپل با معرفی نسل جدید مدل هوش مصنوعی خود، گام بلندی برای تبدیل «سیری» به یک دستیار همه فن حریف برداشته است. طبق گزارش‌های اپل اینسایدر، محققان این شرکت از مدل زبانی-تصویری جدیدی به نام «فرت یو‌آی لایت» (Ferret-UI Lite) پرده‌برداری کرده‌اند.

این مدل که برای اجرا روی سخت‌افزار داخلی آیفون بهینه‌سازی شده، به دستیار صوتی اپل اجازه می‌دهد تا محتویات صفحه نمایش را درست مانند یک انسان «ببیند»، اجزای آن را درک کند و به جای کاربر، دستورات پیچیده را درون برنامه‌ها اجرا نماید. این تحول، نقطه پایانی بر دوران سیری به عنوان یک ابزار پاسخ‌دهنده ساده و آغاز عصر «دستیارهای کنشگر» است.

کالبدشکافی مدل «لایت»؛ قدرت بیکران در کالبدی کوچک و محلی

تفاوت اصلی مدل «فرت یو‌آی لایت» با نسخه‌های قبلی، تمرکز آن بر «حریم خصوصی» و «سرعت» است. برخلاف مدل‌های غول‌آسای ابری، این هوش مصنوعی تنها با ۳ میلیارد پارامتر طراحی شده تا بتواند به صورت مستقیم روی «واحد پردازش عصبی» (NPU) تراشه‌های سری «ای» (A-series) آیفون اجرا شود.

اپل در این مدل از تکنیکی به نام «زوم هوشمند» استفاده کرده است؛ به این صورت که مدل ابتدا یک نگاه کلی به صفحه می‌اندازد، ناحیه مورد نظر را شناسایی کرده و سپس روی آن بخش کوچک «بزرگ‌نمایی» می‌کند تا جزئیات دقیقی مثل آیکون‌های کوچک یا متن‌های ریز را تشخیص دهد.

این قابلیت به سیری اجازه می‌دهد تا کارهای دشواری مثل «پیدا کردن تنظیمات خاص در یک برنامه پیچیده» یا «کلیک روی دکمه‌های کوچک در صفحات وب» را بدون نیاز به ارسال اطلاعات به سرورهای خارجی انجام دهد.

از درک تصویر تا کنترل لمسی؛ سیری همسفر هوشمند شما می‌شود

هدف نهایی اپل از توسعه این فناوری، ادغام آن با نسخه بعدی سیستم‌عامل، یعنی «آی‌او‌اس ۲۶.۴» است که انتظار می‌رود در اواخر سال جاری خورشیدی معرفی شود. طبق تحلیل‌های منتشر شده در ZDNET، با استفاده از مدل «فرت»، کاربر می‌تواند دستوراتی مثل «این عکس را برش بزن و برای علی بفرست» یا «در برنامه دیوار، ارزان‌ترین خانه‌ها را برایم پیدا کن» صادر کند.

هوش مصنوعی اپل با تحلیل «رابط کاربری» (UI)، مسیر حرکت میان صفحات را پیدا کرده و به صورت خودکار مراحل را طی می‌کند. این ویژگی نه تنها برای کاربران عادی لذت‌بخش است، بلکه یک انقلاب بزرگ در زمینه «دسترسی‌پذیری» (Accessibility) برای افراد دارای ناتوانی‌های جسمی یا بینایی محسوب می‌شود، چرا که سیری می‌تواند تمام اتفاقات روی صفحه را برای آن‌ها شرح داده و به نیابت از آن‌ها با گوشی تعامل کند.

لینک‌های بیشتر:

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *