جمنای سهبعدی شد؛ تجربه هوش مصنوعی گوگل در قلب اپل ویژن پرو
گوگل با ادغام آواتارهای سهبعدی پرسونا در اپلیکیشن جمنای، امکان تعامل فیزیکی و بصری با هوش مصنوعی را برای کاربران اپل ویژن پرو فراهم کرد.

- در یک پیشرفت بزرگ نرمافزاری، اپلیکیشن گوگل جمنای در هدست اپل ویژن پرو به قابلیت نمایش آواتار سهبعدی (Persona) مجهز شد. این بهروزرسانی که بر پایه مدل «جمنای ۳ پرو» توسعه یافته، به هوش مصنوعی اجازه میدهد به صورت یک موجود مجازی در محیط فیزیکی کاربر ظاهر شود. سیستم جدید با تشخیص حرکات بدن و صدای فضایی، تجربهای کاملاً غوطهورکننده ارائه میدهد که در آن هوش مصنوعی میتواند به اشیاء واقعی واکنش نشان داده و با کاربر به صورت رو در رو گفتگو کند. این اقدام گوگل، گام مهمی در جهت تبدیل هوش مصنوعی از یک ابزار متنی به یک همکار مجازی در دنیای واقعیت ترکیبی است.
درحالیکه رقابت میان گوگل و اپل در بازارهای سنتی همچنان پابرجاست، دنیای محاسبات فضایی (Spatial Computing) این دو رقیب دیرینه را به همکاریهای شگفتانگیزی واداشته است.
طبق جدیدترین گزارشهای منتشر شده در بهمن ۱۴۰۴ (فوریه ۲۰۲۶)، گوگل با انتشار بهروزرسانی انقلابی برای اپلیکیشن «جمنای» (Gemini)، قابلیت پشتیبانی از «پرسونا» (Persona) یا همان آواتارهای سهبعدی واقعگرایانه اپل را اضافه کرد. این بدین معناست که کاربران «اپل ویژن پرو» اکنون میتوانند با هوش مصنوعی گوگل به گونهای تعامل کنند که گویی یک موجود زنده و سهبعدی در فضای اتاق آنها حضور دارد.
فراتر از یک چتبات ساده؛ وقتی جمنای جان میگیرد
به گزارش وبسایت معتبر اندروید آتوریتی، این قابلیت جدید به جمنای اجازه میدهد تا از دادههای بصری «ویژن او اس» (visionOS) برای خلق یک تجربه تعاملی بینظیر استفاده کند.
آواتار سهبعدی جمنای اکنون میتواند حرکات چشم، دست و حتی تغییرات ظریف چهره کاربر را تشخیص داده و به صورت آنی به آنها واکنش نشان دهد. به نقل از CNET، «این سطح از ادغام نرمافزاری، آواتارهای اپل را از یک ابزار ویدیو کنفرانس ساده به یک رابط کاربری کاملاً هوشمند تبدیل کرده است که میتواند در محیطهای کاری مجازی در کنار کاربر بنشیند و به او در حل مسائل پیچیده کمک کند.»
قدرتنمایی مدل جمنای ۳ پرو در کالبد واقعیت ترکیبی
قلب تپنده این تجربه، مدل جدید «جمنای ۳ پرو» (Gemini 3 Pro) است که برای پردازشهای سنگین چندرسانهای بهینهسازی شده است. به گزارش مکرومرز، این مدل با بهرهگیری از قدرت پردازشی تراشههای «ام ۲» و «آر ۱» در ویژن پرو، توانایی تحلیل محیط فیزیکی کاربر را دارد. برای مثال، کاربر میتواند به یک وسیله خراب در اتاق خود اشاره کند و آواتار سهبعدی جمنای با نگاه کردن به همان نقطه، دستورالعملهای تعمیر را به صورت تصاویر واقعیت افزوده روی بدنه دستگاه نمایش دهد. این در حالی است که پیش از این، تعامل با جمنای در هدستهای اپل تنها به پنجرههای دوبعدی و متنی محدود بود.
علاوهبر این، گوگل قابلیت «صدای زنده» (Gemini Live) را با فناوری «صدای فضایی» (Spatial Audio) اپل ادغام کرده است. این یعنی اگر آواتار جمنای در سمت راست کاربر قرار گرفته باشد، صدای او دقیقاً از همان جهت به گوش میرسد که حس حضور فیزیکی را به شدت تقویت میکند. این حرکت گوگل، پاسخی مستقیم به تلاشهای اپل برای ادغام هوش مصنوعی در «سیری» است و نشان میدهد که گوگل قصد ندارد بازار ارزشمند هدستهای ردهبالا را به رقبا واگذار کند.
لینکهای بیشتر:





