سلاح جدید گوگل در نبرد مدل‌های هوش مصنوعی

مدل جدید هوش مصنوعی گوگل ۷۰۰ برابر قوی‌تر از مدل پیشرو اوپن اِی‌آی است.

کد خبر : 897046

به گزارش خبرگزاری علم و فناوری آنا به نقل از اینترستینگ اینجینیرینگ، گوگل ادعا کرده است که جمنای ۱.۵ (Gemini 1.5) می‌تواند تا یک میلیون کلمه رمزی (توکن)، برابر با چهار میلیون کاراکتر یا ۸۰۰ هزار واژه را مدیریت کند.

موضوع رقابت در عرصه هوش مصنوعی برای گوگل جدی است. فقط یک هفته پس از عرضه قدرتمندترین مدل خود، جمنای ۱.۰ اولترا (Gemini 1.0 Ultra)، این غول فناوری از نسخه جدیدتر، جمنای ۱.۵ رونمایی کرد. این نسل جدید از مدل‌های هوش مصنوعی سریع‌تر، هوشمندتر و همه‌کاره‌تر از قبل است.

جمنای ۱.۵

جمنای ۱.۵ نتیجه نوآوری بی‌وقفه گوگل در پردازش زبان طبیعی است؛ شاخه‌ای از هوش مصنوعی که با درک و تولید زبان انسان سروکار دارد. گوگل ادعا کرده است که جمنای ۱.۵ می‌تواند تا یک میلیون کلمه رمزی (توکن)، برابر با چهار میلیون کاراکتر یا ۸۰۰ هزار واژه را مدیریت کند. این ۷۰۰ برابر بیشتر از رکورد قبلی چت جی‌پی‌تی ۴ – اُپن اِی آی است که تنها می‌تواند ۱۲۸ هزار کلمه رمزی را پردازش کند.

این بدان معناست که جمنای ۱.۵ می‌تواند متن‌های طولانی‌تر و پیچیده‌تر مانند رمان، مقاله یا سخنرانی را با حفظ انسجام و کیفیت، درک و تولید کند. همچنین نشان می‌دهد که جمنای ۱.۵ می‌تواند ورودی‌های چندوجهی مانند متن، تصویر، صدا و ویدیو را مدیریت کند و خروجی‌هایی را در هر یک از این فرمت‌ها به دست دهد. به عنوان مثال، جمنای ۱.۵ می‌تواند به سوالات مطرح‌شده در یک کلیپ ویدیویی پاسخ دهد یا بر اساس یک دستور متنی آهنگ بسازد.

ترکیبی از کارشناسان

جمنای ۱.۵ تنها یک مدل نیست، بلکه خانواده‌ای از مدل‌ها است که نیاز‌ها و کاربرد‌های مختلفی را برآورده می‌کند. مدل جمنای ۱.۵ پرو (Pro) که از هر نظر همه‌کاره است از نظر عملکرد با جمنای ۱.۰ اولترا برابری می‌کند، اما توان محاسباتی بسیار کمتری را به کار می‌گیرد که آن را برای استفاده در دنیای واقعی کارآمدتر و مقیاس‌پذیرتر می‌کند. جمنای ۱.۵ پرو همچنین اولین مدلی است که از تکنیک جدیدی به نام «ترکیبی از کارشناسان (MoE)» استفاده می‌کند که به آن امکان می‌دهد هر بار به جای اجرای کل مدل از مرتبط‌ترین بخش‌ها برای جستجو استفاده کند.

دِمیس حسابیس (Demis Hassabis) مدیرعامل بخش دیپ‌مایند (DeepMind) گوگل که بازوی تحقیقاتی جمنای است می‌گوید: «تکنیک «ترکیبی از کارشناسان» به جمنای ۱.۵ پرو امکان می‌دهد تا به جای ترکیب کردن داده‌ها در آینده، آنها را از همان ابتدا ادغام کند. به این ترتیب جمنای ۱.۵ پرو می‌تواند متن، تصاویر و صدا را به‌طور همزمان یاد بگیرد و از هم افزایی بین آنها استفاده کند.»

آزمایش زبانی

جمنای ۱.۵ پرو از توانایی‌های مهم «یادگیری درون متنی» برخوردار است، به این معنی که می‌تواند با پردازش اطلاعات در یک زمان طولانی بدون نیاز به تنظیمات بیشتر، مهارت جدیدی کسب کند. برای آزمایش این توانایی، گوگل از معیار ترجمه ماشینی کتاب (MTOB) استفاده کرد که توانایی یادگیری این مدل از داده‌های ناآشنا را ارزیابی می‌کند. آنها این مدل را با یک راهنمای دستور زبان از کالامَنگ (زبانی با کمتر از ۲۰۰ گویشور در جهان) محک زدند که توانست ترجمه انگلیسی به کالامنگ را در سطحی قابل مقایسه با یک انسان که این زبان را یاد گرفته است ارائه دهد.

افزایش توانایی‌های قبلی

گوگل با جمنای ۱.۵ بار دیگر سطح تحقیق و توسعه هوش مصنوعی را افزایش داد. بنا بر اعلام گوگل، جمنای ۱.۵ بسیاری از محصولات و خدمات مانند دستیار گوگل، گوگل ترنسلیت و گوگل فوتوز (Google Photos) را قدرتمندتر می‌کند. جمنای اَدوَنسد (Gemini Advanced) پلتفرم مکالمه هوش مصنوعی را تواناتر و رقابتی‌تر می‌کند و آن را به رقیبی قدرتمند برای چت جی‌پی‌تی پلاس اُپن‌اِی‌آی تبدیل خواهد کرد و برخلاف چت جی‌پی‌تی پلاس که فقط متن‌محور بود، جمنای ادونسد می‌تواند ورودی‌ها و خروجی‌های چندوجهی را مدیریت کند و ویژگی‌ها و عملکرد‌های بیشتری را در اختیار کاربر قرار دهد.

گوگل تنها بازیکن در زمین مسابقه هوش مصنوعی نیست. شرکت‌های دیگری مانند مایکروسافت، فیسبوک و آنتروپیک نیز در حال کار توسعه مدل‌های هوش مصنوعی خود هستند که ممکن است به زودی سلطه گوگل را به چالش بکشد. جنگ هوش مصنوعی در حال داغ شدن است و جمنای ۱.۵ جدیدترین سلاح گوگل است.

انتهای پیام/