وبلاگ

آنچه تاکنون می دانیم

در کنفرانس توسعه دهندگان Google I/O در می 2023، ساندار پیچای، مدیر عامل شرکت، سیستم هوش مصنوعی (AI) آینده این شرکت، Gemini را اعلام کرد.

مدل زبان بزرگ (LLM) توسط بخش Google DeepMind (تیم مغز + DeepMind) توسعه یافته است. این می تواند با سیستم های هوش مصنوعی مانند ChatGPT OpenAI رقابت کند و احتمالاً از آن پیشی بگیرد.

در حالی که جزئیات کمیاب است، در اینجا چیزی است که می توانیم از آخرین مصاحبه ها و گزارش ها در مورد Google Gemini جمع آوری کنیم.

Google Gemini چند وجهی خواهد بود

پیچای گفت Gemini نقاط قوت سیستم AlphaGo DeepMind را که به دلیل تسلط بر بازی پیچیده Go معروف است، با قابلیت های مدل سازی زبان گسترده ترکیب می کند.

او گفت که از ابتدا به گونه ای طراحی شده است که چندوجهی باشد و متن، تصاویر و انواع دیگر داده ها را یکپارچه کند. این می تواند توانایی های مکالمه طبیعی بیشتری را فعال کند.

پیچای هم حاکی از به توانایی‌های آینده مانند حافظه و برنامه‌ریزی که می‌تواند وظایفی را که نیاز به استدلال دارند را فعال کند.

  این چه معنایی برای شما دارد • Yoast

Gemini می تواند از ابزارها و API ها استفاده کند

در آپدیت صدای حرفه ای زندگینامه در طول تابستان، دانشمند ارشد گوگل، جفری دین، گفت که جمینی یکی از “نسل بعدی مدل های چندوجهی” است که او رهبری می کند.

این شرکت اعلام کرد که از Pathways، زیرساخت هوش مصنوعی جدید گوگل، برای کمک به مقیاس‌بندی آموزش در مجموعه‌های مختلف داده استفاده خواهد کرد.

این نشان می دهد که Gemini به طور بالقوه بزرگترین مدل زبانی است که تا به امروز ایجاد شده است، که احتمالاً از اندازه GPT-3 با بیش از 175 میلیارد پارامتر فراتر می رود.

با اندازه ها و ظرفیت های مختلف عرضه خواهد شد

جزئیات بیشتر از Demis Hassabis، مدیر عامل DeepMind ارائه شده است.

در ژوئن اعلام کرد سیمی تکنیک‌های AlphaGo، مانند یادگیری تقویتی و جستجوی درختی، می‌تواند به Gemini توانایی‌های جدیدی مانند استدلال و حل مسئله بدهد.

Hassabis گفت Gemini یک “سری مدل” است که در اندازه ها و ظرفیت های مختلف در دسترس خواهد بود.

او همچنین اشاره کرد که Gemini می‌تواند از حافظه، بررسی واقعیت در برابر منابعی مانند جستجوی گوگل و تقویت یادگیری تقویتی برای بهبود دقت و کاهش محتوای توهم‌آمیز خطرناک استفاده کند.

اولین نتایج Gemini امیدوار کننده است

در سپتامبر زمان در طول مصاحبه، Hassabis تکرار کرد که هدف Gemini ترکیب مقیاس و نوآوری است.

وی گفت ادغام برنامه ریزی و حافظه در مراحل اولیه و اکتشافی است.

Hassabis همچنین گفت Gemini می‌تواند از روش‌های بازیابی برای تولید بلوک‌های کامل اطلاعات، به جای تولید کلمه به کلمه، برای بهبود سازگاری واقعی استفاده کند.

  آمازون در نظر دارد تغییرات اساسی را انجام دهد که تجربه جستجو را تغییر خواهد داد

او فاش کرد که Gemini بر اساس کارهای چندوجهی DeepMind، مانند سیستم زیرنویس تصویر فلامینگو، ساخته شده است.

به طور کلی، Hassabis گفت که Gemini “نتایج اولیه بسیار امیدوارکننده” را نشان می دهد.

چت ربات های پیشرفته به عنوان دستیاران شخصی جهانی

در مصاحبه با سیمیPichai که چند روز بعد منتشر شد، واضح ترین نشانه را از اینکه Gemini چگونه در نقشه راه محصول گوگل قرار می گیرد، ارائه کرد.

او گفت که سیستم‌های هوش مصنوعی محاوره‌ای مانند Bard «وضعیت پایانی» نیستند، بلکه نقاطی هستند که به چت‌بات‌های پیشرفته‌تر منتهی می‌شوند.

پیچای گفت Gemini و تکرارهای بعدی آن در نهایت به “دستیارهای شخصی جهانی باورنکردنی” تبدیل خواهند شد که در زندگی روزمره مردم در زمینه هایی مانند سفر، کار و سرگرمی ادغام می شوند.

او تکرار کرد که جمینی نقاط قوت متن و تصاویر را با هم ترکیب می کند و گفت که چت ربات های امروزی در مقایسه با چند سال آینده «بی اهمیت به نظر می رسند».

رقبا به عملکرد Gemini علاقه مند هستند

مدیر عامل OpenAI توییت کرد که به نظر می رسد پاسخی به دیوار پرداخت باشد.مقاله گزارش می دهد که Google Gemini می تواند از GPT-4 بهتر عمل کند.

هیچ پاسخ رسمی به سوال بعدی ایلان ماسک در مورد صحت اعداد ارائه شده توسط SemiAnalysis وجود نداشت.

برخی از کسب و کارها دسترسی زودهنگام به جمینی دارند

سرنخ های بیشتر در مورد پیشرفت Gemini در این هفته: THE اطلاعات گزارش داد که گوگل به گروه کوچکی از توسعه دهندگان خارج از گوگل دسترسی زودهنگام به Gemini داده است.

  Optimizing images for search engines • Yoast

این نشان می دهد که Gemini می تواند به زودی برای بتا و ادغام با سرویس هایی مانند Google Cloud Vertex AI آماده شود.

متا روی LLM کار می کند تا با OpenAI رقابت کند

اگرچه اخبار مربوط به Gemini تا کنون امیدوار کننده است، اما گوگل تنها شرکتی نیست که مایل به راه اندازی یک LLM جدید برای رقابت با OpenAI است.

مطابق با مجله ی وال استریتمتا همچنین در حال کار بر روی یک مدل هوش مصنوعی است که با مدل GPT که به ChatGPT قدرت می‌دهد رقابت کند.

متا اخیراً از انتشار Llama 2، یک مدل منبع باز هوش مصنوعی با همکاری مایکروسافت خبر داده است. به نظر می رسد این شرکت متعهد به ایجاد هوش مصنوعی قابل دسترس تر است.

شمارش معکوس برای Google Gemini

آنچه تاکنون می دانیم نشان می دهد که Gemini می تواند پیشرفت قابل توجهی در پردازش زبان طبیعی داشته باشد.

ادغام آخرین تحقیقات هوش مصنوعی DeepMind با منابع محاسباتی عظیم گوگل، برآورد ، تأثیر بالقوه را دشوار می کند.

اگر Gemini انتظارات را برآورده کند، می‌تواند باعث تغییر در هوش مصنوعی تعاملی شود و با جاه‌طلبی‌های گوگل برای “ارائه مسئولانه هوش مصنوعی به میلیاردها نفر” همسو شود.

آخرین اخبار متا و گوگل چند روز پس از افتتاحیه انجمن بینش هوش مصنوعی منتشر می شود، جایی که مدیران عامل فناوری به طور خصوصی با بخشی از سنای ایالات متحده برای گفتگو در مورد آینده هوش مصنوعی ملاقات کردند.


تصویر ویژه: VDB Photos/Shutterstock

منبع: https://www.searchenginejournal.com/google-gemini-what-we-know-so-far/496494/