- Google Gemini چند وجهی خواهد بود
- Gemini می تواند از ابزارها و API ها استفاده کند
- با اندازه ها و ظرفیت های مختلف عرضه خواهد شد
- اولین نتایج Gemini امیدوار کننده است
- چت ربات های پیشرفته به عنوان دستیاران شخصی جهانی
- رقبا به عملکرد Gemini علاقه مند هستند
- برخی از کسب و کارها دسترسی زودهنگام به جمینی دارند
- متا روی LLM کار می کند تا با OpenAI رقابت کند
- شمارش معکوس برای Google Gemini
در کنفرانس توسعه دهندگان Google I/O در می 2023، ساندار پیچای، مدیر عامل شرکت، سیستم هوش مصنوعی (AI) آینده این شرکت، Gemini را اعلام کرد.
مدل زبان بزرگ (LLM) توسط بخش Google DeepMind (تیم مغز + DeepMind) توسعه یافته است. این می تواند با سیستم های هوش مصنوعی مانند ChatGPT OpenAI رقابت کند و احتمالاً از آن پیشی بگیرد.
در حالی که جزئیات کمیاب است، در اینجا چیزی است که می توانیم از آخرین مصاحبه ها و گزارش ها در مورد Google Gemini جمع آوری کنیم.
Google Gemini چند وجهی خواهد بود
پیچای گفت Gemini نقاط قوت سیستم AlphaGo DeepMind را که به دلیل تسلط بر بازی پیچیده Go معروف است، با قابلیت های مدل سازی زبان گسترده ترکیب می کند.
او گفت که از ابتدا به گونه ای طراحی شده است که چندوجهی باشد و متن، تصاویر و انواع دیگر داده ها را یکپارچه کند. این می تواند توانایی های مکالمه طبیعی بیشتری را فعال کند.
پیچای هم حاکی از به تواناییهای آینده مانند حافظه و برنامهریزی که میتواند وظایفی را که نیاز به استدلال دارند را فعال کند.
Gemini می تواند از ابزارها و API ها استفاده کند
در آپدیت صدای حرفه ای زندگینامه در طول تابستان، دانشمند ارشد گوگل، جفری دین، گفت که جمینی یکی از “نسل بعدی مدل های چندوجهی” است که او رهبری می کند.
این شرکت اعلام کرد که از Pathways، زیرساخت هوش مصنوعی جدید گوگل، برای کمک به مقیاسبندی آموزش در مجموعههای مختلف داده استفاده خواهد کرد.
این نشان می دهد که Gemini به طور بالقوه بزرگترین مدل زبانی است که تا به امروز ایجاد شده است، که احتمالاً از اندازه GPT-3 با بیش از 175 میلیارد پارامتر فراتر می رود.
با اندازه ها و ظرفیت های مختلف عرضه خواهد شد
جزئیات بیشتر از Demis Hassabis، مدیر عامل DeepMind ارائه شده است.
در ژوئن اعلام کرد سیمی تکنیکهای AlphaGo، مانند یادگیری تقویتی و جستجوی درختی، میتواند به Gemini تواناییهای جدیدی مانند استدلال و حل مسئله بدهد.
Hassabis گفت Gemini یک “سری مدل” است که در اندازه ها و ظرفیت های مختلف در دسترس خواهد بود.
او همچنین اشاره کرد که Gemini میتواند از حافظه، بررسی واقعیت در برابر منابعی مانند جستجوی گوگل و تقویت یادگیری تقویتی برای بهبود دقت و کاهش محتوای توهمآمیز خطرناک استفاده کند.
اولین نتایج Gemini امیدوار کننده است
در سپتامبر زمان در طول مصاحبه، Hassabis تکرار کرد که هدف Gemini ترکیب مقیاس و نوآوری است.
وی گفت ادغام برنامه ریزی و حافظه در مراحل اولیه و اکتشافی است.
Hassabis همچنین گفت Gemini میتواند از روشهای بازیابی برای تولید بلوکهای کامل اطلاعات، به جای تولید کلمه به کلمه، برای بهبود سازگاری واقعی استفاده کند.
او فاش کرد که Gemini بر اساس کارهای چندوجهی DeepMind، مانند سیستم زیرنویس تصویر فلامینگو، ساخته شده است.
به طور کلی، Hassabis گفت که Gemini “نتایج اولیه بسیار امیدوارکننده” را نشان می دهد.
چت ربات های پیشرفته به عنوان دستیاران شخصی جهانی
در مصاحبه با سیمیPichai که چند روز بعد منتشر شد، واضح ترین نشانه را از اینکه Gemini چگونه در نقشه راه محصول گوگل قرار می گیرد، ارائه کرد.
او گفت که سیستمهای هوش مصنوعی محاورهای مانند Bard «وضعیت پایانی» نیستند، بلکه نقاطی هستند که به چتباتهای پیشرفتهتر منتهی میشوند.
پیچای گفت Gemini و تکرارهای بعدی آن در نهایت به “دستیارهای شخصی جهانی باورنکردنی” تبدیل خواهند شد که در زندگی روزمره مردم در زمینه هایی مانند سفر، کار و سرگرمی ادغام می شوند.
او تکرار کرد که جمینی نقاط قوت متن و تصاویر را با هم ترکیب می کند و گفت که چت ربات های امروزی در مقایسه با چند سال آینده «بی اهمیت به نظر می رسند».
رقبا به عملکرد Gemini علاقه مند هستند
مدیر عامل OpenAI توییت کرد که به نظر می رسد پاسخی به دیوار پرداخت باشد.مقاله گزارش می دهد که Google Gemini می تواند از GPT-4 بهتر عمل کند.
آیا اعداد اشتباه هستند؟
– ایلان ماسک (@elonmusk) 30 آگوست 2023
هیچ پاسخ رسمی به سوال بعدی ایلان ماسک در مورد صحت اعداد ارائه شده توسط SemiAnalysis وجود نداشت.
برخی از کسب و کارها دسترسی زودهنگام به جمینی دارند
سرنخ های بیشتر در مورد پیشرفت Gemini در این هفته: THE اطلاعات گزارش داد که گوگل به گروه کوچکی از توسعه دهندگان خارج از گوگل دسترسی زودهنگام به Gemini داده است.
این نشان می دهد که Gemini می تواند به زودی برای بتا و ادغام با سرویس هایی مانند Google Cloud Vertex AI آماده شود.
متا روی LLM کار می کند تا با OpenAI رقابت کند
اگرچه اخبار مربوط به Gemini تا کنون امیدوار کننده است، اما گوگل تنها شرکتی نیست که مایل به راه اندازی یک LLM جدید برای رقابت با OpenAI است.
مطابق با مجله ی وال استریتمتا همچنین در حال کار بر روی یک مدل هوش مصنوعی است که با مدل GPT که به ChatGPT قدرت میدهد رقابت کند.
متا اخیراً از انتشار Llama 2، یک مدل منبع باز هوش مصنوعی با همکاری مایکروسافت خبر داده است. به نظر می رسد این شرکت متعهد به ایجاد هوش مصنوعی قابل دسترس تر است.
شمارش معکوس برای Google Gemini
آنچه تاکنون می دانیم نشان می دهد که Gemini می تواند پیشرفت قابل توجهی در پردازش زبان طبیعی داشته باشد.
ادغام آخرین تحقیقات هوش مصنوعی DeepMind با منابع محاسباتی عظیم گوگل، برآورد ، تأثیر بالقوه را دشوار می کند.
اگر Gemini انتظارات را برآورده کند، میتواند باعث تغییر در هوش مصنوعی تعاملی شود و با جاهطلبیهای گوگل برای “ارائه مسئولانه هوش مصنوعی به میلیاردها نفر” همسو شود.
آخرین اخبار متا و گوگل چند روز پس از افتتاحیه انجمن بینش هوش مصنوعی منتشر می شود، جایی که مدیران عامل فناوری به طور خصوصی با بخشی از سنای ایالات متحده برای گفتگو در مورد آینده هوش مصنوعی ملاقات کردند.
تصویر ویژه: VDB Photos/Shutterstock
منبع: https://www.searchenginejournal.com/google-gemini-what-we-know-so-far/496494/