OpenAI بار دیگر با آخرین نوآوری خود در دنیای فناوری موج ایجاد کرده است: GPT-4 با Vision یا GPT-4V.
دیدگاه GPT-4 برای نوشتن کد با طراحی:
-گرگ براکمن (@gdb) 27 سپتامبر 2023
GPT-4V بر روی GPT-4 ساخته شده و قابلیت های بصری را در خود جای داده است و به مدل اجازه می دهد تصاویر ارائه شده توسط مشترکین ChatGPT Plus و Enterprise را تجزیه و تحلیل کند.
در دو هفته آینده برای کاربران پولی عرضه می شود!
-گرگ براکمن (@gdb) 27 سپتامبر 2023
این ویژگی جدید پتانسیل بالایی دارد اما خطراتی را نیز برای مشاغل به همراه دارد.
GPT-4 با نمونه های بینایی
با دسترسی بیشتر کاربران به ویژگی جدید، نمونه هایی از نحوه کار GPT-4 با Vision را به اشتراک می گذارند.
GPT-4 با Vision می تواند دست خط را تجزیه و تحلیل کند.
خیلی باحال. هوش مصنوعی در رمزگشایی دست خط بهتر از من است.
پروفسور برین پرسید که آیا GPT-4 با بینایی می تواند دست نوشته رابرت بویل را بخواند؟ حس خوبی داره!
این احتمالاً برای تعدادی از رشتههای دانشگاهی مشکل بزرگی خواهد بود، به ویژه از آنجایی که هوش مصنوعی میتواند درباره متن «استدلال» کند. pic.twitter.com/78jYWfIhCY
– ایتان مولک (@emollick) 27 سپتامبر 2023
او می تواند با استفاده از نقاشی روی دستمال، کدی برای یک وب سایت ایجاد کند.
دیدن اینکه چگونه مردم از GPT-4 با Vision استفاده می کنند شگفت انگیز است.
pic.twitter.com/1O3AW7DJDr–Hushen Savani (@hushensavani) 27 سپتامبر 2023
او می تواند الگوهای رفتاری را تجزیه و تحلیل کند.
این کاملا وحشی است. من کاملا لال هستم. pic.twitter.com/wGTAx1hFgS
– پیترو شیرانو (@skirano) 27 سپتامبر 2023
علاوه بر این مثال ها، چند تست ساده هم انجام دادم.
GPT-4 با Vision می تواند توضیحات محصول را برای صفحات فروش شما و لیست آمازون بنویسد.
این می تواند به شما کمک کند تا با کدنویسی اولیه برای یک طراحی وب سایت خاص بر اساس یک اسکرین شات شروع کنید.
می تواند کپشن های خلاقانه اینستاگرام را با پیشنهادات هشتگ بنویسد.
او می تواند بر اساس داده های یک وب سایت یا کتاب الکترونیکی، مانند وضعیت سئو 2024، مقاله بنویسد.
مانند هر محتوای تولید شده توسط هوش مصنوعی، بررسی نتایج GPT-4 با Vision برای دقت ضروری است. این هنوز هم باعث توهم و خطرات دیگری می شود.
OpenAI خطرات بالقوه GPT-4V را نشان می دهد
OpenAI یک کاغذ توصیف خطرات بالقوه مرتبط با استفاده از GPT-4V، از جمله:
- خطرات حفظ حریم خصوصی مربوط به شناسایی افراد در تصاویر، یا تعیین موقعیت مکانی آنها، این امکان را دارد که روی عملکردها و انطباق داده های کسب و کارها تأثیر بگذارد. این مقاله خاطرنشان می کند که GPT-4V تا حدی توانایی شناسایی چهره های عمومی و تصاویر برچسب گذاری جغرافیایی را دارد.
- سوگیری های احتمالی در طول تجزیه و تحلیل و تفسیر تصویر می تواند بر گروه های جمعیتی مختلف تأثیر منفی بگذارد.
- خطرات ایمنی مربوط به ارائه توصیههای پزشکی نادرست یا غیرقابل اعتماد، دستورالعملهای خاص برای کارهای خطرناک، یا محتوای نفرتانگیز/خشونتآمیز.
- آسیبپذیریهای امنیت سایبری مانند رفع CAPTCHA یا جیلبریکهای چند وجهی.
خطرات ناشی از مدل منجر به محدودیت هایی مانند امتناع آن از ارائه تجزیه و تحلیل تصویر با افراد شد.
به طور کلی، برندهایی که علاقه مند به استفاده از GPT-4V برای بازاریابی هستند، باید این خطرات و سایر خطرات مربوط به استفاده از هوش مصنوعی مولد را ارزیابی و کاهش دهند تا از فناوری به طور مسئولانه استفاده کنند و از تأثیرات منفی بر مصرف کنندگان و شهرت برند جلوگیری کنند.
اولین شریک OpenAI که ضبط تصویر را برای «در دسترس بودن بیشتر» آماده می کند
OpenAI اعلام کرد که GPT-4 با مدل Vision، یک دستیار دیجیتالی بصری طراحی شده برای افراد کم بینا، Be My Eyes Virtual Volunteer را تامین می کند.
اگرچه این فناوری هنوز در مرحله بتا است، اما احتمالات وسوسه انگیز است. به عنوان مثال، این فناوری می تواند به کسب و کارها کمک کند تا دسترسی به خدمات مشتری را بهبود بخشند.
چشم من باش برنامه ها برای آزمایش این ویژگی با مشتریان سازمانی، با تمرکز بر پتانسیل تجاری آن فراتر از مخاطبان اصلی آن.
آینده GPT-4 با چشم انداز
پتانسیل برنامه ها GPT-4 With Vision برای مشاغل، بازاریابان و متخصصان سئو می تواند انقلابی باشد.
با این حال، همه کاربران باید به دلیل مشکلات احتمالی حریم خصوصی، انصاف و امنیت سایبری که توسط GPT-4 با Vision و سایر مدلهای هوش مصنوعی ایجاد میشود، محتاط باشند.
تصویر ویژه: Tada Images/Shutterstock
منبع: https://www.searchenginejournal.com/gpt-4-with-vision-examples-limitations-and-potential-risks/497250/