به گزارش خبرگزاری مهر به نقل از تک کرانچ، مدل جدید GPT Image ۱.۵ نام دارد و از دیروز برای تمام کاربران چت جی پی تی و همچنین از طریق API در دسترس است. این جدیدترین تحول شرکت در رقابت با هوش مصنوعی جمینای متعلق به گوگل است. علاوه بر آن سم آلتمن مدیر ارشد اجرایی اوپن ای آی ماه گذشته میلادی در یک یادداشت افشا شده کد قرمز اعلام کرده بود.
در این یادداشت برنامههای شرکت برای بازپس گیری موقعیت خود به عنوان رهبر حوزه هوش مصنوعی پس از آنکه گوگل با عرضه جمینای ۳ و نانو بنانا پرو بخشی از سهم بازار را به خود اختصاص داد، اعلام شده بود.
GPT Image ۱.۵ در حالی ارائه میشود که تولید کنندگان ویدئو و عکس فراتر از نمونههای فعلی فعالیت میکنند و قابلیتهای تولید سریعتر بیشتری را دارند. GPT Image ۱.۵ هم مانند نانو بنانا ویژگیهایی مخصوص پس از تولید محتوا ارائه میدهد و کنترلهای ویرایش جزئیتری را برای حفظ ثبات بصری، مانند شباهت چهره، نورپردازی، ترکیببندی و تناژ رنگ در ویرایشهای مختلف فراهم میکند.
بیشتر ابزارهای تولید عکس با هوش مصنوعی در تکرار فعالیتها عملکرد خوبی ندارند، بنابراین چنین قابلیتی یک ارتقای قابل توجه است. مدلهای هوش مصنوعی در مقابل درخواستهایی برای اجرای تغییرات خاص مانند اصلاح حالت صورت یا تغییر نوردهی محیط بیشتر اوقات کل عکس را تغییر میدهند که این امر به عدم هماهنگی منجر میشود.
آپدیت جدید فقط شامل ویژگیهای جدید نمیشود. عکسهای چت جی پی تی اکنون از طریق یک نقطه ورودی خاص در نوار کناری این مدل قابل دسترسی هستند که شبیه یک استودیو خلاق عمل میکند.
فیجی سیمو مدیر ارشد بخش اپلیکیشنهای اوپن ای آی در این باره در یک پست وبلاگی نوشت: قابلیتهای نمایش و اصلاح عکس جدید ابداع تصاویری که با آنچه در ذهن کاربر است یا الهام گرفتن از دستورهای پر طرفدار و فیلترهای از پیش تعیین شده را سادهتر میکند.
اوپن ای آی علاوه بر قابلیت جدید تولید عکس روشهای جدیدی برای بهبود تجربه چت جی پی تی با عناصر بصری بیشتر فراهم میکند. طبق گفتهی سیمو، برنامه این است که جستجوهای جدید، تصاویر بیشتری را با منابع واضح نمایش دهند که میتواند برای کارهایی مانند تبدیل اندازهگیریها یا بررسی نتایج ورزشی مفید باشد.