
মঙ্গলবার ওপেনি ঘোষণা এই সংস্থাটি তার সর্বশেষ চিত্র-প্রজন্মের প্রযুক্তিটিকে তার চ্যাটবট, চ্যাটগেট, এ সংহত করছে জিপিটি -40 মডেল সংস্থাটি গত বছর উন্মোচন করেছিল।
যৌথ প্রযুক্তির সাহায্যে, চ্যাটজিপিটি কৃত্রিমভাবে উত্পাদিত উপকরণগুলির জন্য এ-স্টপ শপে পরিণত হতে পারে, যা কেবল চিত্র নির্মাণের জন্য একটি পৃথক সিস্টেম ডাল-ই 3 প্রতিস্থাপন করতে পারে।
ডাল-ই 3 এর পরিবর্তে, চ্যাটজিপ্টের চিত্রটি পরিবর্তে এটি ব্যবহার করবে সোরাগত বছর সংস্থাটি উন্মোচন করা একটি পৃথক প্ল্যাটফর্ম ভিডিও প্রজন্মকে উত্সর্গীকৃত। ওপেনএআই তার প্রেস বিজ্ঞপ্তিতে চ্যাটজিপিটি ব্যবহার করে ভিডিও-প্রজন্মের দক্ষতার জন্য কোনও স্কিম প্রসারিত করেনি।
ওপেনাই বলেছিলেন যে চ্যাটবোটের চিত্রের ক্ষমতার সর্বাধিক অগ্রগতি হ’ল রেন্ডারিং সক্ষমতার মানের ক্ষেত্রে এর পাঠ। সংস্থাটি দাবি করেছে যে এর সিস্টেমগুলি এখন এমন পাঠের সাথে চিত্র তৈরি করতে পারে যা অর্থবহ এবং পঠনযোগ্য নয় এবং টাইপো-ইলেড।
সংস্থাটি একটি প্রেস বিজ্ঞপ্তিতে বলেছে, “আমরা অনলাইন চিত্র এবং পাঠ্যের যৌথ বিতরণে আমাদের মডেলকে প্রশিক্ষণ দিয়েছি, কেবল চিত্রগুলি কীভাবে ভাষার সাথে সম্পর্কিত তা নয়, তারা কীভাবে একে অপরের অন্তর্ভুক্ত।” “আক্রমণাত্মক পোস্ট-প্রশিক্ষণের সাথে মিলিত, ফলাফলের মডেলটিতে আশ্চর্যজনক ভিজ্যুয়াল প্রবাহ রয়েছে, যা দরকারী, ধারাবাহিক এবং রেফারেন্স-অনিবার্য চিত্র তৈরি করতে সক্ষম” “
সংস্থাটি বলেছে যে এই সিস্টেমটি ব্যবহারকারী-আপলোড করা চিত্রগুলিকে ভিজ্যুয়াল প্রেরণা হিসাবে ব্যবহার করতে সক্ষম হবে এবং নিম্নলিখিত নির্দেশাবলীতে আরও ভাল। ওপেনএআই দাবি করেছে যে “অন্যান্য সিস্টেমগুলি যখন ~ 5-8 অবজেক্টের সাথে লড়াই করে, জিপিটি, 4o 10-20 বিভিন্ন বস্তু পরিচালনা করতে পারে।”
কিছু ট্রেড-ব্যান্ডের সাথে অগ্রগতি আসে, যদিও: মডেলটি নীচের কাছাকাছি দীর্ঘ চিত্র সংগ্রহ করতে পারে, এখনও সেখানে নেই এমন জিনিসগুলি দেখার প্রবণতা করতে পারে এবং ল্যাটিন ভাষা বা চিত্রগুলি উপস্থাপনের জন্য সংগ্রাম করে যেখানে পাঠ্যগুলি খুব ছোট আকারের।
এখানে কোম্পানির প্রেস রিলিজ থেকে কিছু চিত্র পারফরম্যান্স রয়েছে।