
কৃত্রিম বুদ্ধিমত্তার বুদ্ধি পরিমাপ করা, বিড়ম্বনা একটি খুব কঠিন কাজ। এই কারণেই প্রযুক্তি শিল্পটি আর্ক-এজিআইয়ের মতো একটি বেঞ্চমার্ক নিয়ে এসেছে, যা এআই মডেলের জন্য বিশেষত চ্যালেঞ্জিং এমন একাধিক ভিজ্যুয়াল ফাংশনগুলির মাধ্যমে নতুন প্রযুক্তির সক্ষমতা পরীক্ষা করে। ডিসেম্বরে, ওপেনাইয়ের ও 3 যুক্তি মডেলটি 87.5 শতাংশ স্কোর দিয়ে পরীক্ষায় উত্তীর্ণ প্রথম এআই সিস্টেমে পরিণত হয়েছিল।
তবে সেই বিজয় মূল্য ছাড়া ঘটেনি। সেই সময়, আর্ক প্রাইজ ফাউন্ডেশন-যা এআরসি-এজিআই বেঞ্চমার্ক-প্রজেক্ট করে যে ওপেনাইয়ের মডেলটি পরীক্ষা করার ব্যয়টি প্রতি ফাংশন প্রতি প্রায় 3,400 ডলার। পরীক্ষায় 75.7 শতাংশ স্কোর করা ও 3 এর উচ্চ-ঘাটতি সংস্করণের জন্য, চিত্রটি প্রতি ফাংশনটিতে মোট 20 ডলার ছিল।
এটি সনাক্ত করার সাথে সাথে, প্রকৃত ব্যয়টি বেশ উচ্চতর হতে পারে – সঠিক হতে, আরও গুণ বেশি। আর্ক প্রাইজ ফাউন্ডেশনের O3 প্রাইসিংটি মূলত ওপেনাইয়ের O1 মডেলের ব্যয় থেকে আঁকা ছিল, ও 3 এর পূর্ববর্তী, অলাভজনক এখন ওপেনাইয়ের নতুন প্রকাশিত 01-প্রো অনুসারে এটি মূল্য নির্ধারণ করছে। গত মাসে উন্মোচিত, ও 1-প্রো মডেল 01 এর বেশি চালানোর জন্য দশ গুণ বেশি ব্যয়বহুলএটি এটিকে এখন পর্যন্ত ওপেনাইয়ের সবচেয়ে ব্যয়বহুল মডেল হিসাবে তৈরি করছে।
নতুন ও 1-প্রো প্রাইসিংয়ের উপর নির্ভর করে ও 3 সম্ভাব্যভাবে প্রতি ফাংশন প্রতি 30,000 ডলারের বেশি ব্যয় করতে পারে। আরও দক্ষ ও 3 স্ট্রেস তখন থেকে ফাংশন প্রতি 200 ডলার ব্যয় করে তালিকাভুক্ত করা হয়েছে।
“আমাদের বিশ্বাস, এবং এটি ওপেনাই দ্বারা বৈধ নয়,” আর্ক প্রাইজ ফাউন্ডেশনের সভাপতি গ্রেগ কমিটি অবজারভারকে বলেছেন, ও 3 মূল্য নির্ধারণ ও 1-প্রো মূল্যের কাছাকাছি হবে, যা আমাদের ডিসেম্বরে যে মূল্য নির্ধারণ করা হয়েছিল তার জন্য হবে। “” এটি দেওয়া, আমরা আমাদের ম্যাট্রিক্স আপডেট করেছি। “
আর্ক প্রাইজ ফাউন্ডেশন ও 3 এর আরও বেশি গণনা করা-নিবিড় সংস্করণ বাদ দিতে তার আর্ক-এজিআই নেতৃত্বের বোর্ডটি সম্পাদনা করেছে, “”কেবলমাত্র সেই সিস্টেমগুলি যা 10,000 ডলারেরও কম প্রয়োজন“রাইডার।
আর্ক-ইজি কী?
2019 সালে গবেষক ফ্রান্সোইস চোলাত দ্বারা প্রতিষ্ঠিত, এআর-এজিআই বেঞ্চমার্ক ধাঁধাগুলির একটি সিরিজের উপর নির্ভর করে যা এআই সিস্টেমগুলি কীভাবে মানব-স্তরের বুদ্ধিমত্তার কাছাকাছি রয়েছে তা ট্র্যাক করে। কেবলমাত্র ডেটাসেট থেকে আকৃষ্ট করার জন্য কোনও মডেলের দক্ষতা বিশ্লেষণের বিরোধিতা হিসাবে, এটি নতুন সমস্যার সাথে সামঞ্জস্যপূর্ণ হতে পারে এবং নতুন কাজ-নির্দিষ্ট দক্ষতা শিখতে পারে কিনা তা তদন্ত করে। কামরাদ বলেছিলেন, “এটিকে এমন একটি পরীক্ষা হিসাবে ভাবেন যা নতুন জিনিস শেখার ক্ষমতা পরিমাপ করে।”
ওপেনাইয়ের ও 3 পরীক্ষায় বিশেষভাবে সফল হয়েছিল কারণ মডেলটি সবচেয়ে সঠিক উত্তর দিয়ে সাড়া দেওয়ার আগে বেশ কয়েকটি সম্ভাব্য সংকেত প্রতিরোধ এবং বিবেচনা করতে সক্ষম। ওপেনএআই দ্বারা এখনও ও 3 এর মূল্য নির্ধারণের বিষয়টি নিশ্চিত করা হয়নি, তবে এআরসি প্রাইজ ফাউন্ডেশনের অনুমানগুলি ও 1-প্রো ব্যয়ের কাছাকাছি নোঙ্গর করা হবে, যতক্ষণ না সরকারী মূল্য প্রকাশ না হয়। “এটি আরও বেশি হতে পারে, তবে আমরা নিশ্চিত নই,” কামরাদ বলেছিলেন। “আমরা আমাদের যে উপলব্ধ তথ্য রয়েছে তা দিয়ে আমরা কেবল সেরা।” ওপেনএআই পর্যবেক্ষকের কাছ থেকে মন্তব্যগুলির অনুরোধগুলিতে সাড়া দেয়নি।
যদিও সম্প্রতি এআই প্রকাশিত আর্চ-এজিআই 100 শতাংশের কাছাকাছি পৌঁছেছে, গত মাসে প্রকাশিত পরীক্ষার একটি নতুন সংস্করণে এগুলি প্রচুর পরিমাণে স্টাম্পড করা হয়েছে। এআরসি -এজিআই -২ হিসাবে পরিচিত, পরীক্ষায় এমন ফাংশন রয়েছে যা এআই সিস্টেমের জন্য আরও বেশি কঠিন এবং বিশেষত যারা যুক্তির বিশেষজ্ঞ তাদের জন্য ডিজাইন করা হয়েছে। এখনও অবধি, কোনও মডেল 5 শতাংশ চিহ্নে পৌঁছাতে সক্ষম নয়।