
কৃত্রিম বুদ্ধিমত্তা (এআই) এখন একটি ঘরোয়া শব্দ, চ্যাটগিপের মতো বড় ভাষার মডেলগুলির জনপ্রিয়তার জন্য ধন্যবাদ। এই বড় মডেলগুলি পুরো ইন্টারনেটে প্রশিক্ষিত হয় এবং প্রায়শই ঘটে কয়েকশো বিলিয়ন প্যারামিটারগুলির মানদণ্ড – মডেলের অভ্যন্তরের সেটিংস যা শব্দটি একটি অনুক্রমে আরও কী আসে তা অনুমান করতে সহায়তা করে। আরও পরামিতি, মডেল হিসাবে আরও পরিশীলিত।
একটি ছোট ভাষার মডেল (এসএলএম) এক স্কেল-ডাউন সংস্করণ একটি বৃহত ভাষার মডেল (এলএলএম) এর। এটিতে অনেকগুলি পরামিতি নেই, তবে ব্যবহারকারীদের হাতের কাজের ভিত্তিতে অতিরিক্ত শক্তির প্রয়োজন হতে পারে না। উপমা হিসাবে, লোকেরা বেসিক শব্দটি প্রক্রিয়া করার জন্য কোনও সুপার কম্পিউটার প্রয়োজন হয় না। তাদের কেবল একটি নিয়মিত পিসি দরকার।
তবে এসএলএম আকারে ছোট হলেও তারা এখনও শক্তিশালী হতে পারে। অনেক ক্ষেত্রে আইএমবি তথ্য অনুসারে, সেগুলি দ্রুত, সস্তা এবং আরও নিয়ন্ত্রিত দিন – ব্যাংকগুলি না ভেঙে তার অপারেশনে শক্তিশালী এআই মোতায়েনকারী সংস্থাগুলির জন্য কী।
ভাষার মডেলগুলিতে ওপেনএআইয়ের জিপিটি -4 এর মতো ট্রিলিয়নের প্যারামিটারও থাকতে পারে। বিপরীতে, ছোট ভাষার মডেলগুলি সাধারণত কয়েক মিলিয়ন এবং কিছু বিলিয়ন পরামিতিগুলির মধ্যে ঘটে।
2025 জানুয়ারী অনুযায়ী কাগজ অ্যামাজন গবেষকদের দ্বারা, এসএলএম 1 বিলিয়ন থেকে 8 বিলিয়ন মানদণ্ডের পরিসীমাতে আরও ভাল পারফর্ম করেছে।
উদাহরণস্বরূপ, এসএলএমগুলি কিছু ডোমেনে এলএলএম উন্নত করতে পারে কারণ সেগুলি প্রশিক্ষিত নির্দিষ্ট শিল্পে। তবে এলএলএমগুলি সাধারণ জ্ঞানে আরও ভাল করে।
এসএলএমেরও কম কম্পিউটিং শক্তি প্রয়োজন। এগুলি মেঘের পরিবর্তে পিসি, মোবাইল ডিভাইস বা কোম্পানির সার্ভারে স্থাপন করা যেতে পারে। এটি তাদের নির্দিষ্ট ব্যবসায়ের প্রয়োজনের জন্য সহজ, সস্তা এবং সহজ-টিউন করে তোলে।
আরও দেখুন: এআই ব্যাখ্যা করেছেন: একটি বড় ভাষার মডেল কী এবং ব্যবসায়গুলি কেন যত্ন নেওয়া উচিত?
এসএলএম সুবিধা এবং অসুবিধাগুলি
ছোট ভাষার মডেলগুলি এমন ব্যবসায়ের মধ্যে দ্রুত জনপ্রিয় যা এলএলএমের খাড়া ব্যয় এবং জটিলতা ছাড়াই এআই সুবিধা চায়।
নিম্নলিখিত সুবিধা এলএলএমএসে এসএলএম:
- ব্যয় দক্ষতা: বড় ভাষার মডেলগুলি চালানো ব্যয়বহুল, বিশেষত স্কেলে। অন্যদিকে, ছোট মডেল, পৃথক কম্পিউটার বা স্মার্টফোন এবং আইওটি সেন্সরগুলির মতো ডিভাইসগুলি কাজ করতে পারে। আরও গুরুত্বপূর্ণ এবং জটিল ফাংশনগুলির জন্য এলএলএম সহ এসএলএম ব্যবহার করে এআইয়ের ব্যয় হ্রাস করা যেতে পারে।
- ডেটা গোপনীয়তা এবং নিয়ন্ত্রণ: এলএলএম ব্যবহার করার সময়, যার অর্থ মেঘে ডেটা প্রেরণ করা, সর্বদা একটি গোপনীয়তার উদ্বেগ থাকে। ছোট মডেলগুলি প্রাঙ্গনে পুরোপুরি মোতায়েন করা যেতে পারে, যার অর্থ সংস্থাগুলি তাদের ডেটা এবং কর্মপ্রবাহের উপর সম্পূর্ণ নিয়ন্ত্রণ বজায় রাখে। এটি ফিনান্স এবং হেলথ কেয়ারের মতো নিয়ন্ত্রিত শিল্পগুলিতে বিশেষভাবে গুরুত্বপূর্ণ।
- গতি এবং জবাবদিহিতা: যেহেতু তারা হালকা, ছোট মডেলগুলি আরও দ্রুত প্রতিক্রিয়া দেখায় এবং কম বিলম্বের সাথে কাজ করতে পারে। এটি গ্রাহক পরিষেবা চ্যাটবটগুলির মতো বাস্তব -সময় সেটিংসে বিশেষভাবে মূল্যবান।
“এসএলএমের জন্য কম ডেটা এবং প্রশিক্ষণের প্রয়োজনীয়তা দ্রুত পরিবর্তন এবং আরওআইতে দ্রুত অনুবাদ করতে পারে,” অনুসারে ” ইন্টেল,
ক্ষতি এসএলএম:
- এলএলএম থেকে কুসংস্কার শিখেছি: যেহেতু ছোট মডেলগুলি বড় মডেলের বিচ্ছিন্ন সংস্করণ, তাই মূল মডেলটিতে কুসংস্কার পাস করা যেতে পারে।
- জটিল কাজগুলিতে কম পারফরম্যান্স: যেহেতু তারা বড় মডেলের মতো শক্তিশালী নয়, তাই তারা জটিল কার্যগুলিতে কম দক্ষ হতে পারে যা বিস্তৃত বিষয়গুলির বিস্তৃত বিভাগে জ্ঞানের প্রয়োজন।
- সাধারণ কাজ দুর্দান্ত নয়: এসএলএমগুলি আরও সুনির্দিষ্ট, সুতরাং এগুলি সাধারণ ফাংশনগুলিতে এলএলএম হিসাবে ভাল নয়।
হ্যালুসিনেশনের জন্য, যেহেতু এসএলএমগুলি ছোট, আরও ঘনীভূত ডেটাসেটগুলিতে তৈরি করা হয়, তাই তারা শিল্পের অ্যাপ্লিকেশনগুলিতে ব্যবহারের জন্য উপযুক্ত। উদাহরণস্বরূপ, “একটি নির্দিষ্ট শিল্প, খাত বা সংস্থার জন্য ডিজাইন করা একটি ডেটাসেটের প্রশিক্ষণ, এসএলএমকে একটি গভীর এবং সূক্ষ্ম বোঝার বিকাশ করতে সহায়তা করে যা ভুল আউটপুটের ঝুঁকি হ্রাস করতে পারে,” ইন্টেলের মতে।
মেটা লামা এক মাইল এগিয়ে
অ্যামাজন রিসার্চ পেপার অনুসারে গত দু’বছরের সর্বাধিক জনপ্রিয় এসএলএমগুলি মেটায় ওপেন-সুস লামা 2 এবং 3 পরিবারে ছিল “।
লামা 38 বিলিয়ন, 70 বিলিয়ন এবং 405 বিলিয়ন প্যারামিটার মডেলগুলিতে আসে এবং লামা 2 এর 7 বিলিয়ন, 13 বিলিয়ন, 34 বিলিয়ন এবং 70 বিলিয়ন সংস্করণ রয়েছে। এসএলএম লামা 3 থেকে 8 বিলিয়ন মডেল হবে এবং লামা 2 থেকে 7 এবং 13 বিলিয়ন মডেল হবে। (মেটা সবেমাত্র মুক্তি পেয়েছে লামা 4 এই সপ্তাহে।)
সদ্য প্রবেশ করা ডিপসেক আর 1-1.5 বি চাইনিজ এআই স্টার্টআপের আগে লজিক মডেল হিসাবে 1.5 বিলিয়ন পরামিতি সরবরাহ করে।
অন্যান্য এসএলএমগুলির মধ্যে গুগল অন্তর্ভুক্ত রয়েছে মিথুন ন্যানো (১.৮ বিলিয়ন এবং ৩.২৫ বিলিয়ন প্যারামিটার সংস্করণ) এবং এর ওপেন সোর্স মডেলের জামেমা পরিবার। গত মাসে গুগল জেমমা 3 উন্মোচন করেছে, যা 1, 4, 12 বিলিয়ন এবং 27 বিলিয়ন মানদণ্ডে আসে।
গত অক্টোবরে, ফরাসি এআই স্টার্টআপ এবং ওপেনির প্রতিদ্বন্দ্বী মিস্ট্রাল এসএলএমের একটি নতুন পরিবার উন্মোচন করেছে: মন্ত্রণালয়3 এবং 8 বিলিয়ন প্যারামিটারে। এর প্রথম এসএলএম 7 বিলিয়ন প্যারামিটার সহ মিস্ট্রাল 7 বি।
মাইক্রোসফ্ট থেকে আরেকটি উল্লেখযোগ্য এসএলএম হ’ল পিএইচআই -2। মাত্র ২.7 বিলিয়ন প্যারামিটার থাকা সত্ত্বেও, পিএইচআই -২ গণিত, কোড এবং লজিক ফাংশনগুলিতে ভাল পারফর্ম করে। এটি একটি সাবধানে কিডড ডেটাসেট ব্যবহার করে প্রশিক্ষণ দেওয়া হয়েছিল, প্রমাণ করে যে চতুর ডেটা নির্বাচন খুব ছোট মডেলগুলিও সক্ষম করতে পারে।
কোড স্টোর গলা মুখ সংস্থাগুলির ব্যবহারের জন্য শত শত ওপেন-সোর্স এসএলএম উপলব্ধ।