
গবেষকরা পক্ষাঘাতের সাথে কোনও ব্যক্তির মস্তিষ্ক থেকে স্নায়ু সংকেত ব্যাহত করার জন্য একটি নতুন পদ্ধতি তৈরি করেছেন এবং তাদের রিয়েল টাইমের নিকটে অডিও বক্তৃতায় অনুবাদ করেছেন। ফলাফলটি গুগল অনুবাদের উন্নত সংস্করণের অনুরূপ একটি মস্তিষ্ক-কম্পিউটার ইন্টারফেস (বিসিআই) সিস্টেম, তবে একটি ভাষাকে অন্য ভাষায় রূপান্তর করার পরিবর্তে এটি স্নায়ু ডেটা বোঝে এবং এটিকে কথ্য বাক্যে পরিণত করে।
মেশিন লার্নিংয়ের সাম্প্রতিক অগ্রগতি গবেষকদের কোনও ব্যক্তির নিজস্ব ভয়েস রেকর্ডিং ব্যবহার করে এআই ভয়েস সিনথেসাইজারকে প্রশিক্ষণ দিতে সক্ষম করেছে, যা বক্তৃতাটি আরও প্রাকৃতিক এবং ব্যক্তিগত উত্পন্ন করে। পক্ষাঘাতগ্রস্থ রোগীরা ইতিমধ্যে শারীরিক মোটর নিয়ন্ত্রণের কার্যকারিতা উন্নত করতে বিসিআই ব্যবহার করেছেন। কম্পিউটার ইঁদুর নিয়ন্ত্রণ এবং সিন্থেসিসএই নির্দিষ্ট সিস্টেমটি রোগীদের যারা তাদের কথা বলার ক্ষমতা হারিয়ে ফেলেছে তাদের আরও নির্দিষ্ট সাব -বিভাগকে সম্বোধন করে। বিচারে, পক্ষাঘাতগ্রস্থ রোগী নিঃশব্দে পূর্ণ পাঠগুলি পড়তে সক্ষম হন, যা পরে এআই ভয়েস দ্বারা বক্তৃতায় রূপান্তরিত করে 80 মিলিসেকেন্ডেরও কম দেরি করে।
অধ্যয়নের ফলাফল ছিল জার্নালে এই সপ্তাহে প্রকাশিত প্রকৃতি নিউরোলজি ক্যালিফোর্নিয়া বিশ্ববিদ্যালয়, বার্কলে এবং ক্যালিফোর্নিয়া বিশ্ববিদ্যালয়, সান ফ্রান্সিসকো বিশ্ববিদ্যালয়ের গবেষকদের একটি দল দ্বারা।
ইউসি বুর্কলে অধ্যাপক এবং সহ-কম-কো-কো-কো-ইন-ইনকুমেন্ট গোপালা নুমান চিপল্লি এক বিবৃতিতে বলেছেন, “আমাদের স্ট্রিমিং পদ্ধতির একই র্যাপিড স্পিচ ডিকোডিং ক্ষমতা আলেক্সা এবং সিরির মতো নিউরোপ্রোস্টেসে ডিকোডিং ক্ষমতা নিয়ে আসে।” “অনুরূপ ধরণের অ্যালগরিদম ব্যবহার করে আমরা দেখতে পেয়েছি যে আমরা স্নায়ু ডেটা ডিকোড করতে পারি এবং প্রথমে, ঘনিষ্ঠ-সিঙ্ক্রোনাস ভয়েস স্ট্রিমিং সক্ষম করতে পারি The ফলাফলটি আরও প্রাকৃতিক, সাবলীল বক্তৃতা সংশ্লেষণ।”
কীভাবে গবেষকরা মস্তিষ্কের সংকেত বিশ্লেষণ করেছেন
গবেষকরা এন নামের এক পক্ষাঘাতগ্রস্থ মহিলার সাথে কাজ করেছিলেন, যিনি দুর্ঘটনার বিপরীতে কথা বলার ক্ষমতা হারিয়েছিলেন। স্নায়ু ডেটা সংগ্রহ করতে, দলটি স্পিচ মোটর নিয়ন্ত্রণের জন্য দায়ী তার মস্তিষ্কের ক্ষেত্রের উপর একটি 253-চ্যানেল উচ্চ-গ্রেডিং ইলেক্ট্রোকার্টোগ্রাফি (ইসিওজি) অ্যারে প্রতিস্থাপন করেছে। তিনি মুখ বা পর্দার উপর প্রদর্শিত বাক্যাংশগুলি নিঃশব্দে নকল করার সাথে সাথে তিনি তার মস্তিষ্কের ক্রিয়াকলাপটি রেকর্ড করেছিলেন। এন শেষ পর্যন্ত শত শত বাক্য সহ উপস্থাপন করা হয়েছিল, সমস্তই 1,024 শব্দের সীমিত পরিভাষার ভিত্তিতে। এই প্রাথমিক তথ্য সংগ্রহের পর্বটি গবেষকদের তাদের ধারণাগুলি ডিকোড করা শুরু করার অনুমতি দেয়।
“আমরা মূলত লক্ষণগুলি প্রতিরোধ করছি, যেখানে এই ধারণাটি বক্তৃতা এবং সেই মোটর নিয়ন্ত্রণের মধ্যে অনুবাদ করা হয়েছে,” অধ্যয়নের সহ-লেখক চেওল জুন চো এক বিবৃতিতে বলেছেন। “সুতরাং ডিকোড করার পরে আমরা করছি, একটি ধারণার পরে, আমরা কী বলব সিদ্ধান্ত নিয়েছি, যখন আমরা সিদ্ধান্ত নিয়েছি যে কোন শব্দগুলি ব্যবহার করা উচিত এবং কীভাবে আমাদের স্পষ্টবাদী পেশীগুলি সরিয়ে নেওয়া যায়।”
এরপরে ডিকোডেড নার্ভ ডেটা একটি পাঠ্য-থেকে-স্পিচ এআই মডেলের মাধ্যমে প্রক্রিয়া করা হয়েছিল, তার আঘাতের আগে এএনএন এর আসল ভয়েস রেকর্ডিংয়ে প্রশিক্ষিত হয়েছিল। যদিও বিভিন্ন ডিভাইস দীর্ঘকাল ধরে অস্তিত্ব রয়েছে, যা পক্ষাঘাতগ্রস্থ ব্যক্তিদের সহায়তা করে, তারা প্রায়শই প্রাকৃতিক, পিছনে এবং ইন্টারঅ্যাকশন জন্য খুব ধীর হয়। উদাহরণস্বরূপ, প্রয়াত তাত্ত্বিক পদার্থবিদ স্টিফেন হকিং, কথা বলতে একটি কম্পিউটার এবং ভয়েস সিনথেসাইজার ব্যবহার করেছেনতবে সিস্টেমের সীমিত ইন্টারফেস তাকে প্রতি মিনিটে কেবল 10 থেকে 15 শব্দ উত্পাদন করতে দেয়। আরও উন্নত মস্তিষ্ক-কম্পিউটার ইন্টারফেস (বিসিআই) মডেল যোগাযোগের গতিতে ব্যাপক উন্নতি করেছে তবে তারা এখনও ইনপুট অন্তরগুলির সাথে লড়াই করছে। উদাহরণস্বরূপ, একই গবেষণা দল দ্বারা বিকাশিত এই এআই মডেলের একটি পূর্ববর্তী সংস্করণ নিউরাল ডেটা এবং উত্পাদন বক্তৃতার মধ্যে গড়ে আট সেকেন্ড ছিল।
সাম্প্রতিক বছরগুলিতে এই সর্বশেষ সাফল্য প্রযুক্তিগত শিল্পে মেশিন লার্নিংয়ে দ্রুত অগ্রগতির জন্য অন্য উন্নতি গবেষকদের কাছ থেকে কম উন্নতির জন্য ইনপুটটিতে বিলম্বকে হ্রাস করেছে। পূর্ববর্তী মডেলগুলির বিপরীতে, যা এএনএন অনুবাদ করার আগে একটি সম্পূর্ণ ধারণা পূরণের অপেক্ষায় ছিল, এই সিস্টেমটি একই সাথে “ঘন ঘন ডিকোড” বক্তৃতা “ডিকোডড” করে। এন এর জন্য, এর অর্থ হ’ল তিনি এখন নিজের কণ্ঠে নিজেকে শাস্তি বলতে এক সেকেন্ডের মধ্যে শাস্তি বলতে পারেন।
ক্লিনিকাল ট্রায়ালের একটি ভিডিও পারফরম্যান্স তার সামনে একটি স্ক্রিনে “ইউ লাভ মি” বাক্যাংশটি দেখে তার সামনে এন দেখায়। মুহুর্তের পরে, এআই মডেল – এর কণ্ঠে প্রশিক্ষিত – উচ্চস্বরে কথা বলে। দ্বিতীয়টির পরে, তিনি সফলভাবে বাক্যাংশগুলি পুনরাবৃত্তি করেছেন “সুতরাং আপনি কি এটি করেছেন” এবং “আপনি এটি কোথায় পেয়েছেন?” এন। অভিযোগ করেছেন যে সংশ্লেষিত বক্তৃতাটি তার নিজের কণ্ঠের মতো দেখায়।
আনমানচিপল্লি বলেছিলেন, “প্রায় এবং প্রায় সময়ের মধ্যে তার নিজের কণ্ঠস্বর শুনে তার অবতার বেড়েছে।”

মস্তিষ্কের কম্পিউটার ইন্টারফেসগুলি পরীক্ষাগার ছেড়ে চলেছে
এই অগ্রগতি আসে যখন বিসিআইগুলি জনসাধারণের স্বীকৃতি পাচ্ছে। ২০১ 2016 সালে ইলন মাস্ক দ্বারা প্রতিষ্ঠিত নিউরলিংকগুলি ইতিমধ্যে তাদের বিসিআই ডিভাইসটি তিনটি মানব রোগীর মধ্যে প্রতিস্থাপন করেছে। পূর্বে, কোয়াড্রিপলিজিয়া সহ নুল্যান্ড আরবাগ নামে একটি 30 বছরের পুরানো ব্যক্তি বলেছেন যে ডিভাইসটি তাদের কম্পিউটার মাউস নিয়ন্ত্রণ করতে এবং কেবল তাদের ধারণাগুলি ব্যবহার করে ভিডিও গেম খেলতে দিয়েছে। তার পর থেকে, নিউরলিংক আরও বেশি ইলেক্ট্রোড দিয়ে সিস্টেমটি আপগ্রেড করেছে, যা সংস্থাটি বলেছে যে আরও বেশি সংখ্যক ব্যান্ডউইথ এবং দীর্ঘ ব্যাটারির জীবন সরবরাহ করা উচিত। নিউরলিঙ্ক সম্প্রতি একটি বিশেষ উপাধি পেয়েছে খাদ্য ও ওষুধ প্রশাসন (এফডিএ) থেকে চোখের আলো পুনরুদ্ধার করার লক্ষ্যে অনুরূপ একটি সরঞ্জাম সনাক্ত করতে। এদিকে, বিসিআইয়ের আরও একটি বড় সংস্থা সিনক্রন সম্প্রতি প্রমাণ করেছে যে এএলএস এএলএসের সাথে বসবাসকারী একজন রোগী হতে পারে। একটি অ্যাপল ভিশন প্রো পরিচালনা করুন কেবল স্নায়ু ইনপুট ব্যবহার করে মিশ্র বাস্তবতা হেডসেট।
“এই ধরণের বর্ধিত বাস্তবতা ব্যবহার করা খুব কার্যকর এবং আমি কল্পনা করতে পারি যে এটি অন্যদের বা অন্যদের জন্য যারা তাদের প্রতিদিনের জীবনে জড়িত থাকার দক্ষতা হারিয়ে ফেলেছে,” একটি সিঙ্ক্রোনাস রোগীর সাথে মার্ক নামে একজন সিঙ্ক্রন রোগী ” এক বিবৃতিতে বলেছেন“এটি আপনাকে এমন জায়গাগুলিতে নিয়ে যেতে পারে যা আপনি কখনও ভাবেননি যে আপনি আবার দেখতে পাবেন বা অভিজ্ঞতা পাবেন।”
যদিও এই অঞ্চলটি আমেরিকান বেশিরভাগ স্টার্টআপগুলিতে আধিপত্য বিস্তার করে, অন্যান্য দেশগুলি ধরে রয়েছে। এই সপ্তাহে, নিউউসাইবার নিউরোটেক নামে একটি চীনা বিসিআই সংস্থা ঘোষণা করেছে যে এটি গত মাসে তিন রোগীর মধ্যে তার আধা-আক্রমণাত্মক বিসিআই চিপ সন্নিবেশ করিয়েছে। সংস্থা, যেমন শিকড়বছরের শেষের দিকে, আপনার “বিনো নং 1” ডিভাইসটি 10 এবং রোগীদের মধ্যে প্রতিস্থাপনের পরিকল্পনা করা হয়েছে।
তাদের সকলেই বলেছিলেন, আমি বিসিআইএসের জন্য প্রতিদিনের জীবনে কথোপকথন ফিরিয়ে আনতে পারি, যাদের আর বক্তৃতা দেওয়ার ক্ষমতা নেই। ক্যালিফোর্নিয়ার গবেষকরা বলেছেন যে তাদের পরবর্তী পর্যায়ে আবেগ যোগাযোগের জন্য, তাদের বাধা পদ্ধতি এবং এআই মডেলগুলি উন্নত করার জন্য গুরুত্বপূর্ণ দুটি উপাদান অন্তর্ভুক্ত রয়েছে। তারা ইতিমধ্যে তাদের কম বিলম্ব আনতেও কাজ করছে।
“এই কাজটি চলছে, আমরা ইউসি বুর্কলে পিএইচডি শিক্ষার্থী এবং সহ-লেখক কায়ালো লিটলজনের কাছ থেকে এই পক্ষাঘাতের বৈশিষ্ট্যগুলি কতটা ভালভাবে ডিকোড করতে পারি তা দেখার চেষ্টা করছি।