স্টিচিং ব্রেইন অফলাইনে এআই প্রশিক্ষণের জন্য প্রচুর পরিমাণে অবৈধ ডেটা নেয়

এই নিবন্ধটি সর্বশেষ আপডেট করা হয়েছে আগস্ট 23, 2024

স্টিচিং ব্রেইন অফলাইনে এআই প্রশিক্ষণের জন্য প্রচুর পরিমাণে অবৈধ ডেটা নেয়

Stichting Brein

স্টিচিং ব্রেইন অফলাইনে এআই প্রশিক্ষণের জন্য প্রচুর পরিমাণে অবৈধ ডেটা নেয়

কপিরাইট সংস্থা স্টিচিং ব্রেইন অফলাইনে একটি ডাচ ডেটাসেট নিয়েছে, ডেটার একটি সংগ্রহ, যা কৃত্রিম বুদ্ধিমত্তা (AI) প্রশিক্ষণের উদ্দেশ্যে ছিল৷ সংস্থার তরফে জানানো হয়েছে, নেদারল্যান্ডে এই প্রথম এমন ঘটনা ঘটল।

ব্রেইন নিজেই একটি “বড় ডেটাসেট” এর কথা বলে যা, সংস্থার মতে, হাজার হাজার বইয়ের অবৈধ অনুলিপি, Nu.nl-এর মতো ওয়েবসাইটগুলির সংবাদ নিবন্ধগুলির লক্ষ লক্ষ লাইন এবং অবৈধ থেকে অসংখ্য চলচ্চিত্র এবং টিভি সিরিজের সাবটাইটেল রয়েছে। সূত্র পরিচালক বাস্তিয়ান ভ্যান রামশর্স্ট আরও বলেছেন যে তিনি জানেন যে নির্মাতা কে, তবে গোপনীয়তার কারণে বলতে পারেন না।

ডেটা সেট ব্যবহার করুন

ডেটাসেটটি একটি তথাকথিত ভাষার মডেলকে প্রশিক্ষণ দেওয়ার উদ্দেশ্যে তৈরি করা হয়েছে, পরিভাষায় এগুলিকে বড় ভাষা মডেল বলা হয়। ডেটাসেটের স্রষ্টা ব্রেইনকে লিখিতভাবে প্রতিশ্রুতি দিয়েছেন যে এটি আর ব্যবহার করবেন না এবং কে এটি পেয়েছে সে সম্পর্কেও তথ্য সরবরাহ করেছে। ফাউন্ডেশন এখন পরীক্ষা করছে যে ডেটা আসলে এআই মডেলগুলি ব্যবহার করেছে কিনা। যদি তাই হয়, দলগুলোকে জবাবদিহি করতে হবে।

AI প্রশিক্ষণের সময় কপিরাইট লঙ্ঘনকারী উপাদান একটি বড় সমস্যা। সম্প্রতি, গবেষণায় এটি দৃঢ়ভাবে দেখা যাচ্ছে যে ডাচ ইমেজ নির্মাতাদের কাজগুলি তাদের অনুমতি ছাড়াই DALL-E এবং মিডজার্নি সহ সুপরিচিত AI ইমেজ জেনারেটরদের প্রশিক্ষণের জন্য ব্যবহার করা হয়েছে।

মার্কিন যুক্তরাষ্ট্রে, বর্তমানে দ্য নিউ ইয়র্ক টাইমস এবং ওপেনএআই, ChatGPT-এর নির্মাতার মধ্যে একটি মামলা চলছে। সংবাদপত্রটি অভিযোগ করেছে যে সংস্থাটি অনুমতি ছাড়াই এআই প্রশিক্ষণের জন্য বিপুল পরিমাণ সংবাদপত্রের নিবন্ধ ব্যবহার করছে। OpenAI বিশ্বাস করে যে ডেটা ব্যবহার করা অনুমোদিত।

স্টিচিং ব্রেইন

বন্ধুদের সাথে ভাগাভাগি করা

Be the first to comment

Leave a Reply

Your email address will not be published.


*