এই নিবন্ধটি সর্বশেষ আপডেট করা হয়েছে আগস্ট 14, 2024
Table of Contents
স্টিচিং ব্রেইন অফলাইনে এআই প্রশিক্ষণের জন্য প্রচুর পরিমাণে অবৈধ ডেটা নেয়
স্টিচিং ব্রেইন অফলাইনে এআই প্রশিক্ষণের জন্য প্রচুর পরিমাণে অবৈধ ডেটা নেয়
কপিরাইট সংস্থা স্টিচিং ব্রেইন অফলাইনে একটি ডাচ ডেটাসেট নিয়েছে, ডেটার একটি সংগ্রহ, যা কৃত্রিম বুদ্ধিমত্তা (AI) প্রশিক্ষণের উদ্দেশ্যে ছিল৷ সংস্থার তরফে জানানো হয়েছে, নেদারল্যান্ডে এই প্রথম এমন ঘটনা ঘটল।
ব্রেইন নিজেই একটি “বড় ডেটাসেট” এর কথা বলে যা, সংস্থার মতে, হাজার হাজার বইয়ের অবৈধ অনুলিপি, Nu.nl-এর মতো ওয়েবসাইটগুলির সংবাদ নিবন্ধগুলির লক্ষ লক্ষ লাইন এবং অবৈধ থেকে অসংখ্য চলচ্চিত্র এবং টিভি সিরিজের সাবটাইটেল রয়েছে। সূত্র পরিচালক বাস্তিয়ান ভ্যান রামশর্স্ট আরও বলেছেন যে তিনি জানেন যে নির্মাতা কে, তবে গোপনীয়তার কারণে বলতে পারেন না।
ডেটা সেট ব্যবহার করুন
ডেটাসেটটি একটি তথাকথিত ভাষার মডেলকে প্রশিক্ষণ দেওয়ার উদ্দেশ্যে তৈরি করা হয়েছে, পরিভাষায় এগুলিকে বড় ভাষা মডেল বলা হয়। ডেটাসেটের স্রষ্টা ব্রেইনকে লিখিতভাবে প্রতিশ্রুতি দিয়েছেন যে এটি আর ব্যবহার করবেন না এবং কে এটি পেয়েছে সে সম্পর্কেও তথ্য সরবরাহ করেছে। ফাউন্ডেশন এখন পরীক্ষা করছে যে ডেটা আসলে এআই মডেলগুলি ব্যবহার করেছে কিনা। যদি তাই হয়, দলগুলোকে জবাবদিহি করতে হবে।
AI প্রশিক্ষণের সময় কপিরাইট লঙ্ঘনকারী উপাদান একটি বড় সমস্যা। সম্প্রতি, গবেষণায় এটি দৃঢ়ভাবে দেখা যাচ্ছে যে ডাচ ইমেজ নির্মাতাদের কাজগুলি তাদের অনুমতি ছাড়াই DALL-E এবং Midjourney সহ সুপরিচিত AI ইমেজ জেনারেটরদের প্রশিক্ষণের জন্য ব্যবহার করা হয়েছে।
মার্কিন যুক্তরাষ্ট্রে, বর্তমানে দ্য নিউ ইয়র্ক টাইমস এবং ChatGPT-এর নির্মাতা OpenAI-এর মধ্যে একটি মামলা চলছে। সংবাদপত্রটি অভিযোগ করেছে যে সংস্থাটি অনুমতি ছাড়াই এআই প্রশিক্ষণের জন্য বিপুল পরিমাণ সংবাদপত্রের নিবন্ধ ব্যবহার করছে। OpenAI বিশ্বাস করে যে ডেটা ব্যবহার করা অনুমোদিত।
স্টিচিং ব্রেইন
Be the first to comment