What is Phi-2What is Phi-2

What is Phi-2: আপনি যদি ইতিমধ্যে phi-1.5 সম্পর্কে না জেনে থাকেন তবে আমি আপনাকে কয়েক মাস আগে মাইক্রোসফ্টের কার্যকরী ছোট ভাষা মডেল: মাইক্রোসফ্টের 1.3 বিলিয়ন প্যারামিটার phi-1.5 এর মধ্যে যা ছিল তা নিয়ে দ্রুত স্কিম করার পরামর্শ দেব।

এখন আপনার ভিত্তি আছে, আমরা Phi-2 সম্পর্কে আরও শিখতে যেতে পারি। মাইক্রোসফ্ট ‘ফাই’ নামক কয়েকটি ছোট ভাষা মডেল (SLM) প্রকাশ করার জন্য কঠোর পরিশ্রম করছে। মডেলগুলির এই সিরিজটি অসাধারণ পারফরম্যান্স অর্জন করতে দেখানো হয়েছে, ঠিক যেমন এটি একটি বড় ভাষা মডেল ছিল।

মাইক্রোসফটের প্রথম মডেল ছিল ফি-1, 1.3 বিলিয়ন প্যারামিটার এবং তারপরে এসেছিল ফি-1.5।

আমরা Phi-1, Phi-1.5 দেখেছি এবং এখন আমাদের কাছে Phi-2 আছে।

Phi-2 কি? (What is Phi-2)

Phi-2 বড় এবং উন্নত হয়েছে। বড় এবং ভালো, এটি একটি 2.7 বিলিয়ন-প্যারামিটার ভাষার মডেল যা অসামান্য যুক্তি এবং ভাষা বোঝার ক্ষমতা প্রদর্শন করতে দেখানো হয়েছে।

এত ছোট একটি ভাষার মডেলের জন্য আশ্চর্যজনক?

Phi-2 কে 25 গুণ বড় মডেলগুলিকে ছাড়িয়ে যেতে দেখানো হয়েছে৷ এবং এটি সমস্ত মডেল স্কেলিং এবং প্রশিক্ষণ ডেটা কিউরেশনের জন্য ধন্যবাদ। ছোট, কম্প্যাক্ট, এবং অত্যন্ত কর্মক্ষম। এর আকারের কারণে, Phi-2 গবেষকদের জন্য ব্যাখ্যাযোগ্যতা, সূক্ষ্ম টিউনিং পরীক্ষা-নিরীক্ষা এবং নিরাপত্তার উন্নতির জন্য অনুসন্ধান করার জন্য। এটি Azure AI স্টুডিও মডেল ক্যাটালগে উপলব্ধ।

Phi-2 এর সৃষ্টি (The Creation of Phi-2)

Microsofts প্রশিক্ষণ ডেটা হল সিন্থেটিক ডেটাসেটের মিশ্রণ যা মডেল সাধারণ জ্ঞান শেখাতে ব্যবহৃত হয়, যেমন সাধারণ জ্ঞানের পাশাপাশি বিজ্ঞান, মনের তত্ত্ব এবং দৈনন্দিন কার্যকলাপ।

প্রশিক্ষণের ডেটা সতর্কতার সাথে নির্বাচন করা হয়েছে যাতে শিক্ষাগত মান রয়েছে এমন গুণমানের সামগ্রী দিয়ে ফিল্টার করা হয়েছে। স্কেল করার ক্ষমতা তাদের 1.3 বিলিয়ন প্যারামিটার মডেল, Phi-1.5 কে 2.7 বিলিয়ন প্যারামিটার ফি-2-এ নিয়ে গেছে।

Image from Microsoft Phi-2

মাইক্রোসফ্ট Phi-2 পরীক্ষা করে, কারণ তারা মডেল মূল্যায়নের সাথে বর্তমান চ্যালেঞ্জগুলি স্বীকার করে। ব্যবহারের ক্ষেত্রে পরীক্ষাগুলি করা হয়েছিল যেখানে তারা এটিকে মিস্ট্রাল এবং লামা -2 এর সাথে তুলনা করেছিল। ফলাফলগুলি দেখায় যে Phi-2 Mistral-7B কে ছাড়িয়ে গেছে এবং 70 বিলিয়ন Llama-2 মডেল কিছু ক্ষেত্রে Phi-2 কে ছাড়িয়ে গেছে যা নীচে দেখানো হয়েছে:

আরো পড়ুন: Google Gemini AI কী: এখন পর্যন্ত সবচেয়ে শক্তিশালী AI মডেল

Phi-2 এর সীমাবদ্ধতা (Limitations of Phi-2)

যাইহোক, এটি বলার সাথে সাথে, ফি-2 এর সীমাবদ্ধতা রয়েছে। উদাহরণ স্বরূপ:

  • অযৌক্তিকতা: মডেলটির ভুল কোড এবং তথ্য তৈরির কিছু সীমাবদ্ধতা রয়েছে, যা ব্যবহারকারীদের ভালো ভাবে বুঝে গ্রহণ করা উচিত এবং এই আউটপুটগুলিকে একটি সূচনা পয়েন্ট হিসাবে বিবেচনা করা উচিত।
  • সীমিত কোড জ্ঞান: Phi-2 প্রশিক্ষণের ডেটা সাধারণ প্যাকেজগুলি ব্যবহার করার পাশাপাশি পাইথনের উপর ভিত্তি করে ছিল, তাই অন্যান্য ভাষা এবং স্ক্রিপ্টগুলির প্রজন্মের যাচাইকরণের প্রয়োজন হবে।
  • নির্দেশাবলী: মডেলটি এখনও নির্দেশনা ফাইন-টিউনিংয়ের মধ্য দিয়ে যেতে পারেনি, তাই ব্যবহারকারীর দেওয়া নির্দেশাবলী বুঝতে সমস্যা হতে পারে।

এছাড়াও Phi-2 এর অন্যান্য সীমাবদ্ধতা রয়েছে, যেমন ভাষার সীমাবদ্ধতা, সামাজিক পক্ষপাত, বিষাক্ততা এবং শব্দচয়ন।

এটি বলার সাথে সাথে, প্রতিটি নতুন পণ্য বা পরিষেবার সীমাবদ্ধতা রয়েছে এবং Phi-2 মাত্র এক সপ্তাহ বা তার বেশি সময়ের জন্য আউট হয়েছে। অতএব, পরিষেবার উন্নতি করতে এবং এই বর্তমান সীমাবদ্ধতাগুলি কাটিয়ে উঠতে জনসাধারণের হাতে পেতে মাইক্রোসফ্ট-এর প্রয়োজন হবে ফি-2।

মাইক্রোসফ্ট একটি ছোট ভাষার মডেল দিয়ে বছরের সমাপ্তি করেছে যেটি সম্ভবত 2024 সালের সবচেয়ে আলোচিত মডেল হতে পারে। এটি বলা হচ্ছে, বছরটি শেষ করার জন্য – 2024 সালের ভাষা মডেল বিশ্ব থেকে আমাদের কী আশা করা উচিত?


iNFO বাংলা দেখার জন্য ধন্যবাদ

By Tanmoy

আমি তন্ময় ঘোরই, কলকাতা, পশ্চিমবঙ্গের একজন ব্লগার এবং ইউটিউবার। আমি পাঁচ বছরেরও বেশি সময় ধরে ব্লগিং করছি, এবং আমি বিভিন্ন বিষয়ে সহায়ক তথ্য শেয়ার করতে পছন্দ করি।

Leave a Reply

Your email address will not be published. Required fields are marked *