What is Phi-2: আপনি যদি ইতিমধ্যে phi-1.5 সম্পর্কে না জেনে থাকেন তবে আমি আপনাকে কয়েক মাস আগে মাইক্রোসফ্টের কার্যকরী ছোট ভাষা মডেল: মাইক্রোসফ্টের 1.3 বিলিয়ন প্যারামিটার phi-1.5 এর মধ্যে যা ছিল তা নিয়ে দ্রুত স্কিম করার পরামর্শ দেব।
এখন আপনার ভিত্তি আছে, আমরা Phi-2 সম্পর্কে আরও শিখতে যেতে পারি। মাইক্রোসফ্ট ‘ফাই’ নামক কয়েকটি ছোট ভাষা মডেল (SLM) প্রকাশ করার জন্য কঠোর পরিশ্রম করছে। মডেলগুলির এই সিরিজটি অসাধারণ পারফরম্যান্স অর্জন করতে দেখানো হয়েছে, ঠিক যেমন এটি একটি বড় ভাষা মডেল ছিল।
মাইক্রোসফটের প্রথম মডেল ছিল ফি-1, 1.3 বিলিয়ন প্যারামিটার এবং তারপরে এসেছিল ফি-1.5।
আমরা Phi-1, Phi-1.5 দেখেছি এবং এখন আমাদের কাছে Phi-2 আছে।
Phi-2 কি? (What is Phi-2)
Phi-2 বড় এবং উন্নত হয়েছে। বড় এবং ভালো, এটি একটি 2.7 বিলিয়ন-প্যারামিটার ভাষার মডেল যা অসামান্য যুক্তি এবং ভাষা বোঝার ক্ষমতা প্রদর্শন করতে দেখানো হয়েছে।
এত ছোট একটি ভাষার মডেলের জন্য আশ্চর্যজনক?
Phi-2 কে 25 গুণ বড় মডেলগুলিকে ছাড়িয়ে যেতে দেখানো হয়েছে৷ এবং এটি সমস্ত মডেল স্কেলিং এবং প্রশিক্ষণ ডেটা কিউরেশনের জন্য ধন্যবাদ। ছোট, কম্প্যাক্ট, এবং অত্যন্ত কর্মক্ষম। এর আকারের কারণে, Phi-2 গবেষকদের জন্য ব্যাখ্যাযোগ্যতা, সূক্ষ্ম টিউনিং পরীক্ষা-নিরীক্ষা এবং নিরাপত্তার উন্নতির জন্য অনুসন্ধান করার জন্য। এটি Azure AI স্টুডিও মডেল ক্যাটালগে উপলব্ধ।
Phi-2 এর সৃষ্টি (The Creation of Phi-2)
Microsofts প্রশিক্ষণ ডেটা হল সিন্থেটিক ডেটাসেটের মিশ্রণ যা মডেল সাধারণ জ্ঞান শেখাতে ব্যবহৃত হয়, যেমন সাধারণ জ্ঞানের পাশাপাশি বিজ্ঞান, মনের তত্ত্ব এবং দৈনন্দিন কার্যকলাপ।
প্রশিক্ষণের ডেটা সতর্কতার সাথে নির্বাচন করা হয়েছে যাতে শিক্ষাগত মান রয়েছে এমন গুণমানের সামগ্রী দিয়ে ফিল্টার করা হয়েছে। স্কেল করার ক্ষমতা তাদের 1.3 বিলিয়ন প্যারামিটার মডেল, Phi-1.5 কে 2.7 বিলিয়ন প্যারামিটার ফি-2-এ নিয়ে গেছে।
![](https://infobangla.co.in/wp-content/uploads/2024/01/Image-from-Microsoft-Phi-2-1024x237.webp)
মাইক্রোসফ্ট Phi-2 পরীক্ষা করে, কারণ তারা মডেল মূল্যায়নের সাথে বর্তমান চ্যালেঞ্জগুলি স্বীকার করে। ব্যবহারের ক্ষেত্রে পরীক্ষাগুলি করা হয়েছিল যেখানে তারা এটিকে মিস্ট্রাল এবং লামা -2 এর সাথে তুলনা করেছিল। ফলাফলগুলি দেখায় যে Phi-2 Mistral-7B কে ছাড়িয়ে গেছে এবং 70 বিলিয়ন Llama-2 মডেল কিছু ক্ষেত্রে Phi-2 কে ছাড়িয়ে গেছে যা নীচে দেখানো হয়েছে:
![](https://infobangla.co.in/wp-content/uploads/2024/01/arya_phi2_small_lms_big_things_1-1024x356.webp)
আরো পড়ুন: Google Gemini AI কী: এখন পর্যন্ত সবচেয়ে শক্তিশালী AI মডেল
Phi-2 এর সীমাবদ্ধতা (Limitations of Phi-2)
যাইহোক, এটি বলার সাথে সাথে, ফি-2 এর সীমাবদ্ধতা রয়েছে। উদাহরণ স্বরূপ:
- অযৌক্তিকতা: মডেলটির ভুল কোড এবং তথ্য তৈরির কিছু সীমাবদ্ধতা রয়েছে, যা ব্যবহারকারীদের ভালো ভাবে বুঝে গ্রহণ করা উচিত এবং এই আউটপুটগুলিকে একটি সূচনা পয়েন্ট হিসাবে বিবেচনা করা উচিত।
- সীমিত কোড জ্ঞান: Phi-2 প্রশিক্ষণের ডেটা সাধারণ প্যাকেজগুলি ব্যবহার করার পাশাপাশি পাইথনের উপর ভিত্তি করে ছিল, তাই অন্যান্য ভাষা এবং স্ক্রিপ্টগুলির প্রজন্মের যাচাইকরণের প্রয়োজন হবে।
- নির্দেশাবলী: মডেলটি এখনও নির্দেশনা ফাইন-টিউনিংয়ের মধ্য দিয়ে যেতে পারেনি, তাই ব্যবহারকারীর দেওয়া নির্দেশাবলী বুঝতে সমস্যা হতে পারে।
এছাড়াও Phi-2 এর অন্যান্য সীমাবদ্ধতা রয়েছে, যেমন ভাষার সীমাবদ্ধতা, সামাজিক পক্ষপাত, বিষাক্ততা এবং শব্দচয়ন।
এটি বলার সাথে সাথে, প্রতিটি নতুন পণ্য বা পরিষেবার সীমাবদ্ধতা রয়েছে এবং Phi-2 মাত্র এক সপ্তাহ বা তার বেশি সময়ের জন্য আউট হয়েছে। অতএব, পরিষেবার উন্নতি করতে এবং এই বর্তমান সীমাবদ্ধতাগুলি কাটিয়ে উঠতে জনসাধারণের হাতে পেতে মাইক্রোসফ্ট-এর প্রয়োজন হবে ফি-2।
মাইক্রোসফ্ট একটি ছোট ভাষার মডেল দিয়ে বছরের সমাপ্তি করেছে যেটি সম্ভবত 2024 সালের সবচেয়ে আলোচিত মডেল হতে পারে। এটি বলা হচ্ছে, বছরটি শেষ করার জন্য – 2024 সালের ভাষা মডেল বিশ্ব থেকে আমাদের কী আশা করা উচিত?
iNFO বাংলা দেখার জন্য ধন্যবাদ
![tanmoy](http://infobangla.co.in/wp-content/uploads/2024/06/Tanmoy.jpg)
আমি তন্ময় ঘোরই, কলকাতা, পশ্চিমবঙ্গের একজন ব্লগার এবং ইউটিউবার। আমি পাঁচ বছরেরও বেশি সময় ধরে ব্লগিং করছি, এবং আমি বিভিন্ন বিষয়ে সহায়ক তথ্য শেয়ার করতে পছন্দ করি।