CatBoost একটি শক্তিশালী মেশিন লার্নিং লাইব্রেরি যা বিশেষভাবে ক্যাটাগরিকাল ডেটা পরিচালনা করতে ডিজাইন করা হয়েছে। এর মধ্যে একটি গুরুত্বপূর্ণ বৈশিষ্ট্য হল এটি স্বয়ংক্রিয়ভাবে মিসিং ভ্যালু (Missing Values) পরিচালনা করতে পারে, যা মডেল তৈরি ও প্রশিক্ষণের সময় বিশেষভাবে কার্যকর।
নিচে একটি উদাহরণ দেওয়া হলো যেখানে CatBoost ব্যবহার করে মিসিং ভ্যালু পরিচালনা করা হয়েছে:
import pandas as pd
from catboost import CatBoostClassifier
# উদাহরণ ডেটা তৈরি করা, যেখানে কিছু মিসিং ভ্যালু আছে
data = {
'feature1': [1, 2, None, 4, 5],
'feature2': ['A', 'B', 'A', None, 'B'],
'label': [0, 1, 0, 1, 0]
}
df = pd.DataFrame(data)
# ফিচার এবং লেবেল নির্ধারণ
X = df[['feature1', 'feature2']]
y = df['label']
# CatBoostClassifier তৈরি করা
model = CatBoostClassifier(iterations=100, depth=3, learning_rate=0.1, loss_function='Logloss', verbose=0)
# মডেল প্রশিক্ষণ
model.fit(X, y)
# নতুন ডেটার উপর পূর্বাভাস
predictions = model.predict([[None, 'A']]) # মিসিং ভ্যালু সহ
print(predictions)
CatBoost মডেলটি মিসিং ভ্যালু পরিচালনার ক্ষেত্রে অত্যন্ত কার্যকর। এটি স্বয়ংক্রিয়ভাবে মিসিং ভ্যালুগুলিকে পরিচালনা করতে সক্ষম এবং আলাদা সিদ্ধান্ত তৈরি করে, যা মডেলের কার্যকারিতা এবং স্থায়িত্ব উন্নত করে। মডেল প্রশিক্ষণের সময় মিসিং ভ্যালু পরিচালনা করার জন্য CatBoost একটি সহজ এবং কার্যকরী পদ্ধতি প্রদান করে।
আরও দেখুন...