CatBoost (Categorical Boosting) হল Yandex দ্বারা তৈরি একটি উন্নত Gradient Boosting লাইব্রেরি, যা বিশেষ করে ক্যাটেগোরিক্যাল ডেটা পরিচালনা করার জন্য ডিজাইন করা হয়েছে। CatBoost সহজে ব্যবহারযোগ্য এবং উচ্চ কার্যকারিতা প্রদান করে। এখানে CatBoost ব্যবহার করে Training এবং Testing Dataset তৈরি করার প্রক্রিয়া আলোচনা করা হলো।
প্রথমেই আপনার সিস্টেমে CatBoost ইনস্টল করতে হবে। Python-এর জন্য এটি Pip ব্যবহার করে ইনস্টল করা যেতে পারে:
pip install catboost
একটি সাধারণ ডেটাসেট তৈরি করুন বা কোনও পাবলিক ডেটাসেট ব্যবহার করুন। এখানে আমরা একটি কল্পিত ডেটাসেট ব্যবহার করছি, তবে আপনি নিজের ডেটা ব্যবহার করতে পারেন।
import pandas as pd
from sklearn.model_selection import train_test_split
# উদাহরণস্বরূপ একটি ডেটাসেট তৈরি করুন
data = {
'feature1': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10],
'feature2': ['A', 'B', 'A', 'B', 'A', 'B', 'A', 'B', 'A', 'B'],
'target': [0, 1, 0, 1, 0, 1, 0, 1, 0, 1]
}
df = pd.DataFrame(data)
# ডেটা ভাগ করা: 80% ট্রেনিং এবং 20% টেস্টিং
X = df[['feature1', 'feature2']]
y = df['target']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
print("Training set:")
print(X_train)
print(y_train)
print("\nTesting set:")
print(X_test)
print(y_test)
CatBoost ব্যবহার করার জন্য ক্যাটেগোরিক্যাল বৈশিষ্ট্যগুলির জন্য একটি তালিকা তৈরি করুন এবং CatBoostClassifier অথবা CatBoostRegressor ব্যবহার করে মডেল তৈরি করুন।
from catboost import CatBoostClassifier
# ক্যাটেগোরিক্যাল বৈশিষ্ট্যগুলি উল্লেখ করুন
categorical_features_indices = [1] # feature2 হল ক্যাটেগোরিক্যাল ফিচার
# CatBoostClassifier মডেল তৈরি করা
model = CatBoostClassifier(iterations=100, learning_rate=0.1, depth=6, cat_features=categorical_features_indices, verbose=0)
# মডেল প্রশিক্ষণ
model.fit(X_train, y_train)
প্রশিক্ষিত মডেলটি টেস্টিং ডেটাসেটের উপর পরীক্ষা করুন এবং ফলাফল মূল্যায়ন করুন।
# ভবিষ্যদ্বাণী করা
predictions = model.predict(X_test)
# ফলাফল দেখানো
print("\nPredictions:")
print(predictions)
# সঠিকতা মূল্যায়ন
from sklearn.metrics import accuracy_score
accuracy = accuracy_score(y_test, predictions)
print(f"\nAccuracy: {accuracy * 100:.2f}%")
CatBoost ব্যবহার করে Training এবং Testing Dataset তৈরি করা একটি সহজ এবং কার্যকর প্রক্রিয়া। এই প্রক্রিয়ায় ডেটা প্রস্তুতি, মডেল প্রশিক্ষণ এবং টেস্টিং অন্তর্ভুক্ত রয়েছে। CatBoost এর শক্তিশালী বৈশিষ্ট্য এবং ক্যাটেগোরিক্যাল ডেটার জন্য বিশেষায়িত কৌশল ব্যবহার করে এটি উচ্চমানের ফলাফল প্রদান করতে সক্ষম।
আরও দেখুন...