CatBoost একটি শক্তিশালী Gradient Boosting লাইব্রেরি, যা ক্যাটেগোরিক্যাল ডেটা পরিচালনা করার জন্য বিশেষভাবে ডিজাইন করা হয়েছে। Pandas এবং NumPy হল জনপ্রিয় Python লাইব্রেরি যা ডেটা বিশ্লেষণ এবং গণনার জন্য ব্যবহৃত হয়। CatBoost, Pandas এবং NumPy-এর মধ্যে একটি সুষ্ঠু সংযোগ রয়েছে, যা ডেটা প্রক্রিয়াকরণের এবং মডেল ট্রেনিংয়ের জন্য সহজ ও কার্যকরী উপায় সরবরাহ করে।
প্রথমে নিশ্চিত করুন যে আপনার সিস্টেমে CatBoost, Pandas এবং NumPy ইনস্টল আছে। ইনস্টল করতে নিচের কমান্ডগুলি ব্যবহার করুন:
pip install catboost pandas numpy
Pandas ব্যবহার করে একটি ডেটাসেট তৈরি করুন বা একটি বিদ্যমান ডেটাসেট লোড করুন। এখানে আমরা একটি কল্পিত ডেটাসেট তৈরি করছি।
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
# উদাহরণ ডেটাসেট তৈরি
data = {
'feature1': np.random.rand(100),
'feature2': np.random.choice(['A', 'B', 'C'], 100),
'target': np.random.choice([0, 1], 100)
}
df = pd.DataFrame(data)
# ডেটা ভাগ করা: 80% ট্রেনিং এবং 20% টেস্টিং
X = df[['feature1', 'feature2']]
y = df['target']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
CatBoost মডেল তৈরি এবং ট্রেনিং করার জন্য নিচের পদক্ষেপগুলি অনুসরণ করুন।
from catboost import CatBoostClassifier
# ক্যাটেগোরিক্যাল বৈশিষ্ট্যগুলি উল্লেখ করুন
categorical_features_indices = [1] # feature2 হল ক্যাটেগোরিক্যাল ফিচার
# CatBoostClassifier মডেল তৈরি
model = CatBoostClassifier(iterations=100, learning_rate=0.1, depth=6, cat_features=categorical_features_indices, verbose=0)
# মডেল প্রশিক্ষণ
model.fit(X_train, y_train)
# পূর্বাভাস করা
predictions = model.predict(X_test)
# ফলাফল দেখানো
print("\nPredictions:")
print(predictions)
# সঠিকতা মূল্যায়ন
from sklearn.metrics import accuracy_score
accuracy = accuracy_score(y_test, predictions)
print(f"\nAccuracy: {accuracy * 100:.2f}%")
CatBoost ডেটা NumPy অ্যারেতে ব্যবহার করতে পারে। নিচে NumPy এর সাহায্যে ডেটাসেট তৈরি করে CatBoost ব্যবহার করার উদাহরণ দেওয়া হলো।
# NumPy অ্যারেতে ডেটা তৈরি
X_np = np.array(X)
y_np = np.array(y)
# ডেটা ভাগ করা: 80% ট্রেনিং এবং 20% টেস্টিং
X_train_np, X_test_np, y_train_np, y_test_np = train_test_split(X_np, y_np, test_size=0.2, random_state=42)
# CatBoostClassifier মডেল তৈরি
model_np = CatBoostClassifier(iterations=100, learning_rate=0.1, depth=6, cat_features=[1], verbose=0)
# NumPy অ্যারেতে মডেল প্রশিক্ষণ
model_np.fit(X_train_np, y_train_np)
# পূর্বাভাস করা
predictions_np = model_np.predict(X_test_np)
# ফলাফল দেখানো
print("\nNumPy Predictions:")
print(predictions_np)
# সঠিকতা মূল্যায়ন
accuracy_np = accuracy_score(y_test_np, predictions_np)
print(f"\nNumPy Accuracy: {accuracy_np * 100:.2f}%")
CatBoost, Pandas, এবং NumPy এর সংযোগ ব্যবহারকারীদের জন্য একটি শক্তিশালী এবং নমনীয় মেশিন লার্নিং পরিবেশ তৈরি করে। CatBoost-এর ক্যাটেগোরিক্যাল ডেটার জন্য বিশেষায়িত কৌশলগুলি এবং Pandas/NumPy-এর শক্তিশালী ডেটা প্রক্রিয়াকরণের ক্ষমতা একত্রে একটি কার্যকরী সমাধান প্রদান করে। এই প্রযুক্তিগুলি ব্যবহার করে আপনি আপনার মডেলগুলিকে সহজে প্রশিক্ষণ এবং বিশ্লেষণ করতে পারবেন।
আরও দেখুন...