উদাহরণসহ মডেল তৈরি করার ধাপ

XGBoost এর বেসিক ধারণা - এক্সজিবুস্ট (XGBoost) - Latest Technologies

288

XGBoost ব্যবহার করে মডেল তৈরি করার ধাপগুলো বুঝতে একটি উদাহরণ সহ নিচে বিস্তারিতভাবে ব্যাখ্যা করা হলো। ধাপগুলো অনুসরণ করলে আপনি সহজেই XGBoost-এ একটি মেশিন লার্নিং মডেল তৈরি করতে পারবেন। উদাহরণ হিসেবে আমরা ইরিস ডেটাসেট ব্যবহার করছি, যা একটি জনপ্রিয় ডেটাসেট এবং সহজে বোঝা যায়।

XGBoost মডেল তৈরি করার ধাপ

XGBoost-এ মডেল তৈরি করার জন্য সাধারণত নিচের ধাপগুলো অনুসরণ করতে হয়:

ডেটা লোড করা এবং প্রস্তুত করা: ডেটাসেট লোড করা এবং তা প্রক্রিয়ার উপযোগী করে প্রস্তুত করা।
ডেটা ভাগ করা: ট্রেনিং এবং টেস্টিং সেটে ডেটা ভাগ করা।
DMatrix তৈরি করা: XGBoost-এ ট্রেনিং এবং টেস্ট ডেটাকে DMatrix ফরম্যাটে কনভার্ট করা।
প্যারামিটার সেট করা: মডেলের জন্য প্রয়োজনীয় প্যারামিটার নির্ধারণ করা।
মডেল ট্রেনিং: XGBoost মডেল ট্রেনিং করা।
প্রেডিকশন: মডেলের ওপর ভিত্তি করে প্রেডিকশন করা।
মডেল মূল্যায়ন: মডেলের কার্যকারিতা যাচাই করা।

উদাহরণ: XGBoost দিয়ে ক্লাসিফিকেশন মডেল তৈরি (ইরিস ডেটাসেট ব্যবহার করে)

import xgboost as xgb
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# ধাপ ১: ডেটা লোড করা
iris = load_iris()
X = iris.data  # ফিচার (Feature)
y = iris.target  # লেবেল (Label)

# ধাপ ২: ডেটাকে ট্রেন এবং টেস্ট সেটে ভাগ করা
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# ধাপ ৩: ডেটাকে DMatrix ফরম্যাটে কনভার্ট করা
dtrain = xgb.DMatrix(X_train, label=y_train)
dtest = xgb.DMatrix(X_test, label=y_test)

# ধাপ ৪: প্যারামিটার সেট করা
params = {
    'objective': 'multi:softmax',  # মাল্টি-ক্লাস ক্লাসিফিকেশনের জন্য
    'num_class': 3,                # ইরিস ডেটাসেটের ৩টি ক্লাস আছে
    'max_depth': 4,                # গাছের গভীরতা
    'learning_rate': 0.1,          # লার্নিং রেট
    'n_estimators': 100            # ট্রি সংখ্যা
}

# ধাপ ৫: মডেল ট্রেনিং
bst = xgb.train(params, dtrain, num_boost_round=10)

# ধাপ ৬: প্রেডিকশন
y_pred = bst.predict(dtest)

# ধাপ ৭: মডেল মূল্যায়ন
accuracy = accuracy_score(y_test, y_pred)
print(f"Accuracy: {accuracy:.2f}")

ধাপগুলোর ব্যাখ্যা

ধাপ ১: ডেটা লোড করা

আমরা load_iris() ফাংশনের মাধ্যমে ইরিস ডেটাসেট লোড করেছি। X হলো ফিচার এবং y হলো লেবেল।

ধাপ ২: ডেটাকে ট্রেন এবং টেস্ট সেটে ভাগ করা

train_test_split() ফাংশন ব্যবহার করে ডেটাকে ৮০% ট্রেনিং এবং ২০% টেস্টিং সেটে ভাগ করা হয়েছে।

ধাপ ৩: ডেটাকে DMatrix ফরম্যাটে কনভার্ট করা

DMatrix হলো XGBoost-এর নিজস্ব ডেটা ফরম্যাট, যা ডেটাকে দ্রুত প্রক্রিয়া করতে সহায়ক। ট্রেন এবং টেস্ট ডেটা আলাদাভাবে DMatrix ফরম্যাটে কনভার্ট করা হয়েছে।

ধাপ ৪: প্যারামিটার সেট করা

মডেলের জন্য প্রয়োজনীয় প্যারামিটার সেট করা হয়েছে, যেমন:
- 'objective': ক্লাসিফিকেশনের জন্য 'multi:softmax' ব্যবহার করা হয়েছে।
- 'num_class': ইরিস ডেটাসেটের ৩টি ক্লাস আছে।
- 'max_depth': গাছের গভীরতা ৪ সেট করা হয়েছে।
- 'learning_rate': লার্নিং রেট ০.১ সেট করা হয়েছে, যা মডেল ট্রেনিংয়ের গতি নির্ধারণ করে।

ধাপ ৫: মডেল ট্রেনিং

xgb.train() ফাংশন ব্যবহার করে মডেল ট্রেন করা হয়েছে। এখানে num_boost_round=10 সেট করা হয়েছে, যা গাছ তৈরির সংখ্যা নির্দেশ করে।

ধাপ ৬: প্রেডিকশন

ট্রেন করা মডেল দিয়ে টেস্ট ডেটার ওপর প্রেডিকশন করা হয়েছে।

ধাপ ৭: মডেল মূল্যায়ন

মডেলের কার্যকারিতা যাচাই করতে accuracy_score ব্যবহার করা হয়েছে, যা মডেলের একুরেসি পরিমাপ করে।

মডেল অপটিমাইজেশন এবং টিউনিং

XGBoost মডেল আরও উন্নত করার জন্য কিছু অতিরিক্ত ধাপ নেওয়া যেতে পারে:

Hyperparameter Tuning: max_depth, learning_rate, subsample, এবং অন্যান্য প্যারামিটার টিউন করে মডেলের কার্যকারিতা বাড়ানো যায়।
Cross-Validation: মডেলের সঠিকতা বাড়ানোর জন্য Cross-Validation ব্যবহার করা যেতে পারে।
Feature Engineering: ডেটাসেটে নতুন ফিচার যুক্ত করা বা অপ্রয়োজনীয় ফিচার অপসারণ করে মডেলের পারফরম্যান্স বৃদ্ধি করা যায়।

সংক্ষেপে:

XGBoost দিয়ে মডেল তৈরি করা সহজ এবং কার্যকর, বিশেষ করে ক্লাসিফিকেশন এবং রিগ্রেশন টাস্কের ক্ষেত্রে। ধাপগুলো অনুসরণ করে এবং মডেল টিউনিং-এর মাধ্যমে আপনি XGBoost-এ শক্তিশালী এবং নির্ভুল মডেল তৈরি করতে পারবেন।

Content added By

Md. Nasir Uddin (Raju)

DMatrix এবং তার ব্যবহার Feature Engineering এবং Feature Importance Training এবং Validation Data তৈরি করা

উদাহরণসহ মডেল তৈরি করার ধাপ

XGBoost মডেল তৈরি করার ধাপ

উদাহরণ: XGBoost দিয়ে ক্লাসিফিকেশন মডেল তৈরি (ইরিস ডেটাসেট ব্যবহার করে)

ধাপগুলোর ব্যাখ্যা

ধাপ ১: ডেটা লোড করা

ধাপ ২: ডেটাকে ট্রেন এবং টেস্ট সেটে ভাগ করা

ধাপ ৩: ডেটাকে DMatrix ফরম্যাটে কনভার্ট করা

ধাপ ৪: প্যারামিটার সেট করা

ধাপ ৫: মডেল ট্রেনিং

ধাপ ৬: প্রেডিকশন

ধাপ ৭: মডেল মূল্যায়ন

মডেল অপটিমাইজেশন এবং টিউনিং

সংক্ষেপে:

Promotion

Satt AI

Hi, আমি SATT AI!

উদাহরণসহ মডেল তৈরি করার ধাপ

XGBoost মডেল তৈরি করার ধাপ

উদাহরণ: XGBoost দিয়ে ক্লাসিফিকেশন মডেল তৈরি (ইরিস ডেটাসেট ব্যবহার করে)

ধাপগুলোর ব্যাখ্যা

ধাপ ১: ডেটা লোড করা

ধাপ ২: ডেটাকে ট্রেন এবং টেস্ট সেটে ভাগ করা

ধাপ ৩: ডেটাকে DMatrix ফরম্যাটে কনভার্ট করা

ধাপ ৪: প্যারামিটার সেট করা

ধাপ ৫: মডেল ট্রেনিং

ধাপ ৬: প্রেডিকশন

ধাপ ৭: মডেল মূল্যায়ন

মডেল অপটিমাইজেশন এবং টিউনিং

সংক্ষেপে:

All Notifications

Promotion

Satt AI

Hi, আমি SATT AI!