LightGBM ব্যবহার করার জন্য একটি LGBM Dataset তৈরি করা খুবই সহজ। LightGBM-এর নিজস্ব Dataset ক্লাস ব্যবহার করে আপনি ডেটাকে প্রস্তুত এবং ফরম্যাট করতে পারেন, যা মডেল ট্রেনিংয়ের জন্য উপযোগী। নিচে LightGBM-এর সাথে ডেটাসেট তৈরি করার প্রক্রিয়া বিস্তারিতভাবে আলোচনা করা হলো।
LightGBM Dataset তৈরি করার পদক্ষেপ
১. প্রয়োজনীয় লাইব্রেরি ইনপোর্ট করা
প্রথমে LightGBM এবং অন্যান্য প্রয়োজনীয় লাইব্রেরি ইমপোর্ট করুন।
import lightgbm as lgb
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
২. ডেটাসেট তৈরি করা
এখন, একটি উদাহরণ ডেটাসেট তৈরি করি। এখানে আমরা একটি কৃত্রিম ডেটাসেট তৈরি করব।
# উদাহরণস্বরূপ, কৃত্রিম ডেটাসেট তৈরি করা
data = np.random.rand(1000, 10) # 1000টি নমুনা এবং 10টি বৈশিষ্ট্য
labels = np.random.randint(2, size=1000) # 0 বা 1 লেবেল
# ডেটাসেটকে ডাটা ফ্রেমে রূপান্তর
df = pd.DataFrame(data, columns=[f'feature_{i}' for i in range(10)])
df['label'] = labels
৩. ডেটাকে ট্রেন এবং টেস্ট সেটে ভাগ করা
ডেটাসেটকে প্রশিক্ষণ এবং পরীক্ষার সেটে বিভক্ত করুন।
# ডেটাকে ট্রেন এবং টেস্ট সেটে ভাগ করা
X = df.drop('label', axis=1)
y = df['label']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
৪. LightGBM Dataset তৈরি করা
এখন lgb.Dataset ক্লাস ব্যবহার করে ডেটাসেট তৈরি করুন।
# LightGBM Dataset তৈরি
train_data = lgb.Dataset(X_train, label=y_train)
test_data = lgb.Dataset(X_test, label=y_test, reference=train_data)
৫. মডেল প্যারামিটার সেট করা
মডেল প্রশিক্ষণের জন্য কিছু প্যারামিটার সেট করুন।
# মডেল প্যারামিটার সেট করা
params = {
'objective': 'binary',
'metric': 'binary_logloss',
'boosting_type': 'gbdt',
'learning_rate': 0.1,
'num_leaves': 31
}
৬. মডেল ট্রেনিং
LightGBM ব্যবহার করে মডেল প্রশিক্ষণ দিন।
# মডেল ট্রেনিং
model = lgb.train(params, train_data, num_boost_round=100, valid_sets=test_data, early_stopping_rounds=10)
সম্পূর্ণ কোড
একত্রিতভাবে, এখানে সম্পূর্ণ কোড রয়েছে:
import lightgbm as lgb
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
# উদাহরণস্বরূপ, কৃত্রিম ডেটাসেট তৈরি করা
data = np.random.rand(1000, 10) # 1000টি নমুনা এবং 10টি বৈশিষ্ট্য
labels = np.random.randint(2, size=1000) # 0 বা 1 লেবেল
# ডেটাসেটকে ডাটা ফ্রেমে রূপান্তর
df = pd.DataFrame(data, columns=[f'feature_{i}' for i in range(10)])
df['label'] = labels
# ডেটাকে ট্রেন এবং টেস্ট সেটে ভাগ করা
X = df.drop('label', axis=1)
y = df['label']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# LightGBM Dataset তৈরি
train_data = lgb.Dataset(X_train, label=y_train)
test_data = lgb.Dataset(X_test, label=y_test, reference=train_data)
# মডেল প্যারামিটার সেট করা
params = {
'objective': 'binary',
'metric': 'binary_logloss',
'boosting_type': 'gbdt',
'learning_rate': 0.1,
'num_leaves': 31
}
# মডেল ট্রেনিং
model = lgb.train(params, train_data, num_boost_round=100, valid_sets=test_data, early_stopping_rounds=10)
উপসংহার
LightGBM ব্যবহার করে lgb.Dataset তৈরি করা একটি সহজ প্রক্রিয়া, যা আপনাকে মডেল প্রশিক্ষণের জন্য প্রস্তুত করে। উপরের উদাহরণে, একটি কৃত্রিম ডেটাসেট তৈরি করে সেটিকে LightGBM ডেটাসেটে রূপান্তর করা হয়েছে। এটি বাস্তব জীবনের প্রকল্পগুলিতে কাজ করতে শুরু করার জন্য একটি শক্তিশালী ভিত্তি প্রদান করে।
Read more