LightGBM Dataset (LGBM Dataset) তৈরি করা

LightGBM এর বেসিক ব্যবহার - লাইটজিবিএম (LightGBM) - Latest Technologies

225

LightGBM ব্যবহার করার জন্য একটি LGBM Dataset তৈরি করা খুবই সহজ। LightGBM-এর নিজস্ব Dataset ক্লাস ব্যবহার করে আপনি ডেটাকে প্রস্তুত এবং ফরম্যাট করতে পারেন, যা মডেল ট্রেনিংয়ের জন্য উপযোগী। নিচে LightGBM-এর সাথে ডেটাসেট তৈরি করার প্রক্রিয়া বিস্তারিতভাবে আলোচনা করা হলো।

LightGBM Dataset তৈরি করার পদক্ষেপ

১. প্রয়োজনীয় লাইব্রেরি ইনপোর্ট করা

প্রথমে LightGBM এবং অন্যান্য প্রয়োজনীয় লাইব্রেরি ইমপোর্ট করুন।

import lightgbm as lgb
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split

২. ডেটাসেট তৈরি করা

এখন, একটি উদাহরণ ডেটাসেট তৈরি করি। এখানে আমরা একটি কৃত্রিম ডেটাসেট তৈরি করব।

# উদাহরণস্বরূপ, কৃত্রিম ডেটাসেট তৈরি করা
data = np.random.rand(1000, 10)  # 1000টি নমুনা এবং 10টি বৈশিষ্ট্য
labels = np.random.randint(2, size=1000)  # 0 বা 1 লেবেল

# ডেটাসেটকে ডাটা ফ্রেমে রূপান্তর
df = pd.DataFrame(data, columns=[f'feature_{i}' for i in range(10)])
df['label'] = labels

৩. ডেটাকে ট্রেন এবং টেস্ট সেটে ভাগ করা

ডেটাসেটকে প্রশিক্ষণ এবং পরীক্ষার সেটে বিভক্ত করুন।

# ডেটাকে ট্রেন এবং টেস্ট সেটে ভাগ করা
X = df.drop('label', axis=1)
y = df['label']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

৪. LightGBM Dataset তৈরি করা

এখন lgb.Dataset ক্লাস ব্যবহার করে ডেটাসেট তৈরি করুন।

# LightGBM Dataset তৈরি
train_data = lgb.Dataset(X_train, label=y_train)
test_data = lgb.Dataset(X_test, label=y_test, reference=train_data)

৫. মডেল প্যারামিটার সেট করা

মডেল প্রশিক্ষণের জন্য কিছু প্যারামিটার সেট করুন।

# মডেল প্যারামিটার সেট করা
params = {
    'objective': 'binary',
    'metric': 'binary_logloss',
    'boosting_type': 'gbdt',
    'learning_rate': 0.1,
    'num_leaves': 31
}

৬. মডেল ট্রেনিং

LightGBM ব্যবহার করে মডেল প্রশিক্ষণ দিন।

# মডেল ট্রেনিং
model = lgb.train(params, train_data, num_boost_round=100, valid_sets=test_data, early_stopping_rounds=10)

সম্পূর্ণ কোড

একত্রিতভাবে, এখানে সম্পূর্ণ কোড রয়েছে:

import lightgbm as lgb
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split

# উদাহরণস্বরূপ, কৃত্রিম ডেটাসেট তৈরি করা
data = np.random.rand(1000, 10)  # 1000টি নমুনা এবং 10টি বৈশিষ্ট্য
labels = np.random.randint(2, size=1000)  # 0 বা 1 লেবেল

# ডেটাসেটকে ডাটা ফ্রেমে রূপান্তর
df = pd.DataFrame(data, columns=[f'feature_{i}' for i in range(10)])
df['label'] = labels

# ডেটাকে ট্রেন এবং টেস্ট সেটে ভাগ করা
X = df.drop('label', axis=1)
y = df['label']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# LightGBM Dataset তৈরি
train_data = lgb.Dataset(X_train, label=y_train)
test_data = lgb.Dataset(X_test, label=y_test, reference=train_data)

# মডেল প্যারামিটার সেট করা
params = {
    'objective': 'binary',
    'metric': 'binary_logloss',
    'boosting_type': 'gbdt',
    'learning_rate': 0.1,
    'num_leaves': 31
}

# মডেল ট্রেনিং
model = lgb.train(params, train_data, num_boost_round=100, valid_sets=test_data, early_stopping_rounds=10)

উপসংহার

LightGBM ব্যবহার করে lgb.Dataset তৈরি করা একটি সহজ প্রক্রিয়া, যা আপনাকে মডেল প্রশিক্ষণের জন্য প্রস্তুত করে। উপরের উদাহরণে, একটি কৃত্রিম ডেটাসেট তৈরি করে সেটিকে LightGBM ডেটাসেটে রূপান্তর করা হয়েছে। এটি বাস্তব জীবনের প্রকল্পগুলিতে কাজ করতে শুরু করার জন্য একটি শক্তিশালী ভিত্তি প্রদান করে।

Promotion

Are you sure to start over?

Loading...