LightGBM Dataset (LGBM Dataset) তৈরি করা

LightGBM এর বেসিক ব্যবহার - লাইটজিবিএম (LightGBM) - Latest Technologies

225

LightGBM ব্যবহার করার জন্য একটি LGBM Dataset তৈরি করা খুবই সহজ। LightGBM-এর নিজস্ব Dataset ক্লাস ব্যবহার করে আপনি ডেটাকে প্রস্তুত এবং ফরম্যাট করতে পারেন, যা মডেল ট্রেনিংয়ের জন্য উপযোগী। নিচে LightGBM-এর সাথে ডেটাসেট তৈরি করার প্রক্রিয়া বিস্তারিতভাবে আলোচনা করা হলো।

LightGBM Dataset তৈরি করার পদক্ষেপ

১. প্রয়োজনীয় লাইব্রেরি ইনপোর্ট করা

প্রথমে LightGBM এবং অন্যান্য প্রয়োজনীয় লাইব্রেরি ইমপোর্ট করুন।

import lightgbm as lgb
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split

২. ডেটাসেট তৈরি করা

এখন, একটি উদাহরণ ডেটাসেট তৈরি করি। এখানে আমরা একটি কৃত্রিম ডেটাসেট তৈরি করব।

# উদাহরণস্বরূপ, কৃত্রিম ডেটাসেট তৈরি করা
data = np.random.rand(1000, 10)  # 1000টি নমুনা এবং 10টি বৈশিষ্ট্য
labels = np.random.randint(2, size=1000)  # 0 বা 1 লেবেল

# ডেটাসেটকে ডাটা ফ্রেমে রূপান্তর
df = pd.DataFrame(data, columns=[f'feature_{i}' for i in range(10)])
df['label'] = labels

৩. ডেটাকে ট্রেন এবং টেস্ট সেটে ভাগ করা

ডেটাসেটকে প্রশিক্ষণ এবং পরীক্ষার সেটে বিভক্ত করুন।

# ডেটাকে ট্রেন এবং টেস্ট সেটে ভাগ করা
X = df.drop('label', axis=1)
y = df['label']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

৪. LightGBM Dataset তৈরি করা

এখন lgb.Dataset ক্লাস ব্যবহার করে ডেটাসেট তৈরি করুন।

# LightGBM Dataset তৈরি
train_data = lgb.Dataset(X_train, label=y_train)
test_data = lgb.Dataset(X_test, label=y_test, reference=train_data)

৫. মডেল প্যারামিটার সেট করা

মডেল প্রশিক্ষণের জন্য কিছু প্যারামিটার সেট করুন।

# মডেল প্যারামিটার সেট করা
params = {
    'objective': 'binary',
    'metric': 'binary_logloss',
    'boosting_type': 'gbdt',
    'learning_rate': 0.1,
    'num_leaves': 31
}

৬. মডেল ট্রেনিং

LightGBM ব্যবহার করে মডেল প্রশিক্ষণ দিন।

# মডেল ট্রেনিং
model = lgb.train(params, train_data, num_boost_round=100, valid_sets=test_data, early_stopping_rounds=10)

সম্পূর্ণ কোড

একত্রিতভাবে, এখানে সম্পূর্ণ কোড রয়েছে:

import lightgbm as lgb
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split

# উদাহরণস্বরূপ, কৃত্রিম ডেটাসেট তৈরি করা
data = np.random.rand(1000, 10)  # 1000টি নমুনা এবং 10টি বৈশিষ্ট্য
labels = np.random.randint(2, size=1000)  # 0 বা 1 লেবেল

# ডেটাসেটকে ডাটা ফ্রেমে রূপান্তর
df = pd.DataFrame(data, columns=[f'feature_{i}' for i in range(10)])
df['label'] = labels

# ডেটাকে ট্রেন এবং টেস্ট সেটে ভাগ করা
X = df.drop('label', axis=1)
y = df['label']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# LightGBM Dataset তৈরি
train_data = lgb.Dataset(X_train, label=y_train)
test_data = lgb.Dataset(X_test, label=y_test, reference=train_data)

# মডেল প্যারামিটার সেট করা
params = {
    'objective': 'binary',
    'metric': 'binary_logloss',
    'boosting_type': 'gbdt',
    'learning_rate': 0.1,
    'num_leaves': 31
}

# মডেল ট্রেনিং
model = lgb.train(params, train_data, num_boost_round=100, valid_sets=test_data, early_stopping_rounds=10)

উপসংহার

LightGBM ব্যবহার করে lgb.Dataset তৈরি করা একটি সহজ প্রক্রিয়া, যা আপনাকে মডেল প্রশিক্ষণের জন্য প্রস্তুত করে। উপরের উদাহরণে, একটি কৃত্রিম ডেটাসেট তৈরি করে সেটিকে LightGBM ডেটাসেটে রূপান্তর করা হয়েছে। এটি বাস্তব জীবনের প্রকল্পগুলিতে কাজ করতে শুরু করার জন্য একটি শক্তিশালী ভিত্তি প্রদান করে।

Content added By

Md. Nasir Uddin (Raju)

Dataset Preparation এবং Feature Engineering Categorical Features এর কাজ এবং তাদের প্রক্রিয়াকরণ Training এবং Validation Dataset তৈরি করা

LightGBM Dataset (LGBM Dataset) তৈরি করা

LightGBM Dataset তৈরি করার পদক্ষেপ

১. প্রয়োজনীয় লাইব্রেরি ইনপোর্ট করা

২. ডেটাসেট তৈরি করা

৩. ডেটাকে ট্রেন এবং টেস্ট সেটে ভাগ করা

৪. LightGBM Dataset তৈরি করা

৫. মডেল প্যারামিটার সেট করা

৬. মডেল ট্রেনিং

সম্পূর্ণ কোড

উপসংহার

Promotion

Satt AI

Hi, আমি SATT AI!

LightGBM Dataset (LGBM Dataset) তৈরি করা

LightGBM Dataset তৈরি করার পদক্ষেপ

১. প্রয়োজনীয় লাইব্রেরি ইনপোর্ট করা

২. ডেটাসেট তৈরি করা

৩. ডেটাকে ট্রেন এবং টেস্ট সেটে ভাগ করা

৪. LightGBM Dataset তৈরি করা

৫. মডেল প্যারামিটার সেট করা

৬. মডেল ট্রেনিং

সম্পূর্ণ কোড

উপসংহার

All Notifications

Promotion

Satt AI

Hi, আমি SATT AI!