H2O.ai দিয়ে একটি সম্পূর্ণ মেশিন লার্নিং প্রজেক্ট তৈরি

বাস্তব উদাহরণ এবং ডেমো - এইচ২ও (H2O) - Machine Learning

417

H2O.ai একটি শক্তিশালী মেশিন লার্নিং প্ল্যাটফর্ম যা বিভিন্ন মডেল ট্রেনিং, টেস্টিং এবং ডিপ্লয়মেন্ট প্রক্রিয়া সহজ করে তোলে। এই টিউটোরিয়ালে, আমরা H2O.ai ব্যবহার করে একটি সম্পূর্ণ মেশিন লার্নিং প্রজেক্ট তৈরি করবো, যেখানে ডেটা লোড করা, মডেল ট্রেনিং, মডেল টেস্টিং এবং পূর্বাভাসের প্রক্রিয়া অন্তর্ভুক্ত থাকবে।

ধাপ ১: H2O.ai ইনস্টলেশন

প্রথমে Python এ H2O.ai ইনস্টল করতে হবে। যদি আপনি Python ব্যবহার করেন, নিচের কমান্ডটি চালান:

pip install h2o

ধাপ ২: ডেটা লোড করা

এখন, একটি ডেটাসেট লোড করা যাক। এখানে আমরা UCI এর একটি জনপ্রিয় ডেটাসেট "Iris" ব্যবহার করবো।

import h2o

# H2O সার্ভার চালু করা
h2o.init()

# ডেটাসেট লোড করা
data = h2o.import_file("https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data", header=0)

# ডেটার প্রথম কয়েকটি রেকর্ড দেখুন
data.head()

এই কোডটি iris.data ডেটাসেটটি H2O এ লোড করবে।

ধাপ ৩: ডেটা প্রিপ্রসেসিং

ডেটা প্রিপ্রসেসিং বা প্রি-প্রসেসিং হল ডেটাকে মডেলিংয়ের জন্য প্রস্তুত করার প্রক্রিয়া। আমরা এখানে লক্ষ্য কলাম (target column) এবং ইনপুট ফিচারগুলো আলাদা করবো।

# লক্ষ্য কলাম নির্বাচন
data.columns = ['sepal_length', 'sepal_width', 'petal_length', 'petal_width', 'class']

# ডেটাকে ইনপুট এবং আউটপুট ফিচারে ভাগ করা
X = data.columns[:-1]  # ইনপুট ফিচার
y = data.columns[-1]  # লক্ষ্য (target) ফিচার

# ডেটার বিভাজন (train/test)
train, test = data.split_frame(ratios=[.8])

এখানে আমরা ডেটাকে ৮০% প্রশিক্ষণ (train) এবং ২০% টেস্ট (test) সেটে ভাগ করেছি।

ধাপ ৪: মডেল ট্রেনিং

এখন, আমরা H2O.ai এর Random Forest মডেলটি ব্যবহার করে মডেল ট্রেনিং করবো।

from h2o.estimators import H2ORandomForestEstimator

# মডেল তৈরি করা
rf_model = H2ORandomForestEstimator(ntrees=50, max_depth=20)

# মডেল প্রশিক্ষণ
rf_model.train(x=X, y=y, training_frame=train)

এই কোডটি একটি Random Forest মডেল তৈরি করবে এবং আমাদের প্রশিক্ষণ ডেটা ব্যবহার করে সেটি প্রশিক্ষিত হবে।

ধাপ ৫: মডেল মূল্যায়ন

এখন, আমরা আমাদের ট্রেন করা মডেলটি টেস্ট ডেটার উপর মূল্যায়ন করবো। আমরা accuracy এবং অন্যান্য মূল্যায়ন মেট্রিক্স ব্যবহার করতে পারি।

# টেস্ট ডেটার উপর পূর্বাভাস করা
predictions = rf_model.predict(test)

# মডেল মূল্যায়ন
performance = rf_model.model_performance(test)
print(performance)

এই কোডটি আমাদের মডেলটির পারফরম্যান্স বের করে দিবে, যেমন accuracy, AUC, এবং অন্যান্য মেট্রিক্স।

ধাপ ৬: ভবিষ্যৎ পূর্বাভাস

এখন, আমরা মডেলটি ব্যবহার করে নতুন ডেটার জন্য পূর্বাভাস করতে পারি।

# নতুন ডেটার জন্য পূর্বাভাস
new_data = h2o.H2OFrame([[5.1, 3.5, 1.4, 0.2]])  # নতুন ইনপুট ডেটা
prediction = rf_model.predict(new_data)

print("Prediction: ", prediction)

এই কোডটি একটি নতুন উদাহরণ ডেটা দিয়ে পূর্বাভাস করবে এবং সেই অনুযায়ী ফলাফল দেখাবে।

ধাপ ৭: মডেল সেভ করা

মডেলটি সফলভাবে ট্রেন করার পর, আপনি মডেলটি সংরক্ষণ করতে পারেন, যাতে ভবিষ্যতে ব্যবহার করা যায়।

# মডেল সেভ করা
model_path = h2o.save_model(model=rf_model, path="/path/to/save/model", force=True)
print("Model saved to:", model_path)

এই কোডটি আপনার মডেলটি সেভ করবে এবং সেভ করার পাথ দেখাবে।

সারাংশ

এই টিউটোরিয়ালে, আমরা H2O.ai ব্যবহার করে একটি সম্পূর্ণ মেশিন লার্নিং প্রজেক্ট তৈরি করেছি, যেখানে আমরা:

ডেটা লোড করেছি,
ডেটা প্রিপ্রসেসিং করেছি,
একটি Random Forest মডেল ট্রেন করেছি,
মডেল মূল্যায়ন করেছি,
ভবিষ্যৎ পূর্বাভাস দিয়েছি এবং,
মডেলটি সেভ করেছি।

এটি একটি মৌলিক মেশিন লার্নিং প্রজেক্ট, যা H2O.ai প্ল্যাটফর্মের মাধ্যমে দ্রুত এবং কার্যকরীভাবে তৈরি করা যায়।

Content added By

Azizar Rahman Aziz

AutoML এবং Ensemble মডেল তৈরি Deep Learning দিয়ে Image Classification প্রজেক্ট মডেল ডেপ্লয়মেন্ট এবং API Integration এর উদাহরণ

H2O.ai দিয়ে একটি সম্পূর্ণ মেশিন লার্নিং প্রজেক্ট তৈরি

ধাপ ১: H2O.ai ইনস্টলেশন

ধাপ ২: ডেটা লোড করা

ধাপ ৩: ডেটা প্রিপ্রসেসিং

ধাপ ৪: মডেল ট্রেনিং

ধাপ ৫: মডেল মূল্যায়ন

ধাপ ৬: ভবিষ্যৎ পূর্বাভাস

ধাপ ৭: মডেল সেভ করা

সারাংশ

Promotion

Satt AI

Hi, আমি SATT AI!

H2O.ai দিয়ে একটি সম্পূর্ণ মেশিন লার্নিং প্রজেক্ট তৈরি

ধাপ ১: H2O.ai ইনস্টলেশন

ধাপ ২: ডেটা লোড করা

ধাপ ৩: ডেটা প্রিপ্রসেসিং

ধাপ ৪: মডেল ট্রেনিং

ধাপ ৫: মডেল মূল্যায়ন

ধাপ ৬: ভবিষ্যৎ পূর্বাভাস

ধাপ ৭: মডেল সেভ করা

সারাংশ

All Notifications

Promotion

Satt AI

Hi, আমি SATT AI!