H2O.ai দিয়ে একটি সম্পূর্ণ মেশিন লার্নিং প্রজেক্ট তৈরি

বাস্তব উদাহরণ এবং ডেমো - এইচ২ও (H2O) - Machine Learning

392

H2O.ai একটি শক্তিশালী মেশিন লার্নিং প্ল্যাটফর্ম যা বিভিন্ন মডেল ট্রেনিং, টেস্টিং এবং ডিপ্লয়মেন্ট প্রক্রিয়া সহজ করে তোলে। এই টিউটোরিয়ালে, আমরা H2O.ai ব্যবহার করে একটি সম্পূর্ণ মেশিন লার্নিং প্রজেক্ট তৈরি করবো, যেখানে ডেটা লোড করা, মডেল ট্রেনিং, মডেল টেস্টিং এবং পূর্বাভাসের প্রক্রিয়া অন্তর্ভুক্ত থাকবে।

ধাপ ১: H2O.ai ইনস্টলেশন

প্রথমে Python এ H2O.ai ইনস্টল করতে হবে। যদি আপনি Python ব্যবহার করেন, নিচের কমান্ডটি চালান:

pip install h2o

ধাপ ২: ডেটা লোড করা

এখন, একটি ডেটাসেট লোড করা যাক। এখানে আমরা UCI এর একটি জনপ্রিয় ডেটাসেট "Iris" ব্যবহার করবো।

import h2o

# H2O সার্ভার চালু করা
h2o.init()

# ডেটাসেট লোড করা
data = h2o.import_file("https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data", header=0)

# ডেটার প্রথম কয়েকটি রেকর্ড দেখুন
data.head()

এই কোডটি iris.data ডেটাসেটটি H2O এ লোড করবে।

ধাপ ৩: ডেটা প্রিপ্রসেসিং

ডেটা প্রিপ্রসেসিং বা প্রি-প্রসেসিং হল ডেটাকে মডেলিংয়ের জন্য প্রস্তুত করার প্রক্রিয়া। আমরা এখানে লক্ষ্য কলাম (target column) এবং ইনপুট ফিচারগুলো আলাদা করবো।

# লক্ষ্য কলাম নির্বাচন
data.columns = ['sepal_length', 'sepal_width', 'petal_length', 'petal_width', 'class']

# ডেটাকে ইনপুট এবং আউটপুট ফিচারে ভাগ করা
X = data.columns[:-1]  # ইনপুট ফিচার
y = data.columns[-1]  # লক্ষ্য (target) ফিচার

# ডেটার বিভাজন (train/test)
train, test = data.split_frame(ratios=[.8])

এখানে আমরা ডেটাকে ৮০% প্রশিক্ষণ (train) এবং ২০% টেস্ট (test) সেটে ভাগ করেছি।

ধাপ ৪: মডেল ট্রেনিং

এখন, আমরা H2O.ai এর Random Forest মডেলটি ব্যবহার করে মডেল ট্রেনিং করবো।

from h2o.estimators import H2ORandomForestEstimator

# মডেল তৈরি করা
rf_model = H2ORandomForestEstimator(ntrees=50, max_depth=20)

# মডেল প্রশিক্ষণ
rf_model.train(x=X, y=y, training_frame=train)

এই কোডটি একটি Random Forest মডেল তৈরি করবে এবং আমাদের প্রশিক্ষণ ডেটা ব্যবহার করে সেটি প্রশিক্ষিত হবে।

ধাপ ৫: মডেল মূল্যায়ন

এখন, আমরা আমাদের ট্রেন করা মডেলটি টেস্ট ডেটার উপর মূল্যায়ন করবো। আমরা accuracy এবং অন্যান্য মূল্যায়ন মেট্রিক্স ব্যবহার করতে পারি।

# টেস্ট ডেটার উপর পূর্বাভাস করা
predictions = rf_model.predict(test)

# মডেল মূল্যায়ন
performance = rf_model.model_performance(test)
print(performance)

এই কোডটি আমাদের মডেলটির পারফরম্যান্স বের করে দিবে, যেমন accuracy, AUC, এবং অন্যান্য মেট্রিক্স।

ধাপ ৬: ভবিষ্যৎ পূর্বাভাস

এখন, আমরা মডেলটি ব্যবহার করে নতুন ডেটার জন্য পূর্বাভাস করতে পারি।

# নতুন ডেটার জন্য পূর্বাভাস
new_data = h2o.H2OFrame([[5.1, 3.5, 1.4, 0.2]])  # নতুন ইনপুট ডেটা
prediction = rf_model.predict(new_data)

print("Prediction: ", prediction)

এই কোডটি একটি নতুন উদাহরণ ডেটা দিয়ে পূর্বাভাস করবে এবং সেই অনুযায়ী ফলাফল দেখাবে।

ধাপ ৭: মডেল সেভ করা

মডেলটি সফলভাবে ট্রেন করার পর, আপনি মডেলটি সংরক্ষণ করতে পারেন, যাতে ভবিষ্যতে ব্যবহার করা যায়।

# মডেল সেভ করা
model_path = h2o.save_model(model=rf_model, path="/path/to/save/model", force=True)
print("Model saved to:", model_path)

এই কোডটি আপনার মডেলটি সেভ করবে এবং সেভ করার পাথ দেখাবে।

সারাংশ

এই টিউটোরিয়ালে, আমরা H2O.ai ব্যবহার করে একটি সম্পূর্ণ মেশিন লার্নিং প্রজেক্ট তৈরি করেছি, যেখানে আমরা:

  1. ডেটা লোড করেছি,
  2. ডেটা প্রিপ্রসেসিং করেছি,
  3. একটি Random Forest মডেল ট্রেন করেছি,
  4. মডেল মূল্যায়ন করেছি,
  5. ভবিষ্যৎ পূর্বাভাস দিয়েছি এবং,
  6. মডেলটি সেভ করেছি।

এটি একটি মৌলিক মেশিন লার্নিং প্রজেক্ট, যা H2O.ai প্ল্যাটফর্মের মাধ্যমে দ্রুত এবং কার্যকরীভাবে তৈরি করা যায়।

Content added By
Promotion

Are you sure to start over?

Loading...