H2O.ai প্ল্যাটফর্মে Time Series ডেটা ব্যবহার করে মডেল তৈরি করা খুবই সহজ। এটি বিভিন্ন ধরনের মডেল তৈরি করতে সাহায্য করে, বিশেষত AutoML ফিচারটির মাধ্যমে, যা স্বয়ংক্রিয়ভাবে টাইম সিরিজ ডেটার জন্য সেরা মডেল নির্বাচন এবং প্রশিক্ষণ করতে সক্ষম।
এখানে H2O.ai ব্যবহার করে টাইম সিরিজ ডেটার জন্য মডেল তৈরি করার প্রক্রিয়া বর্ণনা করা হয়েছে।
১. Time Series ডেটা প্রস্তুত করা
টাইম সিরিজ ডেটা মূলত টাইম-ডিপেনডেন্ট, যেখানে প্রতিটি ডেটা পয়েন্ট একটি সময়ের সাথে সম্পর্কিত থাকে। সাধারণত একটি টাইম সিরিজ ডেটাসেটের মধ্যে থাকবে:
- ডেট (Date): সময় বা তারিখের কলাম।
- ট্রেনিং ডেটা: ভবিষ্যতের পূর্বাভাস তৈরি করার জন্য বর্তমান ডেটা।
- লক্ষ্য ভেরিয়েবল: যেমন, বিক্রয়, তাপমাত্রা, স্টকের দাম ইত্যাদি।
উদাহরণস্বরূপ, একটি টাইম সিরিজ ডেটাসেট হতে পারে:
| Date | Value |
|---|---|
| 2023-01-01 | 100 |
| 2023-01-02 | 105 |
| 2023-01-03 | 110 |
| ... | ... |
২. H2O.ai তে টাইম সিরিজ ডেটা লোড করা
H2O.ai তে টাইম সিরিজ ডেটা লোড করতে, আপনি h2o.import_file ফাংশন ব্যবহার করতে পারেন।
import h2o
h2o.init()
# টাইম সিরিজ ডেটা লোড করা
data = h2o.import_file("path_to_your_timeseries_data.csv")
৩. Time Series মডেল ট্রেনিং করা
H2O.ai তে টাইম সিরিজ মডেল তৈরি করার জন্য H2O AutoML ব্যবহার করতে পারেন। AutoML স্বয়ংক্রিয়ভাবে সেরা মডেলটি নির্বাচন করে এবং প্রশিক্ষণ দেয়।
from h2o.automl import H2OAutoML
# H2O AutoML শুরু করা
aml = H2OAutoML(max_models=20, seed=1)
aml.train(y="Value", training_frame=data)
এখানে:
y="Value": এটি লক্ষ্য ভেরিয়েবল (যেমন: বিক্রয় বা স্টকের দাম)।max_models=20: সর্বাধিক ২০টি মডেল ট্রেনিং করা হবে।training_frame=data: আপনার টাইম সিরিজ ডেটাসেটটি।
৪. Time Series মডেল এর মূল্যায়ন এবং পূর্বাভাস করা
H2O.ai তে মডেল ট্রেনিং এর পর, আপনি aml.leaderboard ব্যবহার করে মডেলগুলির পারফরম্যান্স দেখতে পারেন এবং সেরা মডেল নির্বাচন করতে পারেন।
# মডেল পারফরম্যান্স দেখতে
print(aml.leaderboard)
এরপর, সেরা মডেল থেকে ভবিষ্যতের পূর্বাভাস তৈরি করতে পারেন:
# সেরা মডেল নির্বাচন করা
best_model = aml.leader
# পূর্বাভাস করা
predictions = best_model.predict(data)
৫. Time Series Forecasting with H2OGradientBoostingEstimator
H2O.ai তে টাইম সিরিজ মডেল তৈরি করার জন্য বিশেষভাবে Gradient Boosting Machine (GBM) ব্যবহার করা যেতে পারে। এটি একটি শক্তিশালী মডেল যা টাইম সিরিজ ডেটার উপর ভিত্তি করে ভবিষ্যৎ পূর্বাভাস তৈরি করতে সক্ষম।
from h2o.estimators import H2OGradientBoostingEstimator
# H2O GBM মডেল তৈরি
gbm_model = H2OGradientBoostingEstimator()
gbm_model.train(x=["Date"], y="Value", training_frame=data)
# পূর্বাভাস তৈরি করা
predictions = gbm_model.predict(data)
৬. Time Series Forecasting এর জন্য H2O.ai এর TimeSeriesModel
H2O.ai তে TimeSeriesModel ব্যবহার করে টাইম সিরিজ মডেল তৈরি করতে পারেন, যা টাইম সিরিজ ডেটার পূর্বাভাস জন্য খুবই কার্যকর।
from h2o.estimators import H2OAutoTimeSeriesEstimator
# H2O Time Series মডেল তৈরি
ts_model = H2OAutoTimeSeriesEstimator(target_col="Value", time_col="Date")
ts_model.train(training_frame=data)
# পূর্বাভাস তৈরি করা
forecast = ts_model.predict(data)
এখানে:
target_col="Value": এটি লক্ষ্য ভেরিয়েবল (যেমন, বিক্রয় বা স্টক দাম)।time_col="Date": এটি টাইম বা তারিখের কলাম।
৭. Time Series মডেল মূল্যায়ন
H2O.ai তে মডেলের পারফরম্যান্স মূল্যায়ন করতে, আপনি বিভিন্ন পরিমাপক যেমন RMSE (Root Mean Squared Error) বা MAE (Mean Absolute Error) ব্যবহার করতে পারেন।
# মডেল মূল্যায়ন
performance = best_model.model_performance()
print(performance)
এটি মডেলের মূল্যায়ন প্রদান করবে এবং আপনি কিভাবে আপনার মডেলটি কাজ করছে তা বুঝতে পারবেন।
সারাংশ
H2O.ai তে টাইম সিরিজ মডেল তৈরি করা অত্যন্ত সহজ। AutoML এবং H2OAutoTimeSeriesEstimator ব্যবহার করে টাইম সিরিজ ডেটার জন্য মডেল তৈরি, ট্রেনিং, এবং পূর্বাভাস করতে পারেন। এছাড়াও, Gradient Boosting Machine এর মতো শক্তিশালী মডেল ব্যবহার করে আপনার ডেটার উপর ভিত্তি করে সঠিক পূর্বাভাস তৈরি করতে পারেন।
Read more