উদাহরণসহ Computer Vision প্রজেক্ট তৈরি

Computer Vision এবং Leonardo AI - লিওনার্দো এআই (Leonardo AI) - Latest Technologies

318

কম্পিউটার ভিশন একটি শক্তিশালী প্রযুক্তি যা মেশিন লার্নিং এবং কৃত্রিম বুদ্ধিমত্তার সাহায্যে ছবি ও ভিডিও বিশ্লেষণ করতে ব্যবহৃত হয়। এখানে একটি উদাহরণের মাধ্যমে কম্পিউটার ভিশন প্রকল্প তৈরি করার প্রক্রিয়া দেখানো হবে। আমরা একটি সহজ প্রকল্প তৈরি করবো যেখানে আমরা একটি কনভলিউশনাল নিউরাল নেটওয়ার্ক (CNN) ব্যবহার করে MNIST ডেটাসেট থেকে হাতের লেখা সংখ্যাগুলি শনাক্ত করবো।

প্রজেক্টের উদ্দেশ্য: হাতের লেখা সংখ্যা শনাক্তকরণ

ধাপ ১: লাইব্রেরি ইনস্টল করা

প্রথমে প্রয়োজনীয় লাইব্রেরিগুলি ইনস্টল করুন।

pip install tensorflow matplotlib

ধাপ ২: ডেটাসেট লোড করা

আমরা MNIST ডেটাসেট ব্যবহার করবো, যা 0 থেকে 9 পর্যন্ত হাতের লেখা সংখ্যার ইমেজ নিয়ে গঠিত।

import tensorflow as tf
from tensorflow.keras.datasets import mnist
import matplotlib.pyplot as plt

# ডেটাসেট লোড করা
(X_train, y_train), (X_test, y_test) = mnist.load_data()

# ডেটা দেখুন
print("Training data shape:", X_train.shape)
print("Testing data shape:", X_test.shape)

# একটি উদাহরণ ইমেজ দেখুন
plt.imshow(X_train[0], cmap='gray')
plt.title(f'Label: {y_train[0]}')
plt.show()

ধাপ ৩: ডেটা প্রিপ্রসেসিং

# ডেটা প্রিপ্রসেসিং
X_train = X_train.reshape((X_train.shape[0], 28, 28, 1)).astype('float32') / 255  # 0-1 এর মধ্যে স্কেলিং
X_test = X_test.reshape((X_test.shape[0], 28, 28, 1)).astype('float32') / 255

# লেবেল এক-হট এনকোডিং
y_train = tf.keras.utils.to_categorical(y_train, 10)
y_test = tf.keras.utils.to_categorical(y_test, 10)

ধাপ ৪: CNN মডেল তৈরি

# মডেল তৈরি করা
model = tf.keras.models.Sequential([
    tf.keras.layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),
    tf.keras.layers.MaxPooling2D(pool_size=(2, 2)),
    tf.keras.layers.Conv2D(64, (3, 3), activation='relu'),
    tf.keras.layers.MaxPooling2D(pool_size=(2, 2)),
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dense(128, activation='relu'),
    tf.keras.layers.Dense(10, activation='softmax')
])

# মডেল সংক্ষিপ্ত বিবরণ
model.summary()

ধাপ ৫: মডেল কম্পাইল করা

# মডেল কম্পাইল
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])

ধাপ ৬: মডেল প্রশিক্ষণ

# মডেল প্রশিক্ষণ
model.fit(X_train, y_train, epochs=5, batch_size=64, validation_split=0.2)

ধাপ ৭: মডেল মূল্যায়ন

# মডেল মূল্যায়ন
test_loss, test_acc = model.evaluate(X_test, y_test)
print(f'Test accuracy: {test_acc:.4f}')

ধাপ ৮: পূর্বাভাস করা

# একটি নমুনা ইমেজের পূর্বাভাস করা
sample_image = X_test[0].reshape(1, 28, 28, 1)
predicted_class = model.predict(sample_image)
print(f'Predicted label: {predicted_class.argmax()}')

সারসংক্ষেপ

এই প্রকল্পে, আমরা একটি CNN মডেল ব্যবহার করে MNIST ডেটাসেট থেকে হাতের লেখা সংখ্যা শনাক্ত করেছি। আমরা ডেটাসেট লোড করেছি, প্রিপ্রসেসিং করেছি, মডেল তৈরি ও প্রশিক্ষণ করেছি এবং শেষ পর্যন্ত মডেলটির কার্যকারিতা মূল্যায়ন করেছি।

কম্পিউটার ভিশন প্রকল্পগুলি বাস্তব জীবনের বিভিন্ন ক্ষেত্রে যেমন স্বচালিত গাড়ি, ফেস রিকগনিশন, এবং সুরক্ষা সিস্টেমে প্রয়োগ করা হয়। এই প্রকল্পের মাধ্যমে আপনি কম্পিউটার ভিশনের মৌলিক ধারণাগুলি বুঝতে পারবেন এবং ভবিষ্যতে আরও জটিল প্রকল্পগুলির জন্য প্রস্তুতি নিতে পারবেন।

Promotion

Are you sure to start over?

Loading...