GAN দিয়ে Image Generation

Machine Learning - পাইথন ডিপ লার্নিং (Python Deep Learning) - GAN (Generative Adversarial Networks)

370

Generative Adversarial Networks (GANs) হল একটি শক্তিশালী মেশিন লার্নিং মডেল যা image generation সহ বিভিন্ন ধরনের ডেটা জেনারেট করতে সক্ষম। GAN এর মাধ্যমে আপনি নতুন ইমেজ তৈরি করতে পারেন যা প্রাকৃতিক ইমেজের মতো দেখায়, কিন্তু সেগুলি আসলে মডেল দ্বারা তৈরি করা হয়। GAN-এ দুটি মডেল থাকে — Generator এবং Discriminator, এবং তারা একে অপরের বিপরীতে কাজ করে।

Image Generation with GAN:

Image generation বা ছবি তৈরি করার জন্য GAN-এর Generator মডেল একটি র্যান্ডম নোইস (noise) ইনপুট নেয় এবং সেটিকে একটি ইমেজে রূপান্তরিত করে, যাতে তা যথাযথ ইমেজের মতো দেখায়। একই সময়ে, Discriminator মডেলটি সঠিকভাবে "real" এবং "fake" ইমেজের মধ্যে পার্থক্য করতে শেখে।

এই প্রক্রিয়াটি এমনভাবে কাজ করে যে Generator প্রতিনিয়ত উন্নত হয় এবং আরও বাস্তবসম্মত ছবি তৈরি করতে সক্ষম হয়।

GAN দিয়ে Image Generation এর প্রক্রিয়া:

Generator:
- Generator মডেলটি একটি random noise vector (এটি সাধারণত Gaussian noise) গ্রহণ করে এবং সেই noise-কে ইমেজে রূপান্তরিত করে। এই ইমেজটি fake হওয়া সত্ত্বেও Discriminator এর জন্য যতটা সম্ভব realistic হওয়া উচিত।
Discriminator:
- Discriminator মডেলটি একটি চিত্র গ্রহণ করে এবং তা real (বাস্তব) নাকি fake (ফেক) তা চিহ্নিত করার চেষ্টা করে।
Adversarial Training:
- Generator এবং Discriminator একে অপরের বিরুদ্ধে কাজ করে। Generator এর লক্ষ্য হল এমন fake images তৈরি করা যা Discriminator ভুলে যায় এবং real images হিসেবে চিহ্নিত করে।
- Discriminator এর লক্ষ্য হল সঠিকভাবে real এবং fake ইমেজ চিহ্নিত করা।
Loss Function:
- Generator Loss: এটি Discriminator কে প্রতারিত করার চেষ্টা করে।
- Discriminator Loss: এটি fake এবং real ইমেজ সঠিকভাবে আলাদা করার চেষ্টা করে।

এই দুইটি মডেল একে অপরকে প্রশিক্ষিত করতে থাকে এবং শেষমেশ Generator অনেক ভালো মানের ইমেজ তৈরি করতে সক্ষম হয়।

Image Generation with GAN Example in TensorFlow/Keras:

এখানে একটি সাধারণ GAN মডেল তৈরি করা হবে যা MNIST dataset (হাতের লেখা ডিজিটের ছবি) দিয়ে ইমেজ তৈরি করবে। নিচে কোডটি দেওয়া হলো:

import tensorflow as tf
from tensorflow.keras import layers, models
import matplotlib.pyplot as plt

# Load MNIST dataset
(x_train, _), (_, _) = tf.keras.datasets.mnist.load_data()
x_train = x_train.astype('float32') / 255.0
x_train = x_train.reshape((-1, 28, 28, 1))

# Define the Generator model
def build_generator():
    model = models.Sequential()
    model.add(layers.Dense(128, input_dim=100, activation='relu'))
    model.add(layers.BatchNormalization())
    model.add(layers.Dense(256, activation='relu'))
    model.add(layers.BatchNormalization())
    model.add(layers.Dense(512, activation='relu'))
    model.add(layers.BatchNormalization())
    model.add(layers.Dense(1024, activation='relu'))
    model.add(layers.BatchNormalization())
    model.add(layers.Dense(28 * 28 * 1, activation='sigmoid'))
    model.add(layers.Reshape((28, 28, 1)))
    return model

# Define the Discriminator model
def build_discriminator():
    model = models.Sequential()
    model.add(layers.Flatten(input_shape=(28, 28, 1)))
    model.add(layers.Dense(1024, activation='relu'))
    model.add(layers.Dense(512, activation='relu'))
    model.add(layers.Dense(256, activation='relu'))
    model.add(layers.Dense(1, activation='sigmoid'))
    return model

# Build the GAN model (combine Generator and Discriminator)
def build_gan(generator, discriminator):
    model = models.Sequential()
    model.add(generator)
    discriminator.trainable = False
    model.add(discriminator)
    return model

# Create and compile the models
generator = build_generator()
discriminator = build_discriminator()
discriminator.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])

# Combine the generator and discriminator into a GAN
gan = build_gan(generator, discriminator)
gan.compile(optimizer='adam', loss='binary_crossentropy')

# Training parameters
epochs = 10000
batch_size = 128
half_batch = batch_size // 2

# Training the GAN
for epoch in range(epochs):
    # Train discriminator with real images
    idx = np.random.randint(0, x_train.shape[0], half_batch)
    real_images = x_train[idx]
    real_labels = np.ones((half_batch, 1))
    
    # Train discriminator with fake images generated by the generator
    noise = np.random.normal(0, 1, (half_batch, 100))
    fake_images = generator.predict(noise)
    fake_labels = np.zeros((half_batch, 1))
    
    # Train the discriminator
    discriminator_loss_real = discriminator.train_on_batch(real_images, real_labels)
    discriminator_loss_fake = discriminator.train_on_batch(fake_images, fake_labels)
    
    # Train the generator via the GAN (keep discriminator's weights frozen)
    noise = np.random.normal(0, 1, (batch_size, 100))
    valid_labels = np.ones((batch_size, 1))
    generator_loss = gan.train_on_batch(noise, valid_labels)
    
    # Print progress
    if epoch % 1000 == 0:
        print(f"{epoch} [D loss: {0.5 * np.add(discriminator_loss_real, discriminator_loss_fake)}] [G loss: {generator_loss}]")
    
    # Save generated images periodically
    if epoch % 5000 == 0:
        noise = np.random.normal(0, 1, (25, 100))
        generated_images = generator.predict(noise)
        generated_images = generated_images.reshape(25, 28, 28)
        
        fig, axs = plt.subplots(5, 5)
        cnt = 0
        for i in range(5):
            for j in range(5):
                axs[i, j].imshow(generated_images[cnt], cmap='gray')
                axs[i, j].axis('off')
                cnt += 1
        plt.show()

কোড ব্যাখ্যা:

MNIST Dataset:
- MNIST dataset (হাতের লেখা ডিজিট) লোড করা হয় এবং এটি 0 থেকে 1 এর মধ্যে স্কেল করা হয় এবং 28x28 পিক্সেল ইমেজ আকারে রূপান্তরিত করা হয়।
Generator Model:
- Generator একটি নিউরাল নেটওয়ার্ক যা ইনপুট হিসেবে random noise (Gaussian noise) গ্রহণ করে এবং সেটি 28x28 পিক্সেল ইমেজে রূপান্তরিত করে।
- এটি fully connected layers এবং batch normalization ব্যবহার করে।
Discriminator Model:
- Discriminator একটি ক্লাসিফায়ার যা ইমেজটি real নাকি fake তা চিহ্নিত করে। এটি fully connected layers ব্যবহার করে এবং শেষে sigmoid activation দিয়ে আউটপুট দেয়।
GAN Model:
- GAN মডেলটি Generator এবং Discriminator মডেলগুলি একত্রিত করে। এখানে Discriminator শুধুমাত্র real বা fake ইমেজ চিহ্নিত করে এবং Generator এর লক্ষ্য হল এমন ইমেজ তৈরি করা যা Discriminator ভুলে "real" হিসেবে চিহ্নিত করবে।
Training:
- Discriminator প্রথমে real এবং fake ইমেজের উপর প্রশিক্ষিত হয়।
- তারপর Generator এর প্রশিক্ষণ চলে যেখানে এটি Discriminator কে প্রতারিত করতে শেখে, অর্থাৎ fake ইমেজগুলোকে real হিসেবে চিহ্নিত করতে চেষ্টা করে।
- প্রতিটি epoch শেষে ইমেজগুলি সেভ করা হয় এবং পর্যায়ক্রমে generated images প্রদর্শন করা হয়।

GAN এর সুবিধা:

Realistic Image Generation: GANs অত্যন্ত বাস্তবসম্মত ইমেজ তৈরি করতে সক্ষম যা প্রাকৃতিক চিত্রের মতো দেখায়।
Creative Applications: চিত্র সৃষ্টির জন্য ব্যবহার করা যেতে পারে যেমন ডিজাইনারদের জন্য নতুন ডিজাইন বা সৃজনশীল কাজ।
Data Augmentation: GANs নতুন ডেটা তৈরি করতে পারে, বিশেষত যখন ডেটা কম থাকে।

সারাংশ:

GANs এর মাধ্যমে Image Generation একটি শক্তিশালী প্রযুক্তি যা Generator এবং Discriminator এর মধ্যে প্রতিযোগিতার মাধ্যমে কাজ করে। এটি বাস্তবসম্মত এবং সৃজনশীল ইমেজ তৈরি করার জন্য ব্যবহ

ৃত হয়। Keras এবং TensorFlow এর মাধ্যমে GAN মডেল তৈরি এবং প্রশিক্ষিত করা যেতে পারে এবং এটি বিভিন্ন image generation অ্যাপ্লিকেশন যেমন ডিজিটাল আর্ট, সিমুলেশন, এবং ডেটা অগমেন্টেশনে ব্যবহার করা যেতে পারে।

Content added By

SATT Academy

GAN এর ধারণা এবং কাজের পদ্ধতি Generator এবং Discriminator এর ভূমিকা GAN এর বাস্তব উদাহরণ

GAN দিয়ে Image Generation

Image Generation with GAN:

GAN দিয়ে Image Generation এর প্রক্রিয়া:

Image Generation with GAN Example in TensorFlow/Keras:

কোড ব্যাখ্যা:

GAN এর সুবিধা:

সারাংশ:

Promotion

Satt AI

Hi, আমি SATT AI!

GAN দিয়ে Image Generation

Image Generation with GAN:

GAN দিয়ে Image Generation এর প্রক্রিয়া:

Image Generation with GAN Example in TensorFlow/Keras:

কোড ব্যাখ্যা:

GAN এর সুবিধা:

সারাংশ:

All Notifications

Promotion

Satt AI

Hi, আমি SATT AI!