Sentiment Analysis এবং Sequence Prediction

Natural Language Processing (NLP) - টেন্সরফ্লো (TensorFlow) - Machine Learning

331

Sentiment Analysis এবং Sequence Prediction দুইটি গুরুত্বপূর্ণ টাস্ক যা ডিপ লার্নিং এবং মেশিন লার্নিংয়ে ব্যাপকভাবে ব্যবহৃত হয়। এগুলি বিশেষত প্রাকৃতিক ভাষা প্রক্রিয়াকরণ (NLP) এর ক্ষেত্রে গুরুত্বপূর্ণ। টেনসরফ্লো ব্যবহার করে এই টাস্কগুলো করতে পারে, যেখানে সাধারণত রিকারেন্ট নিউরাল নেটওয়ার্ক (RNN), লং শর্ট-টার্ম মেমরি (LSTM) বা গ্রেডিয়েন্ট বুস্টিং প্রযুক্তি ব্যবহৃত হয়।

এখন, আসুন এই দুটি টাস্ক সম্পর্কে বিস্তারিত আলোচনা করি:

Sentiment Analysis (মনোভাব বিশ্লেষণ)

Sentiment Analysis হল একটি প্রক্রিয়া যার মাধ্যমে একটি টেক্সট ডেটার মধ্যে মানুষ বা লেখকের অনুভূতি বা মনোভাব শনাক্ত করা হয়। সাধারণত এটি তিনটি শ্রেণীতে ভাগ করা হয়:

ইতিবাচক (Positive)
নেতিবাচক (Negative)
নিরপেক্ষ (Neutral)

ব্যবহার:

পণ্য রিভিউ বিশ্লেষণ: পণ্য বা সেবার রিভিউ থেকে ব্যবহারকারীর অনুভূতি বুঝতে।
সোশ্যাল মিডিয়া মনিটরিং: টুইটার বা ফেসবুকের পোস্ট থেকে ব্র্যান্ড সম্পর্কে জনমত বা মনোভাব যাচাই করা।
ফিনান্সিয়াল মার্কেট প্রেডিকশন: সংবাদ বা সোশ্যাল মিডিয়া পোস্ট থেকে অর্থনৈতিক অবস্থার ভবিষ্যদ্বাণী করা।

Sentiment Analysis এর জন্য টেনসরফ্লো মডেল:

Sentiment Analysis করার জন্য সাধারণত লম্বা সিকোয়েন্স ডেটা থাকে, যেমন টেক্সটের বাক্য বা প্যারাগ্রাফ। এই ধরনের ডেটার জন্য LSTM বা GRU (Gated Recurrent Units) ব্যবহার করা হয়।

কোড উদাহরণ:

import tensorflow as tf
from tensorflow.keras.preprocessing.text import Tokenizer
from tensorflow.keras.preprocessing.sequence import pad_sequences

# টেক্সট ডেটা
sentences = [
    "I love this product",
    "This is the worst thing I have ever bought",
    "I am very happy with my purchase",
    "I will never buy this again"
]

# টোকেনাইজেশন
tokenizer = Tokenizer(num_words=100)
tokenizer.fit_on_texts(sentences)
sequences = tokenizer.texts_to_sequences(sentences)

# প্যাডিং
padded_sequences = pad_sequences(sequences, padding='post')

# সেন্টিমেন্ট এনালাইসিস মডেল
model = tf.keras.Sequential([
    tf.keras.layers.Embedding(input_dim=100, output_dim=64, input_length=len(padded_sequences[0])),
    tf.keras.layers.LSTM(128),
    tf.keras.layers.Dense(1, activation='sigmoid')
])

# মডেল কম্পাইল
model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])

# মডেল ট্রেনিং (যেমন: X_train, y_train)
model.fit(padded_sequences, y_train, epochs=5)

এই কোডটি সাধারণ সেন্টিমেন্ট বিশ্লেষণের জন্য একটি LSTM মডেল তৈরি করে, যা টেক্সট ডেটার অনুভূতি বা মনোভাব নির্ধারণ করতে সক্ষম।

Sequence Prediction (সিকোয়েন্স পূর্বাভাস)

Sequence Prediction হল একটি প্রক্রিয়া যেখানে পূর্ববর্তী সিকোয়েন্স ডেটা ব্যবহার করে ভবিষ্যতের সিকোয়েন্স বা মানের পূর্বাভাস করা হয়। এটি সময় সিরিজ ডেটা বা যেকোনো ধরনের ক্রমবর্ধমান ডেটার জন্য ব্যবহৃত হয়।

ব্যবহার:

টেক্সট জেনারেশন: একটি নির্দিষ্ট শৈলী বা বিষয়ের উপর ভিত্তি করে নতুন টেক্সট বা প্যারাগ্রাফ তৈরি করা।
মৌলিক সময় সিরিজ প্রেডিকশন: স্টক মার্কেট, আবহাওয়া পূর্বাভাস বা শক্তির চাহিদার পূর্বাভাস করা।
ভাষার অনুবাদ: একটি ভাষা থেকে অন্য ভাষায় অনুবাদ করতে সিকোয়েন্স-টু-সিকোয়েন্স মডেল ব্যবহার করা।

Sequence Prediction এর জন্য টেনসরফ্লো মডেল:

এক্ষেত্রে সাধারণত RNN, LSTM, বা GRU ব্যবহার করা হয়। এই মডেলগুলি সময়ভিত্তিক বা সিকোয়েন্স ডেটা ভালোভাবে প্রক্রিয়া করতে সক্ষম।

কোড উদাহরণ:

import numpy as np
import tensorflow as tf

# টাইম সিরিজ ডেটা (যেমন স্টক প্রাইস)
data = np.array([10, 20, 30, 40, 50, 60])

# সিকোয়েন্স তৈরি করা
def create_sequences(data, sequence_length):
    X = []
    y = []
    for i in range(len(data) - sequence_length):
        X.append(data[i:i+sequence_length])
        y.append(data[i+sequence_length])
    return np.array(X), np.array(y)

sequence_length = 3
X, y = create_sequences(data, sequence_length)

# LSTM মডেল
model = tf.keras.Sequential([
    tf.keras.layers.LSTM(50, activation='relu', input_shape=(X.shape[1], 1)),
    tf.keras.layers.Dense(1)
])

model.compile(optimizer='adam', loss='mse')

# মডেল ট্রেনিং
X = X.reshape(X.shape[0], X.shape[1], 1)  # LSTM এর জন্য 3D ইনপুট আকারে রূপান্তর
model.fit(X, y, epochs=200)

# ভবিষ্যতের মান পূর্বাভাস
predicted = model.predict(X[-1].reshape(1, sequence_length, 1))
print(predicted)

এই কোডটি একটি LSTM মডেল ব্যবহার করে একটি সিকোয়েন্স (যেমন স্টক প্রাইস) থেকে ভবিষ্যত মানের পূর্বাভাস দেয়।