পাইথন একটি অত্যন্ত শক্তিশালী ভাষা এবং এর মাধ্যমে ফাইল হ্যান্ডলিং এবং ডেটা ম্যানিপুলেশন খুব সহজেই করা যায়। এখানে ফাইল সংরক্ষণ, পড়া, লেখা এবং ডেটা প্রক্রিয়াকরণ সম্পর্কিত কয়েকটি গুরুত্বপূর্ণ ধারণা এবং কৌশল আলোচনা করা হলো।
১. ফাইল হ্যান্ডলিং (File Handling)
পাইথন ব্যবহার করে ফাইল পড়া, লেখা এবং সম্পাদনা করা অত্যন্ত সহজ। ফাইল হ্যান্ডলিংয়ের জন্য পাইথন built-in open() ফাংশন ব্যবহার করে।
ফাইল খোলা এবং বন্ধ করা:
# ফাইল খোলা
file = open('example.txt', 'r') # 'r' মানে রিড মোড
# ফাইল পড়া
content = file.read()
print(content)
# ফাইল বন্ধ করা
file.close()
এখানে, open() ফাংশন দুইটি প্যারামিটার নেয়:
- প্রথম প্যারামিটার: ফাইলের নাম।
- দ্বিতীয় প্যারামিটার: মোড (যেমন,
r=read,w=write,a=append)।
ফাইলের মধ্যে লেখা:
# ফাইল লিখতে 'w' মোড ব্যবহার করা হয়
file = open('example.txt', 'w')
# ফাইলে লেখা
file.write("Hello, World!")
# ফাইল বন্ধ করা
file.close()
with statement ব্যবহার:
ফাইল খোলার এবং বন্ধ করার প্রক্রিয়া স্বয়ংক্রিয়ভাবে করতে with ব্যবহার করা হয়, যাতে ফাইলটি নিজে নিজে বন্ধ হয়ে যায়।
# ফাইল পড়া 'with' ব্যবহারে
with open('example.txt', 'r') as file:
content = file.read()
print(content)
# ফাইল লেখার জন্য 'with'
with open('example.txt', 'w') as file:
file.write("This is a new line.")
২. ডেটা ম্যানিপুলেশন (Data Manipulation)
পাইথন বিভিন্ন লাইব্রেরি যেমন Pandas এবং NumPy ব্যবহার করে ডেটা ম্যানিপুলেশন করতে খুবই সুবিধাজনক। এখানে Pandas লাইব্রেরি ব্যবহার করে ডেটা ম্যানিপুলেশন বিষয়ক কিছু সাধারণ কাজ দেখানো হলো।
Pandas ইনস্টল এবং ইমপোর্ট করা:
pip install pandas
import pandas as pd
CSV ফাইল থেকে ডেটা পড়া:
# CSV ফাইল থেকে ডেটা পড়া
df = pd.read_csv('data.csv')
print(df)
ডেটা ফ্রেম (DataFrame) তৈরি করা:
# ডেটা ফ্রেম তৈরি
data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35]}
df = pd.DataFrame(data)
print(df)
ডেটা ফ্রেমে নতুন কলাম যোগ করা:
# নতুন কলাম যোগ করা
df['Salary'] = [50000, 60000, 70000]
print(df)
ডেটা ফ্রেম থেকে সারি নির্বাচন:
# প্রথম সারি নির্বাচন
print(df.iloc[0])
# নির্দিষ্ট শর্তে সারি নির্বাচন (যেমন, বয়স ৩০ এর বেশি)
print(df[df['Age'] > 30])
ডেটা ফ্রেমের ডেটা আপডেট করা:
# নির্দিষ্ট মান পরিবর্তন করা
df.loc[df['Name'] == 'Alice', 'Salary'] = 55000
print(df)
ডেটা ফ্রেমে গাণিতিক অপারেশন:
# গাণিতিক অপারেশন
df['Age'] = df['Age'] + 1
print(df)
CSV ফাইলে ডেটা সংরক্ষণ:
# ডেটা ফ্রেম CSV ফাইলে সেভ করা
df.to_csv('updated_data.csv', index=False)
৩. NumPy দিয়ে ডেটা ম্যানিপুলেশন
NumPy লাইব্রেরি মেট্রিক্স এবং অ্যারে ভিত্তিক ডেটা প্রক্রিয়াকরণের জন্য ব্যবহৃত হয়।
NumPy ইনস্টল এবং ইমপোর্ট করা:
pip install numpy
import numpy as np
NumPy অ্যারে তৈরি করা:
# একক ডাইমেনশনের অ্যারে তৈরি
arr = np.array([1, 2, 3, 4, 5])
print(arr)
# দ্বি-ডাইমেনশনাল অ্যারে তৈরি
arr2d = np.array([[1, 2, 3], [4, 5, 6]])
print(arr2d)
অ্যারে থেকে ভ্যালু চয়ন:
# অ্যারে থেকে নির্দিষ্ট ভ্যালু নির্বাচন
print(arr[2]) # ইনডেক্স ২ থেকে মান নির্বাচন (3)
অ্যারে ম্যানিপুলেশন:
# অ্যারে যোগ করা
arr = arr + 5
print(arr)
# অ্যারে গুন করা
arr = arr * 2
print(arr)
ম্যাট্রিক্স অপারেশন:
# ম্যাট্রিক্স যোগ করা
arr1 = np.array([[1, 2], [3, 4]])
arr2 = np.array([[5, 6], [7, 8]])
result = np.add(arr1, arr2)
print(result)
অ্যারে স্লাইসিং:
# স্লাইসিং
print(arr2d[0, 1]) # প্রথম সারির দ্বিতীয় কলাম
সারাংশ
- ফাইল হ্যান্ডলিং: পাইথনে
open()ফাংশন ব্যবহার করে ফাইল পড়া, লেখা এবং বন্ধ করা যায়।withstatement দিয়ে ফাইলটি স্বয়ংক্রিয়ভাবে বন্ধ করা যায়। - ডেটা ম্যানিপুলেশন: Pandas এবং NumPy লাইব্রেরি দিয়ে ডেটা ফ্রেম তৈরি, বিশ্লেষণ, আপডেট এবং ফাইল সংরক্ষণ করা সহজ হয়।
- NumPy দিয়ে অ্যারে এবং ম্যাট্রিক্স ভিত্তিক গণনা করা যায়, এবং Pandas দিয়ে টেবুলার ডেটা বিশ্লেষণ ও প্রক্রিয়াকরণ করা হয়।
এই টুলগুলি ডেটা সায়েন্স, মেশিন লার্নিং, এবং কৃত্রিম বুদ্ধিমত্তা (AI) প্রজেক্টের জন্য অত্যন্ত গুরুত্বপূর্ণ।