ফাইল হ্যান্ডলিং এবং ডেটা ম্যানিপুলেশন

Python এর মৌলিক ধারণা (AI প্রজেক্টের জন্য) - পাইথন কৃত্রিম বুদ্ধিমত্তা (Artificial Intelligence with Python) - Machine Learning

344

পাইথন একটি অত্যন্ত শক্তিশালী ভাষা এবং এর মাধ্যমে ফাইল হ্যান্ডলিং এবং ডেটা ম্যানিপুলেশন খুব সহজেই করা যায়। এখানে ফাইল সংরক্ষণ, পড়া, লেখা এবং ডেটা প্রক্রিয়াকরণ সম্পর্কিত কয়েকটি গুরুত্বপূর্ণ ধারণা এবং কৌশল আলোচনা করা হলো।


১. ফাইল হ্যান্ডলিং (File Handling)

পাইথন ব্যবহার করে ফাইল পড়া, লেখা এবং সম্পাদনা করা অত্যন্ত সহজ। ফাইল হ্যান্ডলিংয়ের জন্য পাইথন built-in open() ফাংশন ব্যবহার করে।

ফাইল খোলা এবং বন্ধ করা:

# ফাইল খোলা
file = open('example.txt', 'r')  # 'r' মানে রিড মোড

# ফাইল পড়া
content = file.read()
print(content)

# ফাইল বন্ধ করা
file.close()

এখানে, open() ফাংশন দুইটি প্যারামিটার নেয়:

  • প্রথম প্যারামিটার: ফাইলের নাম।
  • দ্বিতীয় প্যারামিটার: মোড (যেমন, r=read, w=write, a=append)।

ফাইলের মধ্যে লেখা:

# ফাইল লিখতে 'w' মোড ব্যবহার করা হয়
file = open('example.txt', 'w')

# ফাইলে লেখা
file.write("Hello, World!")

# ফাইল বন্ধ করা
file.close()

with statement ব্যবহার:

ফাইল খোলার এবং বন্ধ করার প্রক্রিয়া স্বয়ংক্রিয়ভাবে করতে with ব্যবহার করা হয়, যাতে ফাইলটি নিজে নিজে বন্ধ হয়ে যায়।

# ফাইল পড়া 'with' ব্যবহারে
with open('example.txt', 'r') as file:
    content = file.read()
    print(content)

# ফাইল লেখার জন্য 'with'
with open('example.txt', 'w') as file:
    file.write("This is a new line.")

২. ডেটা ম্যানিপুলেশন (Data Manipulation)

পাইথন বিভিন্ন লাইব্রেরি যেমন Pandas এবং NumPy ব্যবহার করে ডেটা ম্যানিপুলেশন করতে খুবই সুবিধাজনক। এখানে Pandas লাইব্রেরি ব্যবহার করে ডেটা ম্যানিপুলেশন বিষয়ক কিছু সাধারণ কাজ দেখানো হলো।

Pandas ইনস্টল এবং ইমপোর্ট করা:

pip install pandas
import pandas as pd

CSV ফাইল থেকে ডেটা পড়া:

# CSV ফাইল থেকে ডেটা পড়া
df = pd.read_csv('data.csv')
print(df)

ডেটা ফ্রেম (DataFrame) তৈরি করা:

# ডেটা ফ্রেম তৈরি
data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35]}
df = pd.DataFrame(data)
print(df)

ডেটা ফ্রেমে নতুন কলাম যোগ করা:

# নতুন কলাম যোগ করা
df['Salary'] = [50000, 60000, 70000]
print(df)

ডেটা ফ্রেম থেকে সারি নির্বাচন:

# প্রথম সারি নির্বাচন
print(df.iloc[0])

# নির্দিষ্ট শর্তে সারি নির্বাচন (যেমন, বয়স ৩০ এর বেশি)
print(df[df['Age'] > 30])

ডেটা ফ্রেমের ডেটা আপডেট করা:

# নির্দিষ্ট মান পরিবর্তন করা
df.loc[df['Name'] == 'Alice', 'Salary'] = 55000
print(df)

ডেটা ফ্রেমে গাণিতিক অপারেশন:

# গাণিতিক অপারেশন
df['Age'] = df['Age'] + 1
print(df)

CSV ফাইলে ডেটা সংরক্ষণ:

# ডেটা ফ্রেম CSV ফাইলে সেভ করা
df.to_csv('updated_data.csv', index=False)

৩. NumPy দিয়ে ডেটা ম্যানিপুলেশন

NumPy লাইব্রেরি মেট্রিক্স এবং অ্যারে ভিত্তিক ডেটা প্রক্রিয়াকরণের জন্য ব্যবহৃত হয়।

NumPy ইনস্টল এবং ইমপোর্ট করা:

pip install numpy
import numpy as np

NumPy অ্যারে তৈরি করা:

# একক ডাইমেনশনের অ্যারে তৈরি
arr = np.array([1, 2, 3, 4, 5])
print(arr)

# দ্বি-ডাইমেনশনাল অ্যারে তৈরি
arr2d = np.array([[1, 2, 3], [4, 5, 6]])
print(arr2d)

অ্যারে থেকে ভ্যালু চয়ন:

# অ্যারে থেকে নির্দিষ্ট ভ্যালু নির্বাচন
print(arr[2])  # ইনডেক্স ২ থেকে মান নির্বাচন (3)

অ্যারে ম্যানিপুলেশন:

# অ্যারে যোগ করা
arr = arr + 5
print(arr)

# অ্যারে গুন করা
arr = arr * 2
print(arr)

ম্যাট্রিক্স অপারেশন:

# ম্যাট্রিক্স যোগ করা
arr1 = np.array([[1, 2], [3, 4]])
arr2 = np.array([[5, 6], [7, 8]])
result = np.add(arr1, arr2)
print(result)

অ্যারে স্লাইসিং:

# স্লাইসিং
print(arr2d[0, 1])  # প্রথম সারির দ্বিতীয় কলাম

সারাংশ

  • ফাইল হ্যান্ডলিং: পাইথনে open() ফাংশন ব্যবহার করে ফাইল পড়া, লেখা এবং বন্ধ করা যায়। with statement দিয়ে ফাইলটি স্বয়ংক্রিয়ভাবে বন্ধ করা যায়।
  • ডেটা ম্যানিপুলেশন: Pandas এবং NumPy লাইব্রেরি দিয়ে ডেটা ফ্রেম তৈরি, বিশ্লেষণ, আপডেট এবং ফাইল সংরক্ষণ করা সহজ হয়।
  • NumPy দিয়ে অ্যারে এবং ম্যাট্রিক্স ভিত্তিক গণনা করা যায়, এবং Pandas দিয়ে টেবুলার ডেটা বিশ্লেষণ ও প্রক্রিয়াকরণ করা হয়।

এই টুলগুলি ডেটা সায়েন্স, মেশিন লার্নিং, এবং কৃত্রিম বুদ্ধিমত্তা (AI) প্রজেক্টের জন্য অত্যন্ত গুরুত্বপূর্ণ।

Content added By
Promotion

Are you sure to start over?

Loading...