Big Data and Analytics Sqoop এর মাধ্যমে Relational Database থেকে Data Import এবং Export গাইড ও নোট

283

Sqoop (SQL-to-Hadoop) হলো একটি ওপেন সোর্স টুল যা হাদুপ (Hadoop) এবং রিলেশনাল ডেটাবেস (RDBMS) এর মধ্যে ডেটা ট্রান্সফার করতে ব্যবহৃত হয়। এটি ব্যবহারকারীদের সহজেই ডেটা রিলেশনাল ডেটাবেস থেকে হাদুপ ক্লাস্টারে HDFS (Hadoop Distributed File System), Hive, HBase ইত্যাদিতে ইম্পোর্ট এবং এক্সপোর্ট করার সুযোগ দেয়। Sqoop ডেটাবেসের টেবিলগুলোকে সোজা হাদুপ ফাইল সিস্টেমে নিয়ে আসতে পারে এবং সেখান থেকে ডেটা আবার রিলেশনাল ডেটাবেসে পাঠাতে পারে।


Sqoop এর সুবিধা

  1. ডেটা ইম্পোর্ট এবং এক্সপোর্ট সহজ:
    Sqoop দিয়ে RDBMS থেকে ডেটা হাদুপ সিস্টেমে এবং হাদুপ থেকে RDBMS এ ডেটা পাঠানো খুব সহজ হয়।
  2. পারফরম্যান্স:
    এটি ডেটা ইম্পোর্ট এবং এক্সপোর্ট করার সময় পারফরম্যান্স অপটিমাইজেশন সরবরাহ করে, যেমন ডেটার পার্টিশনিং এর মাধ্যমে দ্রুত ডেটা স্থানান্তর।
  3. স্বয়ংক্রিয়:
    Sqoop স্বয়ংক্রিয়ভাবে RDBMS এবং Hadoop-এর মধ্যে ডেটা স্থানান্তর পরিচালনা করতে সক্ষম, ফলে ডেটা ট্রান্সফার সহজ এবং নির্ভরযোগ্য হয়।
  4. পাশাপাশি একাধিক ডেটাবেস:
    এটি একসাথে একাধিক ডেটাবেস থেকে ডেটা ইম্পোর্ট করতে সক্ষম, যা বড় ডেটা সেট ম্যানেজমেন্টে সাহায্য করে।

Sqoop এর মাধ্যমে Data Import

Sqoop Import কমান্ডটি RDBMS থেকে হাদুপ সিস্টেমে ডেটা ইম্পোর্ট করতে ব্যবহৃত হয়। সাধারণত এটি HDFS, Hive, বা HBase-এ ডেটা স্থানান্তর করতে ব্যবহৃত হয়। ডেটা ইম্পোর্ট করার জন্য ডেটাবেসের সার্ভার, টেবিল, এবং অন্যান্য প্রয়োজনীয় তথ্য প্রদান করতে হয়।

Sqoop Import এর সাধারণ সিনট্যাক্স:

sqoop import --connect jdbc:mysql://localhost/mydatabase \
--username root --password password \
--table mytable --target-dir /user/hadoop/mytable_data

এখানে:

  • --connect: ডেটাবেসের URL যেখানে ডেটা ইম্পোর্ট করা হবে।
  • --username: ডেটাবেস ইউজারনেম।
  • --password: ডেটাবেস পাসওয়ার্ড।
  • --table: যে টেবিলটি ইম্পোর্ট করতে হবে।
  • --target-dir: যেখানে ডেটা HDFS বা অন্য কোনো ডেটাবেসে স্টোর করতে হবে।

Sqoop Import উদাহরণ:

ধরা যাক, আপনার MySQL ডেটাবেসে employees নামে একটি টেবিল রয়েছে এবং আপনি এটিকে HDFS-এ ইম্পোর্ট করতে চান:

sqoop import --connect jdbc:mysql://localhost/employees_db \
--username admin --password admin123 \
--table employees --target-dir /user/hadoop/employees_data

এটি MySQL থেকে employees টেবিলের ডেটা HDFS-এর /user/hadoop/employees_data ডিরেক্টরিতে ইম্পোর্ট করবে।


Sqoop এর মাধ্যমে Data Export

Sqoop Export কমান্ডটি হাদুপ সিস্টেমে থাকা ডেটা রিলেশনাল ডেটাবেসে এক্সপোর্ট করতে ব্যবহৃত হয়। এটি সাধারণত HDFS, Hive, বা HBase থেকে ডেটাবেসে ডেটা পাঠাতে ব্যবহৃত হয়।

Sqoop Export এর সাধারণ সিনট্যাক্স:

sqoop export --connect jdbc:mysql://localhost/mydatabase \
--username root --password password \
--table mytable --export-dir /user/hadoop/mytable_data

এখানে:

  • --connect: ডেটাবেসের URL যেখানে ডেটা এক্সপোর্ট করা হবে।
  • --username: ডেটাবেস ইউজারনেম।
  • --password: ডেটাবেস পাসওয়ার্ড।
  • --table: যে টেবিলটিতে ডেটা এক্সপোর্ট করা হবে।
  • --export-dir: HDFS থেকে এক্সপোর্ট করার জন্য ডেটার ডিরেক্টরি।

Sqoop Export উদাহরণ:

ধরা যাক, আপনি HDFS থেকে MySQL ডেটাবেসের employees টেবিলে ডেটা এক্সপোর্ট করতে চান:

sqoop export --connect jdbc:mysql://localhost/employees_db \
--username admin --password admin123 \
--table employees --export-dir /user/hadoop/employees_data

এটি HDFS-এর /user/hadoop/employees_data ডিরেক্টরি থেকে ডেটা MySQL ডেটাবেসের employees টেবিলে এক্সপোর্ট করবে।


Sqoop এর মাধ্যমে Data Import এবং Export এর বিভিন্ন অপশন

  1. --split-by:
    এটি split অপশন, যা ডেটার পার্টিশন তৈরি করতে ব্যবহৃত হয়। এতে ডেটা দ্রুত ইম্পোর্ট এবং এক্সপোর্ট করা যায়। সাধারণত ইনক্রিমেন্টাল ইম্পোর্ট এবং এক্সপোর্টের জন্য ব্যবহৃত হয়।

    উদাহরণ:

    sqoop import --connect jdbc:mysql://localhost/mydatabase \
    --table employees --split-by id --target-dir /user/hadoop/employees_data
    
  2. --where:
    এটি একটি WHERE ক্লজ ব্যবহার করে শুধুমাত্র নির্দিষ্ট ডেটা ইম্পোর্ট বা এক্সপোর্ট করতে ব্যবহৃত হয়।

    উদাহরণ:

    sqoop import --connect jdbc:mysql://localhost/mydatabase \
    --table employees --where "age > 30" --target-dir /user/hadoop/employees_data
    
  3. --fields-terminated-by:
    এটি ফাইলের মধ্যে ডেটার সেপারেটর নির্ধারণ করে (যেমন কমা বা ট্যাব)। এই অপশনটি সাধারণত CSV ফাইল ইম্পোর্ট এবং এক্সপোর্টের জন্য ব্যবহৃত হয়।

    উদাহরণ:

    sqoop export --connect jdbc:mysql://localhost/mydatabase \
    --table employees --export-dir /user/hadoop/employees_data \
    --fields-terminated-by ','
    

সারাংশ

Sqoop একটি অত্যন্ত কার্যকরী এবং শক্তিশালী টুল যা রিলেশনাল ডেটাবেস এবং হাদুপ সিস্টেমের মধ্যে ডেটা ইম্পোর্ট এবং এক্সপোর্ট করার জন্য ব্যবহৃত হয়। এটি রিলেশনাল ডেটাবেস থেকে HDFS, Hive, এবং HBase তে ডেটা ইম্পোর্ট করতে এবং সেখান থেকে ডেটা এক্সপোর্ট করতে সাহায্য করে। Sqoop ডেটার পারফরম্যান্স উন্নত করার জন্য split-by, where, এবং fields-terminated-by এর মতো অপশন প্রদান করে, যা ডেটা স্থানান্তর প্রক্রিয়াকে আরও দ্রুত এবং কার্যকরী করে তোলে।


Content added By
Promotion

Are you sure to start over?

Loading...