উদাহরণ সহ DOM পার্সিং এবং ডেটা এক্সট্র্যাকশন

DOM (Document Object Model) পার্সার - জাভা এক্সএমএল (Java XML) - Java Technologies

272

Java XML (Java API for XML Processing) হলো জাভা প্রোগ্রামিং ভাষার একটি অংশ যা XML (eXtensible Markup Language) ডেটা পার্স, প্রোসেস এবং ম্যানিপুলেট করতে ব্যবহৃত হয়। XML একটি মানক মার্কআপ ভাষা যা ডেটা স্টোর এবং ট্রান্সফার করতে ব্যবহৃত হয়। জাভা এক্সএমএল টেকনোলজি বিভিন্ন ধরনের XML ডেটা প্রক্রিয়া করার জন্য লাইব্রেরি এবং API প্রদান করে। এর মধ্যে DOM (Document Object Model) পার্সিং একটি জনপ্রিয় পদ্ধতি।

DOM পার্সিং (Document Object Model Parsing)

DOM হলো একটি টেকনিক যা XML ডকুমেন্টকে একটি গাছের (Tree) আকারে মেমরিতে লোড করে এবং ডকুমেন্টের সব এলিমেন্ট এবং এট্রিবিউটগুলোকে এক্সেস করতে দেয়। DOM পার্সিং XML ডকুমেন্টকে এক্সেস এবং ম্যানিপুলেট করার জন্য সবচেয়ে সাধারণ এবং সহজ পদ্ধতি। DOM ডকুমেন্টকে একটি সম্পূর্ণ হায়ারারকিক্যাল গঠন হিসেবে ধারণ করে, যেখানে প্রতিটি এলিমেন্ট একটি নোড হিসেবে প্রতিনিধিত্ব করে।

DOM পার্সিং-এর প্রক্রিয়া:

  1. XML ডকুমেন্ট লোড করা: প্রথমে XML ডকুমেন্টটি DOM পার্সার দিয়ে মেমরিতে লোড করা হয়।
  2. নোড এক্সেস করা: ডকুমেন্টের প্রতিটি এলিমেন্ট বা নোডকে এক্সেস করা হয়।
  3. ডেটা এক্সট্র্যাকশন: পার্স করা ডকুমেন্ট থেকে প্রয়োজনীয় তথ্য সংগ্রহ করা হয়।

উদাহরণ সহ DOM পার্সিং এবং ডেটা এক্সট্র্যাকশন

নিচে একটি উদাহরণ দেওয়া হল যেখানে একটি XML ডকুমেন্ট পার্স করা হয়েছে এবং DOM পার্সিং ব্যবহার করে ডেটা এক্সট্র্যাক্ট করা হয়েছে।

XML ডকুমেন্ট (example.xml):

<?xml version="1.0" encoding="UTF-8"?>
<library>
    <book>
        <title>Java Programming</title>
        <author>John Doe</author>
        <price>29.99</price>
    </book>
    <book>
        <title>XML for Beginners</title>
        <author>Jane Smith</author>
        <price>19.99</price>
    </book>
</library>

Java কোড (DOM Parsing):

import javax.xml.parsers.*;
import org.w3c.dom.*;
import java.io.*;

public class DOMParsingExample {

    public static void main(String[] args) {
        try {
            // XML ডকুমেন্ট পার্সিং
            File xmlFile = new File("example.xml");
            DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
            DocumentBuilder builder = factory.newDocumentBuilder();
            Document document = builder.parse(xmlFile);

            // ডকুমেন্টের রুট এলিমেন্ট
            document.getDocumentElement().normalize();

            // 'book' এলিমেন্টগুলোকে খুঁজে পাওয়া
            NodeList nodeList = document.getElementsByTagName("book");

            // প্রতিটি 'book' এলিমেন্টের তথ্য এক্সট্র্যাক্ট করা
            for (int i = 0; i < nodeList.getLength(); i++) {
                Node node = nodeList.item(i);

                if (node.getNodeType() == Node.ELEMENT_NODE) {
                    Element element = (Element) node;

                    // টাইটেল, অথর এবং প্রাইস এক্সট্র্যাক্ট করা
                    String title = element.getElementsByTagName("title").item(0).getTextContent();
                    String author = element.getElementsByTagName("author").item(0).getTextContent();
                    String price = element.getElementsByTagName("price").item(0).getTextContent();

                    // ফলাফল প্রদর্শন
                    System.out.println("Book Title: " + title);
                    System.out.println("Author: " + author);
                    System.out.println("Price: " + price);
                    System.out.println();
                }
            }

        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

কোড ব্যাখ্যা:

  1. XML ডকুমেন্ট লোড করা: DocumentBuilderFactory এবং DocumentBuilder ব্যবহার করে XML ডকুমেন্টটি লোড করা হয়।
  2. নোড এক্সেস করা: getElementsByTagName("book") দিয়ে book ট্যাগের সব এলিমেন্টগুলো পাওয়া যায়।
  3. ডেটা এক্সট্র্যাকশন: প্রতিটি book এলিমেন্ট থেকে title, author, এবং price এক্সট্র্যাক্ট করা হয় getElementsByTagName() মেথডের মাধ্যমে।

আউটপুট:

Book Title: Java Programming
Author: John Doe
Price: 29.99

Book Title: XML for Beginners
Author: Jane Smith
Price: 19.99

DOM পার্সিং এর সুবিধা:

  1. সহজ ব্যবহার: DOM পার্সিং খুব সহজ এবং ওয়েব ডেভেলপমেন্ট বা অ্যাপ্লিকেশন ডেভেলপমেন্টে খুবই জনপ্রিয়।
  2. পুরো XML ডকুমেন্ট মেমরিতে লোড: একবার XML ডকুমেন্ট মেমরিতে লোড হয়ে গেলে, আপনি যেকোনো অংশের ওপর কাজ করতে পারবেন।

DOM পার্সিং এর অসুবিধা:

  1. মেমরি ব্যবহার: পুরো XML ডকুমেন্ট মেমরিতে লোড হয়, তাই বড় XML ডকুমেন্টের জন্য মেমরি সমস্যা হতে পারে।
  2. পারফরম্যান্স: বড় XML ফাইল পার্স করার সময় পারফরম্যান্স কিছুটা কম হতে পারে।

DOM পার্সিং হল XML ডকুমেন্ট পার্স করার একটি শক্তিশালী পদ্ধতি। এটি বড় এবং জটিল XML ডকুমেন্টের জন্য উপযুক্ত এবং এতে XML ডেটার সব অংশের ওপর কাজ করার সুযোগ পাওয়া যায়। তবে, বড় XML ফাইলের ক্ষেত্রে মেমরি ব্যবহারের বিষয়টি মাথায় রাখা উচিত।

Content added By
Promotion

Are you sure to start over?

Loading...