String থেকে HTML লোড করা

HTML ডকুমেন্ট পার্সিং - জেসুপ (JSoup) - Java Technologies

331

জেসুপ (JSoup) ব্যবহার করে আপনি একটি String থেকে HTML লোড করতে পারেন এবং সেটি পার্স (parse) করে ডকুমেন্ট অবজেক্ট মডেল (DOM) তৈরি করতে পারেন। এটি ওয়েব স্ক্র্যাপিং বা HTML ডকুমেন্ট ম্যানিপুলেশন করার জন্য উপকারী। Jsoup.parse() মেথড ব্যবহার করে HTML string থেকে ডকুমেন্ট তৈরি করা হয় এবং সেই ডকুমেন্টের উপাদানগুলির সাথে কাজ করা সম্ভব হয়।


উদাহরণ: String থেকে HTML লোড করা

নিচে একটি উদাহরণ দেওয়া হল যেখানে String থেকে HTML লোড করা হয়েছে এবং সেই HTML এর বিভিন্ন উপাদান এক্সট্র্যাক্ট করা হয়েছে:

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;

public class JsoupExample {
    public static void main(String[] args) throws Exception {
        // HTML কোড একটি স্ট্রিং (String) আকারে
        String html = "<html><head><title>JSoup Example</title></head><body><h1>Welcome to JSoup</h1><p>This is a paragraph.</p></body></html>";
        
        // Jsoup.parse() মেথড ব্যবহার করে String থেকে HTML লোড করা
        Document doc = Jsoup.parse(html);
        
        // HTML ডকুমেন্টের শিরোনাম এবং প্যারাগ্রাফ এক্সট্র্যাক্ট করা
        String title = doc.title();
        Element heading = doc.select("h1").first();
        Element paragraph = doc.select("p").first();
        
        System.out.println("Title: " + title);           // JSoup Example
        System.out.println("Heading: " + heading.text()); // Welcome to JSoup
        System.out.println("Paragraph: " + paragraph.text()); // This is a paragraph.
    }
}

ব্যাখ্যা

  • Jsoup.parse(): এটি একটি স্ট্যাটিক মেথড যা HTML কোডকে একটি String আকারে গ্রহণ করে এবং সেটি পার্স (parse) করে একটি Document অবজেক্ট তৈরি করে।
  • title(): এটি ডকুমেন্টের শিরোনাম (title) ফেরত দেয়।
  • select(): এই মেথডটি CSS সিলেক্টর ব্যবহার করে HTML উপাদান (elements) নির্বাচন করে। উদাহরণস্বরূপ, h1 সিলেক্টর ব্যবহার করে আমরা <h1> ট্যাগের টেক্সট বের করতে পারি।

সারাংশ

জেসুপ (JSoup) এর মাধ্যমে একটি String থেকে HTML লোড করা খুব সহজ এবং কার্যকর। Jsoup.parse() মেথড ব্যবহার করে আপনি HTML স্ট্রিংকে পার্স (parse) করে ডকুমেন্ট অবজেক্ট তৈরি করতে পারেন এবং পরে সেই ডকুমেন্টের উপাদানগুলির সাথে কাজ করতে পারেন, যেমন শিরোনাম, প্যারাগ্রাফ এবং অন্যান্য HTML ট্যাগের তথ্য এক্সট্র্যাক্ট করা।

Content added By
Promotion

Are you sure to start over?

Loading...