জেসুপ (JSoup) ব্যবহার করে আপনি একটি String থেকে HTML লোড করতে পারেন এবং সেটি পার্স (parse) করে ডকুমেন্ট অবজেক্ট মডেল (DOM) তৈরি করতে পারেন। এটি ওয়েব স্ক্র্যাপিং বা HTML ডকুমেন্ট ম্যানিপুলেশন করার জন্য উপকারী। Jsoup.parse() মেথড ব্যবহার করে HTML string থেকে ডকুমেন্ট তৈরি করা হয় এবং সেই ডকুমেন্টের উপাদানগুলির সাথে কাজ করা সম্ভব হয়।
উদাহরণ: String থেকে HTML লোড করা
নিচে একটি উদাহরণ দেওয়া হল যেখানে String থেকে HTML লোড করা হয়েছে এবং সেই HTML এর বিভিন্ন উপাদান এক্সট্র্যাক্ট করা হয়েছে:
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
public class JsoupExample {
public static void main(String[] args) throws Exception {
// HTML কোড একটি স্ট্রিং (String) আকারে
String html = "<html><head><title>JSoup Example</title></head><body><h1>Welcome to JSoup</h1><p>This is a paragraph.</p></body></html>";
// Jsoup.parse() মেথড ব্যবহার করে String থেকে HTML লোড করা
Document doc = Jsoup.parse(html);
// HTML ডকুমেন্টের শিরোনাম এবং প্যারাগ্রাফ এক্সট্র্যাক্ট করা
String title = doc.title();
Element heading = doc.select("h1").first();
Element paragraph = doc.select("p").first();
System.out.println("Title: " + title); // JSoup Example
System.out.println("Heading: " + heading.text()); // Welcome to JSoup
System.out.println("Paragraph: " + paragraph.text()); // This is a paragraph.
}
}
ব্যাখ্যা
- Jsoup.parse(): এটি একটি স্ট্যাটিক মেথড যা HTML কোডকে একটি
Stringআকারে গ্রহণ করে এবং সেটি পার্স (parse) করে একটিDocumentঅবজেক্ট তৈরি করে। - title(): এটি ডকুমেন্টের শিরোনাম (title) ফেরত দেয়।
- select(): এই মেথডটি CSS সিলেক্টর ব্যবহার করে HTML উপাদান (elements) নির্বাচন করে। উদাহরণস্বরূপ,
h1সিলেক্টর ব্যবহার করে আমরা<h1>ট্যাগের টেক্সট বের করতে পারি।
সারাংশ
জেসুপ (JSoup) এর মাধ্যমে একটি String থেকে HTML লোড করা খুব সহজ এবং কার্যকর। Jsoup.parse() মেথড ব্যবহার করে আপনি HTML স্ট্রিংকে পার্স (parse) করে ডকুমেন্ট অবজেক্ট তৈরি করতে পারেন এবং পরে সেই ডকুমেন্টের উপাদানগুলির সাথে কাজ করতে পারেন, যেমন শিরোনাম, প্যারাগ্রাফ এবং অন্যান্য HTML ট্যাগের তথ্য এক্সট্র্যাক্ট করা।
Read more