Attributes এবং Text Content Access করা

CSS Selectors এবং Elements Extraction - জেসুপ (JSoup) - Java Technologies

306

জেসুপ (JSoup) HTML ডকুমেন্টের মধ্যে থাকা বিভিন্ন উপাদানের (elements) অ্যাট্রিবিউট এবং টেক্সট কন্টেন্ট সহজে এক্সেস করার জন্য শক্তিশালী মেথড সরবরাহ করে। এই মেথডগুলির মাধ্যমে আপনি HTML ট্যাগের অ্যাট্রিবিউটের মান বা টেক্সট কন্টেন্ট বের করতে পারেন।


অ্যাট্রিবিউট (Attributes) এক্সেস করা

HTML ডকুমেন্টের উপাদানগুলিতে অ্যাট্রিবিউট থাকে, যেমন href, src, alt ইত্যাদি। জেসুপ ব্যবহার করে আপনি সহজে এই অ্যাট্রিবিউটের মান উদ্ধার করতে পারেন।

উদাহরণ: অ্যাট্রিবিউট এক্সেস করা

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;

public class JsoupExample {
    public static void main(String[] args) throws Exception {
        String html = "<html><head><title>JSoup Example</title></head><body><a href='https://example.com'>Click here</a></body></html>";
        
        // HTML পার্স করা
        Document doc = Jsoup.parse(html);
        
        // অ্যাঙ্কর ট্যাগ (a) নির্বাচন করা
        Element link = doc.select("a").first();
        
        // href অ্যাট্রিবিউট এক্সেস করা
        String href = link.attr("href");
        
        System.out.println("Link: " + href); // https://example.com
    }
}

এই উদাহরণে, attr() মেথড ব্যবহার করে <a> ট্যাগের href অ্যাট্রিবিউটের মান এক্সট্র্যাক্ট করা হয়েছে।


টেক্সট কন্টেন্ট (Text Content) এক্সেস করা

HTML উপাদানগুলির মধ্যে টেক্সট কন্টেন্ট থাকে যা সাধারণত ট্যাগের মধ্যে থাকে। জেসুপের text() মেথড ব্যবহার করে আপনি সহজেই এই টেক্সট কন্টেন্ট এক্সট্র্যাক্ট করতে পারেন।

উদাহরণ: টেক্সট কন্টেন্ট এক্সেস করা

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;

public class JsoupExample {
    public static void main(String[] args) throws Exception {
        String html = "<html><head><title>JSoup Example</title></head><body><h1>Welcome to JSoup</h1><p>This is a paragraph.</p></body></html>";
        
        // HTML পার্স করা
        Document doc = Jsoup.parse(html);
        
        // হেডিং (h1) এবং প্যারাগ্রাফ (p) টেক্সট এক্সট্র্যাক্ট করা
        Element heading = doc.select("h1").first();
        Element paragraph = doc.select("p").first();
        
        // টেক্সট কন্টেন্ট এক্সট্র্যাক্ট করা
        String headingText = heading.text();
        String paragraphText = paragraph.text();
        
        System.out.println("Heading: " + headingText); // Welcome to JSoup
        System.out.println("Paragraph: " + paragraphText); // This is a paragraph.
    }
}

এখানে text() মেথড ব্যবহার করে <h1> এবং <p> ট্যাগের ভিতরের টেক্সট কন্টেন্ট এক্সট্র্যাক্ট করা হয়েছে।


সারাংশ

জেসুপ (JSoup) HTML উপাদানের অ্যাট্রিবিউট এবং টেক্সট কন্টেন্ট সহজে এক্সেস করার জন্য শক্তিশালী মেথড প্রদান করে। attr() মেথড ব্যবহার করে আপনি HTML উপাদানের অ্যাট্রিবিউটের মান পেতে পারেন এবং text() মেথড ব্যবহার করে আপনি উপাদানগুলির টেক্সট কন্টেন্ট এক্সট্র্যাক্ট করতে পারেন। এগুলি ওয়েব স্ক্র্যাপিং এবং HTML ম্যানিপুলেশনের জন্য অত্যন্ত কার্যকরী।

Content added By
Promotion

Are you sure to start over?

Loading...