যখন আপনি HTML ডকুমেন্ট পার্স (parse) করেন এবং তারপর সেই ডকুমেন্টে কোনো পরিবর্তন আনেন, তখন আপনি পরিবর্তিত HTML ফাইলটি সেভ করতে চাইবেন। জেসুপ (JSoup) লাইব্রেরি ব্যবহার করে এটি খুব সহজে করা যায়। Document অবজেক্টে যেকোনো পরিবর্তন করার পরে, File অথবা Writer ব্যবহার করে সেই পরিবর্তিত HTML ফাইলটি সেভ করা সম্ভব।
এখানে আমরা দেখব কীভাবে একটি পার্স করা HTML ফাইল সেভ করা যায়।
HTML ফাইল সেভ করার পদ্ধতি
HTML ফাইল পার্স করা এবং সেভ করা
যতটুকু সম্ভব সহজভাবে, আমরা একটি HTML ফাইল পার্স করব এবং সেটি একটি নতুন ফাইলে সেভ করব। নিচে একটি উদাহরণ দেওয়া হচ্ছে যেখানে একটি HTML ফাইল পার্স করা হচ্ছে এবং তারপর সেই ফাইলটি সেভ করা হচ্ছে।
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import java.io.File;
import java.io.IOException;
public class JsoupSaveFileExample {
public static void main(String[] args) throws IOException {
// HTML ফাইলের পাথ
File inputFile = new File("input.html");
// HTML পার্স করা
Document doc = Jsoup.parse(inputFile, "UTF-8");
// কিছু পরিবর্তন করা (যেমন, টাইটেল পরিবর্তন)
doc.title("New Document Title");
// পরিবর্তিত HTML ফাইল সেভ করা
File outputFile = new File("output.html");
doc.writeTo(outputFile, "UTF-8");
System.out.println("HTML ফাইল সফলভাবে সেভ করা হয়েছে।");
}
}
ব্যাখ্যা:
- প্রথমে,
input.htmlনামক HTML ফাইলটি পার্স করা হচ্ছেJsoup.parse()মেথড দিয়ে। - এরপর,
doc.title("New Document Title")ব্যবহার করে HTML ডকুমেন্টের টাইটেল পরিবর্তন করা হচ্ছে। - তারপর,
doc.writeTo()মেথড ব্যবহার করে সেই পরিবর্তিত HTML ডকুমেন্টটিoutput.htmlনামক একটি নতুন ফাইলে সেভ করা হচ্ছে।
writeTo() মেথড:
এই মেথডটি Document অবজেক্টের সমস্ত HTML কনটেন্টকে নির্দিষ্ট ফাইলে লিখে দেয়। আপনি এটি একটি File অবজেক্ট অথবা Writer ব্যবহার করে সেভ করতে পারেন।
HTML ফাইলের কিছু পরিবর্তন সেভ করা
এখন, যদি আপনি HTML ডকুমেন্টের ভিতরের কোনো উপাদান বা কনটেন্ট পরিবর্তন করতে চান এবং তারপর সেই পরিবর্তনগুলো সেভ করতে চান, তাহলে এটি খুব সহজভাবে করা যায়। নিচে একটি উদাহরণ দেওয়া হল যেখানে একটি প্যারাগ্রাফের কন্টেন্ট পরিবর্তন করা হচ্ছে এবং সেটি সেভ করা হচ্ছে।
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import java.io.File;
import java.io.IOException;
public class JsoupSaveModifiedFileExample {
public static void main(String[] args) throws IOException {
// HTML ফাইলের পাথ
File inputFile = new File("input.html");
// HTML পার্স করা
Document doc = Jsoup.parse(inputFile, "UTF-8");
// প্যারাগ্রাফের টেক্সট পরিবর্তন করা
Element paragraph = doc.select("p").first();
paragraph.text("This is the updated content.");
// পরিবর্তিত HTML ফাইল সেভ করা
File outputFile = new File("modified_output.html");
doc.writeTo(outputFile, "UTF-8");
System.out.println("HTML ফাইলের পরিবর্তন সেভ করা হয়েছে।");
}
}
এখানে:
doc.select("p").first()দিয়ে প্রথম প্যারাগ্রাফ ট্যাগটি নির্বাচন করা হচ্ছে।paragraph.text("This is the updated content.")দিয়ে প্যারাগ্রাফের টেক্সট পরিবর্তন করা হচ্ছে।- তারপর,
writeTo()মেথড দিয়ে পরিবর্তিত HTML ফাইলটি সেভ করা হচ্ছে।
সারাংশ
জেসুপ (JSoup) ব্যবহার করে HTML ফাইল পার্স করার পর সেই ফাইলটিতে কোনো পরিবর্তন আনা এবং তা সেভ করা খুবই সহজ। আপনি Document অবজেক্টের মাধ্যমে HTML ডকুমেন্টে যেকোনো পরিবর্তন করতে পারেন এবং পরে writeTo() মেথড ব্যবহার করে সেই পরিবর্তিত ডকুমেন্টটি একটি নতুন ফাইলে সেভ করতে পারেন। এটি ওয়েব স্ক্র্যাপিং বা ডেটা প্রক্রিয়াকরণে খুবই কার্যকরী এবং উপকারী।
Read more