Apache PDFBox একটি ওপেন সোর্স Java লাইব্রেরি যা পিডিএফ (PDF) ডকুমেন্ট তৈরি, মডিফাই, এবং পড়তে সাহায্য করে। এটি PDF ফাইলের সাথে বিভিন্ন অপারেশন যেমন টেক্সট এক্সট্র্যাকশন, পিডিএফ পৃষ্ঠা ম্যানিপুলেশন, এবং পিডিএফ জেনারেশন ইত্যাদি পরিচালনা করতে সক্ষম। Maven বা Gradle ব্যবহার করে আপনি সহজেই আপনার প্রকল্পে PDFBox অন্তর্ভুক্ত করতে পারেন।
১. Maven দিয়ে PDFBox অন্তর্ভুক্ত করা
Maven ব্যবহার করে PDFBox অন্তর্ভুক্ত করার জন্য আপনাকে আপনার pom.xml ফাইলে নিচের ডিপেনডেন্সি কোডটি যোগ করতে হবে:
<dependencies>
<dependency>
<groupId>org.apache.pdfbox</groupId>
<artifactId>pdfbox</artifactId>
<version>2.0.28</version> <!-- সর্বশেষ সংস্করণ ব্যবহার করুন -->
</dependency>
</dependencies>
এখানে 2.0.28 হল PDFBox-এর একটি নির্দিষ্ট সংস্করণ। আপনি Maven Central থেকে সর্বশেষ সংস্করণ চেক করতে পারেন।
২. Gradle দিয়ে PDFBox অন্তর্ভুক্ত করা
যদি আপনি Gradle ব্যবহার করেন, তাহলে আপনার build.gradle ফাইলে নিচের কোডটি যোগ করুন:
dependencies {
implementation 'org.apache.pdfbox:pdfbox:2.0.28' // সর্বশেষ সংস্করণ ব্যবহার করুন
}
এছাড়া, আপনি যদি PDFBox এর অন্যান্য কম্পোনেন্ট যেমন pdfbox-app2 বা pdfbox-tools ব্যবহার করতে চান, তবে তাদের ডিপেনডেন্সিও অন্তর্ভুক্ত করতে পারেন।
৩. উদাহরণ: PDF থেকে টেক্সট এক্সট্র্যাকশন
একবার PDFBox আপনার প্রকল্পে অন্তর্ভুক্ত হলে, আপনি সহজেই PDF থেকে টেক্সট এক্সট্র্যাক্ট করতে পারবেন। নিচে একটি উদাহরণ দেওয়া হলো:
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.text.PDFTextStripper;
import java.io.File;
import java.io.IOException;
public class PDFTextExtractor {
public static void main(String[] args) {
try {
// PDF ডকুমেন্ট খোলা
PDDocument document = PDDocument.load(new File("example.pdf"));
// টেক্সট এক্সট্র্যাক্ট করার জন্য PDFTextStripper ব্যবহার করা
PDFTextStripper stripper = new PDFTextStripper();
String text = stripper.getText(document);
// টেক্সট প্রদর্শন
System.out.println("Extracted Text: \n" + text);
// ডকুমেন্ট বন্ধ করা
document.close();
} catch (IOException e) {
e.printStackTrace();
}
}
}
এই উদাহরণে, example.pdf ফাইল থেকে টেক্সট এক্সট্র্যাক্ট করা হচ্ছে এবং তা কনসোলে প্রদর্শিত হচ্ছে।
উপসংহার
Maven বা Gradle ব্যবহার করে আপনি সহজেই Apache PDFBox আপনার Java প্রকল্পে অন্তর্ভুক্ত করতে পারেন। এর মাধ্যমে PDF ডকুমেন্ট তৈরি, সম্পাদনা এবং পড়ার জন্য শক্তিশালী এবং সহজ উপায় পাওয়া যায়।
Read more