PDF ডকুমেন্টের Metadata এর ধারণা

PDF এর Metadata এবং Properties সেট করা - পিডিএফবক্স (PDFbox) - Java Technologies

297

পিডিএফ ডকুমেন্টের মেটাডেটা (Metadata) হল ডকুমেন্টের সাথে সম্পর্কিত অতিরিক্ত তথ্য, যা ডকুমেন্টের কন্টেন্টের বাইরে থাকে। এই তথ্যগুলো পিডিএফ ডকুমেন্ট সম্পর্কে বিবরণ প্রদান করে, যেমন লেখক, টাইটেল, সাবজেক্ট, কীওয়ার্ডস, সৃষ্টির তারিখ ইত্যাদি। পিডিএফবক্স (PDFBox) ব্যবহার করে এই মেটাডেটা অ্যাক্সেস এবং পরিবর্তন করা যায়।

পিডিএফ ডকুমেন্টের মেটাডেটা

পিডিএফ ডকুমেন্টের মেটাডেটা সাধারণত XML ফরম্যাটে থাকে এবং এটি পিডিএফ ফাইলের কাঠামোর একটি অংশ। মেটাডেটার মধ্যে অন্তর্ভুক্ত তথ্য হতে পারে:

  • Title (শিরোনাম): ডকুমেন্টের শিরোনাম
  • Author (লেখক): ডকুমেন্টটির লেখক
  • Subject (বিষয়): ডকুমেন্টের বিষয়বস্তু
  • Keywords (কীওয়ার্ডস): ডকুমেন্টের সম্পর্কিত কীওয়ার্ড
  • Creation Date (সৃষ্টি তারিখ): ডকুমেন্টের সৃষ্টি তারিখ
  • Modification Date (সংশোধন তারিখ): ডকুমেন্টের সংশোধিত তারিখ

এই মেটাডেটাগুলি ডকুমেন্টের সার্বিক তথ্য এবং ব্যবহারকারীর প্রয়োজনীয় অনুসন্ধানের জন্য সহায়ক হতে পারে।

পিডিএফবক্সে মেটাডেটা এক্সেস এবং পরিবর্তন

পিডিএফবক্স ব্যবহার করে আপনি একটি পিডিএফ ডকুমেন্টের মেটাডেটা দেখতে এবং সেটি পরিবর্তন করতে পারেন। নিচে পিডিএফবক্সে মেটাডেটা এক্সেস এবং পরিবর্তন করার উদাহরণ দেওয়া হলো।

মেটাডেটা এক্সট্র্যাক্ট (Extracting Metadata)

পিডিএফ ডকুমেন্টের মেটাডেটা এক্সট্র্যাক্ট করার জন্য PDDocument এবং PDDocumentInformation ক্লাস ব্যবহার করা হয়। নিচে একটি উদাহরণ দেওয়া হলো:

PDDocument document = PDDocument.load(new File("example.pdf"));
PDDocumentInformation info = document.getDocumentInformation();

String title = info.getTitle();
String author = info.getAuthor();
String subject = info.getSubject();
String keywords = info.getKeywords();
String creationDate = info.getCreationDate().toString();

System.out.println("Title: " + title);
System.out.println("Author: " + author);
System.out.println("Subject: " + subject);
System.out.println("Keywords: " + keywords);
System.out.println("Creation Date: " + creationDate);

document.close();

এখানে, getDocumentInformation() পদ্ধতি ব্যবহার করে পিডিএফ ডকুমেন্টের মেটাডেটা এক্সট্র্যাক্ট করা হয়েছে এবং বিভিন্ন তথ্য প্রিন্ট করা হয়েছে।

মেটাডেটা পরিবর্তন (Modifying Metadata)

পিডিএফ ডকুমেন্টের মেটাডেটা পরিবর্তন করতে PDDocumentInformation ক্লাসের মেথড ব্যবহার করা হয়। উদাহরণস্বরূপ:

PDDocument document = PDDocument.load(new File("example.pdf"));
PDDocumentInformation info = document.getDocumentInformation();

info.setTitle("New Title");
info.setAuthor("New Author");
info.setSubject("New Subject");
info.setKeywords("Java, PDFBox, Metadata");

document.save("updated_example.pdf");
document.close();

এখানে, setTitle(), setAuthor(), setSubject(), এবং setKeywords() মেথডের মাধ্যমে পিডিএফ ডকুমেন্টের মেটাডেটা পরিবর্তন করা হয়েছে। তারপর save() মেথড ব্যবহার করে আপডেট করা ডকুমেন্টটি সংরক্ষণ করা হয়েছে।


পিডিএফবক্সে মেটাডেটা এক্সেস এবং পরিবর্তন করার মাধ্যমে পিডিএফ ডকুমেন্টের অতিরিক্ত তথ্য কাস্টমাইজ করা সম্ভব হয়। এটি বিশেষভাবে তখন কার্যকর, যখন ডকুমেন্টের পরিচিতি বা সার্চেবল ইনফরমেশন হিসেবে মেটাডেটার ব্যবহার প্রয়োজন হয়।

Content added By
Promotion

Are you sure to start over?

Loading...