Lucene এ Indexing

লুসিন (Lucene) - Java Technologies

410

Apache Lucene হল একটি ওপেন সোর্স, উচ্চ পারফরম্যান্স সমন্বিত টেক্সট সার্চ ইঞ্জিন লাইব্রেরি যা মূলত টেক্সট ডেটার ইনডেক্সিং এবং অনুসন্ধানের জন্য ব্যবহৃত হয়। Lucene একটি ইনডেক্সিং পদ্ধতি প্রদান করে যা ডেটাকে একটি নির্দিষ্ট স্ট্রাকচার বা ফরম্যাটে সাজিয়ে রাখে, যাতে খুব দ্রুত অনুসন্ধান করা যায়। এটি মূলত Full-text search সিস্টেমে ব্যবহৃত হয়, যেখানে দ্রুত ডেটা অনুসন্ধান করা প্রয়োজন।

১. Lucene এ Indexing এর ভূমিকা

Indexing হল সেই প্রক্রিয়া যা আপনার ডেটা (টেক্সট ডকুমেন্ট বা অন্যান্য ফাইল) কে Lucene ইনডেক্সে রূপান্তরিত করে, যাতে ডেটা দ্রুত খোঁজা (search) এবং পুনরুদ্ধার করা যায়। যখনই আপনি নতুন ডেটা যোগ করেন বা আপডেট করেন, তখন Lucene ওই ডেটাকে ইনডেক্সে জমা করে রাখে, এবং পরবর্তী সময়ে একটি দক্ষ অনুসন্ধান প্রক্রিয়া তৈরি হয়।

Lucene এ Indexing এর মাধ্যমে, ডেটা একটি স্ট্রাকচারড এবং কমপ্যাক্ট ফর্ম্যাটে জমা হয় যাতে দ্রুত অনুসন্ধান করা যায়। এটি অনুসন্ধানের জন্য প্রয়োজনীয় কনটেন্টের উপর ইনডেক্স তৈরি করে এবং অনুসন্ধানের সময় এর উপর ভিত্তি করে ডেটা ফেরত দেয়।

২. Lucene এ Indexing কিভাবে কাজ করে

Lucene ইনডেক্সিং প্রক্রিয়াটি কয়েকটি গুরুত্বপূর্ণ স্টেপে বিভক্ত:

Document তৈরি করা: Lucene এ প্রতিটি ডেটা বা রেকর্ডকে Document হিসেবে উপস্থাপন করা হয়। এই Document একটি বা একাধিক Field ধারণ করতে পারে। প্রতিটি Field হল ডেটার একটি নির্দিষ্ট অংশ (যেমন নাম, বিবরণ, তারিখ ইত্যাদি)।
Field তৈরি করা: Field হল Document এর একটি অংশ যা টেক্সট ডেটার স্টোরেজ এবং অনুসন্ধানের জন্য ব্যবহৃত হয়। প্রতিটি Field একটি নাম (যেমন "title", "content") এবং একটি মান ধারণ করে।
Analyzer ব্যবহার করা: Lucene টেক্সট ডেটাকে ইনডেক্স করার আগে Analyzer ব্যবহার করে, যাতে শব্দগুলোকে পার্স এবং স্টেম করা যায় (যেমন, "running" কে "run" এ রূপান্তর করা)। এটি টেক্সট ডেটার প্রক্রিয়াকরণে সাহায্য করে।
IndexWriter ব্যবহার করা: IndexWriter হল প্রধান ক্লাস যা ডেটা ইনডেক্স করতে ব্যবহৃত হয়। এটি ডেটা ইনডেক্সে সংরক্ষণ করার জন্য ব্যবহৃত হয়।

৩. Lucene Indexing Example

এখন, আসুন একটি সরল উদাহরণ দেখে নেওয়া যাক যেটি Lucene ব্যবহার করে ইনডেক্স তৈরি করে এবং সেই ইনডেক্সে ডেটা যোগ করে।

৩.১ ডিপেনডেন্সি যোগ করা (Maven)

প্রথমে, আপনার pom.xml ফাইলে Lucene এর প্রয়োজনীয় ডিপেনডেন্সি যোগ করুন।

<dependencies>
    <dependency>
        <groupId>org.apache.lucene</groupId>
        <artifactId>lucene-core</artifactId>
        <version>8.10.0</version>
    </dependency>
    <dependency>
        <groupId>org.apache.lucene</groupId>
        <artifactId>lucene-analyzers-common</artifactId>
        <version>8.10.0</version>
    </dependency>
    <dependency>
        <groupId>org.apache.lucene</groupId>
        <artifactId>lucene-queryparser</artifactId>
        <version>8.10.0</version>
    </dependency>
</dependencies>

৩.২ Indexing Code Example

এখানে একটি সরল উদাহরণ দেওয়া হলো যেখানে Lucene ব্যবহার করে ডেটা ইনডেক্স করা হচ্ছে।

import org.apache.lucene.document.*;
import org.apache.lucene.index.*;
import org.apache.lucene.store.*;
import org.apache.lucene.analysis.standard.StandardAnalyzer;

import java.io.IOException;

public class LuceneIndexingExample {
    public static void main(String[] args) throws IOException {
        // ইনডেক্স স্টোর করার জন্য ডিরেক্টরি তৈরি করা
        Directory directory = FSDirectory.open(java.nio.file.Paths.get("lucene_index"));

        // Analyzer (এটি টেক্সটকে প্রক্রিয়াকরণ করবে)
        StandardAnalyzer analyzer = new StandardAnalyzer();

        // IndexWriter কনফিগার করা
        IndexWriterConfig config = new IndexWriterConfig(analyzer);
        IndexWriter writer = new IndexWriter(directory, config);

        // ডকুমেন্ট তৈরি করা
        Document doc = new Document();
        
        // Field তৈরি করা (যেমন title, content)
        Field titleField = new TextField("title", "Lucene in Action", Field.Store.YES);
        Field contentField = new TextField("content", "Lucene provides powerful text search capabilities.", Field.Store.YES);
        
        // Document এ Fields যোগ করা
        doc.add(titleField);
        doc.add(contentField);
        
        // Document ইনডেক্সে যোগ করা
        writer.addDocument(doc);
        
        // ইনডেক্স লেখার পর Writer ক্লোজ করা
        writer.close();
        
        System.out.println("Document indexed successfully!");
    }
}

এখানে:

FSDirectory.open: ইনডেক্স ফাইলের জন্য লোকাল ডিরেক্টরি তৈরি করা।
StandardAnalyzer: এটি টেক্সট ইনডেক্স করার জন্য ব্যবহৃত একটি সাধারণ analyzer।
TextField: এই Field ব্যবহার করে টেক্সট ডেটা যোগ করা হয়। এখানে আমরা title এবং content নামে দুটি ফিল্ড তৈরি করেছি।
IndexWriter: এটি ইনডেক্স লেখার জন্য ব্যবহৃত হয়।

৪. Lucene Indexing এর সাথে ব্যবহারিক সুবিধা

Lucene এর মাধ্যমে ইনডেক্সিং করার বেশ কিছু সুবিধা রয়েছে:

দ্রুত অনুসন্ধান (Fast Search): একবার ডেটা ইনডেক্স হয়ে গেলে, এটি খুব দ্রুত সার্চ করা যায়।
ফিল্ড ভিত্তিক অনুসন্ধান (Field-based Search): আপনি নির্দিষ্ট ফিল্ডের ভিত্তিতে অনুসন্ধান করতে পারবেন, যেমন শুধু title বা content এর ভিত্তিতে।
স্টেমিং এবং এনালাইসিস (Stemming and Analysis): Lucene স্টেমিং বা শব্দের রূপান্তর যেমন "run" এবং "running" একে অপরের সমান করে দেয়, যা আরও নির্ভুল অনুসন্ধান সক্ষম করে।
ফেজ, প্যাটার্ন এবং রেঞ্জ অনুসন্ধান (Phrase, Pattern, and Range Search): Lucene শব্দের নির্দিষ্ট প্যাটার্ন, রেঞ্জ অনুসন্ধান বা কাস্টম প্রশ্ন সমর্থন করে।

৫. Lucene এর মাধ্যমে Search করা

Lucene এ ইনডেক্সিং করার পর, আপনি খুব সহজেই searching প্রক্রিয়া সম্পন্ন করতে পারেন।

Searching Code Example:

import org.apache.lucene.document.Document;
import org.apache.lucene.index.DirectoryReader;
import org.apache.lucene.queryparser.classic.QueryParser;
import org.apache.lucene.search.*;
import org.apache.lucene.store.FSDirectory;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.util.BytesRef;

import java.nio.file.Paths;

public class LuceneSearchExample {
    public static void main(String[] args) throws Exception {
        // ইনডেক্স ডিরেক্টরি পড়া
        Directory directory = FSDirectory.open(Paths.get("lucene_index"));

        // Analyzer
        StandardAnalyzer analyzer = new StandardAnalyzer();

        // IndexReader এবং IndexSearcher তৈরি করা
        DirectoryReader reader = DirectoryReader.open(directory);
        IndexSearcher searcher = new IndexSearcher(reader);

        // Query তৈরি করা
        QueryParser parser = new QueryParser("content", analyzer);
        Query query = parser.parse("text search");

        // সার্চ ফলাফল খুঁজে বের করা
        TopDocs results = searcher.search(query, 10);

        // সার্চ রেজাল্ট প্রদর্শন করা
        System.out.println("Total Results: " + results.totalHits);
        for (ScoreDoc scoreDoc : results.scoreDocs) {
            Document doc = searcher.doc(scoreDoc.doc);
            System.out.println("Title: " + doc.get("title"));
            System.out.println("Content: " + doc.get("content"));
        }

        // Reader বন্ধ করা
        reader.close();
    }
}

এখানে, Lucene IndexSearcher ব্যবহার করে ইনডেক্স থেকে ডেটা অনুসন্ধান করা হচ্ছে। QueryParser এর মাধ্যমে একটি query তৈরি করা হচ্ছে এবং তারপর searcher.search মেথড দ্বারা ফলাফল পাওয়া যাচ্ছে।

৬. Lucene ইনডেক্সিং এর সুবিধা ও চ্যালেঞ্জ

সুবিধা:

High Performance: Lucene উচ্চ পারফরম্যান্স সুরক্ষিত রাখে, বিশেষ করে বড় ডেটাবেস এবং ওয়েব অ্যাপ্লিকেশনে।
Customization: ইনডেক্সিং এবং অনুসন্ধান কাস্টমাইজ করতে পারেন।
Open Source: এটি ওপেন সোর্স এবং সহজে ব্যবহারযোগ্য।

চ্যালেঞ্জ:

Complexity: Lucene এর স্ট্রাকচার এবং কনফিগারেশন কিছুটা জটিল হতে পারে।
Memory Usage: খুব বড় ইনডেক্সিং করলে মেমোরি ব্যবহারে সমস্যা হতে পারে।
Real-time Indexing: কিছু ক্ষেত্রে রিয়েল-টাইম ইনডেক্সিং এর জন্য অতিরিক্ত কোড প্রয়োজন।

সারাংশ

Lucene Indexing হল টেক্সট ডেটার দ্রুত অনুসন্ধান নিশ্চিত করার একটি গুরুত্বপূর্ণ অংশ। ইনডেক্সিং প্রক্রিয়া ডেটাকে একটি স্ট্রাকচারড ফরম্যাটে সাজিয়ে রাখে এবং এটি পরে দ্রুত অনুসন্ধান করতে সহায়তা করে। Lucene এর মাধ্যমে আপনি ডেটা ইনডেক্স এবং সার্চ করতে পারেন খুব সহজেই এবং এটি অনেক বড় এবং জটিল ডেটাসেটের জন্যও কার্যকরী।

Content added By

Md Zahid Hasan

IndexWriter ক্লাস এবং এর ব্যবহার

264

Apache Lucene একটি ওপেন সোর্স লাইব্রেরি যা তথ্য অনুসন্ধান (searching) এবং ইনডেক্সিং (indexing) এর জন্য ব্যবহৃত হয়। এটি মূলত টেক্সট ডেটা অনুসন্ধানের জন্য ডিজাইন করা হলেও, এটি আরো অনেক ধরনের ডেটা কাঠামোতে অনুসন্ধান করতে সক্ষম। Lucene এর IndexWriter ক্লাসটি ডেটা ইনডেক্স করতে ব্যবহৃত হয়। ইনডেক্সিং এর মাধ্যমে ডেটার অনুসন্ধান প্রক্রিয়াকে দ্রুততর এবং কার্যকরী করা সম্ভব হয়।

এই টিউটোরিয়ালে, আমরা IndexWriter ক্লাস এবং এর ব্যবহার বিস্তারিতভাবে আলোচনা করব, যাতে আপনি জানেন কিভাবে ইনডেক্স তৈরি করতে হয় এবং তার সাহায্যে ডেটা অনুসন্ধান করা যায়।

১. IndexWriter ক্লাসের ভূমিকা

IndexWriter হল Lucene এর একটি ক্লাস যা ডকুমেন্ট ইনডেক্সিং পরিচালনা করে। এটি ব্যবহার করে আপনি নতুন ডকুমেন্ট (যেমন, টেক্সট ডেটা) ইনডেক্স করতে পারেন, বিদ্যমান ডকুমেন্টে পরিবর্তন আনতে পারেন বা পুরনো ডকুমেন্ট মুছে ফেলতে পারেন।

IndexWriter এর প্রধান কাজ:

নতুন ডকুমেন্ট ইনডেক্স করা: IndexWriter ব্যবহার করে আপনি নতুন ডকুমেন্ট ইনডেক্স করতে পারেন।
ডকুমেন্ট আপডেট করা: বিদ্যমান ডকুমেন্টগুলোর তথ্য আপডেট করা যায়।
ডকুমেন্ট মুছে ফেলা: নির্দিষ্ট ডকুমেন্ট বা শর্ত অনুসারে ডকুমেন্ট মুছে ফেলা সম্ভব।
কমিট এবং ক্লোজ: ইনডেক্স লেখার পর ডেটা স্টোর করার জন্য commit() ব্যবহার করা হয় এবং শেষে close() মেথড দিয়ে ইনডেক্সWriter ক্লোজ করতে হয়।

২. IndexWriter এর ইনস্ট্যান্স তৈরি করা

IndexWriter ব্যবহার করার আগে, প্রথমে একটি IndexWriterConfig এবং একটি Directory ইনস্ট্যান্স তৈরি করতে হয়। Directory হল একটি ফিজিক্যাল স্থান যেখানে ইনডেক্স সংরক্ষিত থাকে (যেমন, একটি ফোল্ডার)। IndexWriterConfig হল কনফিগারেশন ক্লাস যা ইনডেক্স লেখার জন্য কনফিগারেশন সেটিংস প্রদান করে।

উদাহরণ: Basic IndexWriter Setup

import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.document.TextField;
import org.apache.lucene.index.DirectoryReader;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.FSDirectory;
import java.io.IOException;
import java.nio.file.Paths;

public class LuceneIndexWriterExample {

    public static void main(String[] args) throws IOException {
        // IndexWriterConfig তৈরি করা
        IndexWriterConfig config = new IndexWriterConfig();

        // Directory তৈরি করা যেখানে ইনডেক্স সংরক্ষিত হবে
        Directory directory = FSDirectory.open(Paths.get("indexDirectory"));

        // IndexWriter ইনস্ট্যান্স তৈরি করা
        IndexWriter writer = new IndexWriter(directory, config);

        // একটি নতুন ডকুমেন্ট তৈরি করা
        Document doc = new Document();
        doc.add(new TextField("content", "Lucene indexing example", Field.Store.YES));

        // ডকুমেন্ট ইনডেক্স করা
        writer.addDocument(doc);

        // ইনডেক্সে পরিবর্তন কমিট করা
        writer.commit();

        // IndexWriter বন্ধ করা
        writer.close();
    }
}

এখানে:

FSDirectory ব্যবহার করে ইনডেক্স সংরক্ষণের জন্য ফাইল সিস্টেমে একটি ডিরেক্টরি তৈরি করা হয়েছে।
IndexWriterConfig এর মাধ্যমে IndexWriter কনফিগার করা হয়েছে।
একটি নতুন Document তৈরি করা হয়েছে এবং এতে content নামে একটি ফিল্ড যুক্ত করা হয়েছে।
addDocument() মেথড ব্যবহার করে ডকুমেন্ট ইনডেক্স করা হয়েছে।
commit() ব্যবহার করে ইনডেক্সে পরিবর্তনগুলি সংরক্ষণ করা হয়েছে এবং পরে close() মেথড দিয়ে IndexWriter বন্ধ করা হয়েছে।

৩. IndexWriter এর বিভিন্ন ফিচার

৩.১ ডকুমেন্ট ইনডেক্সিং (Document Indexing)

Lucene এর Document একটি অবজেক্ট যা আপনার ইনডেক্সড ডেটা ধারণ করে। এটি Field অবজেক্টের একটি সংগ্রহ থাকে, যা আসলে ডেটার মান ধারণ করে।

Document doc = new Document();
doc.add(new TextField("title", "Lucene Basics", Field.Store.YES));
doc.add(new TextField("content", "This is a basic example of using Lucene.", Field.Store.YES));

এখানে, title এবং content হল দুটি ফিল্ড এবং তাদের TextField টাইপ দেওয়া হয়েছে, যা টেক্সট ডেটার জন্য ব্যবহৃত হয়।

৩.২ ডকুমেন্ট আপডেট করা (Document Updating)

Lucene এর IndexWriter ব্যবহার করে আপনি ডকুমেন্ট আপডেট করতে পারেন। updateDocument() মেথড ব্যবহার করে নির্দিষ্ট ফিল্ডের মান আপডেট করা যায়।

writer.updateDocument(new Term("title", "Lucene Basics"), doc);

এখানে, updateDocument() মেথড ব্যবহার করা হয়েছে যেটি title ফিল্ডের মানের উপর ভিত্তি করে একটি নতুন ডকুমেন্ট আপডেট করে।

৩.৩ ডকুমেন্ট মুছে ফেলা (Deleting Documents)

Lucene এর IndexWriter ব্যবহার করে আপনি একটি ডকুমেন্ট বা একটি নির্দিষ্ট শর্তের ভিত্তিতে ডকুমেন্ট মুছে ফেলতে পারেন।

writer.deleteDocuments(new Term("title", "Lucene Basics"));

এখানে, deleteDocuments() মেথড ব্যবহার করে title ফিল্ডের মান Lucene Basics যাদের রয়েছে, তাদের ডকুমেন্ট মুছে ফেলা হয়েছে।

৪. IndexWriter এর কার্যকারিতা

Efficient Indexing: IndexWriter দ্রুত ডকুমেন্ট ইনডেক্স করতে সক্ষম এবং এটি ফাইল সিস্টেমে ডেটার গতি বাড়ায়।
Commit and Rollback: ইনডেক্সিংয়ের পর commit() মেথডের মাধ্যমে পরিবর্তনগুলি নিশ্চিত করা হয়। আপনি যদি কোনও কারণে পরিবর্তনগুলি ফেরত নিতে চান, তবে rollback() ব্যবহার করতে পারেন।
Concurrent Writing: Lucene তে একাধিক থ্রেডে ইনডেক্স লেখার জন্য কিছু কনফিগারেশন এবং লকিং প্রয়োজন হতে পারে, তবে সাধারণভাবে এটি একটি সিংল থ্রেডেড প্রসেস।

৫. IndexWriter এর Limitations

Resource Management: IndexWriter অনেক বেশি মেমরি এবং ডিস্ক স্পেস ব্যবহার করতে পারে, বিশেষত বড় ইনডেক্স তৈরি করার সময়। এটি সঠিকভাবে ক্লোজ করা না হলে মেমরি লিক হতে পারে।
Write Locking: একাধিক ইনডেক্স লেখার সময় write lock সৃষ্টি হয়, যার ফলে একাধিক ইনডেক্স লেখার জন্য আপনাকে সিঙ্ক্রোনাইজেশন কৌশল ব্যবহার করতে হতে পারে।

সারাংশ

IndexWriter ক্লাস হল Lucene এর একটি অত্যন্ত গুরুত্বপূর্ণ অংশ, যা ডেটার ইনডেক্সিং, আপডেট, মুছে ফেলা এবং অন্যান্য কার্যক্রম পরিচালনা করে। এটি ব্যবহার করে আপনি ডকুমেন্ট ইনডেক্স করতে পারেন, ডকুমেন্ট মুছে ফেলতে পারেন বা আপডেট করতে পারেন। Lucene এর পারফরম্যান্স এবং কার্যকারিতা অনেকাংশে IndexWriter এর সঠিক ব্যবহার এবং কনফিগারেশনের উপর নির্ভর করে।

IndexWriter এর মাধ্যমে Lucene ডেটাবেস বা ফাইল সিস্টেমে টেক্সট ডেটা ইনডেক্স করতে সক্ষম হয় এবং দ্রুত অনুসন্ধান প্রক্রিয়া পরিচালনা করতে পারে।

Content added By

Md Zahid Hasan

Index তৈরি করা এবং ডকুমেন্ট যোগ করা

295

Apache Lucene একটি ফ্রি এবং ওপেন সোর্স লাইব্রেরি যা পূর্ণাঙ্গ টেক্সট অনুসন্ধান কার্যক্রম (Full-text search) এবং ইন্ডেক্সিংয়ের জন্য ব্যবহৃত হয়। এটি বড় ডেটাসেটের মধ্যে দ্রুত এবং কার্যকরীভাবে তথ্য অনুসন্ধান করতে সক্ষম। Lucene তে Indexing এবং Searching দুটি মৌলিক কাজ, যা ত্রুটিমুক্ত এবং দ্রুত তথ্য পুনরুদ্ধারের জন্য গুরুত্বপূর্ণ।

এখানে আমরা Lucene তে Index তৈরি এবং ডকুমেন্ট যোগ করার প্রক্রিয়া সম্পর্কে বিস্তারিত আলোচনা করব।

১. Lucene Indexing Overview

Indexing হল একটি প্রক্রিয়া যার মাধ্যমে ডেটাকে একটি কাঠামোবদ্ধ আকারে সংরক্ষণ করা হয়, যাতে দ্রুত অনুসন্ধান (searching) করা যায়। Lucene এ ডেটা Document হিসেবে স্টোর হয় এবং Field এর মাধ্যমে বিভিন্ন প্রপার্টি (যেমন টেক্সট, নাম, ইত্যাদি) সংযুক্ত করা হয়। একে Index বলা হয়, যেখানে এই ডকুমেন্টগুলো এবং তাদের ফিল্ডগুলো সংরক্ষিত থাকে।

Lucene তে Indexing দুটি ধাপে সম্পন্ন হয়:

Document Creation: প্রথমে একটি ডকুমেন্ট তৈরি করা হয়, যার মধ্যে বিভিন্ন ফিল্ড (যেমন: নাম, বিবরণ, তারিখ) থাকে।
Document Indexing: তারপর ডকুমেন্টটিকে ইন্ডেক্সে যোগ করা হয়।

২. Lucene তে Index তৈরি করা

Lucene তে একটি ইন্ডেক্স তৈরি করতে হলে আপনাকে IndexWriter ব্যবহার করতে হবে। এটি ইন্ডেক্সে ডকুমেন্ট যোগ করার জন্য ব্যবহৃত হয়।

২.১ Lucene Index Writer Setup

প্রথমে, আপনার প্রোজেক্টে Lucene এর প্রয়োজনীয় ডিপেনডেন্সি যোগ করতে হবে। যদি Maven ব্যবহার করেন, তাহলে pom.xml এ নিচের ডিপেনডেন্সি যোগ করুন:

<dependency>
    <groupId>org.apache.lucene</groupId>
    <artifactId>lucene-core</artifactId>
    <version>8.10.1</version>
</dependency>

২.২ Index তৈরি এবং Document যোগ করার উদাহরণ

এখন আমরা একটি উদাহরণ দেখি যেখানে একটি ইন্ডেক্স তৈরি করা হবে এবং তার মধ্যে ডকুমেন্ট যোগ করা হবে।

import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.document.TextField;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.FSDirectory;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import java.nio.file.Paths;

public class LuceneIndexExample {

    public static void main(String[] args) {
        try {
            // Index Directory
            Directory directory = FSDirectory.open(Paths.get("lucene_index"));

            // Analyzer and IndexWriterConfig
            StandardAnalyzer analyzer = new StandardAnalyzer();
            IndexWriterConfig config = new IndexWriterConfig(analyzer);

            // IndexWriter to add documents to the index
            IndexWriter writer = new IndexWriter(directory, config);

            // Create a new Document
            Document doc = new Document();

            // Add fields to the document
            doc.add(new TextField("title", "Lucene for Beginners", Field.Store.YES));
            doc.add(new TextField("content", "This is an introduction to Lucene.", Field.Store.YES));

            // Add the document to the index
            writer.addDocument(doc);

            // Commit changes and close the writer
            writer.commit();
            writer.close();

            System.out.println("Index created and document added successfully.");

        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

এখানে:

StandardAnalyzer: এটি Lucene এর স্ট্যান্ডার্ড টেক্সট অ্যানালাইজার, যা টেক্সট ফিল্ডগুলোকে টোকেনাইজ এবং প্রসেস করে।
IndexWriter: এটি ডকুমেন্টগুলো ইন্ডেক্সে যোগ করার জন্য ব্যবহৃত হয়।
TextField: এটি টেক্সট ডেটার জন্য ফিল্ড টাইপ, যা স্টোর করা হয় এবং অনুসন্ধানযোগ্য থাকে।
FSDirectory: এটি ফাইল সিস্টেমে একটি ডিরেক্টরি নির্দেশ করে যেখানে ইন্ডেক্স ফাইলগুলো সংরক্ষণ করা হবে।

এভাবে, Lucene তে ডকুমেন্ট তৈরি এবং ইন্ডেক্সে যোগ করা হয়।

৩. Lucene তে Document (ডকুমেন্ট) তৈরি করা

Lucene তে Document হলো এমন একটি অবজেক্ট যা বিভিন্ন ফিল্ড ধারণ করে, এবং এই ফিল্ডগুলোকে ডেটার প্রপার্টি হিসেবে ব্যবহার করা হয়। একটি ডকুমেন্টে একাধিক ফিল্ড থাকতে পারে।

৩.১ Document ফিল্ড তৈরি করা

Lucene তে Field হলো ডেটার একটি ইউনিট, যা একটি ডকুমেন্টের অংশ হিসেবে যুক্ত করা হয়। আপনি বিভিন্ন ধরনের ফিল্ড তৈরি করতে পারেন, যেমন TextField, StringField, IntField, ইত্যাদি।

// Create a Document
Document doc = new Document();

// Add a TextField (which is analyzed and tokenized)
doc.add(new TextField("title", "Lucene for Beginners", Field.Store.YES));

// Add a StringField (which is not analyzed, just stored)
doc.add(new StringField("id", "123", Field.Store.YES));

// Add an IntField (for numeric data)
doc.add(new IntField("age", 30, Field.Store.YES));

৩.২ Field Types:

TextField: এটি সাধারণত টেক্সট ডেটার জন্য ব্যবহৃত হয়, যা অ্যানালাইজড (tokenized) হয় এবং সার্চ করা যায়।
StringField: এটি সাধারণত স্টোর করা স্ট্রিং ডেটার জন্য ব্যবহৃত হয়, কিন্তু এটি অ্যানালাইজড হয় না।
IntField: এটি একক পূর্ণসংখ্যা ডেটার জন্য ব্যবহৃত হয়।
StoredField: এটি ডেটা শুধুমাত্র স্টোর করে, কিন্তু এটি সার্চযোগ্য নয়।

৪. Lucene তে Document খোঁজা (Searching)

Lucene তে তৈরি করা Index থেকে ডকুমেন্ট খুঁজতে IndexSearcher ব্যবহার করা হয়। এটি ইন্ডেক্সে থাকা ডকুমেন্টগুলির মধ্যে অনুসন্ধান করার জন্য ব্যবহৃত হয়।

৪.১ Searching Example

import org.apache.lucene.index.DirectoryReader;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.TermQuery;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.FSDirectory;
import org.apache.lucene.document.Field;
import org.apache.lucene.index.Term;
import java.nio.file.Paths;

public class LuceneSearchExample {

    public static void main(String[] args) {
        try {
            // Open the existing index
            Directory directory = FSDirectory.open(Paths.get("lucene_index"));

            // Open the index reader
            DirectoryReader reader = DirectoryReader.open(directory);

            // Create an IndexSearcher
            IndexSearcher searcher = new IndexSearcher(reader);

            // Create a query (search for documents containing "Lucene")
            Query query = new TermQuery(new Term("title", "Lucene"));

            // Perform the search and get the top 10 hits
            int hitsPerPage = 10;
            TopDocs docs = searcher.search(query, hitsPerPage);

            // Display the results
            for (ScoreDoc scoreDoc : docs.scoreDocs) {
                Document doc = searcher.doc(scoreDoc.doc);
                System.out.println("Found document: " + doc.get("title"));
            }

            // Close the reader
            reader.close();

        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

এখানে:

TermQuery: এটি একটি বেসিক কোয়েরি যা একটি নির্দিষ্ট টার্ম অনুসারে ডকুমেন্ট খুঁজে।
IndexSearcher: এটি ইন্ডেক্সে অনুসন্ধান করার জন্য ব্যবহৃত হয়।
TopDocs: এটি সেই ডকুমেন্টগুলির তালিকা ধারণ করে যা সার্চ কোয়েরি অনুসারে সেরা ফলাফল প্রদান করেছে।

সারাংশ

Lucene একটি শক্তিশালী টুল যা ডেটাকে কার্যকরভাবে ইন্ডেক্স করতে এবং দ্রুত সার্চ করতে সক্ষম। ইন্ডেক্স তৈরি এবং ডকুমেন্ট যোগ করার প্রক্রিয়া খুবই সহজ এবং দ্রুত। এখানে আমরা দেখেছি কিভাবে Lucene Index তৈরি করা হয় এবং Document এর মাধ্যমে ফিল্ড যোগ করে, তারপর সেই ডকুমেন্টগুলো সার্চ করা হয়। Lucene এর মাধ্যমে বিভিন্ন ধরনের ডেটা ম্যাপিং এবং খোঁজার প্রক্রিয়া অনেক সহজ এবং দ্রুত হয়।

Content added By

Md Zahid Hasan

Index তে ডকুমেন্ট আপডেট এবং ডিলিট করা

303

Apache Lucene হল একটি শক্তিশালী ওপেন সোর্স ফুল-টেক্সট সার্চ লাইব্রেরি, যা ডকুমেন্ট ইনডেক্সিং এবং দ্রুত সার্চ অপারেশন সম্পাদন করতে ব্যবহৃত হয়। এটি Java ভিত্তিক এবং প্রধানত ব্যবহার করা হয় টেক্সট-বেসড ডেটার জন্য, যেমন ওয়েবসাইট কন্টেন্ট, ডকুমেন্ট স্টোরেজ সিস্টেম, এবং ফাইল সিস্টেমের জন্য।

Lucene তে ইনডেক্সে ডকুমেন্ট আপডেট এবং ডিলিট করার প্রক্রিয়া কিছুটা আলাদা, কারণ ইনডেক্সটি ডিস্কে সংরক্ষিত থাকে এবং এটি যে কোনো ধরনের পরিবর্তন পরিচালনা করার জন্য লুসিনের সঠিক API ব্যবহারের উপর নির্ভর করে। এখানে আমরা দেখব কিভাবে Lucene তে ইনডেক্সে ডকুমেন্ট আপডেট এবং ডিলিট করা যায়।

১. Lucene Index তে ডকুমেন্ট আপডেট করা

Lucene তে ডকুমেন্ট আপডেট করা কিছুটা সোজা, তবে এটি শুধুমাত্র একটি নির্দিষ্ট ডকুমেন্টের ক্ষেত্র পরিবর্তন করতে ব্যবহৃত হয়। একটি ডকুমেন্টের ক্ষেত্রে আপডেট করার জন্য আপনাকে প্রথমে সেই ডকুমেন্টের ID অথবা Unique Field ব্যবহার করে খুঁজে বের করতে হবে এবং তারপরে সেই ডকুমেন্টটি আপডেট করতে হবে।

ডকুমেন্ট আপডেট করার জন্য প্রক্রিয়া:

Update/Delete Existing Document: প্রথমে একটি ডকুমেন্ট খুঁজে বের করতে হবে এবং তারপর সেই ডকুমেন্টটি ডিলিট করে নতুন ডকুমেন্ট ইনসার্ট করতে হবে।
IndexWriter ব্যবহার করে আপডেট করুন।

উদাহরণ:

import org.apache.lucene.document.*;
import org.apache.lucene.index.*;
import org.apache.lucene.store.*;
import org.apache.lucene.search.*;

public class LuceneUpdateExample {

    public static void main(String[] args) throws Exception {
        // Index ডিরেক্টরি
        Directory directory = FSDirectory.open(new java.nio.file.Path("path/to/index"));
        IndexWriterConfig config = new IndexWriterConfig(new StandardAnalyzer());

        // IndexWriter
        IndexWriter writer = new IndexWriter(directory, config);
        
        // Unique Field ব্যবহার করে existing document খুঁজুন
        String docId = "123";  // Unique Field বা Document ID
        
        // Query to find the document
        Term term = new Term("id", docId);
        TermQuery query = new TermQuery(term);
        
        // Update the document
        Document updatedDoc = new Document();
        updatedDoc.add(new StringField("id", docId, Field.Store.YES));
        updatedDoc.add(new TextField("content", "Updated content for the document", Field.Store.YES));

        // Delete the old document and add the updated document
        writer.updateDocument(term, updatedDoc);

        // Commit changes and close the writer
        writer.commit();
        writer.close();
    }
}

এখানে, updateDocument() মেথড ব্যবহার করে একটি পুরানো ডকুমেন্ট ডিলিট করা হয়েছে এবং নতুন ডকুমেন্ট ইনসার্ট করা হয়েছে।

২. Lucene Index তে ডকুমেন্ট ডিলিট করা

Lucene তে ডকুমেন্ট ডিলিট করা খুবই সহজ। আপনাকে শুধু একটি নির্দিষ্ট ডকুমেন্টের Unique Field বা ID ব্যবহার করে ডকুমেন্টটি খুঁজে বের করতে হবে এবং তারপর সেটি ডিলিট করতে হবে।

ডকুমেন্ট ডিলিট করার জন্য প্রক্রিয়া:

Identify the Document: ডকুমেন্টের আইডেন্টিফায়ার (যেমন, ডকুমেন্টের ID বা অন্য কোনো ইউনিক ফিল্ড) দ্বারা ডকুমেন্ট চিহ্নিত করুন।
Delete the Document: IndexWriter এর মাধ্যমে ডকুমেন্ট ডিলিট করুন।

উদাহরণ:

import org.apache.lucene.document.*;
import org.apache.lucene.index.*;
import org.apache.lucene.store.*;
import org.apache.lucene.search.*;

public class LuceneDeleteExample {

    public static void main(String[] args) throws Exception {
        // Index ডিরেক্টরি
        Directory directory = FSDirectory.open(new java.nio.file.Path("path/to/index"));
        IndexWriterConfig config = new IndexWriterConfig(new StandardAnalyzer());

        // IndexWriter
        IndexWriter writer = new IndexWriter(directory, config);
        
        // Unique Field ব্যবহার করে ডকুমেন্ট খুঁজুন
        String docId = "123";  // Unique Field বা Document ID

        // Query to find the document to delete
        Term term = new Term("id", docId);
        
        // Delete the document
        writer.deleteDocuments(term);

        // Commit changes and close the writer
        writer.commit();
        writer.close();
    }
}

এখানে, deleteDocuments() মেথড ব্যবহার করে ডকুমেন্টটিকে ডিলিট করা হয়েছে, যেখানে Term দিয়ে ডকুমেন্টের ID দেওয়া হয়েছে।

৩. Lucene Index আপডেট এবং ডিলিট করার নোটস

IndexWriter হল সেই ক্লাস যেটি নতুন ডকুমেন্ট ইনডেক্স করতে, পুরানো ডকুমেন্ট আপডেট করতে এবং ডকুমেন্ট ডিলিট করতে ব্যবহৃত হয়।
updateDocument() মেথডটি শুধুমাত্র ডকুমেন্টের ফিল্ড পরিবর্তন করতে ব্যবহৃত হয়। যদি আপনি ডকুমেন্টের কিছু ফিল্ড পরিবর্তন করতে চান, তবে পুরানো ডকুমেন্টটি ডিলিট করে নতুন ডকুমেন্ট যুক্ত করতে হবে।
deleteDocuments() মেথডটি ডকুমেন্ট ডিলিট করতে ব্যবহৃত হয়, যেখানে আপনি যে ফিল্ডের ভিত্তিতে ডিলিট করতে চান তা নির্দেশ করতে পারবেন।

৪. Index তে ডকুমেন্ট আপডেট এবং ডিলিট করার Performance Considerations

Bulk Update/Delete: যদি আপনাকে একসাথে অনেক ডকুমেন্ট আপডেট বা ডিলিট করতে হয়, তবে Batch Processing বা Bulk Update/Delete ব্যবহার করা যেতে পারে, যাতে আপনার পারফরম্যান্স সঠিক থাকে এবং ইনডেক্সের পরিমাণ বৃদ্ধি না পায়।
Index Optimization: নিয়মিত ইনডেক্স অপটিমাইজ করা উচিত, কারণ অনেক ডকুমেন্ট ডিলিট বা আপডেট করার পর, ইনডেক্সের পারফরম্যান্স ধীরে ধীরে কমে যেতে পারে। IndexWriter.forceMergeDeletes() বা IndexWriter.optimize() মেথড ব্যবহার করে ইনডেক্সটি অপটিমাইজ করা যেতে পারে।
Locking Mechanisms: যখন একাধিক প্রক্রিয়া একসাথে ইনডেক্সে ডকুমেন্ট আপডেট বা ডিলিট করে, তখন ইনডেক্সে রাইটিং চলাকালীন লকিং ব্যবহার করা উচিত যাতে ডেটা কনসিস্টেন্সি বজায় থাকে।

সারাংশ

Lucene তে Index তে ডকুমেন্ট আপডেট এবং ডকুমেন্ট ডিলিট করার জন্য IndexWriter ব্যবহার করা হয়। updateDocument() এবং deleteDocuments() মেথড ব্যবহার করে আপনি ইনডেক্সে ডকুমেন্ট পরিবর্তন এবং মুছে ফেলতে পারবেন। এটি মূলত ডকুমেন্টের Unique Field বা ID দ্বারা কাজ করে এবং ডকুমেন্টগুলির আপডেট বা ডিলিট করতে দ্রুত এবং কার্যকরী উপায় প্রদান করে। Bulk Update/Delete এবং Index Optimization এর মাধ্যমে আপনি পারফরম্যান্স নিশ্চিত করতে পারেন এবং অনেক ডকুমেন্টের প্রক্রিয়া আরও কার্যকরীভাবে সম্পন্ন করতে পারেন।

Content added By

Md Zahid Hasan

Practical উদাহরণ: IndexWriter এর মাধ্যমে ডকুমেন্ট ম্যানেজমেন্ট

299

Apache Lucene হল একটি শক্তিশালী ওপেন সোর্স তথ্য অনুসন্ধান লাইব্রেরি যা টেক্সট ডেটা ইন্ডেক্সিং এবং অনুসন্ধানের জন্য ব্যবহৃত হয়। এটি বিশেষভাবে দ্রুত এবং নির্ভুল অনুসন্ধান ইঞ্জিন তৈরি করতে সক্ষম। Lucene এর মাধ্যমে ডকুমেন্ট ইন্ডেক্স এবং সেগুলির মধ্যে অনুসন্ধান পরিচালনা করা যায়।

IndexWriter হল Lucene এর একটি ক্লাস যা ডকুমেন্ট ইন্ডেক্সিংয়ের জন্য ব্যবহৃত হয়। এটি ডকুমেন্ট তৈরি, আপডেট এবং মুছে ফেলার কাজ সম্পন্ন করে।

এই টিউটোরিয়ালে, আমরা IndexWriter ব্যবহার করে কিভাবে ডকুমেন্ট ম্যানেজমেন্ট করা যায় তা উদাহরণের মাধ্যমে দেখবো। আমরা একটি ইন্ডেক্স তৈরি করবো, ডকুমেন্ট যুক্ত করবো, এবং সেই ডকুমেন্ট থেকে অনুসন্ধান করবো।

১. Lucene IndexWriter কনফিগারেশন

Lucene ইন্ডেক্স তৈরি এবং পরিচালনা করার জন্য IndexWriter ব্যবহৃত হয়। প্রথমে, আপনাকে Lucene এর ডিপেনডেন্সি pom.xml ফাইলে যুক্ত করতে হবে।

Maven Dependency for Lucene:

<dependencies>
    <dependency>
        <groupId>org.apache.lucene</groupId>
        <artifactId>lucene-core</artifactId>
        <version>8.11.0</version>
    </dependency>
    <dependency>
        <groupId>org.apache.lucene</groupId>
        <artifactId>lucene-analyzers-common</artifactId>
        <version>8.11.0</version>
    </dependency>
</dependencies>

এখানে, lucene-core এবং lucene-analyzers-common ডিপেনডেন্সি যুক্ত করা হয়েছে, যা ইন্ডেক্সিং এবং অনুসন্ধানের জন্য প্রয়োজনীয়।

২. IndexWriter ব্যবহার করে ডকুমেন্ট ইন্ডেক্সিং

এখন, IndexWriter ব্যবহার করে আমরা Lucene ইন্ডেক্স তৈরি করবো এবং ডকুমেন্ট যোগ করবো। এটি মূলত IndexWriterConfig এবং Analyzer এর মাধ্যমে কনফিগার করা হয়।

উদাহরণ: IndexWriter দিয়ে ডকুমেন্ট ইন্ডেক্স করা

import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.document.TextField;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.RAMDirectory;

public class LuceneIndexer {

    public static void main(String[] args) throws Exception {
        // RAM-based directory (in-memory index)
        Directory directory = new RAMDirectory();

        // Standard analyzer for indexing
        StandardAnalyzer analyzer = new StandardAnalyzer();

        // IndexWriterConfig for IndexWriter initialization
        IndexWriterConfig config = new IndexWriterConfig(analyzer);

        // Creating IndexWriter
        IndexWriter writer = new IndexWriter(directory, config);

        // Creating a document
        Document doc = new Document();
        doc.add(new TextField("title", "Lucene in Action", Field.Store.YES));
        doc.add(new TextField("content", "This is a book about Lucene.", Field.Store.YES));

        // Adding document to index
        writer.addDocument(doc);

        // Committing changes
        writer.commit();

        // Closing the writer
        writer.close();
    }
}

এখানে, আমরা RAMDirectory ব্যবহার করেছি যা ইন-মেমরি ডিরেক্টরি তৈরি করে। এতে ডেটা দ্রুত ইনডেক্স করা যায়, এবং এটি টেম্পোরারি, ইন-মেমরি ইন্ডেক্সের জন্য উপযুক্ত।

Document ক্লাসের মাধ্যমে একটি নতুন ডকুমেন্ট তৈরি করা হয় এবং TextField এর মাধ্যমে ডকুমেন্টের ক্ষেত্র (ফিল্ড) যোগ করা হয়। writer.addDocument(doc) দ্বারা ডকুমেন্টটি ইন্ডেক্সে যুক্ত করা হয়।

৩. IndexWriter এর মাধ্যমে ডকুমেন্ট আপডেট এবং মুছে ফেলা

Lucene এ ডকুমেন্ট আপডেট এবং মুছে ফেলা যায়। IndexWriter ক্লাসের মাধ্যমে এই কার্যাবলী করা হয়।

উদাহরণ: ডকুমেন্ট আপডেট এবং মুছে ফেলা

import org.apache.lucene.index.Term;

public class LuceneUpdateDelete {

    public static void main(String[] args) throws Exception {
        // In-memory index directory
        Directory directory = new RAMDirectory();
        StandardAnalyzer analyzer = new StandardAnalyzer();
        IndexWriterConfig config = new IndexWriterConfig(analyzer);

        // Create an IndexWriter
        IndexWriter writer = new IndexWriter(directory, config);

        // Adding a document
        Document doc = new Document();
        doc.add(new TextField("title", "Lucene in Action", Field.Store.YES));
        doc.add(new TextField("content", "This is a book about Lucene.", Field.Store.YES));
        writer.addDocument(doc);
        writer.commit();

        // Updating a document with new content
        Document updatedDoc = new Document();
        updatedDoc.add(new TextField("title", "Lucene in Action - Updated", Field.Store.YES));
        updatedDoc.add(new TextField("content", "This book covers advanced topics.", Field.Store.YES));

        writer.updateDocument(new Term("title", "Lucene in Action"), updatedDoc);
        writer.commit();

        // Deleting a document by its title
        writer.deleteDocuments(new Term("title", "Lucene in Action - Updated"));
        writer.commit();

        // Closing the writer
        writer.close();
    }
}

এখানে:

updateDocument ব্যবহার করে একটি ডকুমেন্টের আপডেট করা হয়েছে যেখানে Term এর মাধ্যমে ডকুমেন্টের ক্ষেত্রের মানের উপর ভিত্তি করে আপডেট করা হয়েছে।
deleteDocuments ব্যবহার করে ডকুমেন্ট মুছে ফেলা হয়েছে।

৪. ডকুমেন্ট অনুসন্ধান (Searching Documents)

Lucene ইন্ডেক্সিং করার পর ডকুমেন্ট অনুসন্ধান করা সহজ। আমরা IndexSearcher ব্যবহার করে ইন্ডেক্সে খোঁজা চালাতে পারি।

উদাহরণ: ইন্ডেক্স থেকে ডকুমেন্ট অনুসন্ধান

import org.apache.lucene.index.DirectoryReader;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.TermQuery;
import org.apache.lucene.store.Directory;

public class LuceneSearcher {

    public static void main(String[] args) throws Exception {
        // In-memory index directory
        Directory directory = new RAMDirectory();
        StandardAnalyzer analyzer = new StandardAnalyzer();
        IndexWriterConfig config = new IndexWriterConfig(analyzer);
        IndexWriter writer = new IndexWriter(directory, config);

        // Creating and adding a document
        Document doc = new Document();
        doc.add(new TextField("title", "Lucene in Action", Field.Store.YES));
        doc.add(new TextField("content", "This is a book about Lucene.", Field.Store.YES));
        writer.addDocument(doc);
        writer.commit();

        // Searching the document
        DirectoryReader reader = DirectoryReader.open(directory);
        IndexSearcher searcher = new IndexSearcher(reader);

        Query query = new TermQuery(new Term("title", "Lucene in Action"));
        TopDocs topDocs = searcher.search(query, 10);

        System.out.println("Total Hits: " + topDocs.totalHits);
        for (ScoreDoc scoreDoc : topDocs.scoreDocs) {
            Document d = searcher.doc(scoreDoc.doc);
            System.out.println("Found Document: " + d.get("title") + " - " + d.get("content"));
        }

        reader.close();
        writer.close();
    }
}

এখানে:

IndexSearcher ব্যবহার করে আমরা একটি Query এর মাধ্যমে ইন্ডেক্সে অনুসন্ধান চালিয়েছি।
TermQuery ব্যবহার করা হয়েছে যেখানে আমরা "title" ক্ষেত্র থেকে ডকুমেন্ট খুঁজেছি।
TopDocs এবং ScoreDoc ব্যবহার করে ফলাফল প্রদর্শন করা হয়েছে।

সারাংশ

IndexWriter ক্লাস Lucene এ ডকুমেন্ট ইন্ডেক্সিং, আপডেট এবং মুছে ফেলার জন্য প্রধান সরঞ্জাম। এটি ডকুমেন্ট যোগ করতে, আপডেট করতে এবং ডিলিট করতে সাহায্য করে। ইনডেক্সিংয়ের মাধ্যমে, আমরা দ্রুত এবং দক্ষ অনুসন্ধান চালাতে পারি। Lucene ইন্ডেক্সিংয়ের মাধ্যমে আপনার টেক্সট ডেটার উপর দক্ষ অনুসন্ধান কার্যক্রম চালানো সম্ভব হয়, যা বড় ডেটাসেট এবং কাঠামোবদ্ধ ডেটা ব্যবস্থাপনায় গুরুত্বপূর্ণ।

Content added By

Md Zahid Hasan

Lucene এর পরিচিতি Lucene সেটআপ এবং ইন্সটলেশন Lucene এর মৌলিক ধারণা Document এবং Field Analyzer এবং Tokenizer

Lucene এ Indexing

১. Lucene এ Indexing এর ভূমিকা

২. Lucene এ Indexing কিভাবে কাজ করে

৩. Lucene Indexing Example

৩.১ ডিপেনডেন্সি যোগ করা (Maven)

৩.২ Indexing Code Example

৪. Lucene Indexing এর সাথে ব্যবহারিক সুবিধা

৫. Lucene এর মাধ্যমে Search করা

Searching Code Example:

৬. Lucene ইনডেক্সিং এর সুবিধা ও চ্যালেঞ্জ

সুবিধা:

চ্যালেঞ্জ:

সারাংশ

IndexWriter ক্লাস এবং এর ব্যবহার

১. IndexWriter ক্লাসের ভূমিকা

IndexWriter এর প্রধান কাজ:

২. IndexWriter এর ইনস্ট্যান্স তৈরি করা

উদাহরণ: Basic IndexWriter Setup

৩. IndexWriter এর বিভিন্ন ফিচার

৩.১ ডকুমেন্ট ইনডেক্সিং (Document Indexing)

৩.২ ডকুমেন্ট আপডেট করা (Document Updating)

৩.৩ ডকুমেন্ট মুছে ফেলা (Deleting Documents)

৪. IndexWriter এর কার্যকারিতা

৫. IndexWriter এর Limitations

সারাংশ

Index তৈরি করা এবং ডকুমেন্ট যোগ করা

১. Lucene Indexing Overview

২. Lucene তে Index তৈরি করা

২.১ Lucene Index Writer Setup

২.২ Index তৈরি এবং Document যোগ করার উদাহরণ

৩. Lucene তে Document (ডকুমেন্ট) তৈরি করা

৩.১ Document ফিল্ড তৈরি করা

৩.২ Field Types:

৪. Lucene তে Document খোঁজা (Searching)

৪.১ Searching Example

সারাংশ

Index তে ডকুমেন্ট আপডেট এবং ডিলিট করা

১. Lucene Index তে ডকুমেন্ট আপডেট করা

ডকুমেন্ট আপডেট করার জন্য প্রক্রিয়া:

উদাহরণ:

২. Lucene Index তে ডকুমেন্ট ডিলিট করা

ডকুমেন্ট ডিলিট করার জন্য প্রক্রিয়া:

উদাহরণ:

৩. Lucene Index আপডেট এবং ডিলিট করার নোটস

৪. Index তে ডকুমেন্ট আপডেট এবং ডিলিট করার Performance Considerations

সারাংশ

Practical উদাহরণ: IndexWriter এর মাধ্যমে ডকুমেন্ট ম্যানেজমেন্ট

১. Lucene IndexWriter কনফিগারেশন

Maven Dependency for Lucene:

২. IndexWriter ব্যবহার করে ডকুমেন্ট ইন্ডেক্সিং

উদাহরণ: IndexWriter দিয়ে ডকুমেন্ট ইন্ডেক্স করা

৩. IndexWriter এর মাধ্যমে ডকুমেন্ট আপডেট এবং মুছে ফেলা

উদাহরণ: ডকুমেন্ট আপডেট এবং মুছে ফেলা

৪. ডকুমেন্ট অনুসন্ধান (Searching Documents)

উদাহরণ: ইন্ডেক্স থেকে ডকুমেন্ট অনুসন্ধান

সারাংশ

All Notifications

Promotion

Satt AI

Hi, আমি SATT AI!