Solr Configuration ফাইলের পরিচিতি

Apache Solr ইনস্টলেশন এবং সেটআপ - অ্যাপাচি  সলর (Apache Solr) - Big Data and Analytics

367

অ্যাপাচি সলর (Apache Solr) একটি ওপেন-সোর্স সার্চ প্ল্যাটফর্ম, যা Apache Lucene এর উপর ভিত্তি করে তৈরি। সলর ডেটা ইনডেক্সিং, সার্চ এবং বিশ্লেষণ করতে ব্যবহৃত হয় এবং এটি উচ্চ পারফরম্যান্স এবং স্কেলেবিলিটি প্রদান করে। সলরের সঠিক কার্যকারিতা নিশ্চিত করতে, বিভিন্ন configuration files ব্যবহার করা হয় যা সলরের ইনস্টলেশন, ইনডেক্সিং, সার্চ এবং অন্যান্য কার্যক্রম কনফিগার করে।

সলর কনফিগারেশন ফাইলগুলি মূলত XML ফর্ম্যাটে থাকে এবং এগুলি সলরের সার্ভার এবং কোর (core) কনফিগারেশন, ইনডেক্সিং স্ট্রাটেজি, সার্চ অপটিমাইজেশন এবং অন্যান্য ফিচার কাস্টমাইজ করতে ব্যবহৃত হয়।

এই টিউটোরিয়ালে, আমরা সলরের প্রধান কনফিগারেশন ফাইলগুলির পরিচিতি এবং তাদের কার্যকারিতা সম্পর্কে আলোচনা করব।


Solr Configuration ফাইলের ধরন

সলর কনফিগারেশন ফাইলগুলি সাধারণত তিনটি প্রধান ফাইলের মধ্যে বিভক্ত:

  1. solrconfig.xml: সলরের সার্ভার কনফিগারেশন ফাইল।
  2. schema.xml: সলরের ইনডেক্স স্কিমা কনফিগারেশন ফাইল।
  3. solr.xml: সলর সার্ভারের প্রধান কনফিগারেশন ফাইল, যা সার্ভারের সাধারণ সেটিংস ধারণ করে।

১. solrconfig.xml

solrconfig.xml হল সলরের সার্ভার কনফিগারেশন ফাইল যা সার্ভারের বিভিন্ন কার্যকারিতা এবং কর্মপদ্ধতি কনফিগার করে। এই ফাইলটির মধ্যে আপনি বিভিন্ন সার্ভিসের কনফিগারেশন পাবেন, যেমন সার্চ, ইনডেক্সিং, ক্যাশিং, লোগিং, রিপ্লিকেশন এবং আরও অনেক কিছু।

solrconfig.xml ফাইলের কিছু প্রধান সেকশন:

  • Request Handlers: এই সেকশনটি সার্চ কোয়েরি এবং অন্যান্য রিকোয়েস্টের জন্য পছন্দসই হ্যান্ডলার কনফিগার করে। উদাহরণস্বরূপ, সার্চ, ইনডেক্সিং বা ফ্যাসেটিং রিকোয়েস্ট হ্যান্ডলার।

    <requestHandler name="/select" class="solr.SearchHandler">
        <lst name="defaults">
            <str name="wt">json</str>
            <str name="rows">10</str>
        </lst>
    </requestHandler>
    
  • Data Directory: সলর ডেটা এবং ইনডেক্স ফাইলের জন্য ডিরেক্টরি কনফিগার করে।

    <dataDir>${solr.data.dir}</dataDir>
    
  • Caching: ক্যাশিং কনফিগারেশন যেমন filterCache, queryResultCache, ইত্যাদি।

    <filterCache class="solr.LRUCache" size="512" initialSize="64" autowarmCount="0"/>
    
  • Logging: লোগিং কনফিগারেশন সলরের লোগিং পদ্ধতি নির্ধারণ করে।

    <logging>
        <logger name="org.apache.solr" level="INFO"/>
    </logging>
    
  • Replication: সলর ইনডেক্স রেপ্লিকেশন কনফিগারেশন।

    <replication>
        <master>
            <str name="replicaType">master</str>
            <str name="pollInterval">00:00:30</str>
        </master>
    </replication>
    

২. schema.xml

schema.xml ফাইলটি সলরের ইনডেক্স স্কিমা কনফিগার করে, যার মাধ্যমে সলর কীভাবে ডেটাকে ইনডেক্স করবে এবং কীভাবে সার্চ করবে তা নির্ধারিত হয়। এই ফাইলে আপনি বিভিন্ন ইনডেক্স ফিল্ডের জন্য টাইপ, অ্যানালাইজার এবং অন্যান্য বৈশিষ্ট্য কনফিগার করতে পারেন।

schema.xml ফাইলের প্রধান সেকশন:

  • Field Definitions: প্রতিটি ইনডেক্স ফিল্ডের টাইপ, স্টোরেজ প্যারামিটার এবং অন্যান্য বৈশিষ্ট্য নির্ধারণ করা হয়।

    <field name="id" type="string" indexed="true" stored="true"/>
    <field name="name" type="text_general" indexed="true" stored="true"/>
    
  • Field Types: বিভিন্ন ফিল্ড টাইপ যেমন string, text, date, int, float ইত্যাদি কনফিগার করা হয়।

    <fieldType name="text_general" class="solr.TextField">
        <analyzer type="index">
            <tokenizer class="solr.StandardTokenizerFactory"/>
            <filter class="solr.LowerCaseFilterFactory"/>
        </analyzer>
    </fieldType>
    
  • CopyField: এক ফিল্ডের ডেটা অন্য ফিল্ডে কপি করার জন্য এই সেকশনটি ব্যবহৃত হয়।

    <copyField source="name" dest="text"/>
    
  • Dynamic Fields: সলরে ডাইনামিক ফিল্ড ডেফিনিশন।

    <dynamicField name="*_s" type="string" indexed="true" stored="true"/>
    

৩. solr.xml

solr.xml হল সলরের প্রধান কনফিগারেশন ফাইল, যা সার্ভারের সাধারণ সেটিংস এবং কনফিগারেশন ধারণ করে। এটি সলরের সার্ভিস এবং কোরগুলির জন্য বেসিক কনফিগারেশন পরিচালনা করে।

solr.xml ফাইলের কিছু প্রধান সেকশন:

  • Solr Home Directory: সলর হোম ডিরেক্টরি কনফিগার করা হয়। এটি সেই ডিরেক্টরি যেখানে সলরের কনফিগারেশন ফাইল এবং ডেটা সংরক্ষণ করা হয়।

    <solrHome>/path/to/solr_home</solrHome>
    
  • Zookeeper Configuration: সলরের জন্য Zookeeper কনফিগারেশন। এটি সলরের ডিস্ট্রিবিউটেড কনফিগারেশন এবং রেপ্লিকেশন ব্যবস্থাপনার জন্য ব্যবহৃত হয়।

    <zookeeper>
        <str name="host">localhost:2181</str>
    </zookeeper>
    
  • Cores Configuration: সলরের কোর কনফিগারেশন। সলর ক্লাস্টারে কোর ব্যবস্থাপনা এবং তাদের লোকেশন এখানে নির্ধারিত হয়।

    <cores adminPath="/admin/cores">
        <core name="collection1" instanceDir="${solr.home}/collection1" />
    </cores>
    

Solr Configuration ফাইলগুলোর মধ্যে সম্পর্ক

  • solrconfig.xml: সার্ভারের কনফিগারেশন এবং সার্চ হ্যান্ডলার পরিচালনা করে। এটি সলরের প্রাথমিক কার্যক্রম এবং সার্ভিস কনফিগার করে।
  • schema.xml: সলরের ডেটা ইনডেক্স এবং ফিল্ড স্কিমা কনফিগার করে। এটি সলরের সার্চ ইন্ডেক্সে ব্যবহৃত ফিল্ডের গঠন এবং টাইপ নির্ধারণ করে।
  • solr.xml: সলরের প্রধান কনফিগারেশন ফাইল, যা সার্ভারের ডিরেক্টরি, কোর এবং জুকিপার কনফিগারেশন ধারণ করে।

সারাংশ

Solr Configuration Files সলরের কার্যক্ষমতা, ইনডেক্সিং, সার্চ এবং অন্যান্য কার্যক্রম পরিচালনার জন্য অত্যন্ত গুরুত্বপূর্ণ। সলরের মূল কনফিগারেশন ফাইলগুলি solrconfig.xml, schema.xml, এবং solr.xml। এগুলির মাধ্যমে আপনি সলরের সার্ভিস, ইনডেক্স স্কিমা এবং কোর কনফিগারেশন কাস্টমাইজ করতে পারবেন, যা সলরের সার্চ ক্ষমতা এবং পারফরম্যান্স বাড়ানোর জন্য অপরিহার্য।

Content added By
Promotion

Are you sure to start over?

Loading...