Strings এ Unicode Character Representation

Unicode Codepoint Escape Syntax (ইউনিকোড কোডপয়েন্ট এস্কেপ সিনট্যাক্স) - পিএইচপি (PHP 7) - Computer Programming

481

PHP তে Unicode Character Representation ব্যবহারের মাধ্যমে আপনি আন্তর্জাতিক ভাষা বা বিশেষ চিহ্নগুলি কাজ করতে পারেন, যা সাধারণত শুধুমাত্র ASCII ক্যারেক্টার সেটে উপলব্ধ নয়। Unicode ব্যবহার করার ফলে আপনি বিভিন্ন ভাষা, যেমন চীনা, আরবী, বাংলা, এবং অন্যান্য আন্তর্জাতিক ভাষার চরিত্রগুলি PHP এ সহজেই প্রদর্শন এবং প্রক্রিয়া করতে পারেন।

Unicode Character Representation in PHP

PHP তে Unicode এর চরিত্রগুলো বিশেষ কোড পয়েন্ট ব্যবহার করে উপস্থাপিত হয়। Unicode একটি মানক সিস্টেম যা পৃথিবীজুড়ে সকল ভাষার অক্ষর এবং প্রতীকগুলিকে একটি নির্দিষ্ট সংখ্যা দ্বারা চিহ্নিত করে।

১. Unicode Escape Sequences

PHP তে Unicode escape sequences ব্যবহার করা হয় ইউনিকোড ক্যারেক্টার প্রদর্শন করার জন্য। আপনি এই escape sequences ব্যবহার করে বিশেষ ইউনিকোড চরিত্রগুলো কোডের মধ্যে রাখতে পারেন।

  • Unicode escape sequence এর সাধারণ রূপ: \u{xxxx}, যেখানে xxxx হলো সেই ইউনিকোড ক্যারেক্টারের কোড পয়েন্ট।

Unicode Escape Sequence এর উদাহরণ:

<?php
echo "\u{2022}";  // আউটপুট হবে: • (Bullet point character)
?>

এখানে, \u{2022} হলো ইউনিকোডের বুলেট পয়েন্ট চরিত্র। আপনি বিভিন্ন ইউনিকোড ক্যারেক্টার এভাবে ব্যবহার করতে পারেন।


২. utf8_encode() এবং utf8_decode()

PHP তে utf8_encode() এবং utf8_decode() ফাংশন ব্যবহার করা হয় UTF-8 এনকোডিং/ডিকোডিং এর জন্য। তবে, এগুলি শুধুমাত্র ISO-8859-1 থেকে UTF-8 রূপান্তরের জন্য প্রযোজ্য। এটি ইউনিকোড সম্পর্কিত অনেক সমস্যার সমাধান করতে সহায়ক হতে পারে, তবে UTF-8 এবং Unicode সম্পর্কিত কাজের জন্য সাধারণত আপনি mbstring এক্সটেনশন ব্যবহার করেন।

utf8_encode() উদাহরণ:

<?php
$original_string = "café";  // 'é' হলো একটি ইউনিকোড ক্যারেক্টার
$encoded_string = utf8_encode($original_string);

echo $encoded_string;  // আউটপুট হবে: café
?>

এখানে utf8_encode() ফাংশনটি ISO-8859-1 এনকোডিং থেকে UTF-8 তে রূপান্তর করছে।


৩. mbstring (Multibyte String) Extension

mbstring এক্সটেনশন PHP তে বিশেষভাবে Multibyte character encodings (যেমন UTF-8, Shift_JIS, EUC-JP, GB2312) কাজ করার জন্য ব্যবহৃত হয়। এটি Unicode সাপোর্টের জন্য একটি শক্তিশালী সরঞ্জাম, বিশেষ করে যখন বিভিন্ন ভাষার সাপোর্ট প্রয়োজন।

mbstring এর মাধ্যমে Unicode Character Representation:

<?php
// UTF-8 স্ট্রিংয়ে ইউনিকোড ক্যারেক্টার নিয়ে কাজ করা
$str = "Hello, مرحبا, こんにちは";
echo mb_strlen($str, 'UTF-8');  // আউটপুট হবে: 18
?>

এখানে mb_strlen() ফাংশনটি UTF-8 এনকোডিং ব্যবহার করে স্ট্রিংয়ের দৈর্ঘ্য গণনা করছে, যেটি ইউনিকোড ক্যারেক্টারগুলোও সঠিকভাবে গণনা করতে সক্ষম।


৪. Unicode Characters in HTML and PHP

PHP এ ইউনিকোড চিহ্ন ব্যবহার করতে, HTML ট্যাগের মধ্যে numeric character references বা named character references ব্যবহার করা যেতে পারে।

Unicode Character Using Numeric Character Reference:

<?php
echo "Unicode Character: 😀";  // আউটপুট হবে: 😀 (grinning face emoji)
?>

এখানে, 😀 হলো ইউনিকোডের গ্রিনিং ফেস ইমোজির কোড পয়েন্ট।

Unicode Character Using Named Character Reference:

<?php
echo "Unicode Character: ©";  // আউটপুট হবে: © (copyright symbol)
?>

এখানে, © হলো © ইউনিকোড চিহ্নের নাম।


৫. Working with Multilingual Strings

PHP তে ইউনিকোডের মাধ্যমে আপনি বহু ভাষায় কাজ করতে পারবেন, যেমন:

<?php
$bangla_text = "বাংলা ভাষা";
echo $bangla_text;  // আউটপুট হবে: বাংলা ভাষা
?>

এখানে, আপনি বাংলার ইউনিকোড চরিত্রগুলো ব্যবহার করে PHP তে সঠিকভাবে লেখা বা প্রদর্শন করতে পারেন।


সারসংক্ষেপ

PHP তে Unicode Character Representation আপনাকে আন্তর্জাতিক ভাষা এবং বিশেষ চরিত্রগুলির সাথে কাজ করতে সহায়ক একটি গুরুত্বপূর্ণ বৈশিষ্ট্য। আপনি ইউনিকোড ক্যারেক্টারগুলি escape sequences, mbstring এক্সটেনশন, এবং numeric character references ব্যবহার করে কোডে সঠিকভাবে ব্যবহার করতে পারেন। ইউনিকোডের সঠিক ব্যবহার নিশ্চিত করতে আপনি UTF-8 এনকোডিং এবং mbstring এক্সটেনশন ব্যবহার করতে পারেন, যা PHP-তে আন্তর্জাতিকীকরণ এবং বহু ভাষার সমর্থন সহজ করে তোলে।

Content added By
Promotion

Are you sure to start over?

Loading...