বিটওয়াইজ্ সিভ(Bitwise sieve)

বিটওয়াইজ সিভ প্রাইম সংখ্যা বের করার জন্য প্রচলিত অ্যালগোরিদম Sieve of Eratosthene এ মেমরির ব্যবহার অনেক কমিয়ে আনা যায়! সাধারণ সিভে N পর্যন্ত প্রাইম জেনারেট করলে N সাইজের একটি অ্যারে ডিক্লেয়ার করতে হয়। অ্যরের প্রতিটি এলিমেন্ট একটি করে ফ্ল্যাগ হিসাবে কাজ করে যেটা দেখে আমরা বুঝি একটি সংখ্যা প্রাইম নাকি কম্পোজিট। বিটওয়াইজ্ সিভে আমরা ফ্ল্যাগ হিসাবে ইন্টিজার বা বুলিয়ান এর বদলে সরাসরি বিট ব্যবহার করবো।

এ টিউটোরিয়াল পড়ার আগে দুটি বিষয় তোমাকে জেনে আসতে হবে
১. Sieve of Eratosthene এর সাধারণ ভার্সণ,তুমি এটা আমার এই পোস্টটি পড়ে শিখতে পারবে সহজেই।

২. সি/সি++ এ বিটওয়াইজ্ অপারেটরের ব্যবহার। এটাও খুব সহজে শিখতে পারবে এখান থেকে। টিউটোরিয়ালটির ১ম ২টি অংশ খুব ভালো করে পড়ে ফেলো,বিটমাস্ক ডিপি,বিএফএস যখন শিখবে তখন অনেক কাজে লাগবে।

আশা করি এখন তুমি বিটওয়াইজ্ অপারেটর সম্পর্কে অনেক কিছু জানো,সাধারণ সিভ লিখতে কোনো সমস্যা হয়না তোমার। এবার আমরা শিখবো বিটওয়াইজ সিভ।

সাধারণ সিভে status বা flag অ্যারেটার কাজ কি? এই অ্যারের ইনডেক্সের মান দেখে আমরা বলতে পারি একটি সংখ্যা প্রাইম কিনা। ধরলাম তোমার status অ্যারেটা ইন্টিজার টাইপের। প্রতিটি ইন্টিজারের মধ্য আছে ৩২টি বিট। আমরা কেনো এতগুলো বিট ব্যবহার করবো খালি ০ বা ১ নির্দেশ করতে? আমরা অ্যারের যেকোনো ইনডেক্সের প্রতিটি বিট দিয়ে একটি সংখ্যা নির্দেশ করতে পারি।

তুমি যখন ইন্টিজার অ্যারেতে ১-৭ পর্যন্ত প্রাইম জেনারেট কর, তোমার অ্যারের অবস্থা বাইনারিতে থাকে এরকম:

প্রতিটি ইনডেক্সে ৩১টি বিট কোনো কাজে লাগছেনা অথচ এই বিশাল সংখ্যক অব্যবহৃত বিট আমরা সহজেই কাজে লাগাতে পারি। আমরা ধরে নিবো:

তাহলে ১-৭ পর্যন্ত প্রাইম জেনারেট করলে তোমার অ্যারের অবস্থা দাড়াবে:

status[১]= ০০০০…….১০১০১১০০(মোট ৩২টি বিট) (সবথেকে ডানের বিট==০ তম বিট)

৭টি সংখ্যার কাজ একটি ইনডেক্সেই শেষ!!। শুধু ৭টি নয়,আসলে ৩১টি সংখ্যার কাজ শেষ হবে ১টি ইনডেক্স(কারণ প্রতি ইনডেক্সের ৩১টি বিট ব্যবহার করছি আমরা)। এখন প্রশ্ন হলো কোনো সংখ্যার প্রাইমালিটি কত নম্বর ইনডেক্সের কত নম্বর বিট দিয়ে নির্দেশ করা হবে? খুব সহজ, সংখ্যাটি i হলে i/৩২ নম্বর ইনডেক্সের i%৩২ নম্বর বিট আমাদের চেক করতে হবে। তাহলে i=১ হলে চেক করবো ০ নম্বর ইনডেক্সের ১ নম্বর বিট, i=৩৩ হলে চেক করবো ১ নম্বর ইনডেক্সের ১ নম্বর বিট ইত্যাদি। (শুন্য বেসড ইনডেক্সিং)

কোডিং অংশ একদম সহজ। তুমি যেহেতু বিটওয়াজ অপারেটরের ব্যবহার জানো,কোনো সংখ্যার pos তম বিটে ১ বা ০ আছে নাকি সহজেই চেক করতে পারবে। pos তম বিটে নিজের ইচ্ছামত ১ বা ০ বসাতেই পারবে। আমাদের এখানে ০ বসানো দরকার নেই,১ বসাতে পারলেই চলবে। দুটি ফাংশন লিখে ফেলি:

এবার সিভ লিখে ফেলি:

লক্ষ্য করো,আমরা সাধারণ সিভের মত করেই সব লিখেছি,তবে status[i] এর মান চেক করার বদলে status[i/32] এর i%32 নম্বর বিটের মান চেক করেছি।
বিটওয়াইজ সিভ ব্যবহার করে ১০^৮ পর্যন্ত প্রাইম তুমি জেনারেট করে ফেলতে পারবে। সাধারণ সিভের থেকে সময় + মেমরি কম লাগবে। সাধারণ গুণ,ভাগ অপারেশনের থেকে বিটের অপারেশনগুলো দ্রুত কাজ করে। আমরা আরো কিছু অপটিমাইজেশন করতে পারি। যেমন তুমি উপরে দেয়া টিউটোরিয়াল পড়ে থাকলে জানো যে কাওকে ২ দিয়ে গুণ করা আর সংখ্যাটির বাইনারিকে ১ ঘর বামে শিফট করা একই কথা। আবার ২ দিয়ে ভাগ করা আর ১ ঘর ডানে শিফট করা একই কথা,৩২ দিয়ে mod করা আর ৩১ দিয়ে AND করা একই কথা। তাহলে আমরা নিচের মত করে কোডটি লিখতে পারি:

ফাংশন ব্যবহার না করে ম্যাক্রো ব্যবহার করলে আরো কম সময় লাগবে। প্রোগ্রামিং কনটেস্টে খুব কমই বিটওয়াইজ সিভ ব্যবহার করা দরকার হয়,সাধারণ সিভেই কাজ চলে। তারপরেও এটা শিখলে বিটের কনসেপ্ট গুলো কিছুটা পরিস্কার হবে,অন্য কোনো প্রবলেমে হয়তো মেমরি কমিয়ে ফেলতে পারবে। ডাইনামিক প্রোগ্রামিং এ আমরা প্রায়ই বিটমাস্কের ব্যবহার করি মূলত মেমরি কমানোর জন্য।

তোমার ইম্প্লিমেন্টেশন সঠিক নাকি চেক করতে নিচের সমস্যাটি সমাধান করে ফেলো:
http://www.spoj.pl/problems/TDPRIMES/

(নোট: অনেকের ভূল ধারণা আছে যে bool টাইপের ভ্যারিয়েবলের আকার ১বিট। আসলে bool এর আকার ৮বিট বা এক বাইট,char এর সমান। এর কারণ হলো কম্পিউটার ১ বাইটের ছোটো মেমরি সেগমেন্টকে অ্যাড্রেস করতে পারেনা, তাই ভ্যারিয়েবলের নূন্যতম আকার ১ বাইট)

Print Friendly, PDF & Email

ফেসবুকে মন্তব্য

comments

Powered by Facebook Comments

63,370 times read (exlcuding bots)

17 thoughts on “বিটওয়াইজ্ সিভ(Bitwise sieve)

  1. ভাই, ১৫ তম লাইনে j%31 এর পরিবর্তে j%32 হবে না? j%32 এবং j&31 একই হবার কথা। যদি P=2^x হয়, তাহলে n%p = n&(p-1) হওয়ার কথা। এটা নিয়ে একটু confusion হচ্ছে। 🙁

    1. হ্যা j%32 হবে, আমি ঠিক করে দিচ্ছি। যদিও j%31 লিখলেও কোডটা কাজ করে এজন্য হয়তো খেয়াল করিনি ঠিকমত তাই কনফিউশন তৈরি হয়েছে।

  2. int(signed integer) এর left Most bit যেহেতু sign bit, তাই আমরা যখন একে left shifting করি তখন left most বিটে 1 পুশ করলে সংখ্যাটা নেগেটিভ হওয়ার সম্ভাবনা থাকে। তাই i<<1 ব্যবহার করা কি ঠিক হবে?
    আমি ভুল হতে পারি, for( j = i*i; j <= N; j += 2*i ) লাইনের মাধ্যমে কি সব মাল্টিপল বের হবে? for( j = 2*i; j <= N; j += i ) দিলে হবার কথা !
    i%31 গুলোকে i%32 দিয়ে রিপ্লেস করলে ভাল হত। কিছুটা কনফিউজিং লাগছে 🙂

  3. একটা বিষয়ে সমস্যা হচ্ছে, আপনি এখানে status এরেকে গ্লোবাল ধরে নিয়েছেন, এবং N এর মানকেও গ্লোবালি ইনিশিয়ালাইজ করেছেন, আমি যদি status কে লোকাল ভ্যারিয়েবল(মনে করি, সীভ ফাংশনের ভেতর) হিসেবে ইনিশিয়ালাইজ করি, এবং N কে আর্গুমেন্ট আকারে মেইন ফাংশন থেকে পাস করে দেই, তাহলে কিছু প্রাইম জেনারেট হচ্ছে না। এই সমস্যা সমাধান জানালে উপকৃত হতাম 🙂

    কোডটার একটা রাফ ভার্সনঃ
    http://paste.ubuntu.com/8506585/

    1. নিচের লাইনটা যোগ করে নাও ডিক্লারেশন এর পরে:
      memset(refr,0,sizeof refr); //need cstring header file
      লোকাল ভ‍্যারিয়েবল ০ দিয়ে initialize করা থাকেনা, গার্বেজ ভ‍্যালু থাকে, তাই সমস‍্যা হচ্ছে।
      আরেকটা কথা, অ‍্য‍ারের সাইজ বেশি বড় হয়ে গেলে লোকাল ভ‍্যারিয়েবল রানটাইম ইরোর দিতে পারে, তবে লোকাল ভ‍্যারিয়েবলের এক্সেস টাইম গ্লোবালের থেকে কম।

    1. N= (N | (1<<pos)). যে সংখ্যাটির বিটের মধ্যে স্টোর করা হচ্ছে সেই সংখ্যাটির pos তম বিট কে 1 মার্ক করে( 1 বানিয়ে) রিটার্ন করা হয়েছে।
      example :
      N= 100001, pos=3, 1<<3=1000, N | (1<<3) = 101001.
      সুতরাং, মার্ক করে রিটার্ন করার পর N এর নতুন মান 101001.

Leave a Reply

Your email address will not be published. Required fields are marked *