বিজ্ঞান

ক্যাপচা কাজ করে কীভাবে

অনলাইন ফর্মের কিংবা কোন পোর্টালের সাইন-আপটা প্রায় হয়েই গিয়েছিল এমন সময় একটি বক্স এল স্ক্রিনের সামনে। সেখানে কয়েকটা ছবি রয়েছে যাদের মধ্যে আপনাকে ব্রিজ কিংবা স্ট্রিট লাইট বা দরজা ইত্যাদি জিনিসের ছবি খুঁজে ক্লিক করতে হবে (চিত্র – ১)। আপনি প্রয়োজনীয় ছবিগুলিতে ক্লিক করার পর ওই বক্সের নীচে একটা জায়গায় ‘I am not robot’-এই কথার পাশে একটা ছোট্ট বক্সে টিক দিতে হবে। কিংবা ধরুন অনলাইন ফর্মের নীচে একটা এলেমেলো ছড়ানো কিছু শব্দ লেখা আছে ইংরেজিতে যার কিছুটা ক্যাপিটালে আবার কিছুটা স্মল লেটারে। কখনো কখনো শব্দগুলোর ব্যাকগ্রাউন্ডটা খুব একটা পরিস্কার থাকে না তাই শব্দগুলো বুঝতে বেশ অসুবিধাই হয়। কখনো শব্দের জায়গায় বা শব্দের মাঝে অক্ষরও থাকে। আমাদের প্রায়শয়ই এরকম অভিজ্ঞতা হয়ে থাকে। আর বলাবাহুল্য, আমরা কখনো কখনো বেশ বিরক্ত হই এই শব্দগুলি বা ছবিগুলি মিলিয়ে দেখে ফিল-আপ করার সময়। এই শব্দগুলি, সংখ্যাগুলি বা ছবিগুলিকে ‘ক্যাপচা (CAPTCHA)’ বলা হয়। CAPTCHA কথাটার পুরো নাম হল ‘কমপ্লিটলি অটোমেটেড পাবলিক টিউরিং টেস্ট টু টেল কম্পিউটারস অ্যান্ড হিউম্যানস অ্যাপার্ট’ (Completely Automated Public Turing test to tell Computers and Humans Apart)। অন্য কথায় বলতে গেলে ক্যাপচা নির্ণয় করে যে ব্যবহারকারী আসলে মানুষ নাকি একটা স্প্যাম রোবট বা স্প্যামবট। স্প্যামবট হল এক ধরণের কম্পিউটার প্রোগ্রাম যা বিভিন্ন ধরণের স্প্যাম বা অপ্রয়োজনীয় বার্তা ছড়িয়ে থাকে। ক্যাপচা কিছু সংখ্যা বা শব্দ দিয়ে থাকে যা মানুষরাই সহজে বুঝতে পারবে। বিভিন্ন স্প্যাম, বট বা ডসের আক্রমণের থেকে বাঁচাতে এই ক্যাপচা পদ্ধতিকেই ওয়েব শিল্প বেশি করে ব্যবহার করে থাকে। এবার জানব এই ক্যাপচা কাজ করে কীভাবে?  

চিত্র – ১

ক্যাপচা তৈরি হয়েছিল বিংশ শতাব্দীর শুরুর দিকে যখন ইংরেজ গণিতজ্ঞ ও ন্যায়বাগীশ অ্যালান টিউরিং (১৯১২-১৯৫৪) একটা প্রশ্নের উত্তরের খোঁজ করছিলেন যে কম্পিউটারেরা কি মানুষের মতো ভাবতে পারবে? এর জন্য তিনি অনুকরণের একটি খেলা (Imitation game) তৈরি করেছিলেন যার নাম ‘টিউরিং পরীক্ষা (Turing test)। এই খেলায় একজন প্রশ্নকর্তা অংশগ্রহণকারীদের একাধিক প্রশ্ন জিজ্ঞাসা করতেন, এই অংশগ্রহণকারীদের একজন মানুষ এবং অপরজন যন্ত্র। প্রশ্নকর্তা খুঁজে বের করতেন ওই অংশগ্রহণকারীদের মধ্যে কে মানুষ। প্রশ্নকর্তা কিন্তু অংশগ্রহকারীদের দেখতে বা শুনতে পারতেন না কেবলমাত্র তাদের দেওয়া প্রতিক্রিয়ার ওপর নির্ভর করতে হত। যদি প্রশ্নকর্তা কোনটা মানুষ বা কোনটা যন্ত্র চিনতে ভুল করতেন তবে ওই টিউরিং পরীক্ষায় যন্ত্র পাস করে যেত। বর্তমান ক্যাপচা এই একই পদ্ধতির উন্নত রূপ ব্যবহার করে ওয়েবসাইটকে জানিয়ে দেয় যে তার ব্যবহারকারী মানুষ না অন্য কোনো স্প্যামবট। ব্যবহারকারীকে অনেক সময় কম্পিউটার চিনতে পারে না আর তাই এই সমস্যা সমাধানের জন্যে ক্যাপচা কাজে লাগে।আর প্রশ্নগুলিও মানুষের পক্ষে উত্তর দেওয়া সহজ। ২০০০ দশকের শুরুর দিকে কেবলমাত্র ছবি দিয়েই ক্যাপচা তৈরি হত যা স্প্যামবটকে হারাতে যথেষ্ট ছিল কিন্তু যতদিন গড়ালো তত নিরাপত্তার বিষয়টি আরও জোরালো হয়ে উঠল, স্প্যামবটগুলিও আরও চালাক হয়ে উঠল আর সেই কারণে শুধু ছবি নয় এর সাথে লেখা এবং সংখ্যাও জুড়ে গেল।    

ক্যাপচা তৈরি হয়েছিল ওয়েব পেজে স্প্যামি সফটওয়্যারগুলিকে আটকাতে  যাতে সেগুলি কোনো কমেন্ট করতে না পারে বা সন্দেহজনক কোন কাজ করতে না পারে বা একবারে অনেকগুলি প্রসেস বা ট্রানজাকশন চালাতে না পারে। ক্যাপচায় সাধারণত অনেকগুলি ছড়িয়ে ছিটিয়ে ছবি বা আঁকবাঁকা, বড় ছোট মিলিয়ে শব্দ থাকে। ওইসব ছবি থেকে কোনো সাধারণ থিম বের করতে হবে কিংবা শব্দগুলো বুঝে কথাটা লিখতে হবে। আসলে স্প্যামিবট বা বিভিন্ন প্রোগ্রাম নির্দিষ্ট কিছু লজিকে চলে তাই তারা অসামঞ্জস্যপূর্ণ (Random) ছবি বা শব্দ সহজে বুঝতে পারে না।আবার ক্যাপচা মানুষের সামনে সেই সমস্ত ভাষাই রাখে যা মানুষে ধরতে বা বুঝতে পারবে। বিকৃতভাবে লেখাই হোক কিংবা কিংবা বিভিন্ন ফন্টে বা ধরণে লেখা থাকলেও মানুষ তা বুঝতে পারে। ক্যাপচা ব্যবহারের ফলে ওয়েবসাইট ব্যবহারকারী মানুষ না স্প্যামবট তা বুঝতে পারে। মজার কথা হল এই লেখা, সংখ্যা বা ছবি চিহ্নিত করতে মানুষের অসুবিধা না হলেও স্প্যাম রোবট বা স্প্যামবটের বড়ই অসুবিধা হয়, তারা এই চিনতে পারার পরীক্ষায় পাশ করতে পারে না। আর সেজন্য ওয়েবসাইটে প্রবেশ বা অন্যান্য কার্যকলাপ করা সম্ভব হয় না। কিন্তু মানুষেরা চিনতে পারার পরীক্ষায় পাস করে ওয়েবসাইটটি সহজেই ব্যবহার করতে পারে। এই ভাবেই আমরা ওয়েবসাইটটিকে বোঝাতে পারি ‘I am not a robot’- অর্থাৎ পাস হয়ে গেলাম আমরা। 

চিত্র – ২

কিন্তু মজার কথা হল এক দল প্রোগ্রামার যখন ওয়েবসাইটকে সুরক্ষা দিতে ক্যাপচা পদ্ধতির উন্নতি করছেন অন্য দিকে আরেক দল প্রোগ্রামার স্প্যামি বট বা প্রোগ্রামগুলির উন্নতি করে যাচ্ছে। ফলে তাদের আটকাতে ক্যাপচা প্রযুক্তিকেও আরও উন্নত করতে হচ্ছে কেননা আগের সুরক্ষা পদ্ধতির ফাঁকফোঁকর বের করে ফেলছে আধুনিক স্প্যাম বটগুলি। তাই ক্যাপচাকেও আধুনিক হতে হল। বাংলায় বলে না যেমন কুকুর তেমন মুগুর- সেইরকম ব্যাপার আর কি। বর্তমানে প্রথাগত ক্যাপচার পরিবর্তে গুগল থেকে একটি বিনামূল্যে পরিষেবা চালু হয়েছে যার নাম রি-ক্যাপচা (reCAPTCHA)। বাংলায় যদিও বলা যায় পুনরায় ক্যাপচা তবে রি-ক্যাপচা শব্দটিই জনপ্রিয়। এই রি-ক্যাপচা প্রযুক্তি ২০০৭ সালে তৈরি করেছেন মার্কিন যুক্তরাষ্ট্রের কার্নেগি মেলন বিশ্ববিদ্যালয়ের গবেষকরা। পরে ২০০৯ সালে এই প্রযুক্তি গুগল অধিগ্রহণ করে।এই রি-ক্যাপচা প্রযুক্তি সাধারণ ক্যাপচা পরীক্ষার থেকে অনেকটাই উন্নত। ক্যাপচার মতোই কিছু কিছু রি-ক্যাপচার ক্ষেত্রে ব্যবহারকারীদের চিত্রে লেখা শব্দগুলিকেই লিখতে হয়। কখনো কখনো খুব নিরাপত্তার জন্যে সেগুলো বিকৃত বা অস্পষ্ট অবস্থায় থাকে যা পাঠ করতে কষ্টকর হয় (চিত্র – ২)। মজার কথা হল চিত্র থেকে তার শব্দগুলিকে লেখা কম্পিউটারের পক্ষে পাঠোদ্ধার করা বড়োই কষ্টকর। এই রি-ক্যাপচার ক্ষেত্রে আপনাকে চিত্র থেকে শব্দ বা কথা বেছে নিতে হবে। এই কথাটা কোনো রাস্তার নাম হতে পারে, কোনো বইয়ের থেকে কোনো পাঠ্য হতে পারে কিংবা কোনো পুরনো খবরের কাগজের কোনো পাঠ্য হতে পারে। গুগল বর্তমানে রি-ক্যাপচার পরীক্ষার কার্যকারিতাকে আরও প্রসারিত করেছে যার ফলে এখন আর অস্পষ্ট এবং বিকৃত পাঠ্য আর পাঠ করতে হয় না। রি-ক্যাপচা অনেক ধরণের হয় যেমন কোনো চিত্রকে চিহ্নিত করার, ‘I am not a robot’ (চিত্র – ৩) নামক চেকবস্কে টিক দেওয়া ইত্যাদি তো আছেই আর এরসাথে আছে ব্যবহারকারীদের থেকে ক্যাপচা বিষয়ক কোনও সরাসরি ইনপুট না নিয়েই তাদের আচার-আচরণের মূল্যায়ন করে সিদ্ধান্ত নেওয়া।  

চিত্র – ৩

অনেকের কাছেই ছবি সিলেক্ট করা কিংবা অস্পষ্ট বা বিকৃত পাঠ্য উদ্ধার করতে বেশ বিরক্তিকর মনে হয়। বেশ ভুল-ভ্রান্তিও ঘটে। এর পাশাপাশি আধুনিকবটগুলি পুরনো কাপচা ডিকোড সহজেই করতে পারছে। সেই কারণে বর্তমানে  ‘No CAPTCHA reCAPTCHA’ পদ্ধতিকে চালু করা হয়েছে। এই ‘নো ক্যাপচা রি-ক্যাপচা’-র ক্ষেত্রে ব্যবহারকারীদের কেবলমাত্র  “are you a robot?” জিজ্ঞাসা করা হবে। অন্যভাবে বলতে গেলে, ব্যবহারকারীদের ‘I am not a robot’ নামক চেকবস্কটিতে টিক দেওয়াই এক্ষেত্রে যথেষ্ট। এই ধরণের ক্যাপচা কাজ করে কীভাবে তা নিয়ে নিশ্চিত জানা যায়নি কারণ গুগল এই বিষয়ে কিছু প্রকাশ করেনি তবে ধারণা করা হয় নো ক্যাপচা পদ্ধতি আসলে ব্যবহারকারীদের অতীতের ট্র্যাক চেক করে রাখে অতীতের কুকিস বা ওয়েব ব্রাউসারের ইতিহাস দেখে। এছাড়া কার্সর সরানোর পদ্ধতি দেখে বোঝার চেষ্টা করে যে সেটি মানুষ না রোবট। আর ট্র্যাক করতে না পারল তখন আবার রি-ক্যাপচা পদ্ধতিতে ফিরে যায়। 

ক্যাপচা কাজ করে কীভাবে এবং এর প্রয়োজনীয়তা জেনে নেওয়ার পর আশা করি ভবিষ্যতে কোন সাইটে ক্যাপচা দিতে হলে বিরক্ত হবেন না কারণ ক্যাপচা পদ্ধতি আপনার সুরক্ষার জন্যই।

Click to comment

Leave a Reply

আপনার ই-মেইল এ্যাড্রেস প্রকাশিত হবে না। * চিহ্নিত বিষয়গুলো আবশ্যক।

To Top
error: লেখা নয়, লিঙ্কটি কপি করে শেয়ার করুন।

সৌমিত্র চট্টোপাধ্যায়



তাঁর সম্বন্ধে জানতে এখানে ক্লিক করুন