(১)
এই টেকনোলোচনায় ঢোকার আগে, আসুন স্বরণ করি গত তিন দশকে কি দ্রুত বদলেছে আমাদের বেঁচে থাকা। পদ্ধতি, স্টাইল। সমাজ, সরকার, রাজনীতি।
২০০৮ সালে প্রাইমারীতে হিলারীর বিরুদ্ধে জিতলেন ব্যারাক ওবামা। যাকে দুদিন আগেও কেও চিনত না। ক্লিনটন পত্নী আমেরিকাতে প্রবল জনপ্রিয়। দুইদফার বুশ শাসনে দফারফা আমেরিকা চাইছিল-ওয়াশিংটনে আমূল পরিবর্তন। ওবামা শোনালেন সেই আশার কথা "চেঞ্জ"- কিন্ত এই গণতান্ত্রিক বিপ্লবকে সম্ভব করল ফেসবুক। হিলারী যেখানে জিতবেন নিশ্চিত জেনে টাকা তুলছিলেন-ওবামা জোর দিচ্ছিলেন, স্যোশাল মিডিয়াতে সাধারন মানুষের সাথে যোগাযোগ বাড়াতে। আশ্বাস দিতে "চেঞ্জ"।
এরপর স্যোশাল মিডিয়ার হাত ধরেই মিশর, টিউনেশিয়া মরোক্কর গোলাপি বিপ্লব। মানুষের মন, মতামতকে আর নিয়ন্ত্রন করতে পারল না মেইন স্ট্রিম মিডিয়া। তার মালিক মিলিটারি ব্যবসায়ী শ্রেনী।
কেও যদি ভাবেন ফেসবুক বিপ্লবই যথেষ্ট-ধর্ম, রাজনীতির আমূল পরিবর্তন করা গেছে-আগে মহম্মদ, কৃষ্ণ, যীশু ইত্যাদি কাল্পনিক চরিত্রদের মৌরসীপাট্টায় আঘাত করা যেত না। এখন যাচ্ছে। স্যোশাল মিডিয়ার দুনিয়া এক বিরাট সামাজিক বিপ্লবের পথ খুলে দিয়েছে দুহাত চওড়া করে। তাহলে লিখি, প্রযুক্তি বিপ্লব কি করে মানুষের রাজনীতি এবং সমাজকে বদলে দেবে, তার ১% ও আপনি দেখেন নি। বাকী ৯৯% খেলা আসিতেছে। আর যে প্রযুক্তির হাত ধরে এই নতুন দিন, নতুন দেশ, নতুন আইন আসছে-তার পোষাকি নাম বিগডেটা।
আমি খুব অবাক হব না যদি দেখি ত্রিশ বছর বাদে, আর কোন রাজনৈতিক পার্টি নেই। রাজনৈতিক প্রতিনিধি নেই। স্কুল নেই। কলেজ নেই। শিক্ষক নেই। ডাক্তার নেই। উকিল নেই। আছে শুধু বিগ ডেটা ইন্টেলিজেন্ট সিস্টেম। যার ওপর ভিত্তি করে তৈরী হয়েছে নতুন এ আই শিক্ষক । যে আপনার শিশুর সাথে বাড়িতে ক্রমাগত কথা বলে বুঝছে আপনার শিশুর কি কি শেখা দরকার-সে কি লিখবে-কি দেখবে-কি পড়বে-এবং তারপরে মূল্যায়ন ও করে দেবে। ডাক্তারীর ক্ষেত্রেই একই কথা। ডি এন এ, এম আর আই, ব্লাড রিপোর্ট সব বিশ্লেষন করে আপনার যদি কোন ওষুধ লাগে, তার ফর্মুলেশন আপনি কম্পুটারেই পেয়ে যাবেন। আপনার রোগ নিয়ে যা বুঝতে চাইবেন-কি কি করনীয় জানতে চাইবেন-সবই পাবেন হাতের মুঠোয়। সরকার, গর্ভনমেন্টের ভূমিকা ক্রমশ সংকুচিত হবে। ট্যাক্স কালেকশন, কে ট্যাক্স ফাঁকি দিচ্ছে-কে ঘুষ খাচ্ছে-সরকারের কোথায় টাকা খরচ করা উচিত-কিভাবে করা উচিত-সব কিছুর জন্যই থাকবে বিগডেটা রেকমেন্ডেশন সিস্টেম। বাজেট বিতর্কের দরকারই হবে না। নতুন আইন প্রণয়নের ও দরকার হবে না-কারন সোশিওলজিক্যাল বিগডেটা বিশ্লেষন করে বলে দেওয়া সম্ভব হবে, নতুন আইনের দরকার আছে কি নেই! আর ক্রাইম? আমরা এত বেশী সেন্সর নিয়ে ঘুরব-আমরা কোথায় ছিলাম, মনে কিছিল-কোথায় কি করেছি-তা সব সময় এখনি ট্রাক করে যাচ্ছে গুগল, ফেসবুক। এর পরে আসছে আই ও টি বা ইন্টারনেট অব থিংঙ্কস। বিগডেটাই প্রমান করে দেবে কে অপরাধী। এই ফিল্ডটাকে বলে ইডিসকভারী।
কোন সমাজ বিপ্লব, বৈপ্লবিক চিন্তা, বিপ্লবী-কেও নাই। নাই কোন রক্তপাত। নেই গৃহযুদ্ধ। ছোট ছোট কিছু কিছু আবিস্কার। ছোট ছোট ধাপ। বেবী স্টেপ এট আ টাইম। ট্রানজিস্টর-থেকে ইন্টিগ্রেটেড সার্কিট এক অভূতপূর্ব প্রযুক্তি বিপ্লব। এক ইঞ্চি সিলিকন টুকরোর মধ্যে লাখ লাখ ট্রানসিস্টর। সিলিকন ভ্যালীতে ফেয়ার চাইল্ড সেমিকন্ডাক্টরের হাত ধরে আস্তে আস্তে তৈরী হতে শুরু করল, ছোট্ট ছোট্ট কম্পইউটার যার ক্ষমতা আজকের যেকোন মোবাইল ফোনের ১% ও না। তৈরী হোল মাইক্রোসফট আপলের মতন কোম্পানী যারা কম্পুটারের দাম মধ্যবিত্তের ধরা ছোঁয়ার মধ্যে নিয়ে আসল।
সত্যিকারের তথ্যপ্রযুক্তি বিপ্লব এল ইন্টারনেটের হাত ধরে। ইন্টারনেটের পূর্বসূরী আরপানেট। শুধু কম্পিউটার তৈরী করলেই হবে না-তাদের মধ্যে যোগাযোগের ব্যবস্থাও চাই। এই ভাবনা থেকেই উদ্ভব সার্ভার, ওয়েব সার্ভার, ওয়েব দুনিয়া। কিভাবে একজায়গায় তথ্য রেখে সব তথ্য গোটা দুনিয়াকে সার্ভ করা যেতে পারে। ওয়েব সাইটের জন্ম, ইমেল কমিউনিকেশন প্রথম প্রজন্মের তথ্য বিপ্লব। হাজার হাজার ওয়েব সাইট যখন তৈরী হচ্ছে , ১৯৯৪ সালে স্টানফোর্ডের ছাত্র জেরী ইয়াং এর মাথায় ঢুকল এক নতুন ব্যবসার প্ল্যান-একটা ওয়েব সাইট বানালে কেমন হয় যেখানে পৃথিবীর সব ওয়েব সাইটের ডাইরেক্টরী থাকবে? আসলে তখনো ওয়েব সাইট মুড়িমুরকির মত তৈরী হয় নি। সেই ১৯৯৪ সালে সব মিলিয়ে হয়ত ছিল লাখ খানেক সাইট। সেটাই উয়াহুর জন্ম। কিন্ত এত লাখে লাখে ওয়েব সাইট তৈরী হতে শুরু হল প্রতিদিন, জেরী ইয়াং বুঝলেন ডিরেক্টরী ঘেঁটে কেও ওয়েব সাইট খুঁজে পাবে না। চাই সার্চ ইঞ্জিন। সেখান থেকেই ইয়াহু সার্চ ইঞ্জিনের জন্ম। যার প্রতিদ্বন্দী হিসাবে ১৯৯৮ সালে জন্ম গুগুলের।
বিগডেটার জন্ম গুগুলের হাত ধরেই-এবং সেই সার্চ ইঞ্জিনের সমস্যার সমাধান করতে গিয়ে। আজ বিগডেটার ব্যবহার ক্ষেত্র এবং ভবিষ্যত সুদূর প্রসারী। তাই এই প্রযুক্তি বুঝতে গুগুলের সার্চ ইঞ্জিন কিভাবে কাজ করে, সেটা বোঝা দরকার।
সাথে সাথে বুঝতে হবে একেকটি ছোট ছোট আবিস্কার কিভাবে আমূল পরিবর্তন আনছে আমাদের জীবনে। সমাজে। রাজনীতিতে। অপ্রাসঙ্গিক হচ্ছে সমস্ত রাজনৈতিক তত্ত্ব। বেকারত্ব বাড়বে-কারন মানুষের ৯৯% স্কিল আর কোন কাজেই আসবে না।
আমার নিজের মূল ব্যবসা বিগডেটা নিয়েই। যদিও আমার নিজের পেশাগত এবং শিক্ষাগত ব্যাকগ্রাউন্ড টেলিকমে। কিন্ত গততিন বছর ধরে আমি বিগডেটা এনালাইটিকের ব্যবসাতেই আছি-এবং চলমান এক বিরাট পরিবর্তন ভূমিকম্পের মতন আমার চিন্তাকে ক্রমাগত নাড়াচ্ছে। আমি জানি না এর শেষ কোথায়। শুধু চোখের সামনে যেসব চিত্র ভেসে উঠছে-তাই লিখে যাচ্ছি মাত্র। এর কিছু কিছু ঠিক হবে-অধিকাংশই ফলবে না। কারন আমি জানি না-কাল কি নতুন প্রযুক্তি আসতে চলেছে বিগডেটা ক্ষেত্রে। শুধু এটা টের পাচ্ছি এক বিরাট প্রযুক্তি বিস্ফোরনের মধ্যে দাঁড়িয়ে। এর ভলকানিক লাভাশ্রোত কবে কোথায় কাকে ভাসাবে-জানা নেই।
(২)
যেকোন প্রযুক্তির সমাধান বুঝতে, সমস্যাটা বোঝা জরুরী। সার্চ ইঞ্জিন প্রযুক্তি যে সমস্যাগুলির মুখোমুখি হচ্ছিল-সেটা বুঝলেই আমরা বুঝবো বিগডেটা কি ও কেন। আমি যতটা সম্ভব কম প্রযুক্তিগত টার্ম ব্যবহার করব।
পৃথিবীতে প্রতি ঘন্টায় লাখে লাখে নতুন ওয়েব পেজ, পেজ কনটেন্ট তৈরী হচ্ছে। আবার অনেক কিছু মুছেও যাচ্ছে। এবার ধরুন আপনি খুঁজছেন skin cancer. কেন না চামড়ায় কিছু স্পট তৈরী হওয়াতে আপনার সন্দেহ হয়েছে, আপনার স্কিন ক্যান্সার হয়েছে। কি করে আপনাকে সঠিক তথ্য জানাবে সার্চ ইঞ্জিন ?
(১) প্রথমত কোটি কোটি ওয়েব সাইট আছে-তাতে তথ্য আছে হাজার হাজার পেটা বাইট লেভেলে ( ১০০০ টেরা বাইটে এক পেটা বাইট। এক টেরা বাইট মানে ক্যানন ক্যামেরাতে তোলা ১০০,০০০ ছবির আর্কাইভ )। এত তথ্য রাখবেন কি করে?
(২) ধরা যাক বিরাট বিরাট ডেটা সেন্টার বানিয়ে সব তথ্য রাখা গেল। গুগলের এরকম ৩৭ টা ডেটা সেন্টার আছে শুধু আমেরিকাতেই। আর এই সব ডেটাসেন্টারে আছে লাখে লাখে সার্ভার-তারা সম্লিলিত ভাবে যে ইলেক্ট্রিসিটি খায়-তা গোটা কোলকাতায় যে ইলেকট্রিসিটি লাগে তার দশগুন।
এর পরের সমস্যা হচ্ছে এই কোটি কোটি ওয়েব সাইট ঘেঁটে তার মধ্যে থেকে কিভাবে বাছা সম্ভব সেইসব পেজ-যার মধ্যে স্কিন ক্যান্সার আছে? এই কোটি কোটি ওয়েব সাইট ঘাঁটতেই চলে যাবে দিনের পর দিন!
(৩) ধরা যাক, (১) এবং (২) সমস্যার সমাধারন হয়েগেছে। তার পরের প্রশ্ন-এই যে প্রতিদিন হাজারে হাজারে নতুন ওয়েব সাইট আসছে, তার তথ্য রাখবেন কি করে?
(৪) এবার ধরা যাক, ১-৩ সমস্যার ও সমাধান হয়েছে। তারপরের প্রশ্ন তথ্যত শুধু টেক্সটে না। তা আছে ছবি, গান, ভিডিও সব কিছুতে! কোন ভিডিওতে স্কিন ক্যান্সার নিয়ে কিছু বলা হলে, সেটাই বা কি করে টানা যায় সার্চ ইঞ্জিনে?
গুগুলের দুই ইঞ্জিনিয়ার জেফরি জিম এবং সঞ্জয় খেমাওয়ার ২০০৪ সালে প্রথম দুই সমস্যার জন্য ম্যাপ রিডিউস নামে এক ড্রিস্টিবিউটেড কম্পিউটেশন সিস্টেমের প্রস্তাবনা রাখেন। উৎসাহী পাঠকেরা এখানে পেপারটি দেখতে পারেন। গুগল ২০০১ সাল থেকেই প্রথম দুই সমস্যার জন্য এই ম্যাপ রিডিউস সিস্টেমের ব্যবহার করছিল। যেখানে কোন সার্চ এর নির্দেশ এলেই সেই সার্চ ফাংশনটা গুগলের হাজার হাজার সার্ভারের মধ্যে ভাগ করে দেওয়া হত-এই প্রসেসটাকে বলে ম্যাপিং। আর রেজাল্টগুলোকে যখন ফিরিয়ে নেওয়া হয় হাজারটা সার্ভার থেকে এক সার্ভারে-সেই পদ্ধতিকে বলে রিডিউস। সংক্ষেপে এম-আর বা ম্যাপ রিডিউস সিস্টেম। ২০০৭ সালে এর থেকেই তৈরী হবে ওপেন সোর্স এপাচি হাডুপ যাতে নেতৃত্ব দেবে গুগলের প্রতিদ্বন্দী ইহাহু। এর থেকেই বিগডেটার প্রথম প্রজন্মের প্রযুক্তি হাডুপ ইকোসিস্টেমের জন্ম।
কিন্ত তার আগে বোঝা দরকার কেন দরকার পড়ল হাডুপ ইকোসিস্টেমের। ফেসবুক দিয়েই ব্যাপারটা বুঝি। সহজ হবে। এই যে যেকোন মুহুর্তে ফেসবুকে আমরা এত স্টাটাস দিচ্ছি, ফটো আপলোড করছি-এগুলো ফেসবুক সার্ভারে শুধু স্টোর করলেই হবে না-আপনার স্টাটাস ফিডগুলি আপনার বন্ধুদের কাছে পৌঁছে দেওয়াও চাই! কাজটা খুব সহজ না।
প্রথমে ধরুন একটা বিরাট বিরাট সার্ভার দিয়ে ফেসবুক এই কাজ করতে চাইছে। তাহলে কি সমস্যা হত? প্রতি সেকেন্ডে ফেসবুকে কয়েক টেরাবাইট তথ্য ঢোকে। সমস্যা এখানে অনেক। এত তথ্য এত দ্রুত একটা মেমরীতে লিখতে গেলে এত দ্রুত কাজ করা ফ্ল্যাশ মেমরী দরকার- সেটা নেই। একমাত্র উপায় যদি নানান ডেটাসেন্টারে অসংখ্য মেমরীর ডেটাবেসে এই তথ্য ভাগ করে লেখা যায়। শুধু তথ্যটা ভাগ করলেই ত হবে না। পরে সেটাকে বার করতেও হবে মেমারী থেকে। ফলে তথ্য ভাগ করে জোরা লাগানোটাও একটা কঠিন কাজ-আর এই জন্যেই জন্ম হয় ড্রিস্টিবিউটেড ডেটাবেসের। আধুনিক কালে এসেছে আরো উন্নত নতুন টাইপের ডেটাবেস যেমন ট্রি ডেটাবেস, এটমিক ডেটাবেস, গ্রাফিক্যাল ডেটাবেস-যাদের কাজ একটাই। ডেটার মধ্যে সম্পর্ক নির্নয় করে, ডেটাটাকে কাটা আর জোরা লাগানো। এই স্টিচিং অপারেশনটা বিগ ডেটার বেসিক। এটাকে ঠিক ঠাক না করতে পারলে বিগডেটার অধিকাংশ কাজ করা সম্ভব না।
পরের সমস্যা হচ্ছে, এই যে নানান সার্ভারে কাজ করানো হচ্ছে-ডেটার আদান প্রদান হচ্ছে-সেটাকে কিকরে দ্রুত করা যায়। ম্যাপ রিডিউস সিস্টেম যে ক্ল্যাসিক্যাল প্যারালাল কম্পিউটিং ফ্রেমওয়ার্কের চেয়ে খুব বেশী কিছু ভাল না-এই নিয়ে কম্পুটার সমাজেই বিতর্ক আছে। এম আই টির অধ্যাপক প্রফেসর স্টোন ব্রেকার মনে করেন, ম্যাপ রিডিউস সিস্টেম একটা হাইপ। এই সমস্যার সমাধানে আসে দ্বিতীয় প্রজন্মের ম্যাপ রিডিউস সিস্টেম-যেটাকে বলে ইন মেমরী সিস্টেম-পোষাকী নাম স্পার্ক। এটি বার্কলি বিশ্ববিদ্যালয় থেকে উদ্ভুত ওপেন সোর্স। এখানে তথ্যগুলির গুরুত্বপূর্ন অংশ র্যাম বা ডাইনামিক মেমরী রেখে দেওয়া হয়-যাতে তথ্যের আদান প্রদান কমানো যায়। কারন ওখানেই ৯০% সময় যায়। স্পার্ক ফ্রেম ওয়ার্কটির বয়স বছর খানেক হতে চললো। এটিই বিগডেটার এখন জনপ্রিয়তম ফ্রেমওয়ার্ক। হাডুপ এখন অতীত।
স্যোশাল মিডিয়ার উদাহরন থেকে দেখতে গেলে দেখব, বিগ ডেটার চারটি মূল স্তম্ভঃ এগুলিকে বলে ফোর ভি।
(১) ভল্যুউম-বিশাল তথ্যভান্ডার। এটা টেরাবাইট লেভেলেও হতে পারে, এক্সবাইট লেভেলেও হতে পারে
(২) ভেলোসিটি- দ্রুত ঢুকছে তথ্য। দ্রুত বেড়ে উঠছে তথ্য ভান্ডার
(৩) ভ্যারাইটি- নানান ধরনের তথ্য। লেখা, ছবি, গান, ভিডিও ইত্যাদি
(৪) ভেরাসিটি- অধিকাংশ তথ্যই পরিস্কার না। ৯৯% তথ্যই কাজের না।
এত গেল তথ্য। এবং ফ্রেমওয়ার্ক। তথ্য দিয়ে কি হয়? তথ্য থেকে দরকার জ্ঞান বা কাজের কাজ লাগানোর মত সিদ্ধান্ত বা সুপারিশ। এর জন্যে দরকার আধুনিক মেশিন লার্নিং সিস্টেম। যেমন ধরুন আমি ফেসবুকের ডেটা থেকে জানতে চাইছি মোদির নেপাল সফর নিয়ে ভারতের মানুষ খুশী কিনা? এটাকে সেন্টিমেন্ট এনালিসিস বলে। অন্তত ১ মিলিয়ান লোকে মোদির ভারত সফর নিয়ে কমেন্ট করেই থাকবে। ওই এক মিলিয়ান কমেন্ট পড়া সম্ভব না। তাহলে কি করে বুঝবো ওই এক মিলিয়ানের মধ্যে অন্তত ৭০% মোদির পক্ষে? এই কাজটাই সহজ করে লার্নিং সিস্টেম। আমার দরকার ১০০টার মতন স্টাস্টাস যেখানে মোদির নেপাল সফর নিয়ে লোকে কমেন্ট করেছে। সেখান থেকে বেছে আমি দুটো ট্রেনিং সেট বানাবো-একটাতে লোকে মোদির ব্যাপারে পজিটিভ-অন্যটি নেগেটিভ। এই ট্রেনিং সেট মেশিং লার্নিং সিস্টেমে ঢুকিয়ে দিলেই বাকী ১ মিলিয়ান স্টাটাসে ব্যাপারে সে সিদ্ধান্ত নেবে কোনটি মোদির ব্যাপারে পজিটিভ-কোনটি নেগেটিভ। এতে ভুল থাকবে। কিন্ত এক মিলিয়ান স্টাটাস কারই বা পড়া সম্ভব?
বিগডেটা প্রযুক্তির তিনটি স্তম্ভ। প্রথমে বিশাল তথ্যভান্ডার-যার উৎপত্তি হতে পারে মানুষের লেখা, ছবি, গবেষনাপত্র, সেন্সর ডেটা, টেস্ট রেজাল্ট ইত্যাদি। দ্বিতীয়টি হচ্ছে ইনফ্রাস্টাকচার-যার মধ্যে আচ্ছে হাডুপ বা স্পার্কের মতন ম্যাপ-রিডিউসড সিস্টেম। তৃতীয়টি মেশিন লার্নিং এলগোরিদম-সেটা কাজে লাগিয়ে বার করা যাবে তথ্যভান্ডারের মধ্যে আছে টা কি! সুপারিশ বা রেকোমেন্ডেশনটাই বা কি দিচ্ছে !
আমি খুব সংক্ষেপে বিগডেটা প্রযুক্তি নিয়ে লিখলাম-এর বাইরেও অসংখ্য উদ্ভাবন এবং প্রযুক্তি আসছে বিগডেটা ফিল্ডে।
রাজনীতি, সমাজে-আমাদের ব্যক্তিগত জীবনে বিগডেটা কি প্রভাব ফেলবে সেটা জানতে এই টুকু বেসিক মাথায় রাখলে ভাল হয়।
(3)
এবার আসি ধর্ম, রাজনীতি এবং সমাজ নিয়ে।
আমেরিকান সরকার এখনই বিগডেটাকে প্রবলভাবে কাজে লাগাচ্ছে নানান এরিয়াতে। এখানে মেডিকেড বা মেডিকেয়ারে ফ্রড হত সাংঘাতিক। সরকারি ফান্ড থেকে চুরি হত ২০০ বিলিয়ান ডলারের বেশী। ওবামা সরকার এই অপচয়ের অনেকটাই বাঁচিয়েছেন বিগডেটা প্রযুক্তি কাজে লাগিয়ে। আবার এই একই প্রযুক্তি কাজে লাগিয়ে ইন্টেলিজেন্স ডিপার্টমেন্ট পৃথিবীর অন্যান্য দেশের সরকারের ওপর নজরদারী চালিয়েছে-যার ফলশ্রুতি শ্নোডেন কান্ড।
নানান যাত্রায় ভিন্ন ফল আর কি।
সব থেকে বড় কথা ওবামা নিজে ২০১২ সালে জিতলেন বিগডেটা প্রযুক্তি ব্যবহার করে। ওবামার ক্যাম্পেইনের হাতে আমেরিকার সব নাগরিকদের তথ্য ছিল-তাদের রাজনৈতিক মনের খবর ছিল। এটা কিভাবে সম্ভব-তার জন্য অন্য একদিন লিখব। এই ফিল্ডটাকে বলে পলিটিক্যাল বিগডেটা। এর মূল সমস্যা কি করে বার করা যায় ভোটারদের মনের খবর-আর কারা সুইং করতে পারে। ডেভিড এলেক্সরড ছিলেন তার মূল সেনাপতি। যাইহোক ওবামার লোকজন জানত মিঃ এক্সকে কি করে পটাতে হবে-অর্থাৎ কি টোপ ফেলবেন- পরিবেশ না স্যোশাল বেনিফিট-ইত্যাদি!! এইভাবে তৈরী করা হয় ভোটিং ব্লক।
ভারতে মোদিও ডেটা সায়েন্সকে সব থেকে ভাল পেশাদারি ভাবে কাজে লাগিয়েছেন। ফল পেয়েছেন হাতে নাতে। আবেগে না ভেসে, প্রতিটা ভোটারের মনের খবর জেনে, যে রাজনীতিবিদ গিরগিটির মতন রং পরিবর্তন করতে পারবেন-তিনিই এই নতুন যুগের জো জিতে ওহি সিকান্দার! মোদিও কি সুন্দর হিন্দুত্বর রং ছেড়ে-উন্নয়নের আলখাল্লাতে উন্নিত। কারন তার টিম ভোটারদের মন সব থেকে ভাল বুঝে, সেই মতন রং বদলেছে। হিন্দুত্ববাদের আদর্শ আঁকড়ে ধরে ডোবে নি। ওবামা অবশ্য মানুষের মন বুঝে বদলানোর ব্যাপারে গুরুদেব।
তাহলে কি দাঁড়াচ্ছে? পৃথিবীর দুই বৃহত্তম গণতন্ত্রে ওবামা, মোদির নির্বাচন থেকে পরিস্কার আদর্শের দিন শেষ। জনগন চাইছে বাস্তববাদি রাজনীতি-যা তাদের প্রতিদিনের সমস্যা-দুর্নীতি, চাকরি, ইনফ্রাস্টাকচার, সুলভ এবং নির্ভরযোগ্য মেডিক্যাল সিস্টেম উপহার দেবে।
সুতরাং রাজনীতি এবং গনতন্ত্র তার নিজের স্বার্থেই বিগডেটাকে আরো ব্যাপক ভাবে কাজে লাগাবে বা লাগাচ্ছে। বিগডেটা কাজে না লাগালে দুর্নীতি দূর করা সম্ভব না। ইনফ্রাস্টাকচার এবং বাজেটের সৎব্যাবহার সম্ভব না। সুলভ সরকারি পরিশেবা দেওয়া সম্ভব না। অর্থাৎ উন্নত উৎপাদন ব্যবস্থার গণতান্ত্রিক দাবীর কারনেই আস্তে আস্তে সরকারে আমলাদের জায়গায় আসবে বিগডেটা নির্ভর সরকারি মেশিনারী-যেখানে নাগরিকরা তাদের পরিশেবা পাবে দ্রুত। দেওলিয়া সরকারে খরচ ও কমবে অনেক।
এর একটা উদাহরন স্মার্ট সিটি। মোদি ভারতে ১০০ টি স্মার্ট সিটি গড়তে চান। স্মার্ট সিটি আই ও টি বিগডেটার উদাহরন। সেখানে শহরের লাইটিং, ট্রাফিক নিয়ন্ত্রিত হবে সেন্সর দিয়ে, ভিডিও দিয়ে। সর্বত্র সার্ভিলেন্স থাকায় রাস্তাঘাট হবে নিরাপদ। পুলিশ, আমলা ছাড়াই সম্পূর্ন অটোমেশনের ভিত্তিতে চলবে শহরগুলি। খুব স্বাভাবিক কারনে এই শহরগুলি হয়ে উঠবে ব্যবসার তীর্থক্ষেত্র।
তবে এসব ও অতীত। ভবিষ্যত কি?
ধর্ম টিকে আছে রাজনৈতিক পৃষ্টপোষকতায়। কৃষ্ণ মহম্মদ যীশুর ন্যায় কাল্পনিক রূপকথার গল্পে বিশ্বাস করে লোকজন নিজেদের মধ্যে মারমারি হানাহানি করে-এটার কারন একটাই। সমাজ এবং সরকার জোর করে ধর্ম নিয়ে বাচ্চাদের ব্রেইন ওয়াশ করে। এই জিনিসটাই থাকবে না। একজন বাচ্চাও আস্তে আস্তে সমাজ, স্কুল বাদ দিয়ে ওয়েব থেকেই শিখবে বেশী।
আর শেখার পদ্ধতিতেই থাকবে বিগডেটা এনালাইটিক। যেখানে কেও যদি জানতে চায় মহম্মদ কে ছিলেন-তাকে প্রথমেই সিস্টেম জানাবে, মহম্মদ ইসলাম ধর্মের প্রতিষ্ঠাতা হিসাবে স্বীকৃত এক "কাল্পনিক" চরিত্র। কারন তার অস্তিত্বের কোন ঐতিহাসিক প্রমান নেই। কোন প্রতিষ্ঠিত ঐতিহাসিক মহম্মদের অস্তিত্ব স্বীকার করেন নি। ডেটা আনালাইটিক নানান তথ্য ঘেঁটে সত্যতে অনায়াসেই উপনীত হতে পারে। ভুল তথ্য দিয়ে কায়েমি স্বার্থ সেখানে ঢাকা যাবে না।
আর আজকে ইসলামিক দেশে একজন শিশু কিভাবে শিখছে মহম্মদকে? তাকে শেখানো হচ্ছে তিনি পৃথিবীর শ্রেষ্ঠ মানুষ-তার মতন কেও জন্মান নি-তিনি পারফেক্ট! কিন্ত সেই শিশু একবারের জন্যও জানতে পারছে না মহম্মদের চরিত্রটাই স্পাইডারম্যান বা সুপারম্যানের যতটা পারফেক্ট-ততটাই কাল্পনিক। কারন শিক্ষাপদ্ধতিতে সেই অটোমেশন এখনো আসে নি।
এটা যেদিন আসবে ধর্মের রূপকথা সেদিনই শেষ!
একই ব্যাপার ঘটবে নর-নারীর সম্পর্ক স্থাপনে। ই-হার্মোনি বলে একটা ওয়েব সাইট এটা প্রথম শুরু করে-এখন এই ম্যাচিং রেকোমেন্ডেশন বিরাট বড় ইন্ড্রাস্টি। ধরুন আপনি জানতে চাইছেন-আপনার ফেসবুক বন্ধুদের মধ্যে কে সব থেকে ভাল জীবন সঙ্গী হতে পারে ? এরজন্য আপনাকে অত কিছু করতে হবে না। আপনি শুধু সিস্টেমকে জানিয়ে দেবেন-আমি ঠিক এই এই টাইপের বর চাই। সিস্টেম আপনাকে জানিয়ে দেবে, আপনার ফ্রেন্ড প্রোফাইলের মধ্যে কে কে আপনার প্রত্যাশার কাছাকাছি। শুধু তাই না-প্রথম দিন ডেটিং এ আপনাদের মধ্যে কি কি কথা হয়েছে, সেটা বিশ্লেষন করেও বলে দেওয়া সম্ভব আপনাদের সম্পর্কের ভবিষ্যত আছে কি না।
আমূল পরিবর্তন হবে পেশাদারি ক্ষেত্রে। আগেই লিখেছি ডাক্তার, উকিল, শিক্ষক, ম্যানেজার, সাধারন প্রোগ্রামার ইত্যাদি পেশাগুলির অস্তিত্ব সংকটে। কেরানী ত উঠেই গেছে অনেক দিন আগে। শিল্পে অটোমেশনের ফলে শিল্প শ্রমিকও আর লাগবে না। প্রশ্ন উঠছে, তাহলে এত এত মানুষ যাবে কোথায়? কাজ না পেলে খাবে কি?
এখানেই মার্ক্সের লেখাগুলির প্রাসঙ্গিকতা ফিরে আসে। উৎপাদন ব্যাবস্থার মালিকানা সর্বাধিক গুরুত্বপূর্ন ভবিষ্যতের জন্য। কারন শ্রমিক বা কর্মীর প্রাসঙ্গিকতা প্রায় থাকবে না। একটা লোক সম্পূর্ন অটোমেশন এবং রোবটিক্সের সাহায্যে একাই ১ থেকে ১০ মিলিয়ান ডলারের প্রোডাকশন করতে সমর্থ হবে। যা আগে ছিল না।
এই প্রশ্নটা আমাকে অনেকেই করেন-আমাদের ছেলে মেয়েদের ভবিষ্যত কি? কোন পেশাতে গেলে ভাল হয়?
আমার কাছে উত্তর নেই। শুধু এটাই বলি আমাদের সন্তানদের দুটো স্কিল সাংঘাতিক ভাল থাকতে হবে। এক, প্রোগ্রামিং, দুই বিজনেস এনালাইটিক বা ব্যবসা বোঝার ক্ষমতা। চাকরির স্কোপ এত সাংঘাতিক ভাবে কমবে আগামী বছরগুলিতে, সবাই স্বেচ্ছায় অনিচ্ছায় ব্যবসার দিকেই আসতে বাধ্য হবে । টিসিএস, ইনফি, সিটিএস-এই সব বিগ জায়েন্ট কোম্পানী অলরেডি অতীত। কারন বিগডেটা প্রযুক্তি ব্যবহার করে আগে যে আই টির কাজে ১০০০ লোক লাগত-এখন লাগবে ১০ জন। সুতরাং নতুন যে ব্যবসার দিকগুলি খুলবে, তা সেই হাই এন্ড প্রোগ্রামিং মার্কেটেই। ইল্যান্স, ওডেক্স -যা অনলাইন স্কিল মার্কেটপ্লেস-তাদের ব্যবসা বাড়াছে সাংঘাতিক হারে।
তবে কি হবে আগামী দশ বছরে, সেটা কেও জানে বলে মনে হয় না। আমি ত কোন ছাড়!
এই টেকনোলোচনায় ঢোকার আগে, আসুন স্বরণ করি গত তিন দশকে কি দ্রুত বদলেছে আমাদের বেঁচে থাকা। পদ্ধতি, স্টাইল। সমাজ, সরকার, রাজনীতি।
২০০৮ সালে প্রাইমারীতে হিলারীর বিরুদ্ধে জিতলেন ব্যারাক ওবামা। যাকে দুদিন আগেও কেও চিনত না। ক্লিনটন পত্নী আমেরিকাতে প্রবল জনপ্রিয়। দুইদফার বুশ শাসনে দফারফা আমেরিকা চাইছিল-ওয়াশিংটনে আমূল পরিবর্তন। ওবামা শোনালেন সেই আশার কথা "চেঞ্জ"- কিন্ত এই গণতান্ত্রিক বিপ্লবকে সম্ভব করল ফেসবুক। হিলারী যেখানে জিতবেন নিশ্চিত জেনে টাকা তুলছিলেন-ওবামা জোর দিচ্ছিলেন, স্যোশাল মিডিয়াতে সাধারন মানুষের সাথে যোগাযোগ বাড়াতে। আশ্বাস দিতে "চেঞ্জ"।
এরপর স্যোশাল মিডিয়ার হাত ধরেই মিশর, টিউনেশিয়া মরোক্কর গোলাপি বিপ্লব। মানুষের মন, মতামতকে আর নিয়ন্ত্রন করতে পারল না মেইন স্ট্রিম মিডিয়া। তার মালিক মিলিটারি ব্যবসায়ী শ্রেনী।
কেও যদি ভাবেন ফেসবুক বিপ্লবই যথেষ্ট-ধর্ম, রাজনীতির আমূল পরিবর্তন করা গেছে-আগে মহম্মদ, কৃষ্ণ, যীশু ইত্যাদি কাল্পনিক চরিত্রদের মৌরসীপাট্টায় আঘাত করা যেত না। এখন যাচ্ছে। স্যোশাল মিডিয়ার দুনিয়া এক বিরাট সামাজিক বিপ্লবের পথ খুলে দিয়েছে দুহাত চওড়া করে। তাহলে লিখি, প্রযুক্তি বিপ্লব কি করে মানুষের রাজনীতি এবং সমাজকে বদলে দেবে, তার ১% ও আপনি দেখেন নি। বাকী ৯৯% খেলা আসিতেছে। আর যে প্রযুক্তির হাত ধরে এই নতুন দিন, নতুন দেশ, নতুন আইন আসছে-তার পোষাকি নাম বিগডেটা।
আমি খুব অবাক হব না যদি দেখি ত্রিশ বছর বাদে, আর কোন রাজনৈতিক পার্টি নেই। রাজনৈতিক প্রতিনিধি নেই। স্কুল নেই। কলেজ নেই। শিক্ষক নেই। ডাক্তার নেই। উকিল নেই। আছে শুধু বিগ ডেটা ইন্টেলিজেন্ট সিস্টেম। যার ওপর ভিত্তি করে তৈরী হয়েছে নতুন এ আই শিক্ষক । যে আপনার শিশুর সাথে বাড়িতে ক্রমাগত কথা বলে বুঝছে আপনার শিশুর কি কি শেখা দরকার-সে কি লিখবে-কি দেখবে-কি পড়বে-এবং তারপরে মূল্যায়ন ও করে দেবে। ডাক্তারীর ক্ষেত্রেই একই কথা। ডি এন এ, এম আর আই, ব্লাড রিপোর্ট সব বিশ্লেষন করে আপনার যদি কোন ওষুধ লাগে, তার ফর্মুলেশন আপনি কম্পুটারেই পেয়ে যাবেন। আপনার রোগ নিয়ে যা বুঝতে চাইবেন-কি কি করনীয় জানতে চাইবেন-সবই পাবেন হাতের মুঠোয়। সরকার, গর্ভনমেন্টের ভূমিকা ক্রমশ সংকুচিত হবে। ট্যাক্স কালেকশন, কে ট্যাক্স ফাঁকি দিচ্ছে-কে ঘুষ খাচ্ছে-সরকারের কোথায় টাকা খরচ করা উচিত-কিভাবে করা উচিত-সব কিছুর জন্যই থাকবে বিগডেটা রেকমেন্ডেশন সিস্টেম। বাজেট বিতর্কের দরকারই হবে না। নতুন আইন প্রণয়নের ও দরকার হবে না-কারন সোশিওলজিক্যাল বিগডেটা বিশ্লেষন করে বলে দেওয়া সম্ভব হবে, নতুন আইনের দরকার আছে কি নেই! আর ক্রাইম? আমরা এত বেশী সেন্সর নিয়ে ঘুরব-আমরা কোথায় ছিলাম, মনে কিছিল-কোথায় কি করেছি-তা সব সময় এখনি ট্রাক করে যাচ্ছে গুগল, ফেসবুক। এর পরে আসছে আই ও টি বা ইন্টারনেট অব থিংঙ্কস। বিগডেটাই প্রমান করে দেবে কে অপরাধী। এই ফিল্ডটাকে বলে ইডিসকভারী।
কোন সমাজ বিপ্লব, বৈপ্লবিক চিন্তা, বিপ্লবী-কেও নাই। নাই কোন রক্তপাত। নেই গৃহযুদ্ধ। ছোট ছোট কিছু কিছু আবিস্কার। ছোট ছোট ধাপ। বেবী স্টেপ এট আ টাইম। ট্রানজিস্টর-থেকে ইন্টিগ্রেটেড সার্কিট এক অভূতপূর্ব প্রযুক্তি বিপ্লব। এক ইঞ্চি সিলিকন টুকরোর মধ্যে লাখ লাখ ট্রানসিস্টর। সিলিকন ভ্যালীতে ফেয়ার চাইল্ড সেমিকন্ডাক্টরের হাত ধরে আস্তে আস্তে তৈরী হতে শুরু করল, ছোট্ট ছোট্ট কম্পইউটার যার ক্ষমতা আজকের যেকোন মোবাইল ফোনের ১% ও না। তৈরী হোল মাইক্রোসফট আপলের মতন কোম্পানী যারা কম্পুটারের দাম মধ্যবিত্তের ধরা ছোঁয়ার মধ্যে নিয়ে আসল।
সত্যিকারের তথ্যপ্রযুক্তি বিপ্লব এল ইন্টারনেটের হাত ধরে। ইন্টারনেটের পূর্বসূরী আরপানেট। শুধু কম্পিউটার তৈরী করলেই হবে না-তাদের মধ্যে যোগাযোগের ব্যবস্থাও চাই। এই ভাবনা থেকেই উদ্ভব সার্ভার, ওয়েব সার্ভার, ওয়েব দুনিয়া। কিভাবে একজায়গায় তথ্য রেখে সব তথ্য গোটা দুনিয়াকে সার্ভ করা যেতে পারে। ওয়েব সাইটের জন্ম, ইমেল কমিউনিকেশন প্রথম প্রজন্মের তথ্য বিপ্লব। হাজার হাজার ওয়েব সাইট যখন তৈরী হচ্ছে , ১৯৯৪ সালে স্টানফোর্ডের ছাত্র জেরী ইয়াং এর মাথায় ঢুকল এক নতুন ব্যবসার প্ল্যান-একটা ওয়েব সাইট বানালে কেমন হয় যেখানে পৃথিবীর সব ওয়েব সাইটের ডাইরেক্টরী থাকবে? আসলে তখনো ওয়েব সাইট মুড়িমুরকির মত তৈরী হয় নি। সেই ১৯৯৪ সালে সব মিলিয়ে হয়ত ছিল লাখ খানেক সাইট। সেটাই উয়াহুর জন্ম। কিন্ত এত লাখে লাখে ওয়েব সাইট তৈরী হতে শুরু হল প্রতিদিন, জেরী ইয়াং বুঝলেন ডিরেক্টরী ঘেঁটে কেও ওয়েব সাইট খুঁজে পাবে না। চাই সার্চ ইঞ্জিন। সেখান থেকেই ইয়াহু সার্চ ইঞ্জিনের জন্ম। যার প্রতিদ্বন্দী হিসাবে ১৯৯৮ সালে জন্ম গুগুলের।
বিগডেটার জন্ম গুগুলের হাত ধরেই-এবং সেই সার্চ ইঞ্জিনের সমস্যার সমাধান করতে গিয়ে। আজ বিগডেটার ব্যবহার ক্ষেত্র এবং ভবিষ্যত সুদূর প্রসারী। তাই এই প্রযুক্তি বুঝতে গুগুলের সার্চ ইঞ্জিন কিভাবে কাজ করে, সেটা বোঝা দরকার।
সাথে সাথে বুঝতে হবে একেকটি ছোট ছোট আবিস্কার কিভাবে আমূল পরিবর্তন আনছে আমাদের জীবনে। সমাজে। রাজনীতিতে। অপ্রাসঙ্গিক হচ্ছে সমস্ত রাজনৈতিক তত্ত্ব। বেকারত্ব বাড়বে-কারন মানুষের ৯৯% স্কিল আর কোন কাজেই আসবে না।
আমার নিজের মূল ব্যবসা বিগডেটা নিয়েই। যদিও আমার নিজের পেশাগত এবং শিক্ষাগত ব্যাকগ্রাউন্ড টেলিকমে। কিন্ত গততিন বছর ধরে আমি বিগডেটা এনালাইটিকের ব্যবসাতেই আছি-এবং চলমান এক বিরাট পরিবর্তন ভূমিকম্পের মতন আমার চিন্তাকে ক্রমাগত নাড়াচ্ছে। আমি জানি না এর শেষ কোথায়। শুধু চোখের সামনে যেসব চিত্র ভেসে উঠছে-তাই লিখে যাচ্ছি মাত্র। এর কিছু কিছু ঠিক হবে-অধিকাংশই ফলবে না। কারন আমি জানি না-কাল কি নতুন প্রযুক্তি আসতে চলেছে বিগডেটা ক্ষেত্রে। শুধু এটা টের পাচ্ছি এক বিরাট প্রযুক্তি বিস্ফোরনের মধ্যে দাঁড়িয়ে। এর ভলকানিক লাভাশ্রোত কবে কোথায় কাকে ভাসাবে-জানা নেই।
(২)
যেকোন প্রযুক্তির সমাধান বুঝতে, সমস্যাটা বোঝা জরুরী। সার্চ ইঞ্জিন প্রযুক্তি যে সমস্যাগুলির মুখোমুখি হচ্ছিল-সেটা বুঝলেই আমরা বুঝবো বিগডেটা কি ও কেন। আমি যতটা সম্ভব কম প্রযুক্তিগত টার্ম ব্যবহার করব।
পৃথিবীতে প্রতি ঘন্টায় লাখে লাখে নতুন ওয়েব পেজ, পেজ কনটেন্ট তৈরী হচ্ছে। আবার অনেক কিছু মুছেও যাচ্ছে। এবার ধরুন আপনি খুঁজছেন skin cancer. কেন না চামড়ায় কিছু স্পট তৈরী হওয়াতে আপনার সন্দেহ হয়েছে, আপনার স্কিন ক্যান্সার হয়েছে। কি করে আপনাকে সঠিক তথ্য জানাবে সার্চ ইঞ্জিন ?
(১) প্রথমত কোটি কোটি ওয়েব সাইট আছে-তাতে তথ্য আছে হাজার হাজার পেটা বাইট লেভেলে ( ১০০০ টেরা বাইটে এক পেটা বাইট। এক টেরা বাইট মানে ক্যানন ক্যামেরাতে তোলা ১০০,০০০ ছবির আর্কাইভ )। এত তথ্য রাখবেন কি করে?
(২) ধরা যাক বিরাট বিরাট ডেটা সেন্টার বানিয়ে সব তথ্য রাখা গেল। গুগলের এরকম ৩৭ টা ডেটা সেন্টার আছে শুধু আমেরিকাতেই। আর এই সব ডেটাসেন্টারে আছে লাখে লাখে সার্ভার-তারা সম্লিলিত ভাবে যে ইলেক্ট্রিসিটি খায়-তা গোটা কোলকাতায় যে ইলেকট্রিসিটি লাগে তার দশগুন।
এর পরের সমস্যা হচ্ছে এই কোটি কোটি ওয়েব সাইট ঘেঁটে তার মধ্যে থেকে কিভাবে বাছা সম্ভব সেইসব পেজ-যার মধ্যে স্কিন ক্যান্সার আছে? এই কোটি কোটি ওয়েব সাইট ঘাঁটতেই চলে যাবে দিনের পর দিন!
(৩) ধরা যাক, (১) এবং (২) সমস্যার সমাধারন হয়েগেছে। তার পরের প্রশ্ন-এই যে প্রতিদিন হাজারে হাজারে নতুন ওয়েব সাইট আসছে, তার তথ্য রাখবেন কি করে?
(৪) এবার ধরা যাক, ১-৩ সমস্যার ও সমাধান হয়েছে। তারপরের প্রশ্ন তথ্যত শুধু টেক্সটে না। তা আছে ছবি, গান, ভিডিও সব কিছুতে! কোন ভিডিওতে স্কিন ক্যান্সার নিয়ে কিছু বলা হলে, সেটাই বা কি করে টানা যায় সার্চ ইঞ্জিনে?
গুগুলের দুই ইঞ্জিনিয়ার জেফরি জিম এবং সঞ্জয় খেমাওয়ার ২০০৪ সালে প্রথম দুই সমস্যার জন্য ম্যাপ রিডিউস নামে এক ড্রিস্টিবিউটেড কম্পিউটেশন সিস্টেমের প্রস্তাবনা রাখেন। উৎসাহী পাঠকেরা এখানে পেপারটি দেখতে পারেন। গুগল ২০০১ সাল থেকেই প্রথম দুই সমস্যার জন্য এই ম্যাপ রিডিউস সিস্টেমের ব্যবহার করছিল। যেখানে কোন সার্চ এর নির্দেশ এলেই সেই সার্চ ফাংশনটা গুগলের হাজার হাজার সার্ভারের মধ্যে ভাগ করে দেওয়া হত-এই প্রসেসটাকে বলে ম্যাপিং। আর রেজাল্টগুলোকে যখন ফিরিয়ে নেওয়া হয় হাজারটা সার্ভার থেকে এক সার্ভারে-সেই পদ্ধতিকে বলে রিডিউস। সংক্ষেপে এম-আর বা ম্যাপ রিডিউস সিস্টেম। ২০০৭ সালে এর থেকেই তৈরী হবে ওপেন সোর্স এপাচি হাডুপ যাতে নেতৃত্ব দেবে গুগলের প্রতিদ্বন্দী ইহাহু। এর থেকেই বিগডেটার প্রথম প্রজন্মের প্রযুক্তি হাডুপ ইকোসিস্টেমের জন্ম।
কিন্ত তার আগে বোঝা দরকার কেন দরকার পড়ল হাডুপ ইকোসিস্টেমের। ফেসবুক দিয়েই ব্যাপারটা বুঝি। সহজ হবে। এই যে যেকোন মুহুর্তে ফেসবুকে আমরা এত স্টাটাস দিচ্ছি, ফটো আপলোড করছি-এগুলো ফেসবুক সার্ভারে শুধু স্টোর করলেই হবে না-আপনার স্টাটাস ফিডগুলি আপনার বন্ধুদের কাছে পৌঁছে দেওয়াও চাই! কাজটা খুব সহজ না।
প্রথমে ধরুন একটা বিরাট বিরাট সার্ভার দিয়ে ফেসবুক এই কাজ করতে চাইছে। তাহলে কি সমস্যা হত? প্রতি সেকেন্ডে ফেসবুকে কয়েক টেরাবাইট তথ্য ঢোকে। সমস্যা এখানে অনেক। এত তথ্য এত দ্রুত একটা মেমরীতে লিখতে গেলে এত দ্রুত কাজ করা ফ্ল্যাশ মেমরী দরকার- সেটা নেই। একমাত্র উপায় যদি নানান ডেটাসেন্টারে অসংখ্য মেমরীর ডেটাবেসে এই তথ্য ভাগ করে লেখা যায়। শুধু তথ্যটা ভাগ করলেই ত হবে না। পরে সেটাকে বার করতেও হবে মেমারী থেকে। ফলে তথ্য ভাগ করে জোরা লাগানোটাও একটা কঠিন কাজ-আর এই জন্যেই জন্ম হয় ড্রিস্টিবিউটেড ডেটাবেসের। আধুনিক কালে এসেছে আরো উন্নত নতুন টাইপের ডেটাবেস যেমন ট্রি ডেটাবেস, এটমিক ডেটাবেস, গ্রাফিক্যাল ডেটাবেস-যাদের কাজ একটাই। ডেটার মধ্যে সম্পর্ক নির্নয় করে, ডেটাটাকে কাটা আর জোরা লাগানো। এই স্টিচিং অপারেশনটা বিগ ডেটার বেসিক। এটাকে ঠিক ঠাক না করতে পারলে বিগডেটার অধিকাংশ কাজ করা সম্ভব না।
পরের সমস্যা হচ্ছে, এই যে নানান সার্ভারে কাজ করানো হচ্ছে-ডেটার আদান প্রদান হচ্ছে-সেটাকে কিকরে দ্রুত করা যায়। ম্যাপ রিডিউস সিস্টেম যে ক্ল্যাসিক্যাল প্যারালাল কম্পিউটিং ফ্রেমওয়ার্কের চেয়ে খুব বেশী কিছু ভাল না-এই নিয়ে কম্পুটার সমাজেই বিতর্ক আছে। এম আই টির অধ্যাপক প্রফেসর স্টোন ব্রেকার মনে করেন, ম্যাপ রিডিউস সিস্টেম একটা হাইপ। এই সমস্যার সমাধানে আসে দ্বিতীয় প্রজন্মের ম্যাপ রিডিউস সিস্টেম-যেটাকে বলে ইন মেমরী সিস্টেম-পোষাকী নাম স্পার্ক। এটি বার্কলি বিশ্ববিদ্যালয় থেকে উদ্ভুত ওপেন সোর্স। এখানে তথ্যগুলির গুরুত্বপূর্ন অংশ র্যাম বা ডাইনামিক মেমরী রেখে দেওয়া হয়-যাতে তথ্যের আদান প্রদান কমানো যায়। কারন ওখানেই ৯০% সময় যায়। স্পার্ক ফ্রেম ওয়ার্কটির বয়স বছর খানেক হতে চললো। এটিই বিগডেটার এখন জনপ্রিয়তম ফ্রেমওয়ার্ক। হাডুপ এখন অতীত।
স্যোশাল মিডিয়ার উদাহরন থেকে দেখতে গেলে দেখব, বিগ ডেটার চারটি মূল স্তম্ভঃ এগুলিকে বলে ফোর ভি।
(১) ভল্যুউম-বিশাল তথ্যভান্ডার। এটা টেরাবাইট লেভেলেও হতে পারে, এক্সবাইট লেভেলেও হতে পারে
(২) ভেলোসিটি- দ্রুত ঢুকছে তথ্য। দ্রুত বেড়ে উঠছে তথ্য ভান্ডার
(৩) ভ্যারাইটি- নানান ধরনের তথ্য। লেখা, ছবি, গান, ভিডিও ইত্যাদি
(৪) ভেরাসিটি- অধিকাংশ তথ্যই পরিস্কার না। ৯৯% তথ্যই কাজের না।
এত গেল তথ্য। এবং ফ্রেমওয়ার্ক। তথ্য দিয়ে কি হয়? তথ্য থেকে দরকার জ্ঞান বা কাজের কাজ লাগানোর মত সিদ্ধান্ত বা সুপারিশ। এর জন্যে দরকার আধুনিক মেশিন লার্নিং সিস্টেম। যেমন ধরুন আমি ফেসবুকের ডেটা থেকে জানতে চাইছি মোদির নেপাল সফর নিয়ে ভারতের মানুষ খুশী কিনা? এটাকে সেন্টিমেন্ট এনালিসিস বলে। অন্তত ১ মিলিয়ান লোকে মোদির ভারত সফর নিয়ে কমেন্ট করেই থাকবে। ওই এক মিলিয়ান কমেন্ট পড়া সম্ভব না। তাহলে কি করে বুঝবো ওই এক মিলিয়ানের মধ্যে অন্তত ৭০% মোদির পক্ষে? এই কাজটাই সহজ করে লার্নিং সিস্টেম। আমার দরকার ১০০টার মতন স্টাস্টাস যেখানে মোদির নেপাল সফর নিয়ে লোকে কমেন্ট করেছে। সেখান থেকে বেছে আমি দুটো ট্রেনিং সেট বানাবো-একটাতে লোকে মোদির ব্যাপারে পজিটিভ-অন্যটি নেগেটিভ। এই ট্রেনিং সেট মেশিং লার্নিং সিস্টেমে ঢুকিয়ে দিলেই বাকী ১ মিলিয়ান স্টাটাসে ব্যাপারে সে সিদ্ধান্ত নেবে কোনটি মোদির ব্যাপারে পজিটিভ-কোনটি নেগেটিভ। এতে ভুল থাকবে। কিন্ত এক মিলিয়ান স্টাটাস কারই বা পড়া সম্ভব?
বিগডেটা প্রযুক্তির তিনটি স্তম্ভ। প্রথমে বিশাল তথ্যভান্ডার-যার উৎপত্তি হতে পারে মানুষের লেখা, ছবি, গবেষনাপত্র, সেন্সর ডেটা, টেস্ট রেজাল্ট ইত্যাদি। দ্বিতীয়টি হচ্ছে ইনফ্রাস্টাকচার-যার মধ্যে আচ্ছে হাডুপ বা স্পার্কের মতন ম্যাপ-রিডিউসড সিস্টেম। তৃতীয়টি মেশিন লার্নিং এলগোরিদম-সেটা কাজে লাগিয়ে বার করা যাবে তথ্যভান্ডারের মধ্যে আছে টা কি! সুপারিশ বা রেকোমেন্ডেশনটাই বা কি দিচ্ছে !
আমি খুব সংক্ষেপে বিগডেটা প্রযুক্তি নিয়ে লিখলাম-এর বাইরেও অসংখ্য উদ্ভাবন এবং প্রযুক্তি আসছে বিগডেটা ফিল্ডে।
রাজনীতি, সমাজে-আমাদের ব্যক্তিগত জীবনে বিগডেটা কি প্রভাব ফেলবে সেটা জানতে এই টুকু বেসিক মাথায় রাখলে ভাল হয়।
(3)
এবার আসি ধর্ম, রাজনীতি এবং সমাজ নিয়ে।
আমেরিকান সরকার এখনই বিগডেটাকে প্রবলভাবে কাজে লাগাচ্ছে নানান এরিয়াতে। এখানে মেডিকেড বা মেডিকেয়ারে ফ্রড হত সাংঘাতিক। সরকারি ফান্ড থেকে চুরি হত ২০০ বিলিয়ান ডলারের বেশী। ওবামা সরকার এই অপচয়ের অনেকটাই বাঁচিয়েছেন বিগডেটা প্রযুক্তি কাজে লাগিয়ে। আবার এই একই প্রযুক্তি কাজে লাগিয়ে ইন্টেলিজেন্স ডিপার্টমেন্ট পৃথিবীর অন্যান্য দেশের সরকারের ওপর নজরদারী চালিয়েছে-যার ফলশ্রুতি শ্নোডেন কান্ড।
নানান যাত্রায় ভিন্ন ফল আর কি।
সব থেকে বড় কথা ওবামা নিজে ২০১২ সালে জিতলেন বিগডেটা প্রযুক্তি ব্যবহার করে। ওবামার ক্যাম্পেইনের হাতে আমেরিকার সব নাগরিকদের তথ্য ছিল-তাদের রাজনৈতিক মনের খবর ছিল। এটা কিভাবে সম্ভব-তার জন্য অন্য একদিন লিখব। এই ফিল্ডটাকে বলে পলিটিক্যাল বিগডেটা। এর মূল সমস্যা কি করে বার করা যায় ভোটারদের মনের খবর-আর কারা সুইং করতে পারে। ডেভিড এলেক্সরড ছিলেন তার মূল সেনাপতি। যাইহোক ওবামার লোকজন জানত মিঃ এক্সকে কি করে পটাতে হবে-অর্থাৎ কি টোপ ফেলবেন- পরিবেশ না স্যোশাল বেনিফিট-ইত্যাদি!! এইভাবে তৈরী করা হয় ভোটিং ব্লক।
ভারতে মোদিও ডেটা সায়েন্সকে সব থেকে ভাল পেশাদারি ভাবে কাজে লাগিয়েছেন। ফল পেয়েছেন হাতে নাতে। আবেগে না ভেসে, প্রতিটা ভোটারের মনের খবর জেনে, যে রাজনীতিবিদ গিরগিটির মতন রং পরিবর্তন করতে পারবেন-তিনিই এই নতুন যুগের জো জিতে ওহি সিকান্দার! মোদিও কি সুন্দর হিন্দুত্বর রং ছেড়ে-উন্নয়নের আলখাল্লাতে উন্নিত। কারন তার টিম ভোটারদের মন সব থেকে ভাল বুঝে, সেই মতন রং বদলেছে। হিন্দুত্ববাদের আদর্শ আঁকড়ে ধরে ডোবে নি। ওবামা অবশ্য মানুষের মন বুঝে বদলানোর ব্যাপারে গুরুদেব।
তাহলে কি দাঁড়াচ্ছে? পৃথিবীর দুই বৃহত্তম গণতন্ত্রে ওবামা, মোদির নির্বাচন থেকে পরিস্কার আদর্শের দিন শেষ। জনগন চাইছে বাস্তববাদি রাজনীতি-যা তাদের প্রতিদিনের সমস্যা-দুর্নীতি, চাকরি, ইনফ্রাস্টাকচার, সুলভ এবং নির্ভরযোগ্য মেডিক্যাল সিস্টেম উপহার দেবে।
সুতরাং রাজনীতি এবং গনতন্ত্র তার নিজের স্বার্থেই বিগডেটাকে আরো ব্যাপক ভাবে কাজে লাগাবে বা লাগাচ্ছে। বিগডেটা কাজে না লাগালে দুর্নীতি দূর করা সম্ভব না। ইনফ্রাস্টাকচার এবং বাজেটের সৎব্যাবহার সম্ভব না। সুলভ সরকারি পরিশেবা দেওয়া সম্ভব না। অর্থাৎ উন্নত উৎপাদন ব্যবস্থার গণতান্ত্রিক দাবীর কারনেই আস্তে আস্তে সরকারে আমলাদের জায়গায় আসবে বিগডেটা নির্ভর সরকারি মেশিনারী-যেখানে নাগরিকরা তাদের পরিশেবা পাবে দ্রুত। দেওলিয়া সরকারে খরচ ও কমবে অনেক।
এর একটা উদাহরন স্মার্ট সিটি। মোদি ভারতে ১০০ টি স্মার্ট সিটি গড়তে চান। স্মার্ট সিটি আই ও টি বিগডেটার উদাহরন। সেখানে শহরের লাইটিং, ট্রাফিক নিয়ন্ত্রিত হবে সেন্সর দিয়ে, ভিডিও দিয়ে। সর্বত্র সার্ভিলেন্স থাকায় রাস্তাঘাট হবে নিরাপদ। পুলিশ, আমলা ছাড়াই সম্পূর্ন অটোমেশনের ভিত্তিতে চলবে শহরগুলি। খুব স্বাভাবিক কারনে এই শহরগুলি হয়ে উঠবে ব্যবসার তীর্থক্ষেত্র।
তবে এসব ও অতীত। ভবিষ্যত কি?
ধর্ম টিকে আছে রাজনৈতিক পৃষ্টপোষকতায়। কৃষ্ণ মহম্মদ যীশুর ন্যায় কাল্পনিক রূপকথার গল্পে বিশ্বাস করে লোকজন নিজেদের মধ্যে মারমারি হানাহানি করে-এটার কারন একটাই। সমাজ এবং সরকার জোর করে ধর্ম নিয়ে বাচ্চাদের ব্রেইন ওয়াশ করে। এই জিনিসটাই থাকবে না। একজন বাচ্চাও আস্তে আস্তে সমাজ, স্কুল বাদ দিয়ে ওয়েব থেকেই শিখবে বেশী।
আর শেখার পদ্ধতিতেই থাকবে বিগডেটা এনালাইটিক। যেখানে কেও যদি জানতে চায় মহম্মদ কে ছিলেন-তাকে প্রথমেই সিস্টেম জানাবে, মহম্মদ ইসলাম ধর্মের প্রতিষ্ঠাতা হিসাবে স্বীকৃত এক "কাল্পনিক" চরিত্র। কারন তার অস্তিত্বের কোন ঐতিহাসিক প্রমান নেই। কোন প্রতিষ্ঠিত ঐতিহাসিক মহম্মদের অস্তিত্ব স্বীকার করেন নি। ডেটা আনালাইটিক নানান তথ্য ঘেঁটে সত্যতে অনায়াসেই উপনীত হতে পারে। ভুল তথ্য দিয়ে কায়েমি স্বার্থ সেখানে ঢাকা যাবে না।
আর আজকে ইসলামিক দেশে একজন শিশু কিভাবে শিখছে মহম্মদকে? তাকে শেখানো হচ্ছে তিনি পৃথিবীর শ্রেষ্ঠ মানুষ-তার মতন কেও জন্মান নি-তিনি পারফেক্ট! কিন্ত সেই শিশু একবারের জন্যও জানতে পারছে না মহম্মদের চরিত্রটাই স্পাইডারম্যান বা সুপারম্যানের যতটা পারফেক্ট-ততটাই কাল্পনিক। কারন শিক্ষাপদ্ধতিতে সেই অটোমেশন এখনো আসে নি।
এটা যেদিন আসবে ধর্মের রূপকথা সেদিনই শেষ!
একই ব্যাপার ঘটবে নর-নারীর সম্পর্ক স্থাপনে। ই-হার্মোনি বলে একটা ওয়েব সাইট এটা প্রথম শুরু করে-এখন এই ম্যাচিং রেকোমেন্ডেশন বিরাট বড় ইন্ড্রাস্টি। ধরুন আপনি জানতে চাইছেন-আপনার ফেসবুক বন্ধুদের মধ্যে কে সব থেকে ভাল জীবন সঙ্গী হতে পারে ? এরজন্য আপনাকে অত কিছু করতে হবে না। আপনি শুধু সিস্টেমকে জানিয়ে দেবেন-আমি ঠিক এই এই টাইপের বর চাই। সিস্টেম আপনাকে জানিয়ে দেবে, আপনার ফ্রেন্ড প্রোফাইলের মধ্যে কে কে আপনার প্রত্যাশার কাছাকাছি। শুধু তাই না-প্রথম দিন ডেটিং এ আপনাদের মধ্যে কি কি কথা হয়েছে, সেটা বিশ্লেষন করেও বলে দেওয়া সম্ভব আপনাদের সম্পর্কের ভবিষ্যত আছে কি না।
আমূল পরিবর্তন হবে পেশাদারি ক্ষেত্রে। আগেই লিখেছি ডাক্তার, উকিল, শিক্ষক, ম্যানেজার, সাধারন প্রোগ্রামার ইত্যাদি পেশাগুলির অস্তিত্ব সংকটে। কেরানী ত উঠেই গেছে অনেক দিন আগে। শিল্পে অটোমেশনের ফলে শিল্প শ্রমিকও আর লাগবে না। প্রশ্ন উঠছে, তাহলে এত এত মানুষ যাবে কোথায়? কাজ না পেলে খাবে কি?
এখানেই মার্ক্সের লেখাগুলির প্রাসঙ্গিকতা ফিরে আসে। উৎপাদন ব্যাবস্থার মালিকানা সর্বাধিক গুরুত্বপূর্ন ভবিষ্যতের জন্য। কারন শ্রমিক বা কর্মীর প্রাসঙ্গিকতা প্রায় থাকবে না। একটা লোক সম্পূর্ন অটোমেশন এবং রোবটিক্সের সাহায্যে একাই ১ থেকে ১০ মিলিয়ান ডলারের প্রোডাকশন করতে সমর্থ হবে। যা আগে ছিল না।
এই প্রশ্নটা আমাকে অনেকেই করেন-আমাদের ছেলে মেয়েদের ভবিষ্যত কি? কোন পেশাতে গেলে ভাল হয়?
আমার কাছে উত্তর নেই। শুধু এটাই বলি আমাদের সন্তানদের দুটো স্কিল সাংঘাতিক ভাল থাকতে হবে। এক, প্রোগ্রামিং, দুই বিজনেস এনালাইটিক বা ব্যবসা বোঝার ক্ষমতা। চাকরির স্কোপ এত সাংঘাতিক ভাবে কমবে আগামী বছরগুলিতে, সবাই স্বেচ্ছায় অনিচ্ছায় ব্যবসার দিকেই আসতে বাধ্য হবে । টিসিএস, ইনফি, সিটিএস-এই সব বিগ জায়েন্ট কোম্পানী অলরেডি অতীত। কারন বিগডেটা প্রযুক্তি ব্যবহার করে আগে যে আই টির কাজে ১০০০ লোক লাগত-এখন লাগবে ১০ জন। সুতরাং নতুন যে ব্যবসার দিকগুলি খুলবে, তা সেই হাই এন্ড প্রোগ্রামিং মার্কেটেই। ইল্যান্স, ওডেক্স -যা অনলাইন স্কিল মার্কেটপ্লেস-তাদের ব্যবসা বাড়াছে সাংঘাতিক হারে।
তবে কি হবে আগামী দশ বছরে, সেটা কেও জানে বলে মনে হয় না। আমি ত কোন ছাড়!
No comments:
Post a Comment