Science

ডিএনএ-ই ভবিষ্যতের ডাটা স্টোরেজ

মানব সভ্যতার ইতিহাসে তথ্য সংরক্ষণের প্রয়োজনীয়তা অপরিসীম। তাইতো এই তথ্য সংরক্ষণের জন্য যুগে যুগে আবিষ্কার হয়েছে বিভিন্ন পন্থা। ১৮৯০ সালে Punch Cards এর হাত ধরেই যার সূচনা। এরপর ১৯৩২ সালে Magnetic Drum, ১৯৪৭ সালে Williams-Kilburn Tube, ১৯৫১ সালে Magnetic Tape Drive এবং Magnetic Core, ১৯৫৬ সালে Hard Disk Drive (HDD), ১৯৬৭ সালে Floppy Disk, ১৯৮২ সালে Compact Disc (CD), ১৯৯৪ সালে Zip Drive, ১৯৯৫ সালে Digital Video Disc (DVD) ইত্যাদি। এই ডিভাইসগুলো ছিল আকারে বড় এবং মেমোরি সাইজ অনেক কম।

বর্তমানে ১৯৯৯ সাল হতে SD Card এবং USB Flash Drive, ২০০৩ সাল হতে Blu-ray Optical Disc এবং ২০০৬ সাল হতে Cloud Data Storage এর যে প্রযুক্তির হার্ডডিস্ক/মেমোরি আমরা ব্যবহার করছি এগুলোও ডাটার তুলনায় দিন দিন ক্রমশ ছোট হয়ে যাচ্ছে। বর্তমানে পৃথিবীতে যেভাবে ডিজিটাল ডাটার সংখ্যা বৃদ্ধি পাচ্ছে, তাতে অদূর ভবিষ্যতে একসময় এই ডিজিটাল ডিভাইসগুলোর ধারণক্ষমতার বাইরে চলে যাবে। তাহলে প্রশ্ন হলো তখন এই বিপুল পরিমাণ তথ্য কিভাবে সংরক্ষণ করা হবে?

মজার ব্যাপার হল মূল্যবান এ প্রশ্নের উত্তর লুকিয়ে আছে আমাদের দেহের ডিএনএ (DNA) এর মধ্যেই। এই ডিএনএ-ই হতে চলেছে ভবিষ্যতের ডাটা সংরক্ষণের ডিভাইস যা বর্তমানে ব্যবহৃত ডিভাইস গুলোর চেয়ে অনেকগুণ বেশি তথ্য সংরক্ষণ করতে পারবে। বিজ্ঞানীদের মতে পুরো পৃথিবীর এই বিপুল পরিমাণ ডাটা সংরক্ষণ করা যাবে মাত্র কয়েক গ্রাম ডিএনএ’র মধ্যেই। এই প্রযুক্তি ব্যবহার করা গেলে মাত্র ১ গ্রাম ডিএনএ’তে ২১৫ পেটাবাইট ডাটা সংরক্ষণ করা সম্ভব (১ পেটাবাইট = ১০০০ টেরাবাইট), যেখানে একটি হার্ডডিস্ক মাত্র কয়েক টেরাবাইট ডাটার জন্য অনেক বেশি পরিমাণ জায়গা নেয়। আবার প্রযুক্তিগত বিভিন্ন সীমাবদ্ধতার জন্য এসব ডিভাইস হতে প্রতিনিয়ত ডাটা হারানোর ভয় তো আছেই। সেখানে হাজার হাজার বছর যাবত অত্যন্ত স্বল্প পরিসরে নির্ভুলভাবে বিপুল পরিমাণ তথ্য সংরক্ষণ করতে পারবে এই ডিএনএ। ডিএনএ’তে মিউটেশন ছাড়া থাকবে না কোনো তথ্য বিকৃতির ভয়ও। প্রাচীন বরফের নিচে ম্যামথ বা অন্যান্য প্রাণীর জীবাশ্ম বিশ্লেষণ করে বিজ্ঞানীরা জানতে পেরেছেন যে প্রকৃতিতে হাজার হাজার বছর ধরে ডিএনএ অক্ষত অবস্থায় থাকতে পারে। এজন্যই আমরা হাজার বছরের পুরনো তথ্য উদ্ধার করতে পারি এই ডিএনএ হতেই। গবেষকদের দাবি তাত্ত্বিকভাবে মাত্র এক কাপ ডিএনএ এর মধ্যেই ১০ কোটি ঘণ্টারও বেশি High-definition (HD) প্রযুক্তির ভিডিও তথ্য সংরক্ষণ করা যাবে। কিন্তু এই বিপুল পরিমাণ তথ্য ডিএনএ কিভাবে সংরক্ষণ করবে??

এজন্য প্রথমেই জানা প্রয়োজন এই ডিএনএ’র গঠন। আমরা জানি জীবজগতের বংশগতির ধারক ও বাহক ডিএনএ’র পূর্ণরূপ হল ডিঅক্সিরাইবো নিউক্লিক অ্যাসিড (Deoxyribonucleic acid)। ডিএনএ’র এই অণুগুলো দুটো লম্বা সুতোর মতো একে অপরকে জড়িয়ে থাকে। এই সুতোর মতো কুণ্ডলিত ডিএনএ যখন হিস্টোন নামক প্রোটিন দিয়ে মোড়ানো থাকে তখন তাকে বলে ক্রোমোজোম। জীব কোষের নিউক্লিয়াসের ভেতরের এই ক্রোমোজোম এর মধ্যেই মূলত এই ডিএনএ’র অবস্থান। জীবজগতের সকল বৈশিষ্ট্য ধারণ করে এই ডিএনএ এবং বংশ পরম্পরায় তা বহন ও করে। আর এই প্রতিটি বৈশিষ্ট্যই হলো তথ্য যা সংরক্ষিত থাকে ডিএনএ’র চার ধরনের নাইট্রোজেন ঘটিত ক্ষারের যেকোনো একটি, একটি ফসফেট গ্রুপ এবং ৫ কার্বন বিশিষ্ট রাইবোজ সুগারে। এই চারটি ক্ষারের মধ্যে আবার দুইটি ধরন: একটি পিউরিন (অ্যাডেনিন-Adenine ও গুয়ানিন-Guanine) এবং অপরটি পাইরিমিডিন (সাইটোসিন-Cytosine ও থাইমিন-Thymine)। যাকে সংক্ষেপে A, G, C ও T বলা হয়। পূর্ণাঙ্গ একটি মানব কোষে এরকম প্রায় তিন বিলিয়নেরও বেশি নিউক্লিওটাইড থাকে যা নিয়ে ডিএনএ গঠিত হয়। সম্পূর্ণ মানবদেহে এরকম প্রায় ৩৭.২ ট্রিলিয়ন কোষ থাকে।

আমরা জানি কম্পিউটারের ভাষা হচ্ছে ০ এবং ১ বাইনারি কোড, এই দুটো বাইনারি কোড এর মাধ্যমেই কম্পিউটারের সকল তথ্য আদান-প্রদান হয়। তাই যদি ডিএনএ’র এই নিউক্লিওটাইড সিকুয়েন্সকে ০ এবং ১ এর মাধ্যমে রূপান্তর করে উপস্থাপন করা যায় তাহলেই কিন্তু ডাটাকে ডিএনএ তে সংরক্ষণ করা যাবে। তাহলে কিভাবে ডিজিটাল ডাটাকে ০ এবং ১ এ রূপান্তর করা যাবে?

যদি বাইনারি সিস্টেম কে ডিএনএ'র নিজস্ব ভাষায় রূপান্তর করতে হয় তাহলে একটি সাধারন কনভার্সন সিস্টেমের প্রয়োজন হবে। ধরা যাক, ডিএনএ'র চারটি বেস - A, G, C এবং T, যদি A = ০০, G = ০১, C = ১০ এবং T = ১১ হয় তাহলে স্ট্রিং ০১১১১০১০১১০০১১০১ রূপান্তরিত হবে GTCCTATG তে। এভাবে যেকোনো ডিজিটাল ডাটা অথবা সিনেমাকে এই AGCT তে রূপান্তর করা সম্ভব এবং সেগুলোকে প্রয়োজন অনুযায়ী সিকুয়েন্স করে ফেললেই তার মধ্যে সব বাইনারি কোড গুলো সংরক্ষন করা যাবে। আবার পুনরায় এই ডাটা গুলো ব্যবহার করতে চাইলে ডিএনএ সিকোয়েন্স করতে হবে।

আপাতদৃষ্টিতে তাত্ত্বিকভাবে কাজটি খুব সহজ মনে হলেও বাস্তবিকভাবে অনেক জটিল। যেমন কোন একটি নির্দিষ্ট ডাটা খুজতে হলে তার জন্য পুরো ডিএনএ কে ডিকোড করা লাগবে। ডিএনএ সিকোয়েন্সিং এখনো অনেক ব্যয়বহুল যা সাধারণ মানুষের নাগালের বাইরে। ডিএনএ তৈরী, সিকোয়েন্সিং অ্যালগরিদম আর তা ডিকোড করা সহজেই সকলের ব্যবহার উপযোগী করতে বিজ্ঞানীরা চেষ্টা চালিয়ে যাচ্ছেন।

ডিএনএ’তে তথ্য সংরক্ষণের এই ধারণাটি আমাদের কাছে নতুন মনে হলেও এ নিয়ে গবেষণা চলছে বিগত কয়েক দশক যাবত। ১৯৯৯ সালে সর্বপ্রথম নিউয়র্কের বিজ্ঞানীগণ ডিএনএ দিয়ে বর্ণ, সংখ্যা আর চিহ্ন তৈরি করে ২২ টি অক্ষরের একটি চিঠি তৈরি করেন ডিএনএ স্ট্র্যান্ডে। এরপর তারা অত্যন্ত সফলভাবে পুনরায় চিঠিটি ডিকোড করেন। এরপর ২০০৯ সালে কানাডার গবেষকগণ ২০০ বাইটের একটি ছোটদের ছড়ার ছবি, লেখা এবং অডিও ফাইল ডিএনএতে সংরক্ষণ করেন। ২০১২ সালে ব্রিটিশ বিজ্ঞানীরা উইলিয়াম শেক্সপিয়ারের ১৫৪ টি সনেট এবং মার্টিন লুথার কিং এর বিশ্ব বিখ্যাত "আই হ্যাভ এ ড্রিম" বক্তৃতার কিছু অংশের লেখা ১৭৯ কিলোবাইট ডাটায় ডিএনএ তে সংরক্ষণ করতে সক্ষম হন। এরপর ২০১৬ সালে পূর্বের সকল রেকর্ড ভেঙে নতুন রেকর্ড গড়েন মাইক্রোসফ্ট এবং ওয়াশিংটন বিশ্ববিদ্যালয়ের একদল গবেষক। তারা ২০০ মেগাবাইটের ডিজিটাল ডাটাকে ডিএনএ তে রূপান্তর করেন যার মধ্যে ছিল জাতিসংঘের "Universal Declaration of Human Rights" এবং "Ok Go Song" এর High-Definition মিউজিক ভিডিও।

তাহলে প্রশ্ন হলো এত কম পরিমাণে ডাটা ডিএনএ’তে স্টোর করে কি হবে যেখানে বর্তমানে পুরো ডিজিটাল ইউনিভার্সে  ডাটা আছে আনুমানিক ৭৪ জেটাবাইট (১ জেটাবাইট = ১ বিলিয়ন টেরাবাইট = ১ ট্রিলিয়ন গিগাবাইট) যা ২০১৯ সালে ছিল মাত্র ৪১ জেটাবাইট এবং ২০২০ সালে তা বেড়ে দাঁড়ায় ৫৯ জেটাবাইট। এভাবে ডাটার আকার প্রতিনিয়ত বাড়তে থাকলে ২০৪০ সালে গিয়ে দাঁড়াবে প্রায় ১৬০ জেটাবাইটে।

এই পাহাড়প্রমাণ তথ্য সংরক্ষণের জন্য অতি সম্প্রতি ক্যালিফোর্নিয়ার তরুণ গবেষক নাথানিয়েল রকে এবং হিউনজুন পার্ক ডিএন’র মধ্যে তথ্য ধরে রাখার পদ্ধতি নিয়ে একটি স্টার্ট-আপ প্রতিষ্ঠা করেছেন। তারা Microsoft-এর মত ব্যয় বহুল ভাবে তথ্য সংরক্ষণ না করে একটি আলাদা উপায় বের করার চেষ্টা করছেন। এজন্য প্রথমে তারা প্রি-ফ্যাব্রিকেটেড ডিএনএ তৈরী করে যার প্রায় সবই এক এবং অর্থহীন। এরপর তারা এনজাইম দ্বারা সেই ডিএনএ কে যে মেসেজে এনকোড করতে চায়, সেই মেসেজে পরিণত করে। এতে এই প্রক্রিয়াটি অত্যন্ত কম খরচে করা যায়। তারা ইতিমধ্যে এই প্রক্রিয়ায় প্রথম কিলোবাইট এনকোড করেছে।

ডিএনএ’র মাধ্যমে তথ্য সংরক্ষণের এই প্রযুক্তি এখনো প্রাথমিক পর্যায়ে থাকলেও অদূর ভবিষ্যতে অত্যন্ত স্বল্প ব্যয়ে নির্ভুলভাবে প্রকৃতির এই হার্ডডিস্কে আমাদের পুরো ডিজিটাল দুনিয়ার সকল তথ্য সংরক্ষণ করতে পারব।

এ ব্যাপারে আরো তথ্য পাবেন ....

জিনোম সিকোয়েন্স এর ইতিহাস

জিনোম বলতে কোন জীবের সামগ্রিক ডিএনএ (DNA) কে বোঝায়। জীবজগতের বংশগতির ধারক ও বাহক হলো এই ডিএনএ। এর মাধ্যমেই জীবের বৈশিষ্ট্য প্রকাশ পায়। জিনোম সিকোয়েন্সের প্রযুক্তি আজকের এই পর্যায়ে আসার পেছনে রয়েছে বিজ্ঞানীদের দীর্ঘ দিনের অক্লান্ত পরিশ্রম। 

গবাদিপশুর জিনোম সিকোয়েন্স

ডিএনএ (DNA) এর পূর্ণ রূপ হল ডিঅক্সি রাইবোনিউক্লিক এসিড (Deoxyribonucleic acid)। এই ডিএনএ কে বলা হয় জীবজগতের বংশগতির ধারক ও বাহক। জীবজগতের বৈশিষ্ট্য প্রকাশ পায় এই ডিএনএ এর মাধ্যমেই। চারটি নাইট্রোজেন ঘটিত ক্ষারের যেকোনো একটি, একটি ফসফেট গ্রুপ এবং পাঁচ কার্বন বিশিষ্ট রাইবোজ সুগার নিয়ে গঠিত হয় ডিএনএ। এই চারটি ক্ষারের মাঝে আবার দুইটি ধরণ থাকে। একটি পিউরিন (অ্যাডেনিন ও গুয়ানিন) এবং অপরটি পাইরিমিডিন (সাইটোসিন ও থাইমিন)।

ডিএনএ অণুগুলো দুটো লম্বা সুতোর মতো একে অপরকে জড়িয়ে থাকে। এই সুতোর মতো কুণ্ডলিত ডিএনএ যখন হিস্টোন নামক প্রোটিন দিয়ে মোড়ানো থাকে তখন তাকে বলা হয় ক্রোমোজোম। জীবকোষের নিউক্লিয়াসের ভেতরের এই ক্রোমোজোমের মধ্যেই ডিএনএ এর অবস্থান।  আর জিন হচ্ছে এই ডিএনএ এর একটি সুনির্দিষ্ট অংশ যেটি একটি নির্দিষ্ট প্রোটিনকে কোড করতে পারে। অর্থাৎ প্রোটিন সংশ্লেষণের জন্য প্রয়োজনীয় সব তথ্য জিনে অন্তর্নিহিত থাকে।

জীবজগতের কোন বৈশিষ্ট্য প্রকাশিত হওয়া বা না হওয়া সংশ্লিষ্ট জিনের এক্সপ্রেশনের উপর নির্ভর করে। অনেক সময় পরিবেশর উপর নির্ভর করে জিনের এক্সপ্রেশন পরিবর্তিত হয়। আবার সময়ের সাথে সাথে ও জিনে পরিবর্তন হয়। তারপরও সদৃশ প্রজাতিগুলোর মাঝে একটি নির্দিষ্ট জিনের কাছাকাছি অনুরূপ পাওয়া যায় এবং প্রজাতিগত দূরত্ব বাড়ার সাথে সাথে জিনগত পার্থক্যও বাড়ে। একটি নির্দিষ্ট প্রজাতির সকল জিনের সমষ্টিকে একসাথে জিনোম বলা হয়। যেকোনো জীবের বৈশিষ্ট্য প্রকাশের নিয়ন্ত্রক ও এই জিনোম। আসলে জিনোমের খুব সামান্য অংশই জিন। জিনোমের বেশির ভাগ অংশই হলো কোডবিহীন ডিএনএ। তাই কোন নির্দিষ্ট জীবের জিনকে শনাক্ত করতে হলে প্রথমে তার পুরো জিনোমকে সিকোয়েন্স করা প্রয়োজন। জিনোম সিকোয়েন্স মানে হলো শুরু থেকে শেষ পর্যন্ত ডিএনএ অণুর ভেতর চারটি নাইট্রোজেন (ATGC) ঘটিত ক্ষারের বেইস গুলো কিভাবে সাজানো আছে সেটা খুঁজে বের করা।

গবাদিপশু বা গরু আমাদের বহুল পরিচিত একটি প্রাণী। প্রাণিজগতের মধ্যে গরুই প্রথম স্তন্যপায়ী প্রাণী যার জিনোম সিকোয়েন্স করা হয়েছে। আনুমানিক  ১০,০০০ বছর ধরে এই গবাদিপশু তাদের চামড়া, মাংস, দুধ এবং শক্তি দিয়ে মানব সভ্যতার অভাবনীয় উপকার করে আসছে। সর্বপ্রথম ২০০৩ সালে মানবদেহের পূর্ণাঙ্গ জিনোম সিকোয়েন্স প্রকাশিত হবার পর থেকেই গবেষকরা গরুর জিনোম সিকোয়েন্স করার চেষ্টা শুরু করেন। এই জন্য বেছে নেয়া হয় হেরিফোর্ড জাতের (Hereford cow - known as L1 Dominette 01449) গরু।

প্রাথমিকভাবে এই গবেষণা প্রকল্পে অর্থায়ন করে ন্যাশনাল ইনস্টিটিউট অফ হেলথ এর ন্যাশনাল হিউম্যান জিনোম রিসার্চ ইনস্টিটিউট (NHGRI) এবং মার্কিন কৃষি বিভাগ (USDA)। পঁচিশটি (২৫) দেশের তিনশত (৩০০) বিজ্ঞানীর অক্লান্ত পরিশ্রমের ফলে দীর্ঘ ছয় বছর গবেষণার পর গরুর পূর্ণাঙ্গ জিনোম সিকোয়েন্স উন্মোচন করা হয়। এ গবেষণা দলের নেতৃত্বে ছিলেন অধ্যাপক ড. রিচার্ড এ গিবস (Richard A. Gibbs)। গবেষণালব্ধ প্রাথমিক ফলাফল দুই ভাগে সর্বপ্রথম ২০০৯ সালের ২৪ শে এপ্রিল বিশ্ববিখ্যাত সায়েন্স (Science) জার্নালে প্রকাশিত হয়। পরবর্তীতে এই গবেষণার বিশদ বিশ্লেষণ সহ আরো ২০ টিরও বেশি গবেষণাপত্র বায়োমেড সেন্ট্রাল (BioMed Central) ওপেন অ্যাক্সেস জার্নালে প্রকাশিত হয়।

প্রথম Science গবেষণাপত্রে দেখা যায় যে গরুর জিনোম ৩০ জোড়া ক্রোমোজোম নিয়ে গঠিত এবং জিনোমের আকার প্রায় ৩ জিবি (3 billion base pairs)। এতে প্রায় ২২,০০০ জিন রয়েছে যার মধ্যে ১৪,০০০ জিন সমস্ত স্তন্যপায়ী প্রজাতির জন্য সাধারণ। গবাদি পশু তাদের জিনের ৮০ শতাংশ মানুষের সাথে ভাগ করে। এই গবেষক দলের নেতৃত্বে ছিলেন আমেরিকার বেইলার কলেজ অফ মেডিসিনের জিনোম সিকোয়েন্সিং সেন্টার, মার্কিন কৃষি বিভাগ USDA এর কৃষি গবেষণা পরিষেবা (ARS), জর্জটাউন ইউনিভার্সিটি এবং CSIRO (The Commonwealth Scientific and Industrial Research Organisation) গবেষকগণ।

দ্বিতীয় Science গবেষণাপত্রে গবেষকগণ হেরিফোর্ড জাতের গরুর জিনোমকে রেফারেন্স জিনোম ধরে আরো ছয় (৬) জাতের গরুর (Holstein, Angus, Jersey, Limousin, Norwegian Red and Brahman) জিনোমের সাথে তুলনা করেন। এই গবেষক দলের নেতৃত্বে ছিলেন আমেরিকার বেইলার কলেজ অফ মেডিসিনের জিনোম সিকোয়েন্সিং সেন্টার, ARS এবং মিসৌরি বিশ্ববিদ্যালয়ের গবেষকগণ। এরপর  ১৯ টি ভৌগলিক এবং জৈবিকভাবে স্বতন্ত্র জাতের ৪৯৭ টি গবাদি পশুর উপর ফলো-আপ স্টাডি করেন।

বর্তমান সময়ে গরুর মাংস এবং দুগ্ধ শিল্পের অভাবনীয় উন্নতির পেছনে রয়েছে জিনোম সিকোয়েন্সের সাথে সংশ্লিষ্ট সকল বিজ্ঞানিদের অসামান্য অবদান।