کاهش زمان تجزیه و تحلیل DNA از طریق فایل فرمت جدید
به گزارش کارگروه فناوری اطلاعات سایبربان ؛ دانشگاه نیو ساوت ولز و موسسه تحقیقات پزشکی گاروان فرمت فایل کامپیوتری جدیدی را برای سرعت بخشیدن به تجزیه و تحلیل توالی نانوحفره و بهبود درمان های تخصصی برای بیماران مبتلا به سرطان و سایر بیماری ها ایجاد کرده اند.
این تحقیق بیان میکند که فرمت تازه توسعه یافته SLOW5 میتواند توالییابی نانوحفرههای DNA پیچیده را «بیش از 30 برابر سریعتر» از فرمت فایل قبلی به نام FAST5 پردازش کند.
توالییابی نانوحفره برای شناسایی طیفی از بیماریها و کمک به متخصصان پزشکی در تجزیه و تحلیل نمونههای DNA با جزئیات استفاده میشود تا بتوانند درمانهای مناسبی را برای بیماران سرطانی ارائه دهند.
دادههای تولید شده از این فرآیند بهطور معمول در قالبهای فایل FAST5 ضبط میشد که فایلهای بزرگی در حدود 1.3 ترابایت، معادل تقریباً 650 ساعت ویدیوی با کیفیت بالا تولید میکرد. به گفته محققان، به دلیل اندازه بزرگ فایل های FAST5، دو هفته طول می کشد تا رایانه ها آنها را پردازش کنند.
با این حال، نویسنده اصلی و مهندس سیستمهای محاسباتی ژنومیک موسسه Garvanبه نام حاسیندو گاماراچی (Hasindu Gamaarachchi)، گفت که پردازش دادههای ژنوم انسان با استفاده از SLOW5 به نصف روز کاهش مییابد.
او توضیح میدهد که برخلاف FAST5، فرمت SLOW5 محاسبات موازی را امکانپذیر میسازد که به موجب آن چندین پردازنده میتوانند به طور همزمان چندین تجزیه و تحلیل کوچکتر را که از مجموعه دادههای بزرگتر، پیچیدهتر و کاملتر تفکیک شدهاند، اجرا کنند.
او گفت:
فرض کنید 10 نفر میخواهند یک چاله ای حفر کنند اما فقط یک بیل وجود دارد که آنها باید آن را به اشتراک بگذارند. قبلاً فرمتFAST5 اینگونه کار میکرد. اما با SLOW5 هر کسی بیل مخصوص به خود را می گیرد و همه آنها می توانند همزمان حفاری کنند و کار را بسیار سریعتر انجام دهند.
وی افزود :
فرمت FAST5 کند است زیرا نمی توان به داده ها به طور موازی دسترسی داشت. این قالب بر اساس قالب داده Hierarchical است که در دهه 1990 برای کار بر روی ماشین هایی طراحی شد که در آن زمان فقط یک پردازنده داشتند، درحالی که ماشین های مدرن شامل چندین پردازنده هستند. فرمت دادهHierarchical نیز عمومی است، در حالی که SLOW5 هدفمند ساخته شده است. بنابراین از نظر قیاس حفاری، مانند این است که ما یک بیل را نیز ارائه می دهیم که به طور خاص برای همان نوع خاک طراحی شده است. و چون SLOW5 جدید می تواند دسترسی موازی توسط چندین پردازنده به طور همزمان را ارائه دهد، زمان پردازش تا حدود 30 برابر کاهش یافته است.