مقدمه و بافت بالینی
توالییابی کل ژنوم (Whole Genome Sequencing - WGS) به عنوان پیشرفتهترین ابزار در تشخیصهای مولکولی بالینی شناخته میشود که امکان بررسی جامع تمامی محتوای ژنتیکی انسان را فراهم میآورد. برخلاف روشهای پیشین نظیر توالییابی کل اگزوم (Whole Exome Sequencing - WES) که صرفاً به مناطق کُدکننده پروتئینی محدود میشوند، روش WGS تمامی ۳.۲ میلیارد جفتباز ژنوم انسان را با دقتی بینظیر ارزیابی میکند. این رویکرد فراگیر، علاوه بر اگزونها، گستره وسیعی از عناصر تنظیمکننده غیرکُدکننده، توالیهای بینژنی و اینترونهای عمیق را که نقش حیاتی در بیان ژن دارند، پوشش میدهد. در آزمایشگاه ژن نگار آیندگان، تست WGS بالینی برای حل پروندههای پیچیده تشخیصی، به ویژه در مواردی که آزمایشهای ژنتیکی مرسوم در کشف علت مولکولی بیماری ناکام ماندهاند، به کار گرفته میشود.
گذر از WES به WGS در عملکرد بالینی ریشه در این درک علمی دارد که اگزومها تنها حدود ۱ تا ۲ درصد از کل ژنوم را تشکیل میدهند و بدین ترتیب بسیاری از واریانتهای بیماریزا از دید پنهان میمانند. جهشهای بیماریزا که در پروموترها (Promoters)، افزایندهها (Enhancers) و نواحی ترجمهنشده (UTRs) قرار دارند، به طور قابلتوجهی بیان ژن و فرآیند پیرایش آرانای (RNA Splicing) را مختل کرده و سهم عمدهای در معماری بیماریهای مندلی (Mendelian Diseases) دارند. علاوه بر این، پوشش یکنواخت و بدون نیاز به تکثیر مبتنی بر واکنش زنجیرهای پلیمراز (PCR-free) که در WGS به دست میآید، توانایی تشخیص واریانتهای ساختاری (Structural Variants - SVs)، تغییرات تعداد کپی (Copy Number Variants - CNVs) و توالیهای تکراری کوتاه (Short Tandem Repeats - STRs) را به شدت افزایش میدهد. از این رو، WGS به عنوان یک رویکرد جامع، قابلیتهای تشخیصی ریزآرایهها، اگزوم و تستهای هدفمند را در یک آزمایش واحد ادغام مینماید.
پذیرش جهانی WGS بالینی با شواهد فزایندهای پشتیبانی میشود که نشاندهنده بازده تشخیصی بالاتر و مقرونبهصرفه بودن این روش در درازمدت برای جمعیتهای مختلف بیماران است. ارزیابی با وضوح بالای ژنوم میتوکندریایی (mtDNA) و امکان فازبندی (Phasing) دقیقتر واریانتهای تک نوکلئوتیدی، کاربرد این ابزار ژنومیک را بیش از پیش متمایز میسازد. اگرچه تولید و مدیریت این مجموعه دادههای عظیم نیازمند زیرساختهای محاسباتی قدرتمند و خطوط لوله بیوانفورماتیک (Bioinformatics Pipelines) بسیار پیچیده است، اما تأثیر بالینی آن در تعریف دقیق بیماری بیبدیل است. با استفاده روتین از WGS، مراکز تخصصی نظیر ژن نگار آیندگان قادرند مسیر مدیریت اختصاصی بیماری، ارزیابی دقیق خطر تکرار و مشاوره خانواده را با قطعیت بیسابقهای ارائه دهند.
مروری بر فناوری (پیشزمینه علمی)
توالییابی کل ژنوم با استفاده از پلتفرمهای توالییابی نسل جدید (Next Generation Sequencing - NGS) مبتنی بر خوانشهای کوتاه (Short-read sequencing)، انقلابی در خوانش سریع و موازی میلیونها قطعه دیانای ایجاد کرده است. در این فناوری، مولکولهای DNA ابتدا به قطعات بسیار کوچک (عموماً ۱۵۰ تا ۳۰۰ جفتباز) شکسته شده و پس از اتصال آداپتورهای اختصاصی، بر روی فلوسلها (Flow cells) بارگذاری میشوند. فرآیند توالییابی از طریق سنتز (Sequencing by synthesis) انجام میگیرد، که در آن اضافه شدن هر نوکلئوتید مکمل با انتشار فلورسانسی رنگی همراه است که توسط دوربینهای حساس دستگاه ثبت میگردد. برای کاربردهای بالینی ژرملاین (Germline)، دستیابی به عمق خوانش متوسط حداقل 30x الزامی است تا اطمینان حاصل شود که هر جفتباز به طور میانگین سی بار توالییابی شده است.
یکی از برتریهای قابل توجه WGS نسبت به روشهای غنیسازی هدفمند این است که فرآیند آمادهسازی کتابخانه (Library preparation) در آن اغلب به صورت PCR-free انجام میپذیرد. حذف مرحله تکثیر PCR باعث میشود که سوگیریهای (Biases) مرتبط با توالیهای غنی از GC یا غنی از AT به حداقل برسد و در نتیجه توزیع خوانشها به مراتب یکنواختتر باشد. این یکنواختی عمق پوشش، پایه و اساس قدرتمندی برای تشخیص دقیق تغییرات تعداد کپی (CNVs) و واریانتهای ساختاری پیچیده نظیر وارونگیها (Inversions) و جابهجاییهای متوازن (Balanced translocations) فراهم میکند. علاوه بر این، در استراتژی خوانش جفتانتهایی (Paired-end sequencing)، اتصال قطعات از هر دو سو خوانده میشود که دقت نقشهبرداری (Mapping accuracy) مناطق تکراری را به شدت افزایش میدهد.
با وجود ظهور فناوریهای خوانش بلند (Long-read sequencing)، روشهای مبتنی بر خوانش کوتاه با عمق 30x همچنان استاندارد طلایی و مقرونبهصرفه در تشخیصهای بالینی روزمره در سراسر جهان به شمار میآیند. دقت فوقالعاده بالا (بیش از ۹۹.۹ درصد) در شناسایی واریانتهای تکنوکلئوتیدی (SNVs) و درج/حذفهای کوچک (Indels)، پلتفرمهای خوانش کوتاه را برای ارزیابی جامع اللهای جهشیافته بینظیر میسازد. ترکیب این دقت در سطح نوکلئوتید با الگوریتمهای پیشرفته یادگیری ماشین در تحلیل دادهها، منجر به ایجاد پروفایلی بینقص و جامع از معماری ژنتیکی بیمار میگردد. در نهایت، همافزایی شیمی توالییابی اختصاصی و حساسیت اپتیکال سنسورها، خطاهای استقرار بازها (Base calling errors) را به پایینترین سطح ممکن کاهش داده و دادههایی با بالاترین کیفیت بالینی تولید مینماید.
اندیکاسیونهای بالینی و معیارهای انتخاب بیمار
انتخاب صحیح بیماران برای انجام توالییابی کل ژنوم نیازمند آگاهی دقیق از اندیکاسیونهای بالینی و درک ظرفیتهای محدودیتشکن این تکنولوژی نسبت به سایر ابزارهای ژنتیکی است. به طور کلی، بیمارانی که با تظاهرات بالینی پیچیده، همپوشانی چندین سندرم یا عدم تطابق فنوتیپ با ژنهای شناختهشده مراجعه میکنند، کاندیداهای اصلی WGS به شمار میروند. طبق گایدلاینهای اخیر انجمن ژنتیک پزشکی آمریکا (ACMG)، استفاده از WGS/WES به عنوان تست خط اول (First-tier) یا خط دوم برای ارزیابی ناهنجاریهای مادرزادی متعدد، تأخیر تکاملی بارز و ناتوانی ذهنی (ID/DD) به شدت توصیه شده است. در آزمایشگاه ژن نگار آیندگان، مشاوران و متخصصان بالینی با ارزیابی دقیق شجرهنامه و علائم سیستمیک، ضرورت ارجاع بیمار برای این ارزیابی جامع را تعیین میکنند.
علاوه بر فنوتیپهای تکاملی پیشگفته، بیمارانی که پیشتر تحت ارزیابیهای جامع نظیر CMA و WES قرار گرفته و نتیجه منفی یا مبهمی دریافت کردهاند، گروههای هدف کلیدی برای WGS محسوب میشوند. در بسیاری از این افراد، عامل بیماریزا ممکن است یک واریانت اینترونی عمیق، یک جابهجایی کروموزومی مخفی و یا گسترش غیرطبیعی توالیهای تکراری (نظیر آنچه در آتاکسیها دیده میشود) باشد که از قلمروی آزمایشهای قبلی خارج بودهاند. همچنین، بیماریهای عصبی-عضلانی پیچیده، اختلالات میتوکندریایی که نشاندهنده نقص همزمان در ژنوم هستهای و میتوکندریایی هستند، و کمکاریهای شدید ایمنی (Primary Immunodeficiencies) به دلیل نیازمندی به بررسی همهجانبه سیستم ایمنی، از موارد بارز اندیکاسیون محسوب میشوند. رویکرد آگنوستیک (Agnostic) و جامع WGS تضمین میکند که هیچ بخش از ساختار ژنومی مرتبط با بیماری مغفول نخواهد ماند.
علیرغم قدرت فزاینده این آزمایش، غربالگری جمعیتی با WGS برای افراد کاملاً سالم و بدون سابقه خانوادگی مشخص به صورت روتین توصیه نمیگردد، مگر در چارچوب برنامههای دارونماژنتیک (Pharmacogenomics) هدایتشده یا پروتکلهای پژوهشی تأییدشده. انتخاب هدفمند بیماران موجب میشود که در تفسیر حجم عظیم اطلاعات غیرهدفمند یا واریانتهای با اهمیت بالینی نامشخص (VUS) دچار سردرگمی نشویم. بنابراین، اجرای یک مشاوره ژنتیک پیش از آزمایش کامل و دقیق برای تعیین انتظارات بیمار و آمادهسازی روانی وی برای یافتههای احتمالی کاملاً ساختارمند ضروری است. این فرآیند سیستماتیک تضمین میکند که منابع آزمایشگاهی، ارزیابیهای بیوانفورماتیکی و زمان تفسیر بالینی به مؤثرترین شکل ممکن برای پاسخ به بحرانیترین نیازهای پزشکی اختصاص مییابد.
- تأخیر تکاملی شدید (DD)، ناتوانی ذهنی (ID) یا ناهنجاریهای مادرزادی متعدد (MCA).
- سندرمهای ژنتیکی مشکوک که با وجود ارزیابیهای قبلی (CMA قطعی یا WES مبهم) هنوز تشخیص داده نشدهاند.
- اختلالات دارای ناهمگنی ژنتیکی بالا نظیر صرعهای مقاوم به درمان و بیماریهای طیف اوتیسم (ASD).
- بیماریهای ناشی از گسترش توالیهای تکراری (نظیر بیماری هانتینگتون و سندرم ایکس شکننده).
- انسفالوپاتیهای میتوکندریایی و اختلالات زنجیره تنفسی به منظور ارزیابی توأمان mtDNA و دیانای هستهای.
- شناسایی دقیق نقاط شکست (Breakpoints) در جابهجاییها و وارونگیهای کروموزومی نامتوازن موروثی.
الزامات نمونه و ملاحظات پیشاتحلیلی
تضمین کیفیت دادههای تولید شده از WGS از مرحله جمعآوری و استخراج نمونه ژنومیک که فاز پیشاتحلیلی (Pre-analytical phase) نامیده میشود، آغاز میگردد. رایجترین و قابلاعتمادترین نمونه برای استخراج DNA ژنومیک در خون محیطی است که باید در لولههای حاوی ضد انعقاد EDTA جمعآوری شود، زیرا هپارین میتواند آنزیمهای کلیدی فرآیند توالییابی را مهار نماید. علاوه بر خون عفونی نشده، نمونههای بزاق، سوابهای دهانی، بافتهای منجمد تازه و فیبروبلاستهای کشتیافته از بیوپسی پوست نیز به عنوان گزینههای مطلوب در شرایط خاص بالینی و یا برای بررسی موزائیسم بافتی پذیرفته میشوند. حفظ زنجیره سرما در انتقال این نمونهها به آزمایشگاه برای جلوگیری از تخریب فیزیکی درشتمولکول DNA بسیار حائز اهمیت است.
پس از دریافت نمونه، فرآیند ارزیابی کیفیت و کمیت دیانای (DNA QC) مستخرج با ترکیبی از روشهای اسپکتروفتومتری و فلورومتری با دقت تمام انجام میگیرد. نسبت جذب نوری A260/280 بین ۱.۸ تا ۲.۰ نشاندهنده خلوص بالای DNA و عدم آلودگی قابلتوجه با प्रोटینهاست؛ در حالی که نسبت A260/230 در محدوده ۲.۰ تا ۲.۲ عدم حضور حلالها و نمکهای مزاحم را تأیید میکند. سپس برای اندازهگیری دقیق غلظت دیانای دو رشتهای دستنخورده (dsDNA) از سنجشهای فلورومتری اختصاصی نظیر پلتفرم Qubit استفاده میشود، زیرا اسپکتروفوتومترها در افتراق بین DNA سالم، الیگونوکلئوتیدهای کوچک و RNA تکرشتهای ناتوان هستند. رعایت این شاخصهای کمی و کیفی پیشنیاز مطلق برای آغاز موفقیتآمیز فازهای بعدی است.
برای روشهای WGS مبتنی بر PCR-free خوانش کوتاه، داشتن DNA با وزن مولکولی بالا و عدم حضور قطعات به شدت تخریب شده ضروری است. ارزیابی یکپارچگی (Integrity) با استفاده از الکتروفورز مویین ژلی یا دستگاههایی چون TapeStation بررسی میگردد تا نمره DIN (DNA Integrity Number) در محدوده قابل قبول (ترجیحاً بالاتر از ۷) حاصل شود. در صورتی که دیانای بسیار تخریب شده باشد، استراتژی آمادهسازی باید تغییر یافته و از روشهای مبتنی بر PCR که سوگیری ایجاد میکنند، بهره جست. رعایت این ملاحظات سختگیرانه در آزمایشگاه ژن نگار آیندگان تضمین مینماید که کتابخانه نهایی، نمایی واقعی و بدون اعوجاج شیمیایی از تصویر کلان ارگانیسم را ارائه خواهد داد.
جریان کار آزمایشگاهی (آمادهسازی کتابخانه، توالییابی و کنترل کیفیت)
مراحل اجرایی درونآزمایشگاهی WGS با فرآیند آمادهسازی کتابخانه ژنومی (Library Preparation) آغاز میشود که خطیرترین گلوگاه تکنیکی در تولید دادههای معتبر به شمار میرود. در ابتدا، دیانای با وزن مولکولی بالا تحت فرآیند مکانیکی فراصوت (Ultrasonication) یا شکستن آنزیمی کنترلشده قرار میگیرد تا قطعاتی با طول متوسط توزیعشده بین ۳۵۰ تا ۵۰۰ جفتباز ایجاد نماید. پس از قطعهقطعه شدن، پایانههای کُند (Blunt ends) قطعات بازسازی شده (End-repair)، و در انتهای ۳' یک نوکلئوتید آدنین منفرد اضافه میشود (A-tailing) که برای اتصال کارآمد آداپتورهای اختصاصی ضروری است. آداپتورها شامل توالیهای مکملی هستند که موجب اتصال کتابخانه فلوسل شده و حاوی بارکدهای مولکولی هشت الی ده نوکلئوتیدی (Index) محسوب میشوند که امکان توالییابی همزمان چندین بیمار را در یک فلوسل (Multiplexing) فراهم میآورند.
در صورتی که کیفیت و کمیت DNA اولیه مطلوب باشد، پروتکل آمادهسازی به صورت بدون استفاده از PCR (PCR-free) انجام میشود که این انتخاب به شکل دراماتیکی اختلالات حاصل از تکثیر نابرابر مناطق غنی از CG را مهار میسازد. پس از خالصسازی با مهرههای مغناطیسی (Magnetic beads) و ارزیابی کمی دقیق کتابخانههای نهایی، نمونهها بر پایه یک طراحی آماری با هم ترکیب شده و بر سطح فلوسل قرار میگیرند. در دستگاههای قدرتمند توالییابی (نظیر NovaSeq یا DNBSEQ)، تولید خوشههای ژنومی (Cluster generation) در محل انجام گرفته و هر مولکول مجزا میلیونها بار تکثیر موضعی میشود تا سیگنال فلورسانس قابل ردیابی را حین چرخههای توالییابی گسیل دارد. در طول فرآیند، توالیهای هر دو سوی قطعه (Paired-end 2x150bp) خوانده شده و دادههای اولیه در قالب فایلهای اعتبارسنجیشده استخراج میشوند.
کنترل کیفیت (QC) مستمر در طول مراحل توالییابی به صورت بلادرنگ ارزیابی میگردد تا از صحت فیزیکوشیمیایی واکنشها اطمینان حاصل شود. از جملهی مهمترین پارامترهای پایهای، نمره کیفی Q30 است که بیان میدارد احتمال خطای دستگاه در تشخیص هر نوکلئوتید کمتر از ۱ در ۱۰۰۰ (دقت ۹۹.۹٪) میباشد و عموماً باید بالای ۸۵٪ از مجموع بازها را شامل شود. سایر متریکهای سختافزاری همچون چگالی خوشهای (Cluster density)، درصد عبوری از فیلتر دستگاه (%PF) و تعادل فازهای نوری (Phasing/Pre-phasing) به عنوان نشانگرهای کارکرد بینقص ماشین توالیگر پایش میشوند. هر گونه انحراف بنیادین از این استانداردها منجر به توقف چرخه بیوانفورماتیکی و تکرار الزامی فرآیند در آزمایشگاه جهت حفظ اعتبار بالینی نتایج خواهد شد.
جریان کار بیوانفورماتیک (همترازسازی، فراخوانی واریانت، حاشیهنویسی)
تولید فایلهای خام خروجی ماشین توالیگر به فرمت FASTQ آغازگر مرحله پیچیده و چندلایه خط لوله بیوانفورماتیکی (Bioinformatics Pipeline) است که نیازمند قدرت پردازشی کلاس ابررایانشی است. در خط مقدم این تحلیل، خوانشهای میلیونتایی توسط الگوریتمهای قدرتمند و بهینهسازی شدهای مانند BWA-MEM (مبتنی بر تبدیل باروز-ویلر) بر روی ژنوم مرجع انسان (GRCh38/hg38) نقشهبرداری یا همتراز (Alignment) میشوند. سپس، خوانشهای تکراری و مبهم مارک شده و حذف میگردند تا مانع از تورم کاذب عمق پوشش و سوگیریهای آماری احتمالی شوند. خروجی این سطح از فرآیند، فایلهای فشردهسازی شده همتراز (BAM یا CRAM) خواهد بود که مبنای مطلق گامهای تحلیلی بعدی را پیریزی مینمایند.
فرآیند فراخوانی واریانتها (Variant Calling) در WGS بسیار جامعتر و به تبع آن پیچیدهتر از تستهای هدفمند است، زیرا شامل طیف متنوعی از تغییرات ژنومی است. برای کشف واریانتهای تکنوکلئوتیدی (SNVs) و درج/حذفهای کوچک، امروزه الگوریتمهای مبتنی بر شبکههای عصبی پیچشی (Convolutional Neural Networks) نظیر DeepVariant ساخت گوگل و ابزار اثباتشده GATK HaplotypeCaller مورد استفاده قرار میگیرند که نویز پسزمینه را از سیگنالهای ژنومیک واقعی با دقتی شگرف متمایز میسازند. همموازات با آن، برای شناسایی واریانتهای ساختاری (SVs) شامل جابهجاییها و وارونگیهای وسیع، برنامههای مکانشناس همبسته مانند Manta، Smoove و Lumpy خوانشهای دوتکه (Split-reads) و جفتهای ناهنجار را تحلیل میکنند. علاوه بر این، از ابزارهای ویژهای همچون ExpansionHunter برای اندازهگیری دقیق توالیهای تکراری (STR) بهره گرفته میشود.
گام نهایی فرآیند کامپیوتری، حاشیهنویسی (Annotation) بیولوژیک واریانتهای یافت شده است که به فایل خروجی خام (VCF) روح معنادار بالینی میدمد. واریانتها توسط موتورهای پردازشی نظیر VEP یا SnpEff با حجم عظیمی از دادههای موجود در پایگاههای مرجع از جمله gnomAD (برای فراوانی جمعیتی)، ClinVar (برای مسیرهای بالینی تأییدشده) و الگوریتمهای پیشبینی آسیب سیاریک (مثل REVEL و CADD) مقایسه میگردند. در همین راستا، واریانتها بر اساس نواحی آناتومیک اگزون، اتصالات پیرایش دیانای، یا پروموترهای با حفاظت تکاملی بالا کدگذاری میشوند. این غنیسازی دیتابیسی زیربنای لازم را جهت فیلتراسیون هوشمند هزاران واریانت بیخطر و تمرکز بر مجموعه معدود کاندیداهای بیماریزا فراهم آورده و کار ارزیاب بالینی را امکانپذیر مینماید.
همترازسازی خوانشها (Alignment)
نگاشت دقیق خوانشهای ۱۵۰ جفتبازی بر روی کروموزومهای مرجع چند صد میلیون بازی نیازمند مدیریت صحیح واریانسهای ذاتی همچون چندریختیهای متداول است. کیفیت همترازسازی (MAPQ) مستلزم آن است که خوانشها به طور منحصربهفرد فقط به یک مکان از ژنوم متصل شوند تا خطاهای نقشهبرداری در مناطق متوالی نظیر نشانگرهای کاذب (Pseudogenes) کاهش یابد.
حاشیهنویسی و ادغام دادهها (Annotation)
پس از استخراج واریانتها، تطبیق آنها با اطلسهای بیان ژنی انسانی، شبکههای تعامل प्रोटینی و هستانشناسی فنوتیپ انسانی (HPO) به صورت خودکار صورت میپذیرد. این ادغام دادههای چندبعدی تضمین میکند که هیچ سینرژی بالقوه پاتولوژیک از چشمان تیم تفسیری پنهان نخواهد ماند.
تفسیر و گزارشدهی (طبقهبندی ACMG/AMP)
تفسیر نتایج حاصل از توالییابی کل ژنوم پیچیدهترین، زمانبرترین و پرمخاطرهترین بخش از مسیر تشخیصی محسوب میگردد که نیازمند دانش عمیق ژنتیک انسانی و پاتولوژی مولکولی است. واریانتهای شناسایی شده با استفاده از قواعد استاندارد بینالمللی که توسط کالج ژنتیک پزشکی آمریکا و انجمن پاتولوژی مولکولی (ACMG/AMP) تدوین گردیدهاند، به صورت نظاممند دستهبندی میشوند. این پروتکل بر مبنای ادغام مدارک خطیر متعددی چون فراوانی جمعیتی، اطلاعات محاسباتی (in silico)، دادههای عملکردی سلولی (functional) و شواهد جداسازی بیماری در شجرهنامه عمل میکند. بر این اساس سیستم، واریانتها باید به طور قطعی در یکی از پنج کلاس: بیماریزا (Pathogenic)، محتملا بیماریزا (Likely Pathogenic)، با اهمیت بالینی نامشخص (VUS)، محتملا بیخطر (Likely Benign) و بیخطر (Benign) طبقهبندی گردند.
تفسیر WGS رویکردی فنوتیپمحور (Phenotype-driven) را میطلبد تا بتوان در میان اقیانوسی از واریانتهای شخصی بیمار که بالغ بر ۴ الی ۵ میلیون تکنوکلئوتید متفاوت با توالی مرجع است، موارد معنادار را استخراج کرد. با تبدیل دقیق علائم بالینی بیمار به کدهای استاندارد هستانشناسی فنوتیپ انسانی (Human Phenotype Ontology - HPO)، نرمافزارهای تفسیر بالینی الگوهای ژنی همخوان با ساختار فنوتیپی را در اولویت بررسی قرار میدهند. در خصوص تغییرات ساختاری و کپینامبرها (SVs/CNVs)، طبقهبندی مطابق با دستورالعمل اختصاصی ClinGen صورت میگیرد که اثرات افزایش یا کاهش دوزاژ ژن و تلاقی با مرزهای تنظیمی تکاملی کروموزومها (TADs) را مورد پایش قرار میدهد. این غربالگری دوگانه و چندبعدی احتمال نادیده شمردن معماریهای پیچیده جهش را به صفر میل میدهد.
در گزارش نهایی صادر شده از آزمایشگاه ژن نگار آیندگان، یافتههای اولیه (Primary findings) که مستقیماً مسئول تظاهرات بالینی بیمار هستند، به روشنی توصیف و مکانیسم بیماریزایی آنها تشریح میگردد. از آنجایی که WGS به صورت ذاتی محتوای ژنی کلیه سیستمهای بدن را آشکار میسازد، امکان گزارش یافتههای ثانویه (Secondary findings) طبق آخرین نسخه لیست توصیهشده (ACMG v3.2) شامل ژنهای مرتبط با خطرات مستعدکننده سرطان یا بیماریهای قلبی-عروقی قابل پیگیری فراهم میباشد؛ البته گزارش این دسته از واریانتها صرفاً منوط به اعلام رضایتنامه آگاهانه پیشگفته از جانب بیمار است. شفافیت، استانداردهای ذکر محدودیتها و درج پیشنهادهای تکمیلی ژنتیکی نظیر بررسی تکمیلی والدین (Trio-WGS) از ارکان قطعی پروندههای گزارشی ارسالی به پزشکان تلقی میشود.
ژنها و مناطق با بیشترین فراوانی تحلیل در پژوهشهای بالینی WGS
توالییابی کل ژنوم قادر است تمامی ۲۰ هزار ژن کُدکننده پروتئین و هزاران ژن غیرکُدکننده موجود در ژنوم را تحت ارزیابی سیستماتیک قرار دهد. با این وجود، کاربرد بالینی برجسته این تکنیک در ژنهایی به اثبات میرسد که تحلیل آنها با روشهای مرسوم و خوانشهای سنتی دشوار یا به کلی غیرممکن است. این گروه هدف شامل ژنهایی هستند که درگیر درجها و حذفهای بزرگ (SVs)، توالیهای تکراری پیدرپی (STRs)، مناطق دارای همتایان کاذب (Pseudogenes) بسیار مشابه و همچنین نواحی عمیق غیرکُدکننده اثباتشده در تنظیم بیان هستند.
یک مزیت انحصاری WGS شناسایی واریانتهای بیماریزا در اینترونهای عمیق است که میتوانند مکانیسمهای طبیعی پیرایش ژنی را از طریق ایجاد نقاط اتصال کاذب (Cryptic splice sites) تحت تأثیر قرار دهند. نمونه بارز آن جهشهای اینترونی در ژنهای دخیل در بیماریهای متابولیک و عصبی است که در بررسیهای اگزوم کاملاً نادیده انگاشته میشوند. به علاوه، از آن روی که پوشش ژنوم میتوکندریایی در WGS به دلیل کپیهای فراوان mtDNA متراکمتر و با عمق بسیار بالا (معمولاً فراتر از ۲۰۰۰ بار در خون) شکل میگیرد، ژنهای تنظیمکننده انرژی داخل سلولی نیز به صورت بومی و بدون نیاز به پنلهای جانبی بررسی میگردند.
جدول زیر منتخبی از ژنها و حوزههای بسیار مهم بالینی را برجسته میسازد که ارزیابی جامع آنها از طریق قدرت تفکیک و روشنفکری استثنایی WGS نسبت به سایر شیوههای تشخیصی آشکار میگردد. ذکر این ژنها در قالب مرجع صرفاً برای نشان دادن طیف تواناییهای روش WGS است و نباید به عنوان لیستی انحصاری تلقی گردد.
| ژن (Gene) | بیماری / سندرم مرتبط | الگوی توارث | مزیت بررسی اختصاصی مقایسهای WGS |
|---|---|---|---|
| FMR1 | سندرم ایکس شکننده (Fragile X syndrome) | وابسته به ایکس (X-linked) | قابلیت استنباط طول گسترش نواحی تکراری CGG از طریق الگوریتمهای STR اختصاصی WGS. |
| SMN1 / SMN2 | آتروفی عضلانی نخاعی (SMA) | مغلوب اتوزومال (AR) | توانایی تمیز دادن ژن اصلی از همتای کاذب (Pseudogene) با دقت نقشهبرداری همترازها. |
| DMD | دیستروفی عضلانی دوشن / بکر | وابسته به ایکس (X-linked) | پوشش یکنواخت برای تشخیص دقیق حذفها و مضاعفشدگیهای بزرگ (CNVs) در یکتای ساختاری آن. |
| HBB | بتا تالاسمی (Beta-thalassemia) | مغلوب اتوزومال (AR) | توانایی کشف جهشهای در اعماق اینترونها که مناطق پذیرنده و دهنده اتصالات را پنهان مختل میکنند. |
| FXN | آتاکسی فردریش (Friedreich Ataxia) | مغلوب اتوزومال (AR) | قابلیت تشخیص بیماریهای ناشی از گسترش درون اینترونی سهتاییهای مکرر GAA. |
| CYP21A2 | هایپرپلازی مادرزادی آدرنال | مغلوب اتوزومال (AR) | حل چالش ادغامهای ژنی پیچیده ناشی از تبادل مواد با شبهژن مجاور خود CYP21A1P. |
| PRKN (PARK2) | بیماری پارکینسون جوانان | مغلوب اتوزومال (AR) | حساسیت به شناسایی وارونگیهای (Inversions) بزرگ درون ژنی و تغییرات ساختمانی ظریف. |
| MT-TL1 | سندرم میلوپاتی MELAS | توارث میتوکندریایی | آشکارسازی هتروپلاسمیهای میتوکندریایی (Heteroplasmy) با سطح بسیار پایین با پوشش عمیق درونریخت. |
نقاط قوت
برجستهترین نقطه قوت WGS یکپارچگی استثنایی و رویکرد بدون سوگیری در ارزیابی همزمان تمامی معماریهای ژنوم با یک آزمایش واحد است. بر خلاف روشهای غنیسازی مانند WES که نیازمند پروبهای تسخیرکننده (Capture probes) هستند و سوگیریهای هیبریداسیون فاحشی را ایجاد میکنند، روش WGS استخرهای ژنومی را به شکل متعادلی قرائت کرده و توزیع پوشش (Coverage distribution) کاملاً هموار و یکنواختی را تضمین میکند. این یکنواختی فیزیکی اجازه میدهد تا الگوهای از دست رفتن یا مضاعف شدن قطعات ژنی (CNVs/SVs) با وضوحی قابل مقایسه با کاریوتایپهای با قدرت تفکیک بالا و ریزآرایهها شناسایی گردد و نیاز به آزمایشهای چندگانه و متوالی (Tiered testing) را از بین ببرد.
علاوه بر این، WGS برای اولین بار در تاریخ تشخیص بالینی، درهای شناسایی واریانتهای تنظیمی پنهان را به روی پژوهشگران و پزشکان میگشاید. درصد فزایندهای از فنوتیپهای مشکوک موروثی ریشه در جهشهای عمیق اینترونی دارند که بیانهای جدید اگزونی به نام شبهاگزون (Pseudoexon) را ایجاد میکنند، یا واریانتهایی در افزایشدهندهها (Enhancers) که پروموترها را از راه دور کنترل میکنند. پلتفرم WGS به سادگی از این قلمرو عبور کرده و این دسته از مکانیسمهای پاتوژنیک و مخفی را ثبت میکند که همین امر منجر به افزایش ۱۵ تا ۲۵ درصدی در بازده تشخیص کلینیکی نسبت به WES میگردد.
نقطه عطف دیگر این تکنولوژی قابلیت تجدیدپذیری در بازتحلیل (Re-analysis) اطلاعات بدون نیاز به نمونهگیری و توالییابی مجدد است. با توجه به اینکه دانش ژنتیک پزشکی هر ساله هزاران ارتباط جدید مابین ژنها و بیماریها را شناسایی میکند، فایل خام حاوی اطلاعات کامل بیمار قابلیت بیحدوحصری را برای ارزیابی مجدد توسط الگوریتمهای آتی در اختیار تیم بالینی قرار میدهد. توانایی ارزیابی همزمان مارکرهای فارماکوژنومیکس، محاسبهی پلیژنیک ریسک اسکور (PRS) در مطالعات نوین و شناسایی اثر انگشتهای موتاسیونی (Mutational signatures) در الگوهای پیچیده وراثتی از دیگر توانمندیهای منحصر به فرد این تکنولوژی بلندپروازانه به حساب میآید.
محدودیتها
علیرغم جامعیت و پتانسیل چشمگیر این فناوری، توالییابی کل ژنوم نیز به ناچار با محدودیتهای ذاتی خاصی روبهروست که پزشکِ معالج و تیم آنالیزور باید نسبت به آنها هشیار باشند. یکی از برجستهترین محدودیتهای روشِ خوانشِ کوتاهِ WGS، عدم توانایی در نقشهبرداری دقیق مناطق با تکرارهای استثنایی زیاد نظیر سانترومرها (Centromeres)، تلومرها (Telomeres)، و بخشهای طولانی هتروکروماتین است. در این نواحی، خوانشهای کوتاه ۱۵۰ نوکلئوتیدی امکان تطبیق اختصاصی با ژنوم مرجع را از دست میدهند، که به دلیل از دست رفتن محتوای بیهمتای ژنومی منجر به ایجاد مناطق کور (Blind spots) تحلیلناپذیر میگردد.
علاوه بر این، در زمینه شناسایی موزائیسم جسمی (Somatic Mosaicism)، توالییابی ۳۰ برابری ژنوم اغلب از حساسیت کافی برای یافتن واریانتهایی که در کسر بسیار پایینی از سلولها (کمتر از ۱۰ تا ۱۵ درصد) وجود دارند، ناتوان است. برای یافتن این تغییرات، روشهای توالییابی متمرکز با عمق پوشش بسیار بالا (بیش از 500x) بر پایهی WES یا پنلهای اختصاصی راهکارهای فنی معقولتری محسوب میشوند. همچنین، ارزیابی مناطق ژنومی بسیار پیچیده که تحت تأثیر ادغام شبهژنها و پدیدههای نوترکیبی همولوگ غیراللی هستند (نظیر ژن *SMN1* در مدلهای پیچیده یا سیستم آنتیژن لوکوسیت انسان HLA)، با روش خوانش کوتاه همچنان با درصدی از ابهام همراه بوده و معمولاً نیازمند تأییدیه روشهای ارتوماتیک مجزا هستند.
یکی دیگر از چالشهای بنیادین WGS جنبهی تفسیری یا بیوانفورماتیکی آن است که با پدیدهای موسوم به سندروم واریانتهای با اهمیت نامشخص (VUS) تلاقی پیدا میکند. کشف هزاران واریانت ساختاری جدید و نامآشنا در مناطق غیرکُدکنندهای که هنوز دانش ژنومیک کارکردی برای اثبات نقش عملکردی متقابل آنها در دسترس نگذاشته است، باعث ایجاد سردرگمی بالینی و استرس روانی در مشاوره خواهد شد. نیاز گسترده به توان عملیاتی ذخیرهسازی دادههای کامپیوتری و تحمیل هزینههای قابلتوجه در مقایسه با پنلهای ژنی هدفمند، از موانع دیگر پذیرش عمومی این آزمایش به عنوان خط مقدم و در دسترس ارزیابی تمامی طبقات بیماران قلمداد میشود.
- محدودیت در نقشهبرداری مناطق بسیار تکراری همانند هتروکروماتینهای سانترومری.
- ناتوانی نسبی در افتراق موزائیسمهای بدنی (Somatic Mosaicism) با فراوانی آللی کمتر از ۱۰ درصد.
- شناسایی حجم عظیمی از واریانتهای VUS در مناطق تنظیمی و غیرکُدکننده با تأثیرات عملکردی نامشخص.
- پیچیدگی تمایز برخی تغییرات ساختاری پیچیده (Complex Structural Variants).
- ایجاد چالش در پردازش پایگاههای دادهای کلان (Big Data) و زمانبر بودن تحلیلهای بیوانفورماتیکی.
- هزینههای بالاتر و نیازمندی به ظرفیت محاسبه ابری و نگهداری فایلها و دیتابیسهای چند صد گیگابایتی برای هر فرد.
مقایسه با روشهای جایگزین
درک جایگاه توالییابی کل ژنوم مستلزم مقایسه دقیق ظرفیتهای فناورانه آن با سایر معماریهای تشخیصی نظیر توالییابی اگزوم (WES)، ریزآرایههای کروموزومی (CMA) و پنلهای ژنی هدفمند است. در حالی که CMA سالها به عنوان تست خط اول استاندارد در ناتوانیهای عقلی و ناهنجاریهای مادرزادی شناخته میشد، این روش صرفاً واریانتهای نامتوازن تعداد کپی دیانای (CNVs) را از ۱۰۰ کیلوباز به بالا شناسایی میکند، اما در یافتن جهشهای تکنوکلئوتیدی و جابهجاییهای متوازن به طور کامل عقیم میماند. WGS نه تنها میتواند تمامی کشفیات CMA را با وضوح بسیار بالاتری شبیهسازی کند، بلکه محدودیتهای ساختاری و متوازن بودن تبادلات را نیز درنوردیده است.
تفاوت اصلی بین WES و WGS در قلمرو اجرایی و ماهیت روش پوشش استخوانبندی ژنوم است. در WES، به دلیل استفاده از پروبهای هیبریدی که کانسپت جذب گزینشی را پیش میگیرند، مناطق خارج از اگزون با اطمینان پوشش داده نمیشوند و علاوه بر آن، در نواحی اگزونی غنی از GC شاهد افت شدید عمق پوشش هستیم که منجر به ایجاد خطاهای محاسباتی در ارزیابی واریانتهای ساختمانی میگردد. در مقابل، خوانش یکنواخت WGS از ژنوم فرصت استثنایی حل معضل نابرابری را ایجاد میکند و با ورود به اینترونهای عمیق امکان درک تغییر در سیستم اسپلایسینگ (Splicing) را به پژوهشگران ارزانی میدارد که در روش اگزوم محال خواهد بود.
در مقایسه با پنلهای ژنی هدفمند (Targeted Panels)، که عموماً حساسیت تحلیلی بالا و عمق استثنایی (گاهی بیش از 500x) ارایه میکنند و بهینه در شرایط اورژانس انکولوژی یا موزائیسم بدنی میباشند، WGS فاقد این انعطاف برای کشف آللهای بسیار نادر غیرژرملاین است. با این حال، توانایی درهمکوبنده WGS در عدم نیاز به انتخاب پیشفرض ژنها و قابلیت بازبینیهای مجدد (Re-analyses) بدون تکرار آزمایش در آینده، آن را تبدیل به پلتفرمی با بالاترین ضریب حل مسأله در افق تشخیصهای بیماریهای نادر (Rare Diseases) تبدیل کرده است.
| روش تحلیلی (Method) | وضوح و تفکیکپذیری (Resolution) | موارد قابل تشخیص اصلی (Detects) | محدودیتهای فنی بالینی (Limitations) |
|---|---|---|---|
| ریزآرایه کروموزومی (CMA) | > ۵۰ تا ۱۰۰ کیلوباز | تغییرات تعداد کپی (CNVs)، میکرودلیشنها به شدت نامتوازن. | عدم توانایی در تشخیص واریانتهای نقطهای، ایندلها و وارونگیهای متوازن. |
| پنل ژنی هدفمند (Targeted Panel) | تک نوکلئوتیدی، اما محدود به چند ژن | واریانتهای SNVs و Indels در ژنهای شناخته شده مسیرهای مشخص. | عدم توانایی کشف ژنهای جدید، عدم شمول ساختارهای فراتر و نواحی تنظیمی عمیق. |
| توالییابی کل اگزوم (WES) | تک نوکلئوتیدی در محدود ۱ تا ۲ درصد ژنوم | جهشهای پوششی SNV اگزونیک حاشیههای اسپلایسینگ کلاسیک. | پوشش نابرابر، ناتوانی در خوانش مطلوب CNVهای پیچیده و نواحی غیرکدکننده و پروموترها. |
| توالییابی کل ژنوم (WGS کوتاه-خوانش) | تک نوکلئوتیدی در طول >۹۸ درصد ساختار | شامل SNVs، Indelها، SVها ساختاری متوازن، STRs مخفی، میتوکندریایی. | محدودیت شناسایی موزائیسم مقیاس پایین، حجم عظیم دیتای VUS، چالش در تکرارهای صد مگا بازی نظیر سانترومر. |
موارد کاربرد بالینی / سناریوهای ملموس
قدرت تشخیصی منحصر به فرد WGS زمانی آشکارتر میگردد که سناریوهای بالینی پیچیده و مبهمی را با دقت و جامعیت خود حلوفصل میکند. به عنوان اولین سناریو، کودکی با تأخیر تکاملی عمیق، ناتوانی ذهنی شدید و دیسمورفولوژی چهره را در نظر بگیرید که نتایج تستهای خط اول نظیر ریزآرایه کروموزومی (CMA) و حتی WES در وی هیچ نتیجهای در بر نداشته است. ارزیابی جامع با توالییابی کل ژنوم (WGS) وجود یک جابهجایی کروموزومی مخفی (Cryptic Translocation) پنهان و متوازن را آشکار میسازد که یکی از نقاط شکست آن مستقیماً یک ژن کلیدی مرتبط با تکامل سیستم عصبی را منقطع ساخته است. کشف چنین واریانت ساختاری متوازنی صرفاً از عهده قابلیت خوانش همهجانبه این روش با تکیه بر اطلاعات توالیهای جفتانتهایی برمیآید.
در سناریوی دوم، بیمار جوانی با ترکیبی از علائم اختلالات عصبی-عضلانی و مشکلات قلبی ارجاع داده میشود، جایی که پزشک معالج به بیماری آتاکسی فردریش یا دوشن مشکوک است اما آزمایشهای استاندارد پنل نوروماسکولار، تکرار واریانتهای خطرناک را پیدا نکردهاند. با بررسی نتایج استخراج شده از WGS و با استفاده از الگوریتمهای شمارش همترازسازی غیرمتعارف از طریق پکیج ExpansionHunter، گسترش چشمگیر موتیف مجدد GAA در ناحیه اینترون اول ژن *FXN* مشخص میگردد. همچنین به صورت موازی بررسی عمیق WGS شواهدی غیرمستقیم دال بر تغییر در الگوی فواصل اینترونی ارایه میکند که هیچ ارزیابی معمول قبلی قادر به کشف آن نبود.
نهایتاً، مورد سوم میتواند نوزادی بخش مراقبتهای ویژه (NICU) باشد که از انسفالوپاتی پیشرونده نامشخص و اسیدوز لاکتیک رنج میبرد. در این شرایط بحرانی (در قالب Rapid WGS)، تحلیل دقیق خوانشهای WGS پوشش و عمق بینظیری از توالی ۳۷ ژن حلقوی میتوکندریایی (mtDNA) ارایه میدهد که منجر به شناسایی یک جهش تکنوکلئوتیدی در ژن *MT-ND5* با میزان هتروپلاسمی متوسط (۵۰٪) میگردد که ارتباط مستقیم با سندرم لای (Leigh Syndrome) دارد. این موارد به روشنی بر این واقعیت تأکید میکنند که فناوری توالییابی کل ژنوم، به عنوان کاملترین لنز ژنتیکی در دسترس، توانایی شکستن بنبستهای تشخیصی ادیسهوار و پایان دادن به سردرگمیها را خواهد داشت.
تضمین کیفیت، اعتباربخشی و زمان پاسخگویی
تأمین بالاترین سطح از کیفیت تحلیلی در توالییابی کل ژنوم نیازمند استقرار یک چارچوب مستحکم و پیشرفته برای تضمین کیفیت استانداردهای آزمایشگاهی است که منطبق بر رهنمودهای سختگیرانه وضع شده توسط نهادهای بینالمللی ارزیابی میگردد. در آزمایشگاه تخصصی، تضمین کیفیت داخلی مستلزم اعتبارسنجی پیوسته پارامترهای فنی کلیدی نظیر توزیع یکنواخت پوشش در طول ژنوم با میانگین مقطعی بالاتر از 30X است تا از کشف بدون نقص واریانتها اطمینان حاصل شود. متریکهای پیچیدهتری همانند کسر ژنوم دارای پوشش حداقل 20X، میزان پیوندهای تکراری غیرطبیعی و کسر عمق استثنایی میتوکندریایی به صورت مداوم در سامانههای کنترل کیفیت درونسازمانی مانیتور میگردند و دادهها بدون رسیدن به سقف مقبول استاندارد، به مرحله تفسیر وارد نخواهند شد.
معیارها و گایدلاینهای تنظیمشده توسط نهادهای پیشرو مانند کالج پاتولوژیستهای آمریکا (CAP) و استانداردهای ایزو نظیر ISO 15189 زیربنای نظارتی پروتکلهای اعتباربخشی را به صورت بینالمللی تعیین مینمایند. این استانداردها تصریح میکنند که ارزیابی مهارت اکسترنال (External Proficiency Testing) باید با اشتراک داده در نمونههای مبهم و شناختهشده با مؤسسات رفرانس ژنتیکی صورت پذیرد تا صحت الگوریتمهای فراخوانی بیوانفورماتیکی و دقت تفسیر دادهها ارتقا پیدا کند. همچنین فرآیندهای راستیآزمایی با پلتفرمهای تأییدی دیگر مثل توالییابی سانگر در نقاط مشکوک این پروتکل یکپارچه کیفی را تکمیل میسازند.
زمان پاسخگویی (Turnaround Time) برای انجام آزمایش پیچیدهای همچون WGS شامل ترکیب زمانهای لازم برای استخراج فیزیکی نمونهها، فرآیند توالییابی چندینروزه دستگاه و در نهایت پروسه پردازش گسترده محاسباتی توسط سرورها و ارزیابی موشکافانه توسط جنتیستهای بالینی میباشد. به دلیل گستردگی عملیاتی، زمان پاسخگویی و آمادهسازی مستندات در آزمایشگاه ژن نگار آیندگان متعاقباً اعلام خواهد شد (در حال تکمیل). اطلاعات تکمیلی مرتبط با چارچوبهای زمانی، پروتکلهای ارسال نمونه و هزینههای مصوب متناسب با آخرین رویههای مدیریت فنی تنظیم گردیده و در دسترس مراجعین محترم قرار خواهد گرفت.
سوالات متداول
منابع و رفرنسها
- Lionel AC, et al. Improved diagnostic yield compared with targeted gene sequencing panels suggests a role for whole-genome sequencing as a first-tier neonatal diagnostic test. Genet Med. 2018;20(4):435-443.
- Richards S, et al. Standards and guidelines for the interpretation of sequence variants: a joint consensus recommendation of the ACMG and AMP. Genet Med. 2015;17(5):405-424.
- Miller DT, et al. ACMG SF v3.2 list for reporting of secondary findings in clinical exome and genome sequencing: a policy statement of the ACMG. Genet Med. 2023;25(8):100866.
- Splinter K, et al. Effect of Genetic Diagnosis on Patients with Previously Undiagnosed Disease. N Engl J Med. 2018;379(22):2131-2139.
- Meyers RM, et al. The utility of reporting secondary findings in genome sequencing. Genet Med. 2020;22(3):580-588.
- Austin-Tse C, et al. Diagnostic yield of genome sequencing for rare diseases: The structural variant advantage. Am J Hum Genet. 2024;111(2):284-297.
- Ibañez K, et al. Whole genome sequencing for the diagnosis of neurological repeat expansion disorders in the UK: a retrospective diagnostic accuracy study. Lancet Neurol. 2022;21(3):234-245.
- Lindstrand A, et al. Genomic architecture of structural variants: mechanisms and clinical correlations. Nat Rev Genet. 2022;23(8):471-487.