كشف فريق من الباحثين النقاب عن خوارزمية إحصائية جديدة، قادرة على تحديد الجينات المحتملة للأمراض بطريقة أكثر دقة وفعالية من حيث التكلفة .
طريقة جديدة للعثور على الجينات المسببة للأمراض
قدمت دراسة جديدة تابعة لـ UNIST مؤخرا خوارزمية إحصائية جديدة، قادرة على تحديد الجينات المحتملة للأمراض بطريقة أكثر دقة وفعالية من حيث التكلفة، كما تم اعتبار هذه الخوارزمية نهجا جديدا واعدا لتحديد جينات المرض المرشحة، حيث تعمل بفعالية مع بيانات جينومية أقل، ولا تستغرق سوى دقيقة أو دقيقتين للحصول على النتائج، وقد أجرى هذا البروفيسور دوغ نام وفريقه البحثي في كلية علوم الحياة في UNIST وتم نشر النتائج التي توصلوا إليها في مجلة أبحاث الأحماض النووية في التاسع عشر من مارس للعام الجاري 2018 .
ما قام به الباحثون في الدراسة
في هذه الدراسة قدم فريق البحث طريقة وبرمجيات GSA-SNP2 الجديدة، من أجل تحليل إثراء المسار لبيانات القيمة P GWAS، ووفقا لفريق البحث فإن GSA-SNP2 يوفر قدرة عالية على التحكم في الأخطاء من النوع الأول، والحساب السريع من خلال دمج نموذج المجموعة العشوائية ومعدلات الجين المعدلة من SNP، حيث يقول الأستاذ نام : ” إن GSA-SNP2 هي أداة قوية وفعالة لإثراء المسار وتحليل الشبكة لملخصات دراسة الجينوم على مستوى الجينوم (GWAS)، ومع هذه الخوارزمية يمكننا بسهولة تحديد الأهداف الجديدة للعقاقير، وبالتالي تعميق فهمنا للأمراض وفتح علاجات جديدة لعلاجها ” .
الجينوم
كل جينوم في الفرد هو مزيج فريد من تسلسلات DNA التي تلعب أدوارا رئيسية في تحديد من نحن، وهذه الحسابات لجميع الفروق الفردية، بما في ذلك الحساسية للمرض والأنماط المتنوعة، وتعرف هذه الاختلافات الجينية بين البشر باسم تعدد الأشكال النوكليوتيدية الفردية (SNPs)، ويمكن استخدام SNPs التي ترتبط بأمراض محددة كمؤشرات حيوية تنبؤية للمساعدة في تطوير عقاقير جديدة، من خلال التحليل الإحصائي لبيانات ملخص GWAS، ومن الممكن تحديد SNPs المرتبطة بالمرض .
تقنيات الكشف التقليدية
على الرغم من الكم الهائل من المال والوقت المستثمر في التحليل الإحصائي لبيانات SNP، فإن تقنيات الكشف التقليدية SNP لم تتمكن من تحديد جميع SNPs الممكنة، ويرجع ذلك إلى أن معظم الطرق التقليدية للكشف عن SNPs، تم تصميمها للتحكم الدقيق في النتائج الإيجابية الزائفة في النتائج، لذلك فإنه من بين عشرات الآلاف من بيانات الجينوميات ومئات الآلاف من الـ SNPs التي تم تحليلها، فإن عدد العلامات الموصوفة في جينة مرضية معينة غالبا ما يصل إلى عشرات العقد .
يقول الأستاذ نام : ” على الرغم من أن السيطرة على SNPs الإيجابية الخاطئة مطلوبة للتفسير الصحيح للنتائج، إلا أن الكثير من الترشيح قد يعيق فائدتها في تطوير الأدوية، لذلك فإن تعزيز القدرة الإحصائية أمر ضروري للخوارزميات الإحصائية العملية ” .
أهداف فريق البحث
يهدف الفريق إلى تطوير خوارزمية تعمل على تحسين القدرة على التنبؤ الإحصائي، مع الحفاظ على التحكم الدقيق في الإيجابيات الخاطئة، للقيام بذلك قاموا بتطبيق منحنى اتجاه العمود الفقري المكعب الرتيب إلى درجة الجينات عن طريق تحليل المسار التنافسي لبيانات التعبير الجيني .
وفي دراسة مقارنة باستخدام بيانات GWAS المحاكية والحقيقية، عرضت GSA-SNP2 إمكانات عالية الطاقة وأفضل مسارات الذهب القياسية ذات الأولوية، مقارنة مع ست طرق قائمة على التخصيب وطريقتين مستقلتين، وبناءا على هذه النتائج تم بحث الفرق بين طرق تحليل المسار، كما تمت مناقشة تأثير ترابط ارتباط الجينات على تحليل إثراء المسار، بالإضافة إلى ذلك فإن GSA-SNP2 قادرة على تصور شبكات تفاعل البروتين داخل وعبر المسارات الهامة، بحيث يمكن للمستخدم إعطاء الأولوية للشبكات الفرعية الأساسية لمزيد من الدراسات .
توقعات فريق البحث
وفقا لفريق البحث فإن GSA-SNP2 يوفر تحكما كبيرا في ضبط الأخطاء من النوع الأول، باستخدام درجات الجين المعدلة من SNP، مع الحفاظ على قوة إحصائية عالية، كما يوفر أيضا شبكات تفاعلية برمجية محلية وعالمية في المسارات المصاحبة، وقد يسهل تحليل المسارات والشبكات المتكاملة لبيانات GWAS .
ويتوقع فريق البحث أن GSA-SNP2 قادر على تصور شبكات تفاعل البروتين داخل وعبر المسارات الهامة، بحيث يمكن للمستخدم تحديد أولويات الشبكات الفرعية الأساسية لمزيد من الدراسات .
طريقة جديدة للعثور على الجينات المسببة للأمراض
قدمت دراسة جديدة تابعة لـ UNIST مؤخرا خوارزمية إحصائية جديدة، قادرة على تحديد الجينات المحتملة للأمراض بطريقة أكثر دقة وفعالية من حيث التكلفة، كما تم اعتبار هذه الخوارزمية نهجا جديدا واعدا لتحديد جينات المرض المرشحة، حيث تعمل بفعالية مع بيانات جينومية أقل، ولا تستغرق سوى دقيقة أو دقيقتين للحصول على النتائج، وقد أجرى هذا البروفيسور دوغ نام وفريقه البحثي في كلية علوم الحياة في UNIST وتم نشر النتائج التي توصلوا إليها في مجلة أبحاث الأحماض النووية في التاسع عشر من مارس للعام الجاري 2018 .
ما قام به الباحثون في الدراسة
في هذه الدراسة قدم فريق البحث طريقة وبرمجيات GSA-SNP2 الجديدة، من أجل تحليل إثراء المسار لبيانات القيمة P GWAS، ووفقا لفريق البحث فإن GSA-SNP2 يوفر قدرة عالية على التحكم في الأخطاء من النوع الأول، والحساب السريع من خلال دمج نموذج المجموعة العشوائية ومعدلات الجين المعدلة من SNP، حيث يقول الأستاذ نام : ” إن GSA-SNP2 هي أداة قوية وفعالة لإثراء المسار وتحليل الشبكة لملخصات دراسة الجينوم على مستوى الجينوم (GWAS)، ومع هذه الخوارزمية يمكننا بسهولة تحديد الأهداف الجديدة للعقاقير، وبالتالي تعميق فهمنا للأمراض وفتح علاجات جديدة لعلاجها ” .
الجينوم
كل جينوم في الفرد هو مزيج فريد من تسلسلات DNA التي تلعب أدوارا رئيسية في تحديد من نحن، وهذه الحسابات لجميع الفروق الفردية، بما في ذلك الحساسية للمرض والأنماط المتنوعة، وتعرف هذه الاختلافات الجينية بين البشر باسم تعدد الأشكال النوكليوتيدية الفردية (SNPs)، ويمكن استخدام SNPs التي ترتبط بأمراض محددة كمؤشرات حيوية تنبؤية للمساعدة في تطوير عقاقير جديدة، من خلال التحليل الإحصائي لبيانات ملخص GWAS، ومن الممكن تحديد SNPs المرتبطة بالمرض .
تقنيات الكشف التقليدية
على الرغم من الكم الهائل من المال والوقت المستثمر في التحليل الإحصائي لبيانات SNP، فإن تقنيات الكشف التقليدية SNP لم تتمكن من تحديد جميع SNPs الممكنة، ويرجع ذلك إلى أن معظم الطرق التقليدية للكشف عن SNPs، تم تصميمها للتحكم الدقيق في النتائج الإيجابية الزائفة في النتائج، لذلك فإنه من بين عشرات الآلاف من بيانات الجينوميات ومئات الآلاف من الـ SNPs التي تم تحليلها، فإن عدد العلامات الموصوفة في جينة مرضية معينة غالبا ما يصل إلى عشرات العقد .
يقول الأستاذ نام : ” على الرغم من أن السيطرة على SNPs الإيجابية الخاطئة مطلوبة للتفسير الصحيح للنتائج، إلا أن الكثير من الترشيح قد يعيق فائدتها في تطوير الأدوية، لذلك فإن تعزيز القدرة الإحصائية أمر ضروري للخوارزميات الإحصائية العملية ” .
أهداف فريق البحث
يهدف الفريق إلى تطوير خوارزمية تعمل على تحسين القدرة على التنبؤ الإحصائي، مع الحفاظ على التحكم الدقيق في الإيجابيات الخاطئة، للقيام بذلك قاموا بتطبيق منحنى اتجاه العمود الفقري المكعب الرتيب إلى درجة الجينات عن طريق تحليل المسار التنافسي لبيانات التعبير الجيني .
وفي دراسة مقارنة باستخدام بيانات GWAS المحاكية والحقيقية، عرضت GSA-SNP2 إمكانات عالية الطاقة وأفضل مسارات الذهب القياسية ذات الأولوية، مقارنة مع ست طرق قائمة على التخصيب وطريقتين مستقلتين، وبناءا على هذه النتائج تم بحث الفرق بين طرق تحليل المسار، كما تمت مناقشة تأثير ترابط ارتباط الجينات على تحليل إثراء المسار، بالإضافة إلى ذلك فإن GSA-SNP2 قادرة على تصور شبكات تفاعل البروتين داخل وعبر المسارات الهامة، بحيث يمكن للمستخدم إعطاء الأولوية للشبكات الفرعية الأساسية لمزيد من الدراسات .
توقعات فريق البحث
وفقا لفريق البحث فإن GSA-SNP2 يوفر تحكما كبيرا في ضبط الأخطاء من النوع الأول، باستخدام درجات الجين المعدلة من SNP، مع الحفاظ على قوة إحصائية عالية، كما يوفر أيضا شبكات تفاعلية برمجية محلية وعالمية في المسارات المصاحبة، وقد يسهل تحليل المسارات والشبكات المتكاملة لبيانات GWAS .
ويتوقع فريق البحث أن GSA-SNP2 قادر على تصور شبكات تفاعل البروتين داخل وعبر المسارات الهامة، بحيث يمكن للمستخدم تحديد أولويات الشبكات الفرعية الأساسية لمزيد من الدراسات .