ناقشت رسالة ماجستير في كلية العلوم بجامعة ديالى, تصنيف السرطان بالاعتماد على تقنيات تنقيب البيانات, للطالبة هاجر كامل أحمد .
وتضمنت الرسالة اختبار النظام المقترح باستخدام مجوعتين من بيانات السرطان (سرطان الثدي وسرطان الرئة)، إذ اشارت النتائج التي توصلت اليها الباحثة ان النظام المقترح يمتلك دقة عالية مقارنة مع الطرق الموجودة الاخرى حيث ان دقة خوارزمية Naive Bayes باستخدام مجموعة بيانات سرطان الثدي كانت 98% وباستخدام مجموعة بيانات سرطان الرئة كانت %98.8 بينما دقة التقنية الهجينة باستخدام مجموعة بيانات سرطان الثدي كانت 99% و باستخدام مجموعة بيانات سرطان الرئة كانت 95% .
وبينت الرسالة أن تقنيات تنقيب البيانات تتضمن مرحلتين رئيسيتين هما : مرحلة ما قبل المعالجة ومرحلة تصنيف الورم, وقد تحتوي مجموعات البيانات على بعض القيم المفقودة في العديد من مهام العالم الحقيقي فهذه القيم المفقودة تؤثر بشكل سلبي على اداء المصنف, ولذلك تتم معالجتها قبل عملية التصنيف, في هذا العمل تم استخدام خوارزمية (Naive Bayes) وتقنية هجينة تتضمن (Class Association Rule and Deep Neural Network).
وتضمنت الرسالة اختبار النظام المقترح باستخدام مجوعتين من بيانات السرطان (سرطان الثدي وسرطان الرئة)، إذ اشارت النتائج التي توصلت اليها الباحثة ان النظام المقترح يمتلك دقة عالية مقارنة مع الطرق الموجودة الاخرى حيث ان دقة خوارزمية Naive Bayes باستخدام مجموعة بيانات سرطان الثدي كانت 98% وباستخدام مجموعة بيانات سرطان الرئة كانت %98.8 بينما دقة التقنية الهجينة باستخدام مجموعة بيانات سرطان الثدي كانت 99% و باستخدام مجموعة بيانات سرطان الرئة كانت 95% .
وبينت الرسالة أن تقنيات تنقيب البيانات تتضمن مرحلتين رئيسيتين هما : مرحلة ما قبل المعالجة ومرحلة تصنيف الورم, وقد تحتوي مجموعات البيانات على بعض القيم المفقودة في العديد من مهام العالم الحقيقي فهذه القيم المفقودة تؤثر بشكل سلبي على اداء المصنف, ولذلك تتم معالجتها قبل عملية التصنيف, في هذا العمل تم استخدام خوارزمية (Naive Bayes) وتقنية هجينة تتضمن (Class Association Rule and Deep Neural Network).