Share

تحسين التنبؤ الامراض اعتمادا على طريقة مجموعة التقريب المعدله وطريقة شجرة القرار ذات العامل الاكثر شيوعا == Diseases Prediction Improvement Based on Modified Rough Set and Most Common Decision Tree

Author name: علي عبد الكريم رحومي السماك
Supervisor name: ايمان صالح الشمري
General topic: Computer Science
Specific topic: Computer Science
Degree: Master
University: University of Babylon - Information Technology Collage - Department Of Software
Language: English
University location: Babylon
First pages: 28T772 - p.pdf
Abstract: في قطاع الرعاية الصحية, يكون التنبؤ بنوع او شدة الامراض من الامور المهمة لمساعدة الاشخاص لمعرفة مستواهم الصحي واتخاذ الفعاليات المناسبة لتحسين صحتهم. حيث تم تطبيق مبدا جديد من طريقة التقريب والتي اطلق عليها اسم طريقة التقريب المعدله لاختيار الصفات وكذلك تم اقتراح طريقة شجرة القرار ذات العامل الاكثر شيوعا بالاعتماد على ثلاث مقاييس للنقاوة لتحسين كفاءة التنبؤ في طريقه شجرة القرار. يتكون هذا العمل من عدة مراحل : اولا، مرحلة المعالجة المسبقة وتتكون من ثلاث مراحل فرعية هي : اقتراح طريقة MRA لملئ القيم المفقودة في مجموعة البيانات ,التجميع لتدريج قيم بعض الصفات ,واخيرا التسوية.ثانيا، ايجاد درجة الموثوقية لكل ميزة، طريقة التقريب المعدلة (MRS) المقترحة تستخدم لتحديد الميزات الهامة والمؤثرة، حيث المخرج من هذه المرحلة ثلاثة اجزاء وفقا لدرجة اهمية المميزات : المجموعة المهمة جدا والمجموعة المهمة والمجموعة غير المهمة.ثالثا، التنبؤ بنوع او شدة الامراض بالاعتماد على شجرة القرارات ذات العامل الاكثر شيوعا (MCDT) لاتخاذ القرار حيث تم اقتراح اسلوب MCDT لتحسين عمل شجرة القرار في عملية اتخاذ القرار. حيث تستخدم MCDT ثلاثة مقاييس نقاوة لاختيار الجذر الاصلي / الجذر الفرعي للشجرة وكذلك قيمة فئة من كل ميزة. رابعا، تقييم النظام باستخدام مقايسس التقييم. حيث استخدم ثلاثة - دورات في عملية الاختبار. حيث تم تطبيق النظام المقترح على العديد من الامراض ثنائية ومتعددة الاصناف وتحديدا امراض القلب من الدرجة الثنائية (BHD) لديها (صنفين) ، وامراض القلب متعددة الاصناف (MHD) لديها (5 اصناف) والامراض الجلدية لديها (6 اصناف).واخيرا, تم مقارنة MCDT مع اساليب اخرى من طرق شجرة القرار مثل ID3، J48 حيث ان دقة الطريقة المقترحة التي تم الحصول عليها افضل من الطريقتين السابقة. وكذلك تم تطبيق طرق اخرى مثل شبكة بايز ونايف بيز وبينت النتائج كفاءة طريقة MRS باستخدام مقاييس التقيم. حيث ان افضل دقة لبيانات الاختبار تم الحصول عليها في بيانات القلب ذات التصنيف الثنائي هي 94.06 عند استخدام طريقة شجرة القرار باستخدام العامل المشترك الاكبر مع المجموعة الاكثر اهمية باستخدام البيانات المجمعة وافضل دقة لبيانات الاختبار تم الحصول عليها في بيانات القلب متعددة الاصناف هي 76.24 عند استخدام طريقة شجرة القرار باستخدام العامل المشترك الاكبر مع المجموعة الاكثر اهمية والمجموعة المهمة معا باستخدام البيانات المجمعة وافضل دقة لبيانات الاختبار تم الحصول عليها في بيانات الامراض الجلدية متعددة الاصناف هي 100 باستخدام طريقة شجرة القرار باستخدام العامل المشترك الاكبر عند اختيار جميع الخصائص. | In the health care sector predict the type or severity of the disease is important for helping people to knowledge their health standard and take action to improve their health. A Modified Rough Set (MRS) has been employed as a new model for features selection as well as Most Common Decision Tree (MCDT) has been suggested to improve the performance of decision tree prediction. This work consists of many stages : First, preprocessing stage which contains two sub stages : A Mode - Relation - Average (MRA) method for interpolating missing values, a grouping for scaling some of features values.Second, finding Reliability Degree of each feature using MRS which has been proposed to determine the important and influential features. The output of this model is three subsets graduate according to the importance degree of features : Most Important (MI), Important (I) and Unimportant (UM).Third, prediction type or severity of disease based on supervised learner MCDT for making decision where a MCDT style has been proposed to improve working of decision tree. It uses three impurity measures for choosing root/sub root of the tree and category value of each feature. Fourth, system evaluations using evaluation measures. Three - cross validation is used in the testing process. The proposed system has been applied on Binary classes of Heart Disease (BHD), Multi classes of Heart Disease (MHD) (5classes) and Dermatology Disease (DD) (6classes). Finally, the proposed methods have been compared with the other decision tree methods such as ID3 and J48, the Accuracy obtained using the proposed methods are better than two previous methods. Also other prediction methods are applied such as Bayes Net and Naive Bayes. The results show the efficiency of MRS model by using the evaluation measures. The best accuracy measure for testing data was 94.06, 76.24 and 100 for MCDT using MI set of BHD by grouping data, MCDT using MI set and I set of MHD by grouping data, and MCDT using full attributes of DD.
Logo