Share
بعض طرائق تقدير انموذج الانحدار اللوجستي المشروط في حالة البيانات الطولية وتطبيقها في التلوث البيئي
Author name:
يوسف خليل عيسى
Supervisor name:
انتصار عريبي فدعم الدوري
General topic:
Administration and Economics
Specific topic:
Statistics
Degree:
Master
University:
University of Baghdad - Faculty Of Administration And Economics - Department Of Statistics
Language:
Arabic
University location:
Baghdad
First pages:
07T4811 - p.pdf
Abstract:
غالبا ما يعتمد الانحدار اللوجستي الشرطي لدراسة العلاقة بين نتائج حدث ما وعوامل تشخيصية محددة من اجل تطبيق الانحدار اللوجستي والاستفادة من قدراته التنبؤية في الدراسات البيئية. اذ تهدف هذه الرسالة الى اثبات اسلوبا جديدا لتطبيق الانحدار اللوجستي الشرطي في البحوث البيئية من خلال طرائق الاستدلال المبنية على البيانات الطولية. وذلك لانه مع الاستجابات المتقطعة هناك تبعية لا تتجزا للتغير في المتوسط. وبذلك يتطلب التحليل الاحصائي للبيانات الطولية الاساليب التي يمكن ان تراعي بشكل سليم للترابط داخل الموضوعات لقياسات الاستجابة. اذا تم تجاهل هذا الارتباط فان استدلالات مثل الاختبارات الاحصائية وفترات الثقة يمكن ان تكون غير صالحة الى حد كبير. ولتقدير انموذج الانحدار اللوجستي الشرطي لغرض تحليل التلوث البيئي الناتج عن تصفية النفط في المصافي كدالة لانتاج النفط والعوامل البيئية تم استعمال طريقة معادلة التقدير المعممة (GEE) Generalized Estimating Equation في صياغة طرائق الاستدلال، التي من شانها تسهل تقدير انموذج الانحدار اللوجستي الشرطي بالاستفادة من الارتباطات الفعلية بين الاستجابات في البيانات، وكذلك بنية الارتباط المحددة من خلال مقدرات الشطيرة الحصينة (RSE) robust sandwich estimators ، فضلا عن تطبيق العديد من معايير اختيار الانموذج المختلفة. ثم تقييم اداء كلا من نماذج الانحدار اللوجستي الشرطية عندما تكون التاثيرات ثابتة ومختلطة مع تحليل بيانات التلوث وفق طريقة الامكان الاعظم Maximum Likelihood Estimator (MLE). اما في الجانب التطبيقي فقد تم الحصول على بيانات التلوث البيئي من شركة مصافي الوسط في العراق والتي تمثل مجموعة من الملوثات البيئية الطولية وهي الجسيمات العالقة (PM2.5) Particulate matter، وكبريتيد الهيدروجين (H2S) Hydrogen sulfide، واكاسيد النيتروجين (NOx) Nitrogen oxides، والامونيا (NH3) Ammonia، وغاز اول اوكسيد الكاربون (CO) Carbon monoxide، وثاني اوكسيد الكاربون (CO2) Carbon dioxide، والاوزون (O3) The Ozone، ومن خلال تطبيق كلا الطريقتين GEE وMLE لتقدير النماذج المختلطة والثابتة تم اثبات انه باستعمال انموذج الانحدار اللوجستي الشرطي هو اسلوب تقييم حصين للدراسات البيئية، فمن المهم ان نلاحظ انه في محاولة لاختبار مدى حصانة هذا الاسلوب، مع بيانات التلوث في مجموعة بيانات واحدة تستعمل في بناء او اكتشاف علاقة تنبؤية هي مستويات التلوث العالية المتمثلة في النظام البيئي C3)) تنتهك فرضية استقلالية البدائل غير ذات صلة (IIA) Independence of Irrelevant Alternatives ومن ثم قد لا ينطبق على افتراض الحالة الطبيعية. وبالنتيجة فان انموذج الانحدار اللوجستي الشرطي مختلط التاثيرات يكون اكثر دقة لدراسات التلوث، لانه من المحتمل ان تولد نماذج الانحدار اللوجستي الشرطية استنتاجات غير دقيقة مع التاثيرات الثابتة فقط. هذا لان انموذج الانحدار اللوجستي الشرطي مع كلا من التاثيرات الثابتة والعشوائية يقدم افكارا تفصيلية على المجموعات (العناقيد) التي تم تجاهلها الى حد كبير من قبل انموذج الانحدار اللوجستي الشرطي ثابت التاثيرات | Conditional logistic regression is often used to study the relationship between event outcomes and specific prognostic factors in order to application of logistic regression and utilizing its predictive capabilities into environmental studies. This thesis seeks to demonstrate a novel approach of implementing conditional logistic regression in environmental research through inference methods predicated on longitudinal data. Because with discrete responses there integral dependency for change in the mean. Thus, statistical analysis of longitudinal data requires methods that can properly take into account the interdependence within - subjects for the response measurements. If this correlation ignored then inferences such as statistical tests and confidence intervals can be invalid largely. For estimating the conditional regression model for the analysis of environmental pollution resulting from the oil filter in refineries as a function of oil production and environmental factors using the generalized estimating equation (GEE) method in the formulation of inference methods that facilitate the conditional logistic regression model taking advantage of the actual correlations between responses in the data, as well as the specific correlation structure through robust sandwich estimators (RSE) as well as application many of various model selection criteria. We then evaluate the performance of both fixed - effects and mixed - effects conditional logistic regression models with the pollution data analysis according to the maximum likelihood method (MLE). Either in the applied side has been getting the data of environmental pollution from Midland Refineries Company in Iraq are represents a group of environmental pollutants longitudinal is Particulate matter (PM2.5), Hydrogen sulfide (H2S), Nitrogen oxides (NOx), Ammonia( NH3), Carbon monoxide (CO), Carbon dioxide (CO2), The Ozone (O3) and by applying both the GEE and MLE methods to estimate a fixed and mixed models was prove that use the conditional logistic regression model is a robust evaluation method for environmental studies, it is important to note that in an effort to test the robustness of this method, with the pollution data in one set data used to construct or discover a predictive relationship is high pollution levels of the ecosystem (environmental system C3) violates the Independence of Irrelevant Alternatives (IIA) hypothesis and therefore the normality assumption may not apply. Therefore, the mixed - effects conditional logistic regression model is more accurate for pollution studies, because the conditional logistic regression models with fixed - effects only potentially generating flawed conclusions. This is because the conditional logistic regression model with random and fixed - effects provides detailed insights on groups (clusters) that were largely overlooked by fixed - effects conditional logistic regression model