logistic regression - Alghamdi-Biostatistics

يستخدم تحليل الإنحدار اللوجستي في الدراسات الوبائية والطبية والذي من خلاله يتم تحديد المتغيرات المستقلة الكمية والنوعية التي تؤثر في إحتمال حدوث المتغير الناتج. عندما يتم تطبيق الإنحدار اللوجستي فلابد أن يكون متغير النتيجة ثنائي التفسير يحمل الترميز 0 و 1

المطلوب في الإنحدار اللوجستي البسيط

واحد متغير مستقل كمي أو اسمي مثل الوزن ، الطول ، الحالة الإجتماعية ، الجنس

واحد متغير إسمي تابع ثنائي النوع مثل وجود المرض ( نعم ، لا ) نوع الجنس ( ذكر ، أنثى ) وغيرها

المطلوب في الإنحدار اللوجستي المتعدد

إثنان أو أكثر من المتغيرات المستقلة الكمية أو الإسمية مثل الوزن ، الطول ، الحالة الإجتماعية ، الجنس

واحد متغير إسمي تابع ثنائي النوع مثل وجود المرض ( نعم ، لا ) نوع الجنس ( ذكر ، أنثى ) وغيرها

يساعدنا استخدام الإنحدار اللوجستي في التالي

التنبأ في إحتمال وقوع مشاهدات الدراسة في إحدى نواتج المتغير التابع (متغير النتيجة) الذي يرمز له 0 ، 1 عن طريق معرفتنا بالمتغيرات المستقلة التفسيرية ذات النوع الكمي والإسمي وذات الدلالة الإحصائية فلو افترضنا بأن المتغير الإسمي التابع هو وجود المرض الذي يرمز له ( 0= غير موجود ، 1= موجود ) ونريد معرفة علاقة المتغيرات المستقلة الكمية أو النوعية في إحتمال حدوث المرض من عدمة بمعرفة نسبة الأرجحية ومعامل الإنحدار اللوجستي

معادلة خط الإنحدار اللوجستي

(Y) Log odds of the outcome = (b0) + b1X1 + b2X2 + b3X3 + ………

تعني المتغير التابع الذي يرمز له 0 و 1 Y

تعني الثابت وهو معامل الإنحدار اللوجستي للمتغير التابع عندما تكون قيمة المتغير المستقل صفر A

تعني معامل الإنحدار اللوجستي الذي يوضح مقدار التغير في المتغير التابع في حالة التغير بوحدة واحدة للمتغير المستقل B

تعني المتغير المستقل الذي يؤثرعلى المتغير التابع X

شروط الإنحدار اللوجستي

أولا : يجب أن تكون العينة كبيرة وممثلة للسكان

ثانيا : يجب أن يكون هناك علاقة ارتباط بين المتغيرات المستقلة والمتغير التابع

يتم قياس العلاقة عن طريق التحليل الأحادي بين المتغير المستقل والمتغير التابع بأستخدام اختبار مربع كاي ، بيرسون ، سبيرمان أو عن طريق نموذج الإنحدار اللوجستي بشكل فردي بين المتغيرين

ثالثا : يجب أن يكون هتاك علاقة ارتباط بين اللوغارثم للمتغير التابع والمتغير التفسيري ذو النوع المستمر أو الترتيبي

لابد من إنشاء متغير جديد يوضح قيمة اللوغارثم للمتغير التابع وبعدها يتم إكتشاف العلاقة بين المتغيرين

رابعا : يجب أن يكون الإرتباط بين المتغيرات التفسيرية ضعيف

راجع العلاقة الخطية المتداخلة في تحليل الإنحدار المتعدد

عملية الترميز في تحليل الإنحدار اللوجستي

الترميز	الحالة	التفسير للحالة
0	غياب المريض	النتيجة سلبية
1	وجود المريض	التنيجة إيجابية
0	غياب عامل الخطر	عامل الخطر سلبي
1	وجود عامل الخطر	عامل الخطر الايجابي

العلاقة بين المرض وعامل الخطر

سوف نتطرق بالتفصيل لحساب نسبة الأرجحية الغير مضبوطة وبالتالي سنتعرف على الأرجحية المضبوطة والمتعلقة بنموذج الإنحدار اللوجستي والتي يمكن استخدامها في الدراسات الوبائية مثل دراسة الحالة والشاهد ، دراسة المقطع العرضي والتجارب الطبية

نسبة الأرجحية الغير مضبوطة تعني عدم وجود تأثير للعوامل أو المتغيرات المربكة والتي قد تتسبب في التقدير المبالغ للعلاقة بين المتغيرات بينما الأرجحية المضبوطة يتم استخدمها في نموذج الإنحدار اللوجستي وذلك من أجل ضبط العوامل المربكة والحد منها

	وجود المريض	غياب المريض	المجموع
وجود عامل الخطر	A	B	B+A
غياب عامل الخطر	C	D	D+C
المجموع	C+A	D+B	N

Binary level Odds Ratio نسبة الأرجحية للمتغير الثنائي

(A/B) / (C/D)

(A x D) / (B x C)

	وجود المريض	غياب المريض	المجموع
وجود عامل الخطر	40	30	70
غياب عامل الخطر	60	70	130
المجموع	100	100	200

نسبة الأرجحية في حالة التعرض وحدوث المرض = (30/40) / (70/60) = 0.8/1.6 = 2

نسبة الأرجحية في حالة عدم التعرض وحدوث المرض = (70/60) / (30/40) = 1.6/0.8 = 0.5

إذا كانت نسبة الأرجحية = 1 ، فهذا يعني بأن نسبة أرجحية المرض في الأشخاص المعرضين والغير معرضين متساوية وبذلك لا يوجد فرق بينهم ولا توجد علاقة بين المرض والمسبب

إذا كانت نسبة الأرجحية > أكبر من 1 ، فهذا يعني بأن نسبة أرجحية المرض في الأشخاص المعرضين لعامل الخطر أكبر من نسبة أرجحية المرض في الغير معرضين وبذك يتضح وجود علاقة موجبة ضارة بين المرض والمسبب

في المثال السابق نستطيع أن نفسر العلاقة الأولى بين حدوث المرض وحالة التعرض بالشكل الإيجابي حيث أن نسبة الأرجحية أكبر من 1 وتساوي 2 وبذلك فإن أرجحية المرض في الأشخاص المعرضين لعامل الخطر أكبر مرتين من نسبة أرجحية المرض في الأشخاص الغير معرضين لنفس عامل الخطر

يمكن أيضا تفسير العلاقة بين حدوث المرض وعدم التعرض لنفس البيانات بالشكل السلبي الوقائي حيث أن نسبة الأرجحية اصغر من 1 وتساوي 0.5 وبذلك فإن أرجحية المرض في الأشخاص الغير معرضين لعامل الخطر اقل 50% من نسبة أرجحية المرض في الأشخاص المعرضي لنفس عامل الخطر

Multiple levels Odds Ratio نسبة الأرجحية للمتغير المتعدد المستويات

مؤشر كتلة الجسم BMI	الحالات	الشواهد	نسبة الارجحية
1	21	30	21 / 30 = 0.7
2	31	26	31/26=1.92 / 0.7 = 1.70
3	24	11	24 / 11 = 2.81 / 0.7 = 3.11
4	17	4	17 / 4 = 4.25 / 0.7 = 6.07

طريقة بناء نموذج الإنحدار اللوجستي

أولا : تحقيق العلاقة بين المتغير التابع الإسمي الثنائي والمتغير المستقل الإسمي وذلك عن طريق التحليل الأحادي بأستخدام مربع كاي وأختبار الإرتباط

ثانيا : تحقيق علاقة الإرتباط بين لوغارثم المتغير التابع الإسمي الثنائي والمتغير المستقل الكمي المستمر عن طريق مخطط التشتت بين المتغيرين حيث لابد أن تكون العلاقة موجبه

ثالثا : تحليل العلاقة الخطية المتداخلة بين المتغيرات المستقلة

العلاقة الخطية المتداخلة راجع الرابط التالي تحليل

رابعا : الإضافة والحذف في النموذج

طريقة الحذف والإضافة طريقة الحذف والإضافة