آموزش کاربرد مدل تحلیل رگرسیون لجستیک در spss در انجام پایان نامه روانشناسی و علوم تربیتی و مشاوره بحثی است که در این مقاله به آن پرداخته ایم.
رگرسیون لجستیک:
فرض کنید می خواهیم تاثیر عوامل جنسیت، وضعیت اشتغال و محل سکونت را بر روی وضعیت عضویت افراد در احزاب مختلف کشور بررسی کنیم.
بنابراین عامل وضعیت عضویت افراد در احزاب را متغیر پاسخ و سایر عوامل ذکر شده را متغیرهای توضیحی می نامیم.
در واقع این مثال را می توان به صورت یک مدل رگرسیونی تحلیل نمود. وقتی متغیر پاسخ دو سطحی و متغیرهای توضیحی عوامل طبقه بندی شده باشند مدل رگرسیونی را مدل لوجیت می نامند.
اگر سطوح متغیر پاسخ را با 1 و 2 نشان دهیم در این صورت می توان تغییرات پاسخ در اثر سطوح مختلف متغیرهای توضیحی را با احتمال شرطی،P1|i2,…im=P{متغیرهای توضیحی در سطوح مختلف | متغیر پاسخ در سطح 1} بیان کرد.
اگر تحت مدل چندجمله ای،Pi1,i2,…imرا احتمال مشاهده ی نمونه در خانه ی(i1,..,im)فرض کنیم در این صورت داریم:
مقادیر بزرگ تابع لوجیت، متناظر مقادیر x نزدیک به 1 و مقادیر کوچک آن،متناظر مقادیر x نزدیک به صفراند.
بنابراین مقادیر لوجیت وقتی بزرگ است که با احتمال زیاد در سطوح(i2,..,im)متغیرهای توضیحی،سطح متغیر پاسخ برابریک باشد و لوجیت وقتی منفی و کوچک است که با احتمال زیاد در سطوح (i2,..,im) متغیرهای توضیحی،سطح متغیر پاسخ برابر دو باشد.
اگر logit(P1|i2…..im) معلوم باشد می توان اثر متغیرهای توضیحی را بر احتمال مشاهده ی سطح اول پاسخ مطالعه نمود. زیرا:
استفاده از چندین رگرسور (پیشگوکننده):
فرض کنید یک آزمایش خونی کشف شده استکه وضعیت قبل از بیماری را که در سنین میان سالی وبه علت مصرف سیگار یا الکل ایجاد می شود را مشخص می کند.
بر این اساس صد نفر از نظر وجود این وضعیت پیش از بیماری مورد آزمایش قرار گرفتند و مصرف سیگار یا الکل در آن ها ثبت گردید (داده های آن در انتهای فصل آمده است). همانند رگرسیون چندگانه باید امیدوار باشیم که با استفاده از دو رگرسیور یا بیشتر، پیش بینی بهتری انجام دهیم.
در این حالت فرض این است که لوجیت موردنظر تابع خطی رگرسورها باشد. بنابراین: Log it = A+B1(x1)+B2(x2) که در آن:میزان مصرف سیگارx1=میزان مصرف الکلx2= احتمال وضعیت خونی برای سطح خاصی از مصرف سیگار از روی تابع لوجستیک پیش بینی شده است.
تفسیر ضرایب رگرسیون به خاطر بیاورید که در رگرسیون دو متغیر ساده،ضریب زاویه خط رگرسیون، متوسط تغییر در متغیر معیار است که به دنبال یک واحد تغییر در متغیر رگرسور پیش می آید. در رگرسیون لجستیک که به جای واحدهای اصلی با لگاریتم ها سروکار داریم.
مسئله به این سادگی نیست. فرض کنید که B = 1\5 باشد، یعنی یک واحد افزایش در سیگار کشیدن (مثلا 10 نخ سیگار) موجب افزایش لوجیت وضعیت خونی به میزان ...می شود. اگر عبارت elogit را میزان شانس بنامیم به سادگی به دست می آید: e1/5=4/48 اما یک مسئله ی دیگر نیز وجود دارد.
هنگامی که لگاریتم ها با هم جمع می شوند، اعداد اصلی ضرب می شوند. به عبارت دیگر وقتی لگاریتم شانس 5/1واحد افزایش می یابد، مقدار شانس در 48/4ضرب می شود. یعنی احتمال رخ دادن پیش آمد چهار و نیم برابر افزایش می یابد.
مثالی با سه رگرسور جدول زیر اطلاعات مربوط به چهار عامل دو سطحی را نشان می دهد.
این عوامل عبارتند از: A: عضویت در حزب، B: جنس، C: وضعیت اشتغال، D: محل سکونت که A متغیر پاسخ و B ، C و ِD متغیرهای توضیحی اند.
ابتدا متغیرها را همانند شکل زیر تعریف کرده و وارد SPSS کنید.
سپس با دستور Weight Case متغیر Count را وزن دار کنید. هم اکنون داده های مثال، آماده ی انجام رگرسیون لجستیک می باشد که به صورت زیر عمل می کنیم:
Analyze
Regression
Binary Logistic
1- متغیر وابسته (عضویت در حزب) را به کادر Dependent منتقل کنید.
2- سه متغیر جنسیت،وضعیت اشتغال و محل سکونت را به کادر Covariaters انتقال دهید.
روی دکمه ی Option کلیک نمایید تا کادر مکالمه ی آن باز شود، در کادر Statistics and plots روی گزینه ی Hosmer-Lemeshow goodness of fit کلیک کنید و همچنین برای این که سیر تکرارها را دلشته باشیم گزینه ی Interation history را انتخاب نمایید.
برروی دکمه ی Continue و سپس از آن بر روی OK کلیک نمایید.
خروجی رگرسیون لجستیک بعد از خلاصه ای از تعداد موارد خوانده شده و کدهای داخلی SPSS برای طبقه های متغیر معیار، خروجی به دو بخش تقسیم می شود.
این دو بخش دارای دو عنوانBlock1:Method=Enter و Block0:Beginning Blockمی باشد.
بلوک صفر نتایج آنالیزی را گزارش می کند که تنها مقدار ثابت در آن وجود دارد و در این آنالیز به تمامی موارد،احتمال یکسانی برای متعلق بودن به طبقه هدف از متغیر وابسته داده می شود.
از آنجایی که از 2924 شرکت کننده در مطالعه تنها 213 نفر، در حزب عضویت دارند، نرم افزار SPSS براورده می کند که هیچ کدام از موارد در طبقه هدف قرار نمی گیرند.
(اگر بیشتر از نیمی از شرکت کننده ها، عضویت را دارا بودند، جدول Classification میزان موفقیت اولیه را قبل از این که رگرسوری وارد شود،ارائه می کند).
این جدول نشان می دهد 100% مواردی که در حزب عضویت ندارند به درستی پیش بینی شده اند.
همچنین نشان می دهد که شرکت کنندگان در حدود 93% موارد به درستی طبقه بندی شده اند.
بلوک 1 نتایج آنالیز رگرسیون بعد از آن که رگرسورها وارد شدند را نشان می دهد.
حال جدول طبقه بندی فرقی با بلوک صفر نمی کند. (در این مثال خاص)