این مقاله را می توانید بهترین مطلب برای آموزش رگرسیون خطی ساده در spss برای تحلیل آماری پایان نامه روانشناسی بدانید.
رگرسیون ساده :
در بخش قبل دیدیم که ضریب همبستگی معیار خوبی برای سنجش همبستگی خطی میان دو متغیر تصادفی می باشد .
در واقع همبستگی پیرسون برای اندازه گیری قدرت رابطه بین دو متغیر کمی استفاده می شود .
اما مجموعه ای از روش ها وجود دارد که از وجود رابطه بین دو متغیر برای پیش بینی کردن مقدار یک متغیر از روی متغیر دیگر استفاده می کند .
هرگاه مقدار داده شده ی X را با x نشان دهیم ومقدار Y را به وسیله ی تابعی مانند (x) d پیش بینی کنیم،تابع (x) d را تابع پیش بینی کننده می نامیم . متغیر اول را متغیر کنترل شده یا پیش بینی کننده می نامند .
متغیر دوم را که به x بستگی دارد و مقدار آن تصادفی می باشد، متغیر پاسخ می نامند .
تابع پیش بینی کننده را به صورت خطی E (Y|x) = a+bx نشان می دهند . که در آن E (Y|x) را مقدار برآورده شده ی y،ɕ را مقدار ثابت رگرسیون (عرض از مبدا) وb را ضریب رگرسیون (ضریب زاویه) می نامند .
بررسی مانده ها :
بعد از این که مدل برازش داده شد تمام اطلاعات مربوط به تغییراتی که نمی توانند به وسیله مدل توضیح داده شوند مشمول درمانده ها،یعنی e ̂=y-y ̂هستند که در آن y ، مقدار مشاهده شده و y ̂مقدار پیش بینی شده متناظر با آن به وسیله مدل برازش داده شده است .
بررسی مقادیر باقیمانده ها اهمیت فراوانی دارد زیرا این مقادیر پایه ای برای شاخص های درستی برآورده می باشند .
مقادیر باقیمانده در برابر مقادیر پیش بینی شده :
رسم مقادیر باقیمانده در برابر مقادیر پیش بینی شده برای برقراری فرض خطی بودن مدل و فرض ثابت بودن واریانس خطاها، کمک شایانی می کند . اگر نقاط به صورت شکل مربوطه (الف) بود نشانه ای از غیرعادی بودن وجود ندارد و فرض خطی بودن مدل و فرض ثابت بودن واریانس خطاها برقرار است .
اگر نقاط به صورت شکل مربوطه (ج) و (د) باشد واریانس خطاها ثابت نیست و باید با انجام تبدیل های مناسب باعث پایداری واریانس شد . اگر به صورت شکل 4-7 (ب) باشد فرض خطی بودن برقرار نیست و باید فرم درجه دومی را مورد بررسی قرار داد .
مثال : فرض کنید مطالغه ی تغییرات میانگین فشار خون سیستولیک جامعه مردان در رابطه با وزن آن ها مورد نظر باشد . در این مثال فشارخون را متغیر پاسخ و وزن را متغیر کنترل شده درنظر می گیریم .
روند رگرسیون ساده :
ابتدا متغیرهای bloodpre و weight را در قسمت Variable View نام گذاری می کنیم و در ستون Lable برای متغیر bloodpre برچسب bloodpressure و برای متغیر weight،برچسب (pound) weight تعریف می کنیم .
سپس داده های مثال را در قسمت Data View وارد می کنیم .
حال روند زیر را دنبال کنید .
Analyze Regression Linear تا کادر گفتگوی Linear Regression باز شود .
1- متغیر فشارخون را که متغیروابسته است را انتخاب کرده و با کلیک کردن روی دکمه ی ► آن را به کادر Dependent منتقل می کنیم .
2- متغیر وزن را که متغیر مستقل است را انتخاب کرده و با کلیک کردن روی دکمه ی► آن را به کادر Independent منتقل می کنیم .
3- بر روی Statistics کلیک کرده تا کادر آن باز شود .
برای درخواست کردن مدل برازش شده قسمت Model fit و برای برآورد ضرایب رگرسیون قسمت Estimates انتخاب شده است . برای درخواست کردن آماره های توصیفی در قسمت Descriptives کلیک کنید .
مقدار باقیمانده،اختلاف بین مقدار واقعی متغیر وابسته و مقدار برآورد شده ی آن است .
قسمت Casewise diagnostics لیستی از مقادیر باقیمانده ی بزرگ (با بیش از سه انحراف معیار) را به ما می دهد که می توان آن ها را مقادیر پرت در نظر گرفت و از تجزیه و تحلیل حذف کرد .
بعد از انتخاب این گزینه، روی Continue کلیک کنید .
1- برای بدست آوردناطلاعاتی در مورد باقیمانده ها از روی نموداربر روی Plots کلیک کرده تا کادر ان باز شود .
متغیر ZRESID که باقیمانده های استاندارد شده است را در کادر Y و متغیر ZPRED که مقادیر پیش بینی شده ی استاندارد است را در کادر X وارد کنید و روی Continue کلیک کنید .
1- بر روی Ok کلیک کنید .
خروجی رگرسیون ساده چون در این قسمت هیچ داده ی پرتی وجود ندارد به بررسی جداول مختلف و نمودارها می پردازیم . اولین جدول آماره های توصیفی را می دهد .
در جدول دوم ضریب همبستگی و آزمون فرض آن داده است که رابطه ی بالایی را بین دو متغیر وزن و فشارخون نشان می دهد .
جدول بعدی شامل مقدار R چندگانه است که نسبت تغییرپذیری مقادیر y را که می تواند توسط خط برازش شده بیان شود، اندازه می گیرد .
چون در این جا تنها یک متغیر وجود دارد با مقدار ضریب همبستگی r برابر است .
آماره ی بعدی مربع R (ضریب تعیین) است که در واقع درصد تغییرپذیری کل به علت رگرسیون روی x است .
آماره های بعدی مربع R تصحیح شده و انحراف معیار باقیمانده ها می باشد .
خروجی بعد شکل مربوطه درباره ی آنالیز واریانس رگرسیون است و خطی بودن رابطه ی بین متغیرها را آزمون می کند .
برای این منظور با تشکیل فرمول (Mean Square Regression)/(Mean Square Residuals)مقدار F جدول به دست می آید .
در این مثال مقدار F به شدت معنی دار است و فرض خطی بودن برقرار است . اما باید توجه داشت که تنها از روی نمودار پراکنش می توان فرض خطی بودن را تایید کرد .
جدول شکل مربوطه شامل ضرایب رگرسیون و ثابت است . بنابراین معادله ی رگرسیون به صورت زیر است :
E (Y|x) =3/553+0/763x بنابراین برای یک نفر با وزرن 170 این فشارخون پیش بینی می شود :
3/553+0/763* (170) =133/263
آماره ی Std . Error خطای معیار ضریب رگرسیون (B) است .
Beta وزن بتاست که نشان دهنده ی میزان تغییر متغیر پاسخ به ازای تغییری به اندازه ی یک انحراف معیار در متغیر مستقل است .
آزمون t برای آزمودن ضریب رگرسیون است و Sig مقدار p-value برای t می باشد و چون مقدار ان کمتر از 005/0 نشان می دهد که t مربوط به تغییر وزن در سطح فراتر از . . . معنی دار است . جدول بعد شکل مربوطه مربوط به آماره های باقیمانده است .
متغیر Predicted Value شامل مقادیر پیش بینی شده ی استاندارد نشده است .
متغیر Residual باقیمانده های استاندارد نشده است . متغیر Std . Predicted Value شامل مقادیرپیش بینی شده ی استاندارد شده است (یعنی میانگین آن صفر و انحراف معیارش 1 می باشد) .
متغیر std Residual شامل باقیمانده های استاندارد شده است .
آخربن خروجی مربوط به نمودار پراکنش باقیمانده های استاندارد شده (ZRESID) در مقابل مقادیر پیش بینی شده ی استاندارد (ZPRED) است .
این نمودار الگوی مشخصی را نشان نمی دهد و فرض های خطی بودن مدل و ثابت بودن واریانس خطاها برقرار است .