مراحلی که برای تعیین و تصحیح مدل به کار برده می شود عبارتند از: تحلیل باقی مانده ها: نتایج حاصل از تحلیل رگرسیون وقتی معتبر و با مفهوم هستند که فرض های مربوط به Residual (باقی مانده) های مدل نیز صحت داشته باشد. نتیجه اینکه، ساختار باقی مانده ها و الگوی داده ها بااستفاده از نمودار، اهمیت زیادی پیدا می کند. به خاطر داشته باشید که بالا بودن مقدارR^2 و یا معنی دار بودن آمارۀ t حاکی از آن نیست که «برازش» (fit) به خوبی انجام شده است. در این راستا تحلیل باقیمانده ها روشی ساده و موثر برای روشن کردن کاستی های مدل در تحلیل رگرسیون می باشد.

تعیین و تصحیح عیوب مدل

مراحلی که برای تعیین و تصحیح مدل به کار برده می شود عبارتند از:

تحلیل باقی مانده ها:

نتایج حاصل از تحلیل رگرسیون وقتی معتبر و با مفهوم هستند که فرض های مربوط به Residual (باقی مانده) های مدل نیز صحت داشته باشد. نتیجه اینکه، ساختار باقی مانده ها و الگوی داده ها بااستفاده از نمودار، اهمیت زیادی پیدا می کند. به خاطر داشته باشید که بالا بودن مقدارR^2 و یا معنی دار بودن آمارۀ t حاکی از آن نیست که «برازش» (fit) به خوبی انجام شده است. در این راستا تحلیل باقیمانده ها روشی ساده و موثر برای روشن کردن کاستی های مدل در تحلیل رگرسیون می باشد.

شناسایی نقاط دور افتاده:

باقی مانده هایی که نسبت به سایرین به طور قابل توجهی بزرگ باشند (مثلا فاصلۀ سه یا چهار انحراف معیار از میانگین)، «نقاط دور افتاده (Outliers) یا «پرت» به شمار می روند. نقاط دور افتاده بسته به موقعیت خود، (روی محورX) ، می توانند اثرات متوسط تا شدیدی بر مدل رگرسیون داشته باشند.

رسم «نمودار پراکندگی» (scatter plot) باقی مانده ها مقابل X در شناسایی نقاط پرت مفید است. اکنون به بررسی چند گزینۀ مهم، در پنجرۀ linear regression: save می پردازیم: گزینۀ studentized (استودنت شده): این گزینه در ناحیۀ Residuals (باقی مانده ها) قرار دارد و نشان دهندۀ مقادیر زیر است:


تعیین و تصحیح عیوب مدل در تحلیل آماری با spss

 

برای آزمون همزمان، از سطح معنی داری α^'=α استفاده می شود (n تعداد مشاهدات است). مقادیر t_i را با مقدارt_α'^((n-p-1)) مقایسه می کنیم. اگر t_i> t_α^((n-p-1))باشد نتیجه می گیریم که مشاهدۀ i اُم یک نقطۀ پرت است.

گزینۀ leverage values:

این گزینه در ناحیۀ Distances (فواصل) قرار گرفته و از آن برای شناسایی نقاط پرت یا دور افتاده استفاده می شود. برای مثال، اگر بخواهیم براساس این معیار، دو تا از مشاهدات را مشخص کنیم، دو عددی که بالاترین هستند را انتخاب می کنیم.

نکته اگر به مشاهدۀ i یک واحد اضافه شود، به تاثیر آن در مقدار برازش یافتۀY_i ، Leverage (اهرم) گفته می شود.

گزینۀ DifFit:

این زینه در ناحیۀ (آماره های تاثیر) قرار داشته و مقادیر:


تعیین و تصحیح عیوب مدل در تحلیل آماری با spss

 

را نشان می دهد که برای آزمون تاثیر مشاهدۀ iام روی «مقادیر فیت شده» به کار می رود.

گزینۀ DfBeta(s):

از این گزینه که مقادیر: Studentized Change in β_2=(β_2-β_((r)))/(σ ̂(β ̂_2-Y ̂_((r))))~t_α^((n-p-1)) را نشان می دهد برای آزمون تاثیر مشاهدۀ i ام روی برآورد پارامترها استفاده می شود.

گزینۀ covariance ratio:

تغییر دترمینان ماتریس کواریانس ضرایب رگرسیون در اثر حذف مشاهدۀ i امین را اندازه گرفته و عبارتست از: covariance ratio= (σ_i^2)/〖MS〗_E که در آنσ_i^2 برآوردσ^2 با حذف مشاهدۀ i ام است. نقاط با leverage بالا دارای covariance ratio بالایی نیز هساتند: اگر covariance ratio 2)یا DfBetals > 2) در موارد فوق،p معرف تعداد پارامترهای مدل و n معرف «تعداد مشاهدات» است.

نکات

برای شناسایی نقاط پرت از مقادیر cook's distances (فواصل کوک) نیز استفاده می شود. برای این ویژگی، گزینۀ cook's را در ناحیۀ distances از پنجرۀ linear regression: save انتخاب کنید.

نقاطی که coo;'s distance آن ها بیشترین مقدار باشد را می توانیم به عنوان «نقاط پرت» در نظر بگیریم. در یک رگرسیونی: مقادیر standardized residuals (باقی مانده های استاندارد شده) را بررسی کرده و مطمئن شوید که: در 5% موارد r| < 2| در 1% موارد r| < 2.5| اگر مقدار r > 3، آن مورد (متغیر) یک موردoutlier (پرت) است مقادیر cook's distance (فاصله کوک) را در پنجرۀ data editor (ویرایشگر ماده) بررسی کنید. اگر 1< cook distance باشد، ممکن است آن مورد بر مدل تاثیر گذار باشد.

متوسط leverage (اهرم) که به صورت (k+1)/nمحاسبه می شود را تعیین کنید (k معرف تعداد predictor (پیش بینی کننده)ها است).

مقادیر بیشتر از 2 یا 3 برابر متوسط را بیابید.

در نمونه های با تعداد نمونۀ بالا، n= 500، اگر Mahalanobis distance >25 و در نمونه های با تعداد نمونۀ پایین، n= 100، اگر Mahalanobis distance > 15باشد روی داده ها تحلیل های دقیق تری انجام دهید. جاهایی DF Beta|>1|که است را بیابید.

حدود بالا و پایین (نسبت کواریانس) که به صورت:

1+3(K+1)/n = حدبالا و 1-3(K+1)/n= حد پایین می باشد را محاسبه کنید. داده های خارج از این محدوده ممکن است مشکل ساز باشند. برای اطمینان از صحت برازش کلی مدل به داده ها: نمودارZPRED* × ZRESID*را رسم کنید. اگر در این نمودار: نقاط به صورت تصادفی و یکنواخت پراکنده شوند، مدل برازش یافته مناسب است. نقاط یک جا جمع شده و یا بیرون از نمودار پراکنده شده باشند، فرض یکسان بودن واریانس ها رد می شود.

بتوان یک الگوی فرضی تشخیص داد، ممکن است بتوان فرض خطی بودن مدل را رد کرد. برخی نقاط نسبت به دیگری پراکندگی بیشتری داشته باشد ممکن است بتوان فرض یکسان بودن واریانس و خطی بودن مدل را رد کرد.

نکات

در هریک از متغیرها نمودارهای partial (جزئی) را بررسی کنید.

نمودار های p-p و هیستوگرام ها را رسم کنید: اگر شکل ظاهری هیستوگرام ها مشابه توزیع نرمال بوده و نمودار p-p مشابه خط مورب دیده شود، مدل مناسب است.

اگر شکل ظاهری هیستوگرام ها مشابه توزیع نرمال نبوده و نمودار p-p دارای خط انحنادار باشد مدل به خوبی به داده ها برازش نمی شود.

اگر تعداد و حجم نمونه کم باشد، ممکن است با وجود نرمال بودن، توزیع مربوطه غیر نرمال به نظر برسد.

برای دریافت متن کامل این مقاله آموزشی بسته آموزش تحلیل آماری با spss را تهیه کنید:

شما با این بسته می توانید تحلیل آماری با spss و amos را کامل و آسان بیاموزید

و قطعا قادر می شوید کارهای آماری را حودتان انجام دهید

چگونه؟

بسته آموزشی تجزیه تحلیل آماری با SPSS و AMOS

از صفر تا صد آموزش  spss

آموزش مباحث اساسی AMOS

آموزش به زبان ساده ، موضوعی و گام به گام همراه با تصویر

33 پکیج (1378 صفحه تصویری)+ به همراه همه مقالات آموزشی این سایت درباره spss

لطفا و خواهشا برای سوال های آماری و رفع اشکال تماس نگیرید

هر آنچه لازم باشد در این بسته آموزشی آمده است.

 


انتخاب جدیدترین موضوعات پایان نامه روانشناسی، مشاوره و علوم تربیتی و انجام تخصصی پروپوزال(دانلود نمونه کار پروپوزال)::

شماره تماس: 09011853901
جهت ارسال سریع پیام در پیام رسان های زیر نام هر یک را لمس کنید.