برای اطلاع از روش و نحوه سنجش روایی و پایایی پرسشنامه پایان نامه ارشد روانشناسی و علوم تربیتی مشاوره و زمینه های مرتبط با این مقاله همراه باشید.

پس از انتخاب سوالات پرسشنامه ، نمرات پرسشنامه، مقیاس معنی داری را به وجود می آورند .

در گام نخست این مقیاس (scale ) یک نمره خام است که به طور ساده برابر با مجموع ارزش نمرات پاسخ های پرسشنامه است .

اما یک نمره خام ، مثلاً 28 به خودی خود هیچ گونه ارزشی ندارد و چیزی که در ابتدا برای ما مهم است این سوال کلی است که این نمرات خام چه چیز را و با چه درجا های از دقت می سنجند .

در تهیه ی سوالات پرسشنامه مجموعه ای از سوالات در دسترس قرار دارند که طبیعتاً سوال های اضافی نیز در آن وجود دارد . بنابراین می توان سوال های بهتری را از میان آنها انتخاب کرد . پس هر پرسشنامه معرف مجموعه پرسش هایی است که به عنوان یک نمونه از مجموعه ی مرجع انتخاب شده باشد .

در ارزش یابی پرسشنامه با دو سوال کلی روبرو هستیم :

1- نمونه ی پرسشنامه تا چه حد معرف دقیق مرجع وسیع تر پرسشهایی است که از آن استخراج شده است (اعتبار).

2- پرسش دوم این است که مرجع مورد نظر از لحاظ مطابقت با صفت پنهان تا چه حد صداقت دارد (روایی).

برای کاهش دادن تعداد متغیرها ( سوالات پرسشنامه) دو روش وجود دارد :

روش اول با ترکیب کردن متغیرهایی که با همدیگر همبستگی بالایی دارند ، آنها را در قالب متغیرهای جدید خلاصه می کند و به این ترتیب تعداد متغیرهای اصلی را کاهش می دهد .

روایی (با استفاده از روند تحلیل عاملی (Factor Analysis ) و تحلیل مولفه های اصلی (principal Components ) از این روش استفاده می کنند (فصل ششم تحلیل عاملی را ببینید .) روش دوم با حذف متغیرهایی که همبستگی کمتری با سایر متغیرها دارند تعداد متغیرها را کاهش می دهند .

روندهای اعتبار (Reliability ) و مقیاس سازی چندبعدی (Multidimansional Scaling ) از این روش استفاده می کنند . 

 

اعتبار ( Reliability )

منظور از اعتبار آزمون ، دقت اندازه گیری و ثبات و پایانی آن است . منظور از دقت اندازه گیری این است که نمره ی کسب شده توسط فرد تا چه حدی می تواند بیانگر نمره ی حقیقی وی باشد .

به عنوان مثال پرسشنامه 27 سوالی رضایت مندی شغلی را در روز معینی به پاسخگو می دهیم . در پایان نمره ای برای پاسخگو به دست می آوریم که به عنوان اندازه ای از جایگاه این فرد در صفت پنهان رضایت مندی شغلی به کار برده می شود . مسلماً تنها چیزی که در اختیار ماست همین نمره ی نمونه ی نسبتاً کوچک از پاسخ های فرد است .

طبیعی است که ما علاقه مند به این نمونه کوچک تنها نیستیم بلکه علاقه مند به داشتن نمره ای هستیم که انتظار می رود فرد در هر نمونه ای از سوالات رضایت مندی شغلی داشته باشد به دست آورد .

از این رو فکرما در این جا بر این مطلب متمرکز می شود که نمونه ی مورد نظر تا چه حد دقیقاً با مرجع مربوطه مطابقت و هم خوانی دارد . واضح است که این مرجع نیز بزرگ و تا حدودی نامشخص است .

بنابراین این سوال نیز پیش می آید که آیا اگر پرسش هایی دیگر از همین مرجع مطرح شود و یا پرسش ها در موقعیت های دیگر مثلاً یک هفته بعد ، یک ماه بعد و یا شش ماه بعد ارائه شود نتیجه به چه صورت خواهد بود ؟ وقتی که به سنجش یک صفت یا خصیصه می پردازیم در واقع کیفیتی را اندازه می گیریم که در طول زمان های مختلف و دامنه ای از موقعیت های خاص، دست کم تا حدودی ثابت است .

البته درجه ی پایداری این صفات کامل نیست زیرا شرایط محیط تغییر می کند ، افراد تغییر می نند و رفتارها و عوامل موجود تا حدی ناپایدار و غیرقابل پیش بینی هستند ، اما تا آن اندازه که این ثبات و پایداری وجود دارد به دست آوردن نمره ای برای فرد (با انجام یک آزمون و سنجش خصیصه ) دارای اهمیت است . پیداست که نمره ی کسب شده توسط فرد نمی تواند نمره ی حقیقی وی باشد و دارای مقداری خطای اندازه گیری است .

نمره ی حقیقی به صورت مقدار متوسط اندازه گیری های مکرری تعریف می شود که وقتی تعداد این اندازه ها با استفاده از روش های اندازه گیری یکسان ( پرسشنامه های همتا یا موازی ) به گونه ای نا محدود افزایش یابد و به آن نزدیک می شود . البته اصطلاح یکسان ، شرطی است که مسلماً در دنیای واقعی نمیتوان به آن دست یافت .

دو آزمون را در صورتی موازی یا همتا می گویند که میانگین ، واریانس، تعداد سوالات و سطح دشواری سوالات آنها (برآورد درجه ی دشواری سوال به وسیله ی درصد افرادی که به سوال، پاسخ درست داده اند مشخص می گردد ) با هم برابر باشد و بر اساس هدف و محتوای واحدی ساخته شده باشند .

مدل کلاسیک اعتبار ، نمره ی پرسشنامه را به عنوان نمره ای در نظر می گیرد که دارای دو مولفه یا دو جزء اصلی جمع پذیر یعنی نمره ی حقیقی و خطاست :

تحلیل آماری با spss

 

وقتی تعداد اندازه گیری ها نا محدود باشد ، میانگین نمره های کسب شده با میانگین نمره های حقیقی در حد برابر خواهد بود زیرا خطاها گاهی می توانند مثبت و گاهی هم منفی ظاهر شوند و در مجموع برابر صفر خواهند بود .

در بیشتر بحث هایی که از این پس ارائه می شود با نمره هایی سر و کار خواهیم داشت که به عنوان انحراف از میانگین یعنی X=X_OB-X ̅بیان می شود .

تعریف کلاسیک اعتبار بر پایه واریانس نمره حقیقی و خطا ، به صورت زیر ارائه شده است :

 تحلیل آماری با spss

که در آن S_oi^2 واریانس نمره های کسب شده ، S_ei^2 واریانس خطاها و S_ti^2واریانس نمره های حقیقی است . اگر میزان خطاها صفر باشد ، یعنی وقتی که واریانس نمره های حقیقی و واریانس نمره های کسب شده با هم برابرند، ضریب اعتبار برابر یک است . از تعریف همبستگی ، می دانید که همبستگی، مبتنی بر انحرافات از میانگین گروه مربوط است .

به طور کلی می توان نشان داد که همبستگی بین دو آزمون موازی یا همتا برابر با واریانس نمره های حقیقی تقسیم بر وایانس نمره های کسب شده است . یعنی اعتبار آزمون را می توان به عنوان همبستگی بین نمرات دو یا چند آزمون موازی یا همتا که در ممورد گروه واحدی اجرا شده باشد تعریف کرد (کتاب روان سنجی کاربردی نوشته رابرت ثرندایک، ترجمه حیدر علی هومن ، انتشارات دانشگاه تهران 1375، صفحه 197) .

فرض کنید n نفر پاسخگو به m پرسش تستی جواب داده باشند بنابراین یک ماتریس n x m از داده ها در اختیار داریم که می توان آن را به صورت درایه های موجود در مربع زیر نشان داد.

 تحلیل آماری با spss

درایه های کناری مجموع ارقام هر ردیف و هر ستون را نشان می دهد که در آن زیر نویس نقطه (•) معرف حاصل جمع برای ردیف یا ستون مربوط است . در این ماتریس هر ردیف معرف یک شخص است در نتیجه X_(i.)- نمایشگر حاصل جمع نمره های پرسش ها برای شخص i است . هر ستون معرف یک پرسش و در نتیجه X_(.j) مولفه های واریانس با استفاده از محاسبات معمولی تحلیل واریانس به صورت زیر انجام می دهیم :

تحلیل آماری با spss

بنابراین خواهیم داشت :

تحلیل آماری با spss

 

اعتبار، ثبات و پایابی نمرات آزمون را نشان می دهد .

تاکنون ملاحظه کردید که صفت مورد اندازه گیری در طول زمان ، موقعیت های خاص و همچنین از یک پرسشنامه به پرسشنامه موازی دیگر (ابعاد مختلف بی ثباتی ) تغییر میکند اما می دانیم این کیفیت ، دست کم تا حدودی ثابت است و نمره ی کسب شده در اثر ابعاد مختلف بی ثباتی، از نمره ی حقیقی دور شده است .

بنابراین باید میزان تغییرات ناشی از بعد زمان و از یک آزمایش به آزمایش دیگر (این تغییرات، عوامل خطا در نمره ی حاصل هستند ) را مشخص کنیم. چون در اعتبار می خواهیم، هماهنگی و ثبات اندازه هایی را که در زمان ها، موقعیت ها و پرسشنامه های موازی مختلف به دست آمده اند مطالعه کنیم باید تفاوت های منظم و بی ثباتی های نامنظم مربوط به همه ی ابعاد فوق را به عنوان منابع "خطا" در نظر بگیریم و در تجزیه و تحلیل نتایج نیز به همین منوال با آنها رفتار کنیم (این تغییرات قبلاً در نمره ی کسب شده دفن شده اند و به عنوان جزئی از آن منظور شده اند ) .

تاکنون مسأله ی اعتبار را از جهت منطق اساسی بررسی نمودیم و بر پایه ی واریانس نمره ی حقیقی و واریانس خطا، تعریف کلاسیک اعتبار را ارائه دادیم . در SPSS مسأله را از جهت روش های گرد آوری داده ها اندازه گیری می کنیم .

توجه کنید که در تمام تعریف هایی که برای سنجش اعتبار وجود دارند ابتدا ابعاد مختلفی را که منابع احتمالی واریانس در نمره ی حاصل می باشند مشخص می کنند یعنی اندازه های مولفه های ممن واریانس را مدنظر قرار می دهند ، به عنوان مثال در به دست آوردن اعتبار از طریق ضریب آلفای کرونباخ، سه جزء اصلی واریانس وجود دارند :

مولفه ی واریانس بین اشخاص که با نماد S_1^2 نمایش می دهیم (واریانس نمرات آزمون که همان واریانس ستون مقیاس در ماتریس داده ها با ستون جمع کل است ). مولفه واریانس بین سوال ها که با نماد S_1^2 نمایش می دهیم (واریانس سوال i ام ).

مولفه ی واریانس مربوط به اثر متقابل اشخاص با سوال ها، در این مورد باید بگوییم که همان جمله پس مانده یا باقی مانده است که شما آن را در محاسبات تحلیل واریانس ملاحظه کردید و برابر بود با :

( واریانس پرسش ها ) – ( واریانس اشخاص ) – ( واریانس کل) = واریانس باقیمانده ها در مطالب فوق و فرمول آلفای کرونباخ، تنها منبع واریانس خطا عبارت است از اثر متقابل بین اشخاص و پرسش ها (جمله ی باقی مانده و دیگر منبع خطایی نداریم زیرا اشخاص به سوال های یک پرسشنامه پاسخ می دهند و تغییری در آنها صورت نمیگیرد در نتیجه فاقد واریانس خواهد بود و سوال ها به عنوان اثر ثابت در نظر گرفته می شوند (یعنی نمی توان نتایج را به سوال های دیگر از همین مرجع تعمیم داد .)