این مقاله به مباحث تئوریک در زمینه تفاوت آزمون های آماری پارامتریک و ناپارامتریک در تحلیل آماری با spss می پردازد.
تحلیل واریانس بی پارامتری و آمار مربوط
تحلیل داده ها و استنباط درباره روابط میان متغیرها بدون استفاده از آمار نیز امکانپذیر است .
برای مثال ، گاهی داده ها به اندازه ای بدیهی هستند که در واقع به آمار نیازی نیست . اگر همه نمره های گروه آزمایشی از نمره های گروه گواه بزرگتر ( یا کوچکتر باشند ) دراین صورت آزمون آماری کاری زاید است .
همچنین ممکن است آماری داشته باشیم که ماهیت آن از آنچه که مطالعه می کردیم به کلی متفاوت باشد ، آماری که در آن به جای خصایص دقیقاً کمّی داده ها ، از خصایص دیگر آنها استفاده شده است .
ما می توانیم اثر X را بر Y استنباط کنیم در صورتی که نمره های یک گروه آزمایشی ، هنگامی که با نمره های گروه گواه مقایسه می شوند ، همگی از یک نوع باشند ، مانند زیاد ، کم . علت این امر آن است که بر اساس آرایش تصادفی و شانس ، انتظار داریم که تعداد انواع نمره های مختلف در هر گروه گواه و آزمایشی تقریباً برابر باشند .
به همین ترتیب ، اگر همه نمره های گروه آزمایشی و گواه را بر حسب رتبه آنها ، مثلاً از بزرگ به کوچک مرتب کنیم ، در این صورت بر اساس تصادف محض انتظار داریم که مجموع یا متوسط رتبه های دو گروه تقریباً برابر باشند .
اگر چنین نباشد ، اگر رتبه های بالاتر یا رتبه های پایین تر در یک گروه انباشته شوند ، در این صورت چنین استنباط می کنیم که «چیزی» غیر از عامل تصادف دست اندکار بوده است . در حقیقت ، برای رویکرد به داده ها و تحلیل آنها بجز مقایسه میانگینها و واریانسها ، بسیاری از روشهای دیگر نیز وجود دارند .
اما هرگاه کار در جهان احتمالی را دنبال کنیم اصل اساسی کار همواره یکسان است :
نتایج بدست آمده با انتظارهای نظری یا تصادفی مقایسه می شود . برای مثال ، اگر چهار تدبیر آزمایشی در مورد آزمودنیها به کار بندیم و انتظار داشته باشیم که اثر یکی از چهار تدبیر بیش از سه تای دیگر است ، می توانیم میانگین گروه مورد نظر را با میانگین یا متوسط سه گروه دیگر از راه تحلیل واریانس و شیوه مقایسه های برنامه ریزی شده مورد مقایسه قرار دهیم .
اما فرض کنید داده های ما از یک یا چند نظر بسیار نامنظم باشند و درباره روایی آزمونهای متداول معنی دار بودن بیمناکیم . چه کار باید بکنیم؟ ما می توانیم به عنوان یک راه همه مشاهده ها را برحسب رتبه مرتب کنیم . هرگاه هیچ یک از چهار تدبیر آزمایشی در مقایسه با بقیه اثر بیشتری نداشته باشد ، انتظار داریم که توزیع رتبه ها بین چهار گروه کم و بیش یکسان باشد .
اما اگر A_2 به گونه قابل ملاحظه ای دارای رتبه های بالا ( یا پایین ) باشد ، در این صورت نتیجه می گیریم که انتظار معمولی از میان رفته است . این گونه استدلال بخش مهمی از مبنای روشهای آماری به اصطلاح بی پارامتری یا نابسته به توزیع به شمار می رود . در این فصل ، اشکال معین و جالب توجهی از تحلیل واریانس بی پارامتری را بررسی می کنیم . سایر اشکال آمار بی پارامتری به اختصار بیان خواهند شد .
این فصل دو هدف عمده دارد : آشنا کردن خواننده با مفاهیم بنیادی آمار بی پارامتری ، به ویژه تحلیل واریانس بی پارامتری ، و روشن ساختن شباهت اساسی بیشتر روشهایی که برای استنباط به کار بسته می شوند .
دانشجو باید آگاه باشد که مطالعه دقیق آمار بی پارامتری سبب می شود که شخص درباره آمار و استنباط آماری بینش عمیق به دست آورد . بینش حاصل احتمالاً از آزاد کردن تفکر از شرایط مقید کننده که ظاهراً در کار کردن تنگاتنگ با ساخت آماری معمول رخ می دهد ناشی می شود .
به عبارت دیگر ، شخص چشم انداز گسترده تری را می بیند ؛ همین که مفاهیم اصلی به خوبی فهمیده شد ، او حتی می تواند آزمونهای آماری را ابداع کند . به طور خلاصه ، مفاهیم آماری و استنباطی بر مبنای مفاهیم بنیادی نسبتاً ساده تعمیم داده می شود .
آمار پارامتری و بی پارامتری
آزمون آماری پارامتری ، از نوع آزمونی که تا کنون مورد بررسی قرار داده ایم ، به تعدادی از فرضها درباره جامعه ای که نمونه های مورد استفاده در آزمون از آن انتخاب می شود وابسته است . معروفترین چنین فرضی آن است که نمره های جامعه توزیع بهنجار دارد . آزمون بی پارامتری یا نابسته به توزیع یه هیچ فرضی مانند شکل جامعه نمونه یا اندازه های پارامترهای جامعه وابسته نیست .
برای مثال ، آزمونهای بی پارامتری به فرض بهنجار بودن توزیع نمره های جامعه وابسته نیستند . مسئله فرضها دشوار ، ناراحت کننده و بحث انگیز است . بعضی از متخصصان آمار و پژوهشگران نادیده گرفتن فرضها را مسئله جدی تلقی می کنند که به عدم روایی آزمونهای آماری پارامتری منجر می شود .
بعضی دیگر بر این باورند که ، به طورکلی ، تخطّی از فرضها چندان جدی نیست زیرا آزمون هایی مانند F و t آزمونهایی قوی هستند ، بدین معنا که آنها حتی در شرایط تخطّی از فرضها نیز تقریباً به خوبی عمل می کنند ، به شرطی که تخطی از فرضها زیاد و چندگانه نباشد . با وجود این ، اکنون سه فرض اساسی و دلایل اعتقاد به قوت روشهای پارامتری را بررسی می کنیم .
همچنین فرض چهارم یعنی مستقل بودن مشاهده ها که به سبب کلیت آن – صرفنظر از نوع آزمونی که به کار می رود صادق است – و نیز به این دلیل که تخطی از آن نتایج بیشتر آزمونهای معنی دار بودن آماری را ناروا می سازد ، مورد بحث قرار می گیرد .
فرض بهنجار بودن
معروفترین فرض زیربنایی استفاده از بیشتر آمارهای پارامتری فرض بهنجار بودن است .
برای مثال ، در به کار بستن آزمون t و F ( و لذا تحلیل واریانس ) ، فرض می شود نمونه هایی که با آنها کار می کنیم از جامعه هایی انتخاب شده اند که توزیع بهنجار دارند . گفته می شود هر گاه جامعه هایی که نمونه ها از آنها انتخاب می شوند دارای توزیع بهنجار نباشند ، در این صورت آزمونهای آماری ای که به فرض بهنجار بودن وابسته اند بی اساس خواهند بود .
بنابراین ، نتیجه گیری از مشاده های نمونه و آماره های آن مورد تردید خواهد بود . گفته می شود که هر گاه بهنجار بودن جامعه تردید آمیز باشد ، یا موقعی که شخص می داند جامعه بهنجار نیست ، بعضی از استادان ، دانشجویان روانشناسی وعلوم تربیتی را تشویق می کنندکه ، چون بهنجار نبودن جامعه ها در بیشتر پژوهشهای روانشناسی و علوم تربیتی زیر سوال است ، فقط آزمونهای بی پارامتری را به کار ببندند .
موضوع به این سادگی نیست .
همسانی واریانس
مهمترین فرض بعدی ، همسانی واریانس است . در تحلیل واریانس فرض می شود که واریانسهای درون گروهها از نظر آماری یکسانند . به عبارت دیگر ، در محدوده تغییرپذیری تصادفی ، فرض می شود که واریانسها از گروهی به گروه دیگر همسانند . اگر این درست نباشد آزمون F بی اساس است . برای این گفته دلیل کافی وجود دارد .
پیش از این دیدیم که واریانس درون گروهها متوسط واریانسهای درون دو ، سه یا چند گروه از شاخصهاست . اگر تفاوت واریانسها خیلی زیاد باشد ، در این صورت محاسبه شاخص متوسط آنها تردید آمیز است . تفاوت زیاد بین این واریانسها موجب افزایش واریانس درون گروهها می شود . در نتیجه آزمون F ممکن است معنی دار نباشد ، در صورتی که در حقیقت بین میانگینها تفاوت معنی دار وجود دارد .
این هر دو فرض از طریق روشهای تجربی به طور نسبتاً کامل بررسی شده اند . جامعه های ساختگی ایجاد کرده ، از آنها نمونه هایی انتخاب شده و آزمونهای t و F درباره آنها انجام گرفته است .
شواهد موجود تاکنون حاکی از آن است که درباره اهمیت بهنجار بودن و همسانی واریانسها اغراق شده است ، دیدگاهی که مولف نیز باآن موافق است . هر گاه بر این عقیده که توزیع جامعه ها به طور نسبتاً جدی نابهنجار و واریانسها ناهمسانند دلایل کافی در دست نباشد ، معمولاً به کار بستن آزمونهای بی پارامتری به جای آزمونهای پارامتری عاقلانه نیست .
دلیل این امر آن است که توان آزمونهای پارامتری تقریباً همیشه بیش از آزمون های بی پارامتری است . ( توان یک آزمون آماری یعنی احتمال زد فرضیه صفر هنگامی که این فرضیه واقعاً غلط است ) .
یک موقعیت یا به عبارت بهتر ، ترکیبی از موقعیتها وجود دارد که ممکن است خطرناک باشد . بونو یافت که هرگاه واریانسها ناهمسان و بین حجم نمونه های آزمایشی تفاوت باشد ، آزمونهای معنی دار بودن به طور وارونه تحت تاثیر قرار می گیرند .