رگرسیون چندگانه یک معادله پیش بینی است که همبستگی بین مجموعه ای از دو یا چند متغیر پیش بین و یک متغیر ملاک را تعیین می کند.

برای مثال، ممکن است معدل کارشناسی، معدل کارشناسی ارشد و نمرات آزمون ورودی (شفاهی، کمی و تحلیلی) را برای پیش بینی موفقیت در دانشگاه های تحصیلات تکمیلی در نظر بگیریم.

رگرسیون چندگانه به دلیل قابلیت و دقتی که دارد، یکی از پرکاربردترین فنون آماری در علوم اجتماعی است.

این روش می تواند برای تحلیل داده های حاصل از طرح های تحقیق کمی مثل آزمایشی، علی- مقایسه ای و همبستگی مورد استفاده قرار گیرد.

رگرسیون چندگانه می تواند داده های اسمی، ترتیبی، فاصله ای و نسبی را مورد استفاده قرار دهد و نه تنها رابطه بین متغیرها، بلکه مقدار و شدت روابط را نیز نشان دهد.

 

مثال :

کاربرد رگرسیون چندگانه درمطالعه همبستگی که به وسیله لوننبرگ و کلومبا (1992) انجام شد، نشان داده شد.

هدف آنها از مطالعه، شناسایی عوامل شخصیتی و سطح تحصیلات بود که بین مدیران شهری با عملکرد بالا و عملکرد متوسط تمایز ایجاد می کرد ( 179 = n ).

برای اندازه گیری عملکرد مدیر (متغیر وابسته) چهار متغیر مستقل زیر مورد استفاده قرار گرفت: رتبه بندی توسط سرپرست، رتبه بندی توسط مقایسه زوجی، رتبه بندی توسط هم ردیفان و رتبه بندی توسط معلم، که نمره کل عملکرد مدیر حاصل مقادیر به دست آمده از این چهار متغیر بود. 

شانزده عامل مربوط به شخصیت (که با 16 PF اندازه گیری شد) و سطح تحصیلات (فوق لیسانس یا دکتری) متغیرهای پیش بین (متغیرهای مستقل) بودند.

تحلیل گام به گام رگرسیون، چندگانه نشان داد که عوامل E (نفوذ)، M (تحلیل)، Q_2 (خود اتکایی)، A (صمیمیت) و سطح تحصیلات دکتری، به عنوان متغیرهای اصلی پیش بین عملکرد عالی مدیران شهری عمل می کردند (جدول 4.3 را مشاهده کنید).

به دلیل این که رگرسیون چند گانه، یکی از پرکاربرترین فنون آماری در علوم اجتماعی است، این روش را با استفاده از مثال و تا حدودی مفصل تر شرح خواهیم داد.

 

معمولاً اولین گام در رگرسیون چندگانه، محاسبه همبستگی بین بهترین متغیر پیش بین و متغیر ملاک است.

ضریب همبستگی چندگانه (R) در جدول 4.3 نشان داده شده است.

چون عامل E (نفوذ)، بهترین پیش بینی کننده است، به عنوان اولین متغیر پیش بین وارد رگرسیون چندگانه شده است.

اگر شما متغیری را از قبل تعیین نکرده باشید، برنامه رایانه ای، تحلیل رگرسیون چندگانه را با قوی ترین پیش بینی کننده متغیر ملاک آغاز خواهد کرد.

فرض کنید که شما ترتیب متغیرهای پیش بین را برای ورود به تحلیل رگرسیون چند گانه مشخص نکرده باشید.

در این صورت، بعد از انتخاب بهترین متغیر پیش بین، برنامه رایانه ای برای دومین متغیر پیش بینی کننده متغیر ملاک دست به جست و جو خواهد زد.

این متغیر پیش بین دوم بر مبنای همبستگی گشتاوری (r) با متغیر ملاک انتخاب نشده است.

بلکه، متغیر پیش بین دوم بر این مبنا انتخاب می شود که تا چه اندازه می تواند پیش بینی به دست آمده به وسیله متغیر اول را بهبود بخشد.

یک متغیر چه ویژگی هایی باید داشته باشد تا بتواند به عنوان متغیر پیش بین دوم انتخاب شود؟

در پاسخ باید گفت که اول این که، کمترین همبستگی را با متغیر پیش بین اول داشته باشد.

دومین ویژگی متغیر پیش بین ثانویه آشکار و بدیهی است و آن این که با متغیر ملاک، بیشترین همبستگی را داشته باشد.

خلاصه این که، متغیر پیش بین متغیری است که با متغیر پیش بین اول، کمترین همبستگی و با متغیر ملاک، بیشترین همبستگی را داشته باشد.

سومین متغیر پیش بین که وارد تحلیل رگرسیون چندگانه می شود، متغیری خواهد بود که پیش بینی انجام شده توسط دو متغیر پیش بین قبلی را بهبود می بخشد.

برنامه رایانه ای، افزودن متغیرهای پیش بین را تا جایی ادامه خواهد داد که هیچ متغیر پیش بین دیگری باقی نمانده باشد.

هر متغیر پیش بین جدید نسبت به متغیر پیش بین قبلی، بهبود کمتری در R ایجاد خواهد کرد و با اضافه شدن متغیرهای پیش بین جدید تر، سرعت بهبود R کمتر خواهد شد.

در این جا می توانیم معنای بیشتری را برای R در نظر بگیریم.

ضریب همبستگی چندگانه (R) مقیاسی برای اندازه گیری رابطه بین یک متغیر ملاک و مجموعه ای از متغیرهای پیش بین است.

مقدار R با ورود هر متغیر به تحلیل رگرسیون چندگانه افزایش می یابد.

از این رو، در جدول 4.3 مشاهده می کنیم که با ورود یک به یک متغیرهای پیش بین، مقدار R برای پیش بینی عملکرد بالا به تدریج از 49/0 به 64/0 افزایش یافته است.

مقدار 64/0 بهترین برآوردی را نشان می دهد که یک فرد می تواند بر اساس متغیرهای پیش بین فهرست شده در جدول 4.3 از عملکرد مدیر داشته باشد.

مقدار R می تواند بین 00/0 تا 00/1 باشد؛ وجود مقادیر منفی غیر ممکن است. هر چه مقدار R بزرگ تر باشد، پیش بینی بهتری از متغیر ملاک به عمل خواهد آمد.

اگر R به توان دو برشد، آماره ای به دست می آید که به نام ضریب تعیین (R^2) شناخته می شود.

ستون دهم جدول 4.3 مقدار ضریب R^2 را بر اساس مقدار R مندرج در ستون نهم نشان می دهد، برای مثال، ضریب R^2 برابر با 41/0 است که مجذور ضریب R می باشد (64/0).

ضریب R^2 مقدار واریانس متغیر ملاک را نشان می دهد که به وسیله یک متغیر پیش بین یا ترکیبی از متغیرهای پیش بین تبیین می شود.

هر مقدار b در معادله رگرسیون چندگانه، یک وزن رگرسیونی محسوب می شود که می تواند از 1- تا 1+ تغییر کند.

یک وزن رگرسیونی (که بعضی اوقات وزن b خوانده می شود) ضریبی است که در یک معادله رگرسیون به هر متغیر پیش بین اضافه می شود تا ارزش پیش بینی متغیرها به حداکثر برسد.

وزن های b قابل تبدیل به وزن های بتا (B) است.

وزن های بتا، وزن های رگرسیونی در یک معادله رگرسیون چندگانه است که در آن تمامی متغیرهای معادله به شکل نمره استاندارد در آمده است.

برخی از محققان، وزن های بتا را ترجیح می دهند، زیرا این وزن ها یک مقیاس کامل را شکل می دهند.

برای مثال، یک وزن بتای برابر با 40/0+ ، صرف نظر از متغیر پیش بین مربوط، شدت بیشتری از یک وزن بتای 30/0+ دارد.

در مقابل، اندازه وزن b، به شکل مقیاس متغیر پیش بین مربوط بستگی دارد.

انواع مختلفی از تحلیل رگرسیون چند گانه وجود دارد که عبارتند از: گام به پیش (پیش رو)، گام به پس (پس رو) و گام به گام.

هر یک از انواع تحلیل رگرسیون چندگانه، روش متفاوتی را برای انتخاب زیر مجموعه ای از متغیرهای پیش بین به کار می برند تا بهترین پیش بینی از یک متغیر ملاک به دست آید.

در رگرسیون چند گانه پیش رو، متغیر پیش بینی که منجر به بیشترین افزایش در R می شود به مجموعه فعلی اضافه می گردد و افزودن متغیرها تا جایی ادامه می یابد که اضافه کردن متغیر به افزایش معنادار آماری منجر نگردد.

در رگرسیون چند گانه پس رو، همه متغیرهای پیش بین در وهله اول وارد تحلیل می شوند و سپس مرحله به مرحله، متغیری که به کوچکترین کاهش در R منتهی می شود، حذف می گردد تا هنگامی که یک کاهش معنادار آماری رخ دهد.

در رگرسیون چندگانه گام به گام، هر دو روش پیش رو و پس رو ترکیب می شوند.

لوننبرگ و کلومبا (1992) روش رگرسیون چند گانه گام به گام را به کار برده بودند.

گاهی اوقات تحلیل رگرسیون چندگانه توسط محققان به درستی به کار برده نمی شود.

یکی از مسائل رایج این است که پیش بینی با تبیین اشتباه گرفته می شود.

اگر هدف محقق بهینه سازی پیش بینی یک متغیر ملاک باشد، همه این روش ها نسبتاً ساده و قابل استفاده اند.

با این حال، اگر نظریه ای داشته باشید که برای متغیرهای پیش بین شما معناداری علّی را نسبت بدهد، باید در انتخاب روش تحلیل خود دقیق باشید.

در چنین وضعیتی، نباید معناداری علّی یک متغیر پیش بین را با وزن رگرسیونی یا مقدار افزایش R^2 آن در یک معادله رگرسیون چندگانه اشتباه بگیرید.

اگر می خواهید یک نظریه علت و معلولی را با استفاده از داده های همبستگی چند متغیره بیازمایید، کار درستی نیست، باید به جای آن از تحلیل مسیر یا مدل سازی معادله ساختاری استفاده کنید.

 

باید یک تعادل منطقی بین اندازه نمونه و تعداد متغیرهای پیش بین مورد استفاده در تحقیق وجود داشته باشد.

با یک حساب سر انگشتی می توان گفت که به ازای هر متغیری که در تحلیل رگرسیون چندگانه منظور می شود، حداقل باید 15 آزمودنی به تعدا نمونه اضافه شود.

با استفاده از این قاعده، برای تحلیل رگرسیون چندگانه ای که دارای سه متغیر پیش بین است.

یک نمونه حداقل 45 نفری را باید انتخاب کنید.