تحلیل خوشه ای یک روش چند متغیری است که هدف آن طبقه بندی یک نمونه از آزمودنی ها یا اشیاء بر اساس مجموعه ای از متغیرها است که نتیجه ی آن تشکیل گروه هایی با اعضاء مشابه است.

تحلیل خوشه ای

تحلیل خوشه ای یک روش چند متغیری است که هدف آن طبقه بندی یک نمونه از آزمودنی ها یا اشیاء بر اساس مجموعه ای از متغیرها است که نتیجه ی آن تشکیل گروه هایی با اعضاء مشابه است.

به طور مثال، در حوزه ی روان پزشکی، دسته بندی بیماران بر اساس مجموعه ای از نشانگان بالینی امکان انتخاب نوع مناسبی از درمان را برای هر گروه از بیماران فراهم می کند.

در تحلیل خوشه ای، سازه کاری برای تمایز میان متغیرهای مرتبط و نامرتبط در ایجاد خوشه ها وجود ندارد.

بنابراین، انتخاب متغیرهایی که در تحلیل خوشه ای وارد می شوند، باید به واسطه ی ملاحظات مفهومی مقید و محدود شوند.

به طور مثال، اگر یک متغیر نامربوط با حوادث با متغیرهایی که گمان می رود با آسیب های شغلی ارتباط دارند همراه شود، از لحاظ مفهومی خوشه های منسجمی تشکیل نمی شود.

داده های فاصله ای، ترتیبی و طبقه ای می توانند در تحلیل خوشه ای به کار روند، لیکن آمیزه ای از انواع گوناگون متغیرها، تحلیل خوشه ای را غامض می کند.

روش های گوناگونی برای تشکیل خوشه ها وجود دارد که در این جا به برخی از آن ها اشاره می شود.

روش واردز (Word's Method):

در این روش تمام جفت خوشه های ممکن در میان داده ها تشکیل و مجموع مجذورات فواصل در هر خوشه محاسبه می شود و سپس مجموع مجذورات فواصل تمام خوشه ها جمع و در نهایت، آن ترکیبی که کمترین مجموع مجذورات را نشان دهد، انتخاب می شود. روش واردز اغلب خوشه هایی با حجم مساوی تولید می کند که همیشه مطلوب نیست.

روش مرکزواره:(Centrorid Mehod)

در این روش، مرکزواره یا همان میانگین متغیر برای هر خوشه محاسبه می شود و فاصله میان این مرکزواره ها مبنای تلفیق یا جداسازی خوشه ها قرار می گیرد. خوشه هایی که میانگین های آن ها نزدیک به هم است، در هم آمیخته می شوند. روش مرکزواره ها از توان خوبی جهت جداسازی گروهای متمایز برخوردار است.

روش های نسبت F (F- Vatio Methods):

روش های نسبت F شباهت زیادی با محاسبه نسبت F در تحلیل واریانس دارند. در این روش ها، طوری خوشه ها تشکیل می شوند که مجموع مجذورات بین گروهی نسبت به مجموع مجذورات دون گروهی یا مجموع مجذورات کل بیشینه مقدار شود. از میان روش های تحلیل خوشه ای، روش خوشه بندی K- Means دارای مزایای خوبی است. در این روش، پیشاپیش تعداد خوش ها به دلخواه مشخص می شود و بهترین راه حل خوشه بندی اتخاذ می شود.

هنگامی که داده های نسبتاً گسترده ای در اختیار است، تحلیل خوشه ای غیر سلسله مراتبی (K- Means) کاربرد مؤثری در تشکیل خوشه ها دارد. به خاطر این روش K- Means به هر آزمودنی اجازه ی جابه جایی در خوشه های گوناگون را می دهد، اغلب این روش ترجیح داده می شود.

 

به طور کلی، در انتخاب نوع تحلیل خوشه ای، این سه نکته را به خاطر داشته باشید:

اگر داده های گسترده ای در اختیار دارید که آمیزه ای از متغیرهای فاصله ای و طبقه ای هستند، از تحلیل خوشه ای Two Step Cluster استفاده کنید.

- اگر قصد دارید حداکثر خوشه را از داده ها اندک استخراج کنید، از روش سلسه مراتبی Hierarchical استفاده کنید.

- اگر داده های نسبتاً گسترده ای در اختیار دارید و همچنین از تعداد خوشه های قابل استخراج آگاهی دارید، روش K- Means را به کار ببرید.

پس از ذکر مقدمه ی کوتاهی راجع به تحلیل خوشه ای، یک عنوان پژوهشی که لازمه بررسی آماری آن تحلیل خوشه ای است، در زیر مطرح می شود.

مثال پژوهشی:

بررسی طولی اثر متغیرهای شخصیتی در بروز حوادث شغلی.

فرضیه های پژوهشگر:

کارگردانی که میانگین آن ها در روان نژندی، حواس پرتی و مخاطره جویی بالاتر از همکارانشان است، بیشتر دچار حادثه ی شغلی می شوند.

برای تقسیم نمونه ی پژوهش به دو گروه متمایز، از روش تحلیل خوشه ای K- Mean Cluterاستفاده می شود.

فرآیند اجرایی تحلیل خوشه ای در ادامه بیان شده است:

- از سربرگ Analyze گزینه ی Classify و از انشعاب آن گزینه ی-K- Mean Cluter را انتخاب کنید.

- متغیرهای شخصیتی را از جعبه ی متغیرها به جعبه Variables منتقل کنید و پیش گزیده های SPSS، یعنی تعداد خوشه برابر با 2، Numder of Clusters و Iterate را علامت دار نگه دارید.

- از کادر ارتباطی تحلیل خوشه ای (شکل 11) بر روی گزینه ی Save کلیک کنید و گزینه ی Cluster Membership را علامت دار کنید تا برای دو خوشه ی درخواستی یک متغیر با کد 1 و 2 در محیط SPSS ایجاد کند.

- گزینه ی Option را از کادر ارتباطی تحلیل خوشه ای کلیک کرده و دو گزینه ی Initial Cluster Centers و ANOVA table را علامت دار نمایید.

نخستین گزینه ی میانگین متغیرها را برای خوشه ها و دومین گزینه مقادیر F و سطوح معنی داری (تفاوت میان خوشه ها را از لحاظ متغیرهای پژوهش) را نشان می دهند.

- از کادرهای ارتباطی خارج شوید و با کلیک بر گزینه ی OK فرمان را اجرا کنید.


روش های تحلیل خوشه ای در spss


روش های تحلیل خوشه ای در spss

 

در نخستین جدول از خروجی 11، مرکزوارهای اولیه ی خوشه ها وجود دارند.

به بیان دیگر، مرکزواره ی 30 برای متغیر Cognitive Failure، 12 برای متغیر Neurosis و 8 برای متغیر Risk taking به عنوان میانگین های اولیه محاسبه شده اند و سپس نمره ی هر فردی که به این میانگین ها نزدیک است، به خوشه اول و اگر با این مرکزوارها فاصله ی زیاد دارد به خوشه 2 وارد می شود.

نمره های 79، 46 و 25 به عنوان مرکزوارهای خوشه دوم در نظر گرفته شده اند.

در دومین جدول از خروجی 11، بعد از انتخاب مرکزوارهای اولیه ی خوشه ها، هر آزمودنی بر اساس فاصله ای که با مرکزوارهای خوشه دارد، به نزدیک ترین خوشه گمارده می شود.

بعد از آن که تمام آزمودنی ها به خوشه ها گمارده شدند، مرکزوارهای خوشه ها مجدداً محاسبه می شود. گمارش موارد در خوشه ها و محاسبه ی مرکزوارهای جدید تا جایی ادامه پیدا می کند که تغییر محسوسی در خوشه ها رخ ندهد.

پیش گزیده ی SPSS برای گمارش گوناگون و محاسبه ی مرکزوارهای جدید 10 می باشد. معمولاً تا پیش از 10 چرخش، تفاوت میان مرکزوارهای جدید به صفر می رسد؛ به عبارت دیگر، هرگونه جایگزینی آزمودنی ها در خوشه های گوناگون، منجر به اختلاف بیشتر میانگین خوشه ها نمی شود.

اگر با اجرای 10 چرخش تغییر در مرکزواری خوش ها به صفر منتهی نشود، بر گزینه ی Iteration در کادر ارتباطی تحلیل خوشه ای کلیک کرده و در جعبه ی Maximum Iteration عدد بزرگ تری (مثلاً 20) را وارد کنید. همان گونه که در دومین جدول از خروجی 11 ملاحظه می شود، در ششمین چرخش، تغییر در مرکزواره ی خوشه ها به صفر رسیده است.

در سومین جدول از خروجی 11، میانگین سه متغیر شخصیتی برای خوشه ی 1 و 2 درج شده است. میانگین حواس پرتی، روان نژندی و مخاطره جویی خوشه ی یک به ترتیب برابر است با 57/41، 11/27 و 12/11. پرواضح است که سطح حواس پرتی، روان نژندی و مخاطره جویی خوشه ی دوم به مراتب بیشتر از خوشه ی اول است.

بنابراین، از لحاظ آماری محتمل است که برای آزمودنی های خوشه ی دوم حوادث شغلی بیشتری رخ دهد. در سومین جدول، نتایج یک تحلیل واریانس میان خوشه ها از لحاظ سه متغیر شخصیتی انجام گرفته است. با توجه به مقادیر F تحلیل واریانس، بیشترین و کمترین تفاوت میانگین گروه ها مربوط به متغیر روان نژندی و مخاطره جویی است.

26 نفر در خوشه ی اول (افراد سالم) و 152 نفر (مستعد حادثه) در خوشه ی دوم جای گرفته اند.

نکته ی مهم:

در پژوهش های طولی برای دسترسی به آزمودنی ها و ثبت و ضبط حوادث آن ها و از همه مهم تر مقایسه ی دو گروه از لحاظ میزان حوادث، مستلزم آگاهی از نام و نشان این آزمودنی ها می باشد.

بنابراین، در پرسش نامه ی پژوهش، علاوه بر ویژگی های شخصیتی، درج نام یا یک کد که برای آن ها کاملاً شناخته شده باشد، ضروری است.

برای دریافت متن کامل این مقاله آموزشی بسته آموزش تحلیل آماری با spss را تهیه کنید:

شما با این بسته می توانید تحلیل آماری با spss و amos را کامل و آسان بیاموزید

و قطعا قادر می شوید کارهای آماری را حودتان انجام دهید

چگونه؟

بسته آموزشی تجزیه تحلیل آماری با SPSS و AMOS

از صفر تا صد آموزش  spss

آموزش مباحث اساسی AMOS

آموزش به زبان ساده ، موضوعی و گام به گام همراه با تصویر

33 پکیج (1378 صفحه تصویری)+ به همراه همه مقالات آموزشی این سایت درباره spss

لطفا و خواهشا برای سوال های آماری و رفع اشکال تماس نگیرید

هر آنچه لازم باشد در این بسته آموزشی آمده است.


هر سوالی دارید بپرسید:
انتخاب جدیدترین موضوعات روانشناسی، مشاوره و علوم تربیتی و انجام تخصصی پروپوزال:
شماره تماس: 09011853901

 دانلود رایگان کتاب بانک موضوع پایان نامه در کانال تلگرام