چنانچه بخواهید نزدیک بودن توزیع «داده ها» (data)به یک توزیع «نرمال»(normal) را بررسی کنید، استفاده از نمودار های از نوع Histogram (هیستوگرام) مفید است.
اما با این حال، تعیین نرمال بودن توزیع داده ها با کمک نمودارهای «هیستوگرام» می توان دقت کافی را نداشته باشد.
به همین دلیل، باید از «آزمون» مناسب استفاده کرد.
همانطور که می دانید از آماره های Skewers (چولگی» و Kurtosis (گشتاوری) برای بررسی برای بررسی انحراف از نرمال بودن، «توزیع جنبه های غیر نرمال» یا « انحراف از نرمال بودن توزیع داده ها» استفاده می شود.
روش دیگر، مقایسه کل توزیع با توزیع نرمال است.
آمار دانانی همچون Kolmogorov - smirnov (کلمو گروف_ اسمیرنوف) و Shapiro - Wilk (شاپیرو ویلک) اینکار را انجام داده اند.
در این آزمون:
اگر P > 0.05 ، توزیع نمونه اختلاف معنی داری با توزیع نرمال نداشته و به عبارتی ، توزیع نمونه نرمال است
اگر P < 0.05 ، توزیع نمونه اختلاف معنی داری با توزیع نرمال دارد. به عبارت دیگر، توزیع نمونه نرمال نیست.
این آزمون ها از این نظر که قابلیت نمایش و بیان نرمال بودن توزیع نمونه را دارند مهم هستند، ولی نقطه ضعف هایی نیز دارند. در نمونه های با حجم بالا مرتکب شدن خطا نسبت به نمونه های با حجم بالا بودن یک توزیع را اشتباه رد کنیم در حالیکه آن نمونه ها دارای توزیع نرمال باشند.
بنابراین توصیه ما این است که:
این آزمون را روی همۀ نمونه ها اجرا کنید.
نمودار داده ها را رسم کنید تا از «نرمال» یا «غیرنرمال» بودن آن ها مطمئن شوید.