آماره هایی نظیر میانگین و انحراف معیار، خصوصیت مجموعه ای داده را بصورت کلی بیان می کنند:
میانگین: عبارتست از «مجموع مقادیر» تقسیم بر «تعداد مقادیر»، که یک اندازۀ خلاصۀ مکانی و راجع به اینکه توزیع در کجا واقع شده است فراهم می آورد.
انحراف معیار: عبارتست از توان دوم واحد اندازه گیری مشخصۀ تحت مطالعه. مثلا در مثالی مربوط به نقاط ذوب، واریانس برحسب توان دوم درجات سلسیوس بیان می شود.
اغلب علاقه مندیم به واحد اندازه گیری اولیه برگردیم.
واحدهای اصلی را با بهدست آوردن ریشۀ دوم واریانس به دست می آوریم.
مقدار حاصل را «انحراف معیار» (Standard Deviation) می گویند و از آن به عنوان یک اندازۀ تغییرپذیری نیز استفاده می شود.
همانند واریانس، هر چه تغییرپذیری مقادیر مجموعۀ داده ها، بزرگتر باشد، مقدار انحراف معیار بیشتر است.
اگر تغییرپذیری وجود نداشه باشد، یعنی، اگر «تمام مقادیر مساوی» باشند، «انحراف معیار» برابر 0 خواهد بود.
البته لازم به ذکر است در داده های شامل مقادیر «دور افتاده» یا «پرت»، ممکن است میانگین و انحراف معیارها به دلیل «چولگی» و یا در حقیقت؛ «نامتقارن بودن توزیع»، کارایی مناسبی نداشته باشند.