منو سایت

  • خانه
  • وبلاگ
  • تفاوت بین آمار توصیفی و استنباطی – و اینکه چرا برای شما به عنوان یک دانشمند داده مهم است

تفاوت بین آمار توصیفی و استنباطی – و اینکه چرا برای شما به عنوان یک دانشمند داده مهم است

 تاریخ انتشار :
/
  وبلاگ
تفاوت بین آمار توصیفی و استنباطی - و اینکه چرا برای شما به عنوان یک دانشمند داده مهم است

آمار نقش کلیدی در کار دانشمندان داده ایفا می کند. جمع آوری، سازماندهی، تجزیه و تحلیل و تفسیر داده ها وظایفی هستند که شامل استفاده از آمار می شوند. آمار به ارائه خلاصه‌ای از داده‌ها و ساده‌سازی حجم زیادی از اطلاعات کمک می‌کند. دو نوع اصلی آماری که دانشمندان داده از آن استفاده می کنند، آمار توصیفی و استنباطی است. هر دو نوع به دلایل مختلف برای علم داده مهم هستند و مهم است که بدانیم چه زمانی از کدام دسته استفاده کنیم.

تصویر پست وبلاگ آمار توصیفی و استنباطی 1

آمار توصیفی

خیلی ساده، آمار توصیفی برای توصیف داده هایی که جمع آوری کرده اید استفاده می شود. در آمار توصیفی از نمونه کوچکی از جامعه مورد مطالعه استفاده می کنیم. به عنوان مثال، فرض کنید می خواهیم عادات کاری کارکنان یک شرکت بزرگ را مطالعه کنیم. با بیش از 1000 کارمند، مصاحبه با هر فردی بسیار چالش برانگیز است. با این حال، می‌توانیم با بررسی 10 نفر از نمونه جامعه استفاده کنیم.

معیارهای گرایش مرکزی، مانند میانگین، میانه و حالت، در آمار توصیفی برای توصیف داده‌هایی که معمولی یا متوسط ​​هستند استفاده می‌شوند. اگر از 10 نفر در مورد چند ساعت کار در هفته نظرسنجی کنیم، نتایج ممکن است به این شکل باشد.

تعداد ساعات کار: 35، 42، 40، 37، 41، 35، 35، 45، 44، 49

میانگین با جمع کردن همه اعداد و سپس تقسیم بر تعداد افراد محاسبه می شود.

35+42+40+37+40+35+35+45+44+49 = 403 / 10 = 40.3

بنابراین، میانگین یا میانگین تعداد ساعات کار 40.3 است.

برای محاسبه میانه ابتدا اعداد را از کوچکترین به بزرگ مرتب کنید سپس وسط را پیدا کنید.

35، 35، 35، 37، 40، 41، 42، 44، 45، 49

در این حالت 40 و 41 اعداد وسط هستند. آنها را با هم جمع می کنیم و حاصل را بر دو تقسیم می کنیم تا میانه بدست آید.

بنابراین میانه ما 40+41 = 81/2 = 40.5 است.

حالت به سادگی عددی است که اغلب اتفاق می افتد. می بینیم که عدد 35 سه بار ظاهر می شود و آن را به حالت این مجموعه داده تبدیل می کند.

این مثال از نمونه بسیار کوچکی که تنها 10 نفر است استفاده می کند. هنگام کار با مجموعه داده های بزرگ، آمار توصیفی برای توضیح اطلاعات به صورت عملی مفید است. به عنوان مثال، اگر ما از 1000 نفر در مورد حقوق آنها نظرسنجی کنیم، می توانیم اطلاعات را با گفتن اینکه میانگین حقوق برای آن نمونه 46000 دلار است ارائه دهیم. برای مفید و مرتبط بودن اطلاعات، نیازی به اشتراک گذاری همه 1000 حقوق نداریم.

در حوزه آمار هم از داده های کمی و هم از داده های طبقه ای استفاده می شود. داده های کمی شامل اعدادی است که می توانند گسسته (اعداد کامل) یا پیوسته باشند. به عنوان مثال، تعداد حیوانات خانگی که کسی دارد گسسته خواهد بود، در حالی که دما مداوم خواهد بود. داده‌های طبقه‌بندی شامل داده‌های ترتیبی – آنهایی که می‌توان به‌طور منطقی ترتیب داد، و داده‌های اسمی – آنهایی که ترتیب منطقی ندارند، می‌شود. نمونه ای از داده های ترتیبی سن و نمونه ای از داده های اسمی می تواند رنگ مو باشد. معیارهای واریانس مورد استفاده در آمار توصیفی شامل انحراف معیار، واریانس، چولگی و دامنه است. همبستگی و مجذور کای دو مورد از رایج ترین معیارهای ارتباط هستند.

آمار توصیفی اغلب از عناصر بصری برای توصیف مجموعه داده ها استفاده می کند. نمودار دایره ای، نمودار میله ای، هیستوگرام، و نمودار پراکندگی نمونه هایی از روش های ارائه داده های شما هستند. انتخاب بهترین نمودار به عوامل مختلفی بستگی دارد، از جمله تعداد متغیرهایی که دارید، مجموعه داده های شما چقدر بزرگ است و اینکه آیا تغییرات را در طول زمان در مقابل داده های ایستا اندازه گیری می کنید یا نه. هنگام ارائه داده های شما، تصاویر می تواند بسیار مفید باشد.

آمار استنباطی

آمار استنباطی از یک نمونه معین برای استنباط یا استنباط در مورد جمعیت بزرگتر استفاده می کند. این می تواند زمانی مفید باشد که جمعیت برای مطالعه بسیار زیاد باشد. با مثال قبلی، ما 10 کارمند را مورد بررسی قرار دادیم – این نمونه ما از یک جمعیت 1000 نفری بود. آمار استنباطی به ما امکان می دهد تعیین کنیم که آیا این نمونه نماینده کل جمعیت است یا خیر.

با استفاده از آمار استنباطی می‌توانیم تخمین، پیش‌بینی یا تعمیم در مورد جمعیت انجام دهیم. به عنوان مثال، داروهای جدید در نمونه کوچکی از جامعه آزمایش می شوند. با استفاده از تئوری احتمال، می توانیم تعیین کنیم که آیا نتایج مطالعه نمونه می تواند برای کل جامعه اعمال شود یا خیر. نتایجی که از نظر آماری معنی دار در نظر گرفته می شوند باید نشان دهند که احتمال 95% یا بیشتر وجود دارد که این اثر توسط دارو ایجاد شده باشد و نه تصادفی.

آزمون فرضیه و احتمال در آمار استنباطی برای تعیین اینکه آیا یک نمونه تفاوت معناداری با جامعه دارد یا خیر استفاده می شود. آزمون هایی که معمولا در آمار استنباطی مورد استفاده قرار می گیرند شامل تحلیل رگرسیون، آزمون تی و آنالیز واریانس (ANOVA) می باشد. تحلیل رگرسیون معمولاً برای یافتن رابطه بین یک متغیر وابسته و یک یا چند متغیر مستقل استفاده می شود. آزمون های تی هنگام مقایسه گروه ها استفاده می شود و می تواند اهمیت آماری تفاوت بین آنها را به شما بگوید. ANOVA مشابه آزمون t است و می تواند برای ارزیابی درجه واریانس بین گروه ها استفاده شود.

تصویر پست وبلاگ آمار توصیفی و استنباطی ۲

تفاوت آمار توصیفی و استنباطی

آمار توصیفی داده ها را توصیف می کند، در حالی که آمار استنباطی از آن داده ها برای نتیجه گیری استفاده می کند.

آمار توصیفی بر نمونه متمرکز است در حالی که آمار استنباطی بر جامعه متمرکز است.

مجموعه داده های کوچک در آمار توصیفی استفاده می شود، در حالی که مجموعه داده های بزرگ در آمار استنباطی استفاده می شود.

نمودارها و نمودارها برای توصیف نتایج در آمار توصیفی استفاده می شوند، در حالی که در آمار استنباطی نتایج به عنوان نتیجه احتمال توصیف می شوند.

داده ها با آمار توصیفی دقیق تر هستند، در حالی که آمار استنباطی ممکن است داده های دقیق تری داشته باشد.

خلاصه

آمار بخشی جدایی ناپذیر از علم داده است و آمار استنباطی و توصیفی هر دو در زمینه های مختلف مفید هستند. هنگامی که نیاز به سازماندهی، خلاصه کردن یا توصیف جنبه های کلیدی یک مجموعه داده دارید، آمار توصیفی بهترین است. اگر نیاز به قضاوت یا نتیجه گیری در مورد جمعیت بیشتری دارید، بهترین گزینه استفاده از آمار استنباطی است. دانستن زمان و نحوه استفاده از هر نوع به شما کمک می کند تا داده ها را به گونه ای ارائه دهید که بیشترین منطق را داشته باشد.

The post تفاوت بین آمار توصیفی و استنباطی – و دلیل اهمیت آن برای شما به عنوان یک دانشمند داده اولین بار در Skillspot ظاهر شد.