آمار استنباطی
ذخیره مقاله با فرمت پی دی اف
آمار استنباطی، یکی از مباحث مطرح در
روانسنجی در علم
روانشناسی بوده و به معنای ابزار و روشهایی است که برای خلاصه کردن و توصیف دادهها، دستورالعمل لازم را فراهم میسازند و روشهای لازم جهت تعمیم نتایج از
گروههای آزمودنی به گروههای وسیعتر را تهیه کرده و برای گزینش آزمودنی و جایگزینی آنها در گروههای مختلف و جمعآوری دادهها دستورالعمل ارائه میکنند. در این مقاله بعد از بیان تعریف و کاربرد آمار استنباطی به بررسی مفاهیمی چون
جامعه و
نمونه،
پارامتر و
شاخص آماری، ویژگیهای برآوردکنندهها،
آزمون فرض و ... میپردازیم.
مفاهیم و ابزارهای آماری به صورت صریح یا ضمنی بخشی از فرایند اکثر تحقیقات را شامل میشوند. نقش این مفاهیم و ابزارها را میتوان هنگام تصمیمگیری در مورد گزینش آزمودنیها، جایگزینی آنها در گروههای مختلف، توصیف دادههای جمعآوریشده و تعمیم یافتههای حاصل از مطالعه، مشاهده کرد. بنابراین در
تحقیق رفتاری،
روشهای آماری چندین نقش ایفا میکنند که با هم ارتباط دارند. روشهای آماری برای خلاصه کردن و توصیف دادهها دستورالعمل لازم را فراهم میسازند. همچنین روشهای لازم جهت تعمیم نتایج از گروههای آزمودنی به گروههای وسیعتر را تهیه کرده و برای گزینش آزمودنی و جایگزینی آنها در گروههای مختلف و جمعآوری دادهها دستورالعمل ارائه میکنند.
نقش آمار توصیفی در واقع، جمعآوری، خلاصه کردن و توصیف اطلاعات کمّی به دستآمده از نمونهها یا جامعهها است. اما محقق معمولا کار خود را با توصیف اطلاعات پایان نمیدهد، بلکه سعی میکند آنچه را که از بررسی
گروه نمونه به دست آورده است به گروههای مشابه بزرگتر تعمیم دهد.
تئوریهای روانشناسی از طریق تعمیم نتایج یک یا چند مطالعه به آنچه که ممکن است در مورد کل افراد جامعه صادق باشد به وجود میآیند.
از طرف دیگر در اغلب موارد مطالعه تمام اعضای یک جامعه ناممکن است. از اینرو محقق به شیوههایی احتیاج دارد که بتواند با استفاده از آنها نتایج به دستآمده از مطالعه گروههای کوچک را به گروههای بزرگتر تعمیم دهد. به شیوههایی که از طریق آنها ویژگیهای گروههای بزرگ براساس اندازهگیری همان ویژگیها در گروههای کوچک استنباط میشود آمار استنباطی گفته میشود.
به بیان دیگر، در پژوهشهای روانشناسی و سایر
علوم رفتاری کسب اطلاعات درباره گروههای کوچک غالبا هدف پژوهشگر نیست، بلکه او علاقمند است که از طریق یافتههای این گروه کوچک، اطلاعات لازم را درباره جامعهای که این گروه کوچک را از آن انتخاب کرده است، کسب کند. یعنی در این پژوهشها هدف پژوهشگر تعمیم نتایج بهدستآمده از یک گروه کوچک به یک جامعه بزرگتر میباشد. این تعمیم مستلزم آن است که پژوهشگر از روشهای آماری پیشرفتهتری تحت عنوان "
استنباط آماری" استفاده نماید.
در مدل استنباط آماری، فرض بر این است که میخواهیم در مورد یک مجموعه خیلی بزرگ (شاید نامحدود)، اطلاعات کسب کنیم (مثلا نمره پیشرفت تحصیلی درس ریاضی دانشآموزان کلاس پنجم دبستان در سراسر کشور). به این مجموعه، جامعه گفته میشود. گاه حجم جامعه آنقدر بزرگ است که نمیتوان تمام آن را مطالعه نمود، لذا از کل مجموعه، یک زیرمجموعه به عنوان نمونه کل مشاهدات ممکن برای مطالعه انتخاب میشود.
به این زیرمجموعه که شامل تعداد محدودی از اعضای جامعه است "نمونه" گفته میشود. اما جهت استنباط خصوصیات جامعه از روی خصوصیات نمونه، مدل آماری ایجاب میکند که اعضای گروه نمونه بهصورت تصادفی انتخاب شوند.
نمونه تصادفی به نمونهای گفته میشود که همه اعضای جامعه به یکاندازه شانس شرکت و انتخاب شدن در آن را داشته باشند. همچنین انتخاب هر فرد مستقل از افراد دیگر صورت گیرد.
برای استنباط در مورد یک جامعه، محقق خصوصیات جامعه (مثلا مقادیر مرکزی یا شاخصهای پراکندگی) را با استفاده از خصوصیات گروه نمونه توصیف میکند. به مقادیری که خصوصیات جامعه (مثل
میانگین یا
واریانس) را توصیف میکنند، پارامتر گفته میشود. به مقادیری هم که خصوصیات نمونه را توصیف میکنند،
آماره یا شاخص آماری میگویند.
برای تمییز قائل شدن بین دو مفهوم پارامتر و شاخص آماری معمولا پارامترها را با حروف یونانی و شاخصهای آماری را با حروف لاتین نمایش میدهند. به عنوان مثال برای نمایش دادن
میانگین جامعه از حرف یونانی (مو = µ) و برای نشان دادن
میانگین گروه نمونه از حرف لاتین ۱۲X' type="#_ x۰۰۰۰_ t۷۵"> (بخوانید ایکسبار) و برای نشان دادن
واریانس جامعه از حرف یونانی ۲σ (مجذور زیگما) و برای نشان دادن
واریانس نمونه از ۲S استفاده میشود.
از آنجا که اندازهگیری پارامترها (به خاطر حجم بزرگ جامعه و هزینههای بالا) عملا ناممکن است، این پارامترها با استفاده از آمارهها یا شاخصهای آماری، برآورد میشوند. اما چون نمونه فقط بخش کوچکی از یک جامعه را تشکیل میدهد، احتمال مساوی بودن آمارهها با پارامترها کم است. به عنوان مثال، اگر چه ۱۲X' type="#_ x۰۰۰۰_ t۷۵">به عنوان بهترین برآوردکننده µ بهشمار میرود، ولی این برآورد معمولا با مقداری خطا همراه است. این خطا ناشی از عوامل تصادفی بیشماری است که محقق از وجود آنها بیاطلاع است. برآوردکنندهها سه ویژگی عمده دارند:
· غیر سودار بودن: برآوردکنندهای غیر سودار است که اگر تعداد بینهایت نمونه به صورت تصادفی از یک جامعه انتخاب شود، میانگین آن در تمام نمونهها با مقدار پارامتر برآورد شده برابر باشد.
· یکنواخت بودن: منظور از یکنواخت بودن برآوردکننده آن است که هر چه تعداد یا حجم نمونه افزایش یابد، مقدار برآوردشده به مقدار پارامتر جامعه نزدیک و نزدیکتر گردد.
· کارا بودن: کارآیی برآوردکننده عبارت است از مقدار تغییر در برآورد پارامترهای جامعه از یک نمونه به نمونه دیگر. یعنی دقت برآوردکننده در پارامتر جامعه را کارآیی برآوردکننده مینامند.
البته باید توجه داشت که یک برآوردکننده ممکن است یک، دو یا هر سه خصوصیت را دارا باشد.
فرض آماری، ادعایی در مورد یک یا چند جمعیت مورد بررسی است که ممکن است درست یا نادرست باشد. به عبارت دیگر فرض آماری، یک ادعا یا گزارهای در مورد توزیع یک جمعیت یا
پارامتر توزیع یک
متغیر تصادفی است. فرضیه آماری، نقطه آغاز
آزمون فرض است و اصولا بدون داشتن فرضیه آماری امکان انجام یک آزمون دشوار است.
فرضیه آماری به دو نوع
فرض صفر (H۰) و
فرض خلاف (HA) بیان میشود. فرضیهای که در آزمونهای آماری مورد آزمون قرار میگیرد فرضیه صفر است که همیشه حاکی از عدم وجود تفاوت میباشد. اما فرض خلاف همان فرضیه پژوهشی است که میتواند جهتدار یا غیر جهتدار باشد. البته انتخاب فرضیه جهتدار دلخواه و تصادفی نیست، بلکه در صورتی فرضیه پژوهشی را میتوان جهتدار تدوین کرد که تئوری یا تحقیقات قبلی شواهدی برای آن ارائه کنند.
پس از انجام
آزمونهای آماری، محقق در مورد رد یا عدم رد فرضیه صفر تصمیم میگیرد. اگر نتایج آزمون به گونهای باشد که نتوان آن را رد کرد، جایی برای اثبات یا تایید فرضیه پژوهشی باقی نمیماند، اما اگر فرضیه صفر رد شود، بهطور غیرمستقیم فرضیه پژوهشی تایید میشود. اگر فرضیه صفر در واقع صحیح باشد ولی محقق تصمیم به رد آن بگیرد خطای نوع اول رخ داده است. بر عکس اگر فرضیه صفری در واقع فرضیهای غیرصحیح باشد ولی محقق آن را تایید کند، دچار خطای نوع دوم شده است.
آزمونهای آماری مورد استفاده جهت تجزیه و تحلیل اطلاعات به دستآمده از یک گروه کوچک (نمونه) و تعمیم آن به جامعه مورد نظر با توجه به
مقیاس اندازهگیری متغیرها، به دو گروه "
پارامتریک" و "
ناپارامتریک" تقسیم میشوند.
آزمونهای پارامتریک، به تجزیه و تحلیل اطلاعات در سطح
مقیاس فاصلهای و
نسبی میپردازند که حداقل شاخص آماری آنها
میانگین و
واریانس است. در حالی که
آزمونهای ناپارامتریک، به تجزیه و تحلیل اطلاعات در سطح
مقیاس اسمی و
رتبهای میپردازند که شاخص آماری آنها میانه و نما است.
از پرکاربردترین آزمونهای پارامتریک میتوان به
آزمون t و
آزمون تحلیل واریانس اشاره کرد. آزمون t، توزیع یا در حقیقت خانوادهای از توزیعها است که با استفاده از آنها فرضیههایی که درباره نمونه در شرایط جامعه ناشناخته است، آزمون میشود.
اهمیت این آزمون (توزیع) در آن است که پژوهشگر را قادر میسازد با نمونههای کوچکتر (حداقل ۲ نفر) اطلاعاتی درباره جامعه به دست آورد. آزمون t شامل خانوادهای از توزیعها است (برخلاف
آزمون z) و اینطور فرض میکند که هر نمونهای دارای توزیع مخصوص به خود است و شکل این توزیع از طریق محاسبه
درجات آزادی (Degrees of Freedom) مشخص میشود. به عبارت دیگر توزیع t تابع درجات آزادی است و هرچه درجات آزادی افزایش پیدا کند به
توزیع طبیعی نزدیکتر میشود.
از سوی دیگر هرچه درجات آزادی کاهش یابد،
پراکندگی بیشتر میشود. خود درجات آزادی نیز تابعی از اندازه نمونه انتخابی هستند. هرچه تعداد نمونه بیشتر باشد بهتر است. از آزمون t میتوان برای تجزیه و تحلیل میانگین در
پژوهشهای تکمتغیری یکگروهی و
دوگروهی و
چند متغیری دوگروهی استفاده کرد.
زمانی که پژوهشگری بخواهد بیش از دو میانگین (بیش از دو نمونه) را با هم مقایسه کند، باید از
تحلیل واریانس استفاده کند. تحلیل واریانس روشی فراگیرتر از آزمون t است و برخی پژوهشگران حتی وقتی مقایسه میانگینهای دو نمونه مورد نظر است نیز از این روش استفاه میکنند.
طرحهای متنوعی برای تحلیل واریانس وجود دارد و هر یک تحلیل آماری خاص خودش را طلب میکند. از جمله این طرحها میتوان به
تحلیل یکعاملی واریانس (تحلیل واریانس یکراهه) و
تحلیل عاملی متقاطع واریانس،
تحلیل واریانس چندمتغیری،
تحلیل کوواریانس یکمتغیری و
چندمتغیری و... اشاره کرد.
در پژوهشهایی که در سطح مقیاسهای اسمی و رتبهای اجرا میشوند، باید از آزمونهای ناپارامتریک برای تجزیه و تحلیل اطلاعات استفاده شود. آزمونهای زیادی برای این امر وجود دارد که براساس نوع تحلیل (نیکویی برازش، همسویی دو نمونه مستقل، همسویی دو نمونه وابسته، همسویی K نمونه مستقل و همسویی K نمونه وابسته) و مقیاس اندازهگیری میتوان دست به انتخاب زد. از آزمونهای مورد استفاده برای پژوهشها در سطح اسمی میتوان به
آزمون ۲χ،
آزمون تغییر مک نمار،
آزمون دقیق فیشر و
آزمون کاکرن اشاره کرد. از آزمونهای مورد استفاده برای پژوهشها در سطح رتبهای میتوان به
آزمونهای کولموگروف – اسمیرونف،
آزمون تقارن توزیع،
آزمون علامت،
آزمون میانه،
آزمون Uمان – ویتنی،
آزمون تحلیل واریانس دو عاملی فریدمن و... اشاره کرد.
•
سایت پژوهه، برگرفته از مقاله «آمار استنباطی»، تاریخ بازیابی ۱۳۹۹/۰۶/۱۹.