هدف اصلی در آزمون فرض برای میانگین جامعه، تصمیم در مورد مقدار یا حدود میانگین جامعه است. بنابراین میتوان از آزمونهای ساده یا مرکب، یک طرفه یا دو طرفه برای این کار استفاده کرد.
فرض کنید آزمون مورد نظر از دو فرض صفر و فرض مقابل که به صورت زیر نوشته شدهاند تشکیل شده است.
باید توجه داشت که هر دو مقدار μ۰ و μ۱ معلوم هستند و داریم μ۰<μ۱. از آنجایی که هم فرض صفر و هم فرض مقابل توزیع جامعه را مشخص میکنند، به آنها فرضیههای ساده گفته شده و این آزمون فرض به صورت فرض ساده در مقابل ساده خوانده میشود.
نیاز به آماره آزمون داریم و همانطور که میدانید، آماره آزمون باید به پارامتر مجهول جامعه (μ) وابسته نباشد.
به این منظور دو حالت را در نظر میگیریم:
آزمون Z
در این حالت با معلوم بودن واریانس جامعه آماری، آماره آزمون Z را به صورت زیر تحت فرض H0 در نظر میگیریم:
همانطور که دیده میشود، متغیر تصادفی Z تحت فرض H0 به پارامتر مجهول وابسته نیست و توزیع آن نیز نرمال با میانگین صفر و واریانس ۱ است. در نتیجه Z را آماره آزمون نامیده و ناحیه بحرانی را براساس آن ایجاد میکنیم. با توجه به فرض و شرطی که بین مقدار μ۰ و μ۱ وجود دارد ناحیه بحرانی را به صورت زیر تعریف میکنیم:
این ناحیه بحرانی نشان میدهد که اگر اختلاف میانگین نمونه از مقدار μ۰ زیاد باشد (به ازاء هر واحد از انحراف استاندارد) به رد فرض صفر رای میدهیم. مقدار c را نیز با توجه به تعریف احتمال خطای نوع اول (αα) به صورت زیر بدست میآوریم.
در این رابطه Φ(c) مقدار تابع توزیع احتمال نرمال استاندارد در نقطه c است. در نتیجه مقدار c را با استفاده از رابطه زیر بدست میآوریم:
به این ترتیب میتوان ناحیه بحرانی را به صورت Z>z(1−α) نوشت.
۱- در سطرهای اول و دوم، نوع آزمون یک طرفه
۲- در سطر سوم آزمون دو طرفه
۳- در جدول فرض صفر به صورت فرض ساده بیان شده است
نکته :
اگر بتوان توزیع جامعه را نرمال فرض کرد و واریانس جامعه نیز معلوم باشد از آزمون Z استفاده میشود. در عمل زمانی که تعداد مشاهدات بیشتر از ۳۰ باشند میتوان توزیع Z را نرمال فرض کرد. در غیر اینصورت بهتر است از آزمونهای مربوط به آماره T استفاده شود.
جامعه آماری، از پسرانی که در محدوده سنی ۱۰ تا ۱۲ سال هستند تشکیل شده است. اطلاعات قبلی نشان میدهد که متوسط قد این افراد برابر است با ۷۵ سانتیمتر و واریانس جامعه آماری برای قد این پسران برابر است با۱۱٫۶۲ سانتیمتر مربع. با توجه به تغییر شیوه تغذیه اعتقاد داریم که میانگین قد پسرها در جامعه افزایش داشته و به ۸۰ سانتیمتر رسیده است. براساس یک نمونه ۲۵ تایی میانگین قدها برابر با ۸۰٫۹۴ سانتیمتر بدست آمده است. آیا میتوان از اطلاعات قبلی در مورد قد اطمینان داشت یا میتوان به کمک آزمون آماری نشان داد که تغییر محسوسی در میزان قد پسران رخ داده است؟
برای پاسخ به این سوال دست به یک آزمون آماری میزنیم. فرضیات این آزمون به صورت زیر نوشته میشود:
همانطور که گفته شد، (فرضیه صفر)، نتایج و نظراتی که از قبل وجود داشته را بیان کرده ولی فرض مقابل نظر محقق را نشان میدهد.
اگر میزان احتمال خطای نوع اول را α=۰٫۰۵ در نظر بگیریم، خواهیم داشت:
در نتیجه با خطای ۰٫۰۵، رای به رد فرض H0 میدهیم.
در این حالت با توجه به اینکه واریانس جامعه نامعلوم است، باید از برآورد آن در آماره آزمون استفاده کرد. به همین دلیل آماره آزمون دیگر دارای توزیع نرمال نخواهد بود. اگر برآورد واریانس جامعه را با S2 نشان دهیم، خواهیم داشت:
S2، برآوردگر نااریب برای واریانس جامعه است. براساس این برآوردگر آماره آزمونT را به صورت زیر در نظر میگیریم:
حال فرض کنید آزمون مورد نظر از دو فرض صفر و فرض مقابل که به صورت زیر نوشته شدهاند تشکیل شده است.
همانطور که دیده میشود، آماره آزمون مورد نظر (T) یک متغیر تصادفی است که تحت فرضH0 به پارامتر مجهول وابسته نیست و دارای توزیع t-student با n-1 درجه آزادی است. این آماره توسط «ویلیام گوست» (William Gosset) شیمیدان و آماردان انگلیسی در سال ۱۹۰۸ معرفی و در آزمونهای آماری بسیاری به کار گرفته شد.
ویلیام گوست آماردان انگلیسی
با توجه به فرضیات مربوط به آزمون فرض که به صورت ساده در مقابل ساده نوشته شده است میتوان ناحیه بحرانی را به صورتی در نظر گرفت که با بزرگ شدن آماره آزمون فرض صفر رد شود. در نتیجه ناحیه بحرانی با توجه به احتمال خطای نوع اول (α) در این حالت به صورت زیر در خواهد آمد.
بنابراین ناحیه بحرانی برابر است با T>t1−α(n−۱). پس اگر مقدار T براساس نمونه از مقدار صدک ۱−α توزیع t با n-1 درجه آزادی بزرگتر باشد، به رد فرض صفر رای میدهیم.
البته باید توجه داشت که با تغییر فرض مقابل ممکن است ناحیه بحرانی به شکل دیگری نوشته شود. در زیر به چند حالت از فرض مقابل و ناحیه بحرانی مربوطه اشاره میکنیم:
در سطرهای اول و دوم نوع آزمون یک طرفه
در سطر سوم آزمون دو طرفه
در جدول فرض صفر به صورت فرض ساده در نظر گرفته شده است.
یک شرکت تولید کننده موتورسیکلت ادعا دارد که میزان مصرف سوخت تولیداتش در هر ۱۰۰ کیلومتر برابر با ۲ لیتر است. به این منظور سازمان بهینهسازی مصرف سوخت، ۸ موتورسیکلت از این شرکت را به منظور بررسی ادعایش تحویل گرفته. اطلاعات مربوط به مصرف سوخت این ۸ دستگاه در جدول زیر آورده شده است. در سطح خطای α=۰٫۰۵ ادعای تولید کننده بررسی میشود.
با توجه به اطلاعات جدول، میانگین و انحراف معیار نمونه محاسبه شده و آماره آزمون بدست میآید.
حال آماره آزمون را محاسبه کرده و در ناحیه بحرانی قرار میدهیم.
با توجه به صدک ۹۵ام از توزیع T با ۸−۱=۷ درجه آزادی که برابر با ۱٫۸۹۵ است، میبینیم که آماره آزمون در ناحیه بحرانی قرار گرفته و فرض صفر رد میشود زیرا ۹٫۱۶۵<1.895 پس ادعای کارخانه تولید کننده موتورسیکلت رد میشود.