در خصوص تصادفی بودن تحلیل آماری و ازمون گردش، فرض کنید مشاهداتی به صورت x1,x2,⋯,xn در اختیار داریم. از طرفی اگر میانه این دادهها را m بنامیم، میدانیم که نصف مقدارها از میانه بزرگتر و بقیه از میانه کوچکتر هستند. برای هر یک از مقادیر با استفاده از دو برچسب L و U مشخص میکنیم که آیا از میانه بزرگتر یا کوچکتر هستند. بنابراین برای مثال اگر xi بزرگتر ازm باشد، برچسب آن را U در غیراینصورت L انتخاب میکنیم.
برای روشن شدن موضوع به جدول زیر توجه کنید.
به این ترتیب توالی از برچسبهای تحلیل آماری U و L حاصل خواهد شد که نشان میدهد کدام یک از مقادیر از میانه بیشتر یا کمتر هستند.
گردش یا دو برای دادههای «دو وضعیتی» (Dichotomous) تعریف شده است. به این معنی که متغیری که برای بررسی یا شمارش گردشها به کار میرود باید دو مقدار داشته باشد. تعداد توالی تکرارهای این مقدارها، تعداد گردش را نشان میدهد.
با توجه به جدول بالا، میتوانیم گردش یا دو را تعریف کنیم. در این حالت روند تکرار برچسبها را گردش تحلیل آماری یا دو مینامند. هرگاه در توالی برچسبها به یک برچسب متفاوت برخورد کنیم یک گردش ایجاد شده است. بنابراین با توجه به روند برچسبهای جدول بالا تعداد گردشها برابر است با ۲٫
فرض صفر (تصادفی بودن داده) را رد میکنیم اگر تعداد گردشها کوچک باشد. به بیان دیگر اگر r≤c1 فرض صفر رد میشود زیرا به نظر میرسد که یک روند در بین مشاهدات وجود دارد. البته مقدار c1 را با توجه به توزیع r و سطح معنیداری آزمون تعیین خواهیم کرد.
حال به یک مثال دیگر بپردازیم. واضح است که برای برچسبهای زیر تعداد گردشها برابر ۹ است.
به این ترتیب به نظر میرسد که یک حالت چرخشی بین مشاهدات وجود دارد. بنابراین به نظر میرسد که اگر تعداد گردشها با توجه به تعداد مشاهدات خیلی زیاد باشد، «تصادفی بودن» (Randomness) دادهها مورد اشکال است. به این ترتیب اگر r≥c2 باشد، فرض تصادفی بودن دادهها رد میشود زیرا به نظر میرسد که حالت تناوبی در بین دادهها وجود دارد.
به این ترتیب میتوانیم برای رد کردن فرض صفر که بیانگر تصادفی تحلیل آماری بودن دادهها است دو دلیل بیاوریم. اگر تعداد گردشها از مقدار c1 کمتر یا از c2 بیشتر باشد، فرض تصادفی بودن دادهها را رد خواهیم کرد.
همانطور که مشاهده کردید، گردشها براساس دادههای دو وضعیتی ساخته میشوند و مشخص است که این برچسبها تحلیل آماری یا دادههای دو وضعیتی دارای توزیع دوجملهای (Binomial Distribution) هستند.
فرض کنید که تعداد Lها برابر با n1 و تعداد Uها نیز برابر با n2 است بطوری کهn1+n2=n. با توجه به اینکه متغیر تصادفی R که تعداد گردشها است، یک متغیر تصادفی گسسته با تکیهگاه متناهی است، میتوانیم تابع احتمال آن را برحسب مفهوم احتمال براساس فراوانی نسبی بدست آوریم.
اگر r=2k یعنی تعداد گردشها زوج باشد، احتمال از طریق رابطه زیر محاسبه میشود.
و اگر تعداد گردشها فرد یعنی r=2k+1 باشد رابطه محاسباتی برای احتمال گردشها به صورت زیر خواهد بود.
فرض کنید توالی از برچسبها به صورت زیر در اختیارتان قرار گرفته است. میخواهیم تشخیص دهیم که با چه میزان سطح آزمون، میتوان تصادفی بودن آنها را تعیین کنیم.
مطابق با رابطه بالا احتمالات را برای چند وضعیت مختلف محاسبه میکنیم.
در نتیجه اگر بخواهیم در سطح آزمون حدود ۰٫۰۱۸ تصمیم بگیریم ناحیه بحرانی به صورت زیر در خواهد آمد.
بنابراین چون تعداد گردشها در این دادهها برابر است با ۷ و از ۱۴ کوچکتر و از ۲ بزرگتر است، فرض صفر که بیانگر تصادفی بودن دادهها است، در سطح آزمون ۰٫۰۲ رد نمیشود. به این ترتیب خواهیم گفت که براساس این نمونه شواهدی مبنی بر رد فرض صفر وجود ندارد.
البته برای توزیع مجانبی آماره آزمون نیز هنگامی که مشاهدات زباد باشند، با کمک توزیع نرمال میتوان آزمون را انجام داد. اگر R تعداد گردشها، نیز متوسط تعداد گردشها و نیز واریانس گردشها باشد، آماره آزمون برای گردشها یعنی Z توسط رابطه زیر محاسبه میشود.
به این ترتیب اگر در آزمون «دو طرفه» (Two Tailed) تحلیل آماری برای گردشها با توجه به فرض صفر و فرض مقابل زیر، با توجه به صدک توزیع نرمال، اگر مقدار |Z|>Z1−α۲|Z|>Z1−α۲ باشد، فرض صفر را رد کرده و رای به غیرتصادفی بودن دادهها خواهیم داد.
همانطور که اشاره شد، در اینجا، به عنوان محل برش یا تعیین برچسبها از میانه استفاده شد. به این شکل خواهیم گفت که دادهها حول میانه به طور تصادفی پراکنده هستند. ممکن است این محل برش براساس میانگین، میانه یا هر مقدار دلخواه دیگری تعیین شود. به این ترتیب خواهیم گفت دادهها حول میانگین یا نما تصادفی هستند.
در ادامه به منظور اجرای آزمون گردش از نرمافزار SPSS استفاده خواهیم کرد و به کمک آن تصادفی بودن دادههای مربوط به یک مثال را مورد بررسی قرار میدهیم.
۱- آزمون گردش برای مشخص کردن تصادفی بودن دادهها بسیار مناسب است.
۲- یکی از اصول در تغییرات فرآیند تولید، تصادفی بودن آن است
در دادههایی که در تصویر زیر میبینید وزن ۱۶ بسته ماکارونی برحسب گرم ثبت شده است که دستگاه سنجش وزن مورد بازبینی قرار می گیرد. با استفاده از آزمون گردش میخواهیم مشخص کنیم که آیا دستگاه ترازو احتیاج به کالیبراسیون دارد یا تفاوت در وزنها، ناشی از خطای تصادفی فرآیند تولید یا اندازهگیری است.
برای انجام آزمون کافی است که متغیر مورد نظرتان را در کادر Variable List قرار دهید.
اگر میخواهیم مبنای تفکیک برای تصادفی بودن دادهها، میانه در نظر گرفته شود گزینه Median را در کادر Cut Point مشخص کنید.
از دیگر گزینههای تحلیل آماری این بخش میتوانید میانگین (Mean)، نما (Mode) و حتی مقداری دلخواه (Custom) را برای تفکیک دادهها به دو بخش معرفی کنید.
اگر میخواهید «آزمون دقیق» (Exact Test) و براساس توزیع دقیق آماره R انجام گیرید، دکمه Exact را در پنجره اصلی انتخاب و تنظیمات را در پنجره Exact Tests مانند تصویر بالا درآورید. با فشردن دکمه Continue به پنجره اولیه باز خواهید گشت.
اگر میخواهید تنظمیات دیگری که مربوط به دادههای گمشده و یا نمایش آمار توصیفی و چندکهای دادهها است را فعال کنید از دکمه Options استفاده کنید. در پنجره اصلی، با فشردن دکمه OK محاسبات انجام شده و نتیجه مطابق با تصویر زیر ظاهر خواهد شد.
عنوان | شرح |
Test Value | مقدار برش که با توجه به زیرنویس در اینجا میانه (Median) محاسبه شده است. |
Cases < Test Value | تعداد مشاهداتی که دارای مقداری کمتر از مقدار برش هستند. |
Cases >= Test Value | تعداد مشاهداتی که دارای مقداری بزرگتر یا مساوی با مقدار برش هستند. |
Total Cases | تعداد کل مشاهدات |
Number of Runs | تعداد گردشها |
Z | مقدار آماره آزمون (براساس توزیع مجانبی) |
Asymp. Sig. (2-tailed) | مقدار احتمال دو دنبالهای با توجه به توزیع مجانبی آماره R |
Exact Sig. (2-tailed) | مقدار احتمال دو دنبالهای با توجه به توزیع دقیق آماره R |
Point Probability | مقدار احتمال برای تعداد گردشها با توجه به فرض صفر و توزیع آماره R |
همانطور که در جدول خروجی مشاهده میکنید با توجه به اینکه مقدار Sig=0.429 بزرگتر از احتمال خطای نوع اول ۰٫۰۵٫ است، دلیلی برای رد فرض صفر وجود ندارد. بنابراین نمونه، گواهی بر تصادفی بودن دادهها است و نیازی به کالیبره کردن دستگاه ترازو نیست.
اگر از پنجره Syntax بخواهید دستورات را وارد کنید کافی است از کد زیر بهره ببرید. نتیجه با اجرای این دستورات به مانند قبل خواهد بود.
البته میتوانید این آزمون را در محیط «نمایشگر مدل» (Model Viewer) نیز اجرا و نتایج را نمایش دهید. کافی است که از مسیر زیر به پنجره اجرای آزمون گردش دسترسی پیدا کنید.
Analyze->Nonparamteric Tests- > One Sample
با توجه به انتخابی که در قسمت یا برگه Objective انجام دادهاید، SPSS گزینه Test Sequence را انتخاب کرده است.
مشخص است که نوع آزمون به درستی تعیین شده است. هر یک از گزینههای سمت چپ کادر Select and item با توجه به نوع آزمون انتخابی، اختیاراتی را برای انجام آزمون ظاهر میکند. برای مثال با انتخاب Test Options قادر هستید، «میزان خطا» (Significant Level) یا «سطح اطمینان» (Confidence Interval) آزمون و فاصله اطمینان را تعیین کنید. یا نسبت به نقش مقدارهای گمشده (Missing) در آزمونهایی با چند متغیری تصمیمگیری کنید.
اگر دکمه Options را که در انتهای پنجره دیده میشود، کلیک کنید، امکاناتی که مختص آزمون گردش است، ظاهر خواهد شد.
با انتخاب Sample mean، به عنوان تحلیل آماری نقطه برش برای «متغیرهای پیوسته» (Continuous Fields) از میانگین استفاده خواهد شد.
همچنین میتوانید به طور دستی گروهها را مشخص کنید.
با انتخاب گزینه Recode data into ۲ categories مقدارهایی که باید متعلق به گروه اول باشند را در لیست Define first category وارد کرده و دکمه OK را بزنید.
پس از انجام همه تنظیمات و گزینهها در پنجره اصلی با فشردن دکمه Run اجرای آزمون صورت خواهد گرفت و خروجی به شکل زیر خواهد بود.
از طرفی در ستون Decision نیز مشخص است که نتیجه اجرای آزمون تایید فرض صفر است.
البته توجه داشته باشید که نوع و فرض صفر مربوط به آزمون در ستون Null Hypothesis نوشته شده است.
در کادر سمت راست نیز نمودار مربوط به توزیع آماره گردشها یعنی R ترسیم شده است.
میانگین توزیع بوسیله خط چین مشکی تحلیل آماری و مقدار محاسبه شده گردش نیز با خط قرمز رنگ روی نمودار دیده میشود.
مقدار آماره و انحراف استاندارد تحلیل آماری آماره و مقدار Sig نیز در جدول زیرین قابل مشاهده است.
بالای هر کادر در این پنجره دکمههایی برای تهیه نسخهبرداری از نمودارها یا دادهها و چاپ نتایج وجود دارد.
توجه داشته باشید که با توجه به تعداد دادهها این روش از توزیع مجانبی (Asymptotic Distribution) آماره آزمون استفاده کرده است. در نتیجه خروجیهای مربوط به Sig همه برحسب توزیع مجانبی محاسبه شده است.