در انجام بسیاری از تحلیل های آماری،توزیع نرمال نقش اساسی ایفا می کند در این روش ها به بررسی نرمال نرمال کردن یا همان نرمالیزه کردن داده ها در اس پی اس اس می پردازیم و کمی زمان بر تر از سایر دستورات گفته شده این نرم افزار می باشد.
این سؤال خیلی از هموطنان است که می پرسند استانداردسازی دادهها چه فایده ای دارد؟
پاسخ این است که استانداردسازی دادهها کمک میکند که اهمیت آنها به واحد اندازهگیریشان بستگی نداشته باشد. در نتیجه در مواردی مانند دادهکاوی و تحلیل دادههای چند متغیره از دادههای استاندارد شده استفاده میشود. همچنین استانداردسازی برای دادههای کمی و کیفی قابل اجرا است و چند روش استانداردسازی وجود دارد.
در بسیاری از روشهای آماری نرمال بودن متغیر وابسته یکی از فروض اصلی بشمار میرود که زیر به برخی روشهای معمول نرمال سازی اشاره شده است.
۱- وارون سازی داده ها: وارون کردن همه مشاهدات : در صورت عدم مشاهده صفر
۲- لگاریتم(LOG): محاسبه لگاریتم همه مشاهدات : در صورت منفی نبودن مشاهدات
۳- ریشه دوم: محاسبه ریشه دوم همه مشاهدات: در صورت منفی نبودن مشاهدات
۴- تبدیل جانسون(Johnson Transformation) : سیستم تبدیل جانسون بر مبنای سه توزیع Bounded system(SB) و Log-normal system (SL) و Unbounded system (SU) و برآورد پارامترهای تورزیع های فوق عمل میکند.
بهینه سازی پارامترهای توزیع تا جایی که یکی از توابع تبدیل، بهترین توزیع نرمال را تولید کند ادامه می یابد. الگوریتم انتخاب بهترین توزیع توسط Polansky , Chou در سال ۱۹۹۹معرفی شد. این روش با توجه به علامت جبری داد ه ها روشی مناسب برای نرمال سازی به شمار میرود.
۵- تبدیل باکس کاکس(Box-Cox transformation): این تبدیل یکی از روشهای قدرتمند در نرمال سازی توزیع مشاهدات به شمار میرود. این روش مقداری به عنون توان (λ) تعیین کرده و همه مشاهدات را به توان آنمیرساند و سپس ازمون نرمال روی مشاهدات انجام شده تا بهترین سری از مشاهدات بدست آید.مقدار λ بین –۵ تا ۵ تغییر میکند.این روش فقط برای داده های مثبت به کار میرود و این تنها نقطه ضعف این روش است.
مرحله۱- داده ها را وارد محیط نرم افزار spss می کنیم. در این مرحله می توان داده ها را به صورت دستی وارد کرد و یا از محیط دیگری مثل اکسل داده ها را کپی کرد.
مرحله۲- پس از اینکه داده ها را وارد کردید به تب Analyze رفته و وارد قسمت Descriptive Statistics و Explore شوید.
مرحله۳- در پنجره باز شده، صفت مورد نظر را وارد کادر Dependent List می کنیم. در این مرحله اگر چند صفت داشته باشیم می توانیم آزمون نرمال بودن را به صورت همزمان روی همه صفات انجام دهیم بنابراین همه صفات را وارد کادر Dependent List می کنیم.
مرحله۴- پس از وارد کردن صفات باید از قسمت Plots تیک عبارت Normality plots with tests را فعال و روی دکمه Continue و Ok کلیک می کنیم تا نتایج آزمون در پنجره Output ظاهر شود.
مرحله ۵- مشاهده کردید که چگونه براحتی با دو آزمون، نرمال بودن داده ها بررسی شد. اکنون طبق گفته های بالا، نتایج آزمون کولموگروف-اسمیرنوف را بررسی می کنیم. در این جدول اگر مقدار sig. بیشتر از ۰٫۰۵ باشد داده ها نرمال و اگر کمتر از ۰٫۰۵ باشد داده ها توزیع نرمال ندارند و باید آنها را قبل از تجزیه واریانس تبدیل بکنیم.
نحوه نرمال سازی داده ها در spss