تجزیه و تحلیل رگرسیون

 

واژه رگرسیون اغلب جهت رساندن مفهوم بازگشت به یک مقدار متوسط یا میانگین به کار برده می شود. تحلیل رگرسیون روشی است که جهت مطالعه روابط بین متغیرها و به ویژه فهم نحوه وابستگی یک متغیرها مورد استفاده قرار می گیرد. به عبارتی تحلیل رگرسیون تحلیلی جهت کمّی نمودن ارتباط بین یک متغیر ملاک (یا متغیر وابسته) و یک یا چند متغیر پیش بینی کننده (یا متغیر مستقل) می باشد. بطور کای این تکنیک را می توان جهت دو مقصود اساسی به کار گرفت.
پیش بینی متغیر ملاک بر مبنای مقادیر معین متغیرهای پیش بینی کننده
فهم نحوه ارتباط یا تأثیر گذاری متغیرهای پیش بینی کننده بر متغیر ملاک
چنانچه بهبود در میزان دقت پیش بینی یک متغیر بر مبنای اطلاعات سایر متغیرها ایجاد شود. در واقع می توان گفت که این متغیرها دارای همبستگی هستند. مفهوم همبستگی نباید با رابطه علّت و معلولی اشتباه گرفته شود.
کیم وکاوت1(1975) رابطه علّی را چنین تعریف می کند: 1Xعلت است چنانچه X0 و فقط X0 با متغیر1X و فقط 1X تغییر نماید “البته رابطه علّی برای یک نوع خاص پیش بینی بکار برده می شود، بنابراین اختلاف زیادی میان همبستگی و رابطه علّی وجود دارد.
مدلهای آزمون آماری در دسترس می باشند که قدرت همبستگی میان پیش بینی کننده ها و متغیرهای ملاک را اندازه گیری می کنند، بعلاوه این مدلها قادر به تعریف یک تابع یا فرمول به منظور تخمین متغیر ملاک و یا حادثه می باشند. این مدلها بر اساس این فرض که میان پیش بینی کننده ها و متغیرهای ملاک ارتباط خطّی وجود دارد و توزیع نرمال می باشد ساخته شده اند. این مدلها از لحاظ آماری به اندازه کافی قدرتمند هستند تا اطلاعاتی را که بطور ویژه با فرضیه های مدل تطابق ندارند را نیز مورد استفاده قرار دهند. مدل خطّی خاص مورد استفاده بستگی به مقیاس متغیرهای مورد آزمون دارند. مقیاس داده ها می تواند اسمی، رتبه ای و یا فاصله ای باشد. هر مقیاس دارای ویژگی خاص است که آنرا از سطح دیگر مقیاسها متمایز می سازد.
تجزیه و تحلیل رگرسیون خطّی2
در کاربرد رگرسیون خطّی برای پیش بینی فرض بر این است که روابط بین متغیرها بر مبنای توابع خطی است. معادله رگرسیون بصورت کلّی عبارتست از Y=F(X) که در آن Y متغیر معیار و X متغیر پیش بینی است.
اما مشخصاً اگر دو متغیر داشته باشیم معادله رگرسیون بصورت روبرو خواهد بود: y=a+by
که در آن a و b، ضرایبی هستند که روابط بین x و y را تعریف می کنند. روابط درونی بین نسبتهای مالی بطور قطعی تعریف نشده است. به همین دلیل برای یک مقدار x داده شده y لزوماً بوسیله تابع تعریف شده برآورد نمی گردد. مدل فوق بمنظور برطرف کردن این نقیصه (یا در واقع اندازه گیری خطاها) می تواند دستکاری شود و بصورت روبرو می باشد: y=a+bx+ε
که در آن ε مقدار خطایی است که انحرافات جزئی مشاهده شده در ارزش Y که از تابع بدست آمده را تعریف می کند. مفروضات اساسی مدل رگرسیون خطّی عبارتند از (1971 (Smith & Williams.
a و b پارمترهای ناشناخته جامعه هستند که باید تخمین زده شوند.
Y یک متغیر وابسته است که در مدل خطّی مستقیماً وابسته به مقدار X همراه با مقدار خطاست.
X یک متغیر مستقل و غیر تصادفی است که بدون خطا اندازه گیری می شود.
ε یک متغیر تصادفی است که خطاهای غیر قابل مشاهده را تعریف می کند و برای برقراری رابطه بین x و y مورد استفاده قرار می گیرد و دارای تابع توزیع نرمال می باشد.
ویژگیهای اساسی متغیر ε این است که میانگین آن صفر و واریانس آن ε 2δ می باشد.
نکته مثبت تابع خطّی و مفروضات مدل رگرسیون این است که بر مبنای رابطه خطّی میان X و Y بیان می گردد و میانگین Y بر مبنای میانگین X بدست می آید.
Y

                                                    .
این نوشته در متفرقه ارسال شده است. افزودن پیوند یکتا به علاقه‌مندی‌ها.