رشته حقوق

روش اعتبارسنجی

دانلود پایان نامه

1-5-8-2-اعتبارسنجی متقابل
اعتبار مدل عبارتست از پاسخ به این سؤال که آیا مدل در راستای اهداف تعیین شده
قابلیت های لازم را دارد یا خیر؟
تعیین اعتبار درست یک مدل رگرسیونی بایستی مشتمل بر یک مطالعه روی علامتها و اندازههای ضرایب باشد، بدین معنی که آیا میتواند بصورت قابل قبولی به عنوان یک برآورد از اثر تعبیر شود؟ همچنین بایستی پایداری ضرایب رگرسیون مورد رسیدگی واقع شود. بدین معنی که آیا بدست آمده از یک نمونه جدید تا حد امکان شبیه ضرایب جاری میباشد؟ نهایتاً تعیین اعتبار ایجاب میکند پیشبینی انجام گرفته بوسیلهی مدل مورد رسیدگی قرار گیرد.
برای تعیین اعتبار یک مدل رگرسیونی سه روش بکار گرفته میشود:
تحلیل ضرایب مدل و مقادیر پیش بینی: برای تعیین پایداری و قابل قبول بودن علامتها و اندازههای ضرایب نهایی رگرسیون بایستی آنها را با تجربیات قبلی و دیگر مدلهای تحلیلی یا نتایج شبیه سازی مقایسه کرد.
جمعآوری دادههای جدید: مؤثرترین روش تعیین اعتبار یک مدل نسبت به نقش پیش بینی آن جمعآوری دادههای مناسب و مقایسهی مستقیم پیشبینیهای مدل با آنها میباشد.
تقسیم یا جداسازی دادهها: در بعضی وضعیتها جمعآوری دادههای جدید برای تعیین اعتبار امکانپذیر نیست. به عنوان مثال ممکن است منبع جمعآوری دادهها تخلیه شده باشد یا ماشینآلات به تولیدات دیگر پرداخته باشند و یا دیگر وسایل جمعآوری اطلاعات و منابع لازم در دسترس نباشد. در چنین شرایطی دادههای موجود با روش قابل قبولی به دو قسمت تقسیم میشوند. اِسنی در سال 1977 این دادهها را دادههای برآورد و دادههای پیش بینی نامگذاری کرده است.(رضوی پاریزی1388)
در این پایاننامه تنها روش سوم از روشهای تعیین اعتبار مدل را در نظر گرفته که در ادامه به آن میپردازیم.
گاهی تقسیم دادهها، اعتبارسنجی نامیده میشود (موستلر و توکی(1968) ). تقسیم دادهها از چند راه انجام میشود. به عنوان مثال اگر دادهها بر پایهی دنبالهای از زمان جمعآوری شده باشند، در این صورت زمان میتواند به عنوان مبنای تقسیم دادهها بکار رود. یعنی دورهی خاصی از زمان معین شود و همه مشاهدات جمعآوری شده قبل از این دوره زمانی تشکیل دادههای برآورد (آموزشی) و دادههای بعد از این دوره زمانی تشکیل دادههای پیشبینی(اعتبار) را میدهند. در مواردی که مبنای خاصی برای تقسیم دادهها وجود ندارد میتوان بطور تصادفی مشاهداتی را برای مجموعه دادههای برآورد و پیش بینی تخصیص داد.
فرض کنید داده داریم که که تعداد دادههای آموزشی و تعداد دادههای اعتبار است. در این صورت تعداد راه متفاوت برای تقسیم دادهها وجود دارد.
شاید بتوان گفت روش اعتبارسنجی متقابل یکی از سادهترین و پرکاربردترین روشهای برآورد خطای پیش بین است.
برای جزییات بیشتر به معرفی خطای پیش بین میپردازیم، فرض کنید یک بردار تصادفی از مقادیر ورودی حقیقی مقدار باشد و متغیر تصادفی خروجی حقیقی مقدار با توزیع توأم احتمال و تابعی حقیقی مقدار است که برای پیشبینی از روی در نظر گرفته میشود. حال برای پیشبینی تاوان خطا در نظر گرفته میشود. اکثراً برای راحتی کار تابع زیان درجهی دوم را در نظر میگیرند، یعنی
در این صورت خطای پیشبین) بصورت
تعریف میشود. خطای پیش بین معیاری برای انتخاب به ما ارائه میدهد.
اعتبارسنجی متقابل لایه
در حالت ایدهآل اگر به اندازهی کافی داده داشته باشیم یک مجموعه از دادهها را برای پیش بینی کنار میگذاریم و از آن برای برآورد خطای پیشبین استفاده میکنیم. با توجه به اینکه اغلب تعداد دادهها کم میباشند، چنین چیزی امکانپذیر نیست. خوبی مسئلهی اعتبارسنجی متقابل لایه در این است که دادههای در دسترس را به دو قسمت تقسیم میکند، بخشی از آن را برای برازش مدل و بخش دیگر را برای پیشبینی بکار میبرد.
برای مثال 5 در نظر گرفته و روش CVی لایه را برای آن بکار میبریم.
5
4
3
2
1
آموزشی

مطلب مشابه :  اقلام تعهدی اختیاری

برای دانلود متن کامل فایل این  پایان نامه می توانید  اینجا کلیک کنید