ما همیشه دادههای فراوانی برای پروژههای خود نداریم. اکثر زمان ها، ما تنها یک تیم داده نمونه داریم که به دلیل کمبود منابع برای ایفا آزمایشات مکرر (مانند آزمایش A/B) با آن فعالیت کنیم.
خوشبختانه، ما شیوههای نمونهگیری مجدد داریم تا از هر دادهای که داریم بیشترین به کار گیری را بکنیم. بوت استرپینگ یک تکنیک نمونه گیری مجدد است که چنانچه که مدل خود را صرفا یکبار بر روی نمونه اصلی قرار دهیم، اطلاعات دیگری در اختیار ما قرار می دهد.
در حالی که ممکن هست ما با «چه» و «به چه شکل» پشت بوت استرپینگ آشنا باشیم، هدف این نوشتهعلمی ارائه «چرایی» بوت استرپینگ به شیوهای غیر انسانی میباشد.
عدهبندی سریع بوت استرپینگ
مقصود از بوت استرپ تشکیل داد یک تخمین (مثلا میانگین نمونه x) برای پارامتر جمعیت (برای مثال، میانگین جامعه θ) براساس یکسری نمونه داده بهدستآمده از نمونه اصلی است.
بوت استرپینگ با نمونهبرداری مکرر (با جایگزینی) مجموعه داده نمونه برای ساخت نمونههای شبیهسازی شده جاری ساختن می شود. هر نمونه بوت استرپ شبیهسازی شده برای احتساب تخمین پارامتر استفاده می گردد و آن گاه این برآوردها مخلوط میشوند تا یک توزیع نمونهبرداری را تشکیل دهند.
آن گاه توزیع نمونهگیری بوت استرپ به ما اجازه میدهد تا استنتاجهای آماری مانند برآورد خطای استاندارد پارامتر را بدست آوریم.
فرآیند خودراه انداز | تصویر از تالیف کننده
عکس ۲:
چرا بوت استرپینگ عمل میکند؟
شما باید تعجب نمائید، چهگونه کار نمونهگیری مکرر از یک تیم داده نمونه به ما اجازه می دهد تا دربارهی آمار جمعیت استنتاج کنیم؟
در وضعیت ایدهآل، ما میخواهیم یک سری نمونه جداگانه از دنیای حقیقی را از جمعیت واقعی بگیریم تا آمار جمعیت را فهم و شعور کنیم. با این فعلا، ما قبلا ثابت کردهایم که این شغل ممکن است همیشه ممکن نباشد.
بنابراین، ما می بایست با گروه دادههای نمونه خودکار کنیم، که تبدیل به بهترین (و صرفا) اطلاعاتی میشود که درخصوص جمعیت داریم.
منطقی می باشد فرض کنیم که بیشتر نمونهها (در حالتیکه به صورت تصادفی کشیده شوند) نسبتاً شبیه جمعیتی خواهند بود که از آن منشا میگیرند. با پیش گویی این گزینه، بدین مضمون هست که دادههای نمونه ما را میقدرت به عنوان جمعیتی در حیث گرفت که ما وانمود میکنیم جمعیت حقیقی را نشان میدهد.
با این جمعیت تظاهر کننده خواهیم توانست نمونههای تصادفی چندگانه (بوت استرپ) را از آن رسم کنیم. این به گونهای میباشد که گویی ما تعدادی نمونه از جمعیت حقیقی وواقعی را به دست میآوریم.
توجه: در حقیقت، نمونه اساسی تنها یک نمونه میباشد که ما از جمعیت حقیقی وواقعی داریم.
از آنجا که نمونهبرداری با جایگزینی مجاز میباشد، نمونههای بوت استرپ را میقدرت به عنوان نمونههای تصادفی ساخت شده ذیل طرزها و احتمال ها گوناگون در لحاظ گرفت.
اطلاعات عدهآوریشده نمونهبرداری شده از این نمونههای بوت استرپ در نهایت به ما یاری خواهد کرد تا برآوردهای دقیقی از پارامتر جمعیت، مثلا میانگین جمعیت، طراحی سایت در مشهدبه دست آوریم.
عکس ۳: تصویر از یک مقدمه به یادگیری آماری-ویرایش دوم
پس نمونهبرداری بوت استرپ چقدر مفید هست؟ تصویر بالا برآوردهای پارامتر (α) را از ۱۰۰۰ نمونه شبیهسازی شده از جمعیت حقیقی وواقعی در مقابل ۱۰۰۰ نمونه بوت استرپ مقایسه میکند.
خواهیم توانست ببینیم که نمودارهای میلهای دارای گسترههای مشابهی هستند، که آرم میدهد روش بوت استرپ قادر است به طور موثری تغییرپذیری مربوط به برآورد پارامتر را برآورد کند.
خلاصه
درین مقاله، ما یک توضیح معمولی از شهود پشت بوت استرپینگ را تفحص کردیم. امیدوارم که این نوشتن فهم بهتری از بوت استرپینگ و اینکه چرا از لحاظ تئوری و عملی فعالیت میکند، به شما بدهد.
مضمون کلیدی این میباشد که فرض می شود نمونه اساسی نماینده جمعیت باشد. با نمونهگیری مجدد این نمونه چند دفعه، ما یک توزیع نمونهگیری نسبتا دقیق از تخمین نمونه پارامتر جمعیت بدست میآوریم.
اما، تعدادی هشدار در این مورد وجود دارااست. برای مثال، در موقعیت معمولی نمونهگیری از جمعیت واقعی، ما هرگز یک نمونه به اندازه آحاد جمعیت نخواهیم گرفت. طراحی سایت با این فعلا، به کار گیری از اندازه نمونه مشابه با گروه داده مهم در بوت استرپینگ رایج میباشد.
برای جزئیات بیشتر در خصوص هشدارهای گوناگون، میتوانید این مورد را در اینجا تفحص نمائید.
ما همیشه دادههای فراوانی برای پروژههای خود نداریم. اکثر زمان ها، ما تنها یک تیم داده نمونه داریم که به دلیل کمبود منابع برای ایفا آزمایشات مکرر (مانند آزمایش A/B) با آن فعالیت کنیم.
خوشبختانه، ما شیوههای نمونهگیری مجدد داریم تا از هر دادهای که داریم بیشترین به کار گیری را بکنیم. بوت استرپینگ یک تکنیک نمونه گیری مجدد است که چنانچه که مدل خود را صرفا یکبار بر روی نمونه اصلی قرار دهیم، اطلاعات دیگری در اختیار ما قرار می دهد.
در حالی که ممکن هست ما با «چه» و «به چه شکل» پشت بوت استرپینگ آشنا باشیم، هدف این نوشتهعلمی ارائه «چرایی» بوت استرپینگ به شیوهای غیر انسانی میباشد.
عدهبندی سریع بوت استرپینگ
مقصود از بوت استرپ تشکیل داد یک تخمین (مثلا میانگین نمونه x) برای پارامتر جمعیت (برای مثال، میانگین جامعه θ) براساس یکسری نمونه داده بهدستآمده از نمونه اصلی است.
بوت استرپینگ با نمونهبرداری مکرر (با جایگزینی) مجموعه داده نمونه برای ساخت نمونههای شبیهسازی شده جاری ساختن می شود. هر نمونه بوت استرپ شبیهسازی شده برای احتساب تخمین پارامتر استفاده می گردد و آن گاه این برآوردها مخلوط میشوند تا یک توزیع نمونهبرداری را تشکیل دهند.
آن گاه توزیع نمونهگیری بوت استرپ به ما اجازه میدهد تا استنتاجهای آماری مانند برآورد خطای استاندارد پارامتر را بدست آوریم.
فرآیند خودراه انداز | تصویر از تالیف کننده
عکس ۲:
چرا بوت استرپینگ عمل میکند؟
شما باید تعجب نمائید، چهگونه کار نمونهگیری مکرر از یک تیم داده نمونه به ما اجازه می دهد تا دربارهی آمار جمعیت استنتاج کنیم؟
در وضعیت ایدهآل، ما میخواهیم یک سری نمونه جداگانه از دنیای حقیقی را از جمعیت واقعی بگیریم تا آمار جمعیت را فهم و شعور کنیم. با این فعلا، ما قبلا ثابت کردهایم که این شغل ممکن است همیشه ممکن نباشد.
بنابراین، ما می بایست با گروه دادههای نمونه خودکار کنیم، که تبدیل به بهترین (و صرفا) اطلاعاتی میشود که درخصوص جمعیت داریم.
منطقی می باشد فرض کنیم که بیشتر نمونهها (در حالتیکه به صورت تصادفی کشیده شوند) نسبتاً شبیه جمعیتی خواهند بود که از آن منشا میگیرند. با پیش گویی این گزینه، بدین مضمون هست که دادههای نمونه ما را میقدرت به عنوان جمعیتی در حیث گرفت که ما وانمود میکنیم جمعیت حقیقی را نشان میدهد.
با این جمعیت تظاهر کننده خواهیم توانست نمونههای تصادفی چندگانه (بوت استرپ) را از آن رسم کنیم. این به گونهای میباشد که گویی ما تعدادی نمونه از جمعیت حقیقی وواقعی را به دست میآوریم.
توجه: در حقیقت، نمونه اساسی تنها یک نمونه میباشد که ما از جمعیت حقیقی وواقعی داریم.
از آنجا که نمونهبرداری با جایگزینی مجاز میباشد، نمونههای بوت استرپ را میقدرت به عنوان نمونههای تصادفی ساخت شده ذیل طرزها و احتمال ها گوناگون در لحاظ گرفت.
اطلاعات عدهآوریشده نمونهبرداری شده از این نمونههای بوت استرپ در نهایت به ما یاری خواهد کرد تا برآوردهای دقیقی از پارامتر جمعیت، مثلا میانگین جمعیت، طراحی سایت در مشهدبه دست آوریم.
عکس ۳: تصویر از یک مقدمه به یادگیری آماری-ویرایش دوم
پس نمونهبرداری بوت استرپ چقدر مفید هست؟ تصویر بالا برآوردهای پارامتر (α) را از ۱۰۰۰ نمونه شبیهسازی شده از جمعیت حقیقی وواقعی در مقابل ۱۰۰۰ نمونه بوت استرپ مقایسه میکند.
خواهیم توانست ببینیم که نمودارهای میلهای دارای گسترههای مشابهی هستند، که آرم میدهد روش بوت استرپ قادر است به طور موثری تغییرپذیری مربوط به برآورد پارامتر را برآورد کند.
خلاصه
درین مقاله، ما یک توضیح معمولی از شهود پشت بوت استرپینگ را تفحص کردیم. امیدوارم که این نوشتن فهم بهتری از بوت استرپینگ و اینکه چرا از لحاظ تئوری و عملی فعالیت میکند، به شما بدهد.
مضمون کلیدی این میباشد که فرض می شود نمونه اساسی نماینده جمعیت باشد. با نمونهگیری مجدد این نمونه چند دفعه، ما یک توزیع نمونهگیری نسبتا دقیق از تخمین نمونه پارامتر جمعیت بدست میآوریم.
اما، تعدادی هشدار در این مورد وجود دارااست. برای مثال، در موقعیت معمولی نمونهگیری از جمعیت واقعی، ما هرگز یک نمونه به اندازه آحاد جمعیت نخواهیم گرفت. طراحی سایت با این فعلا، به کار گیری از اندازه نمونه مشابه با گروه داده مهم در بوت استرپینگ رایج میباشد.
برای جزئیات بیشتر در خصوص هشدارهای گوناگون، میتوانید این مورد را در اینجا تفحص نمائید.