کاربرد روش وزن‌دهی احتمال معکوس سانسورها در تحلیل بقای مبتنی بر روش‌های یادگیری ماشین

Applying the inverse probability of censoring weighting approach in survival analysis based on machine learning methods


چاپ صفحه
پژوهان
صفحه نخست سامانه
مجری و همکاران
مجری و همکاران
اطلاعات تفضیلی
اطلاعات تفضیلی
دانلود
دانلود
دانشگاه علوم پزشکی تبریز
دانشگاه علوم پزشکی تبریز

مجریان: محمد اصغری جعفرآبادی , توحید جعفری کشکی

خلاصه روش اجرا: در این مطالعه با استفاده از روش وزن‌دهی احتمال معکوس سانسور (Inverse Probability of Censoring Weighting: IPCW) در کنار الگوریتم‌های درخت تصمیم (Decision trees: DT)، k-‌نزدیک‌ترین همسایه (K- Nearest Neighbors: KNN) و مدل جمعی تعمیم‌یافته ( Generalized Additive Model: GAM)، به بررسی روابط بین متغیر وابسته بقا با متغیر‌های سن، جنس، مورفولوژی، مرحله و درجه پرداخته خواهد شد. تجزیه و تحلیل‌ها با استفاده از پکیج‌های rpart، yaImpute و mgcv در نرم‌افزار R انجام و وزن‌های IPC با استفاده از آرگومان weight اعمال خواهد شد. در این مطالعه از داده‌های سرطان آذربایجان شرقی برای تمامی بیماران تشخیص داده شده به سرطان پستان اولیه در فاصله زمانی 20 مارس 2011 تا 19 مارس 2015 استفاده خواهد شد که تمام داده‌های کلینیکوپاتولوژیک شامل سن، جنس، مورفولوژی (یعنی ساختار‌شناسی، رفتار و درجه)، مرحله و درجه به طور منظم در ثبت سرطان مبتنی بر جمعیت آذربایجان شرقی، با استفاده از شماره شناسایی شخصی 11 رقمی منحصر‌بفرد ثبت شده است. اطلاعات اضافی در مورد بقای کل و پیشامدها در طول پیگیری توسط تماس با بیماران یا بستگانشان و صحبت کردن با آنها یا مراجعه به سیستم اطلاعات بیمارستان بدست آمده است. همچنین پایگاه داده‌ها با استفاده از شناسنامه اصلی و شماره شناسایی منحصر‌بفرد بیمار به سیستم ثبت مرگ منطقه‌ای مرتبط شده است. از 3024 نمونه اولیه، تعدادی از داده‌ها به دلیل نبود داده اصلی، اطلاعات تماس و تغییر مکان بیمار در سال‌های گذشته، از مطالعه خارج شده‌اند. پیشامد اولیه، بقای کلی به صورت مدت زمان از تاریخ تشخیص تا تاریخ مرگ به علت سرطان پستان بوده و بیمارانی که تا پایان مطالعه زنده مانده‌اند، سانسور شده‌اند و ماکزیمم زمان پیگیری 5 سال بوده است.

اطلاعات کلی طرح
hide/show

مرحله جاری طرح خاتمه قرارداد و اجرا
کد طرح 62120
عنوان فارسی طرح کاربرد روش وزن‌دهی احتمال معکوس سانسورها در تحلیل بقای مبتنی بر روش‌های یادگیری ماشین
عنوان لاتین طرح Applying the inverse probability of censoring weighting approach in survival analysis based on machine learning methods
نوع طرح طرح - پایان نامه
اولویت طرح اپیدمیولوژی، پیشگیری، تشخیص زودهنگام، درمان و بازتوانی در سرطان‌های شایع
نوع مطالعه مطالعه هم گروهی ( Cohort )
تحقیق در نظام سلامت بلی
آیا طرح پایان‌نامه دانشجویی است؟ بله
مقطع پایان نامه کارشناسی ارشد
مدت اجرا - ماه 12
نوآوری و ضرورت انجام تحقیق روش‌های یادگیری ماشین در بررسی مشاهدات از راست سانسور شده در مطالعات بقا، از رویکرد‌هایی استفاده می‌کنند که این رویکرد‌ها باعث برآوردهای اریب یا پیش‌بینی‌هایی با دقت کمتر برای ریسک می‌شوند. هدف از مطالعه حاضر به کارگیری روش IPCW در کنار روش‌های یادگیری ماشین (شامل الگوریتم‌های DT، KNN و GAM) به منظور ارائه برآورد‌های بهتری از سانسورها و پیش‌بینی‌هایی با دقت بیشتر برای داده‌های سرطان پستان است.
اهداف اختصاصی

تعیین میزان پیشگویی DT با استفاده از تکنیک IPCW برای بقای بیماران مبتلا به سرطان پستان

-

تعیین میزان پیشگویی روش KNN با استفاده از تکنیک IPCW برای بقای بیماران مبتلا به سرطان پستان

-

تعیین میزان پیشگویی GAM با استفاده از تکنیک IPCW برای بقای بیماران مبتلا به سرطان پستان

-

مقایسه یافته‌های حاصل از DT، KNN و GAM در داده های بقای بیماران مبتلا به سرطان پستان

چکیده انگلیسی طرح In this study, the Inverse Probability of Censoring Weighting (IPCW) method, along with Decision Trees (DT), K-Nearest Neighbors (KNN) and Generalized Additive Model (GAM) algorithms, will be used to investigate the relationships between the dependent variable of survival and the variables of age, sex, morphology, stage and grade. Analyses will be performed using the rpart, yaImpute and mgcv packages in R software and IPC weights will be applied using the weight argument. This study will use the East Azerbaijan Cancer Registry data for all patients diagnosed with primary breast cancer between March 20, 2011 and March 19, 2015. All clinicopathological data including age, sex, morphology (i.e., morphology, behavior, and grade), stage, and grade were routinely recorded in the East Azerbaijan Population-Based Cancer Registry using a unique 11-digit personal identification number. Additional information on overall survival and events during follow-up was obtained by contacting patients or their relatives and talking to them or referring to the hospital information system. The database was also linked to the regional death registration system using the original ID card and the patient's unique identification number. Of the 3024 original samples, a number of data were excluded due to missing original data, contact information, and patient relocation in the past years. The primary outcome was overall survival as the time from the date of diagnosis to the date of death due to breast cancer. Patients who survived to the end of the study were censored, and the maximum follow-up time was 5 years.
کلمات کلیدی مدل: تعریف نظری: مدل از ریشه لاتین modus به معنای اندازه گرفته شده است و جزء کوچکی از یک واقعیت است. بدین ترتیب در شرایطی که امکان دسترسی به تمام جزئیات و روابط پدیده‌ها، مشکل، پر هزینه و وقت‌گیر است، مدل، آن‌ها را سهل و آسان می‌کند و با برخورداری از امکان تجزیه و تحلیل، پیش‌بینی نتایج را ممکن می‌نماید [56]. تعریف عملی: در مطالعه حاضر منظور از مدل، مدل‌های Decision trees، KNN، GAM در تحلیل داده‌های بقا بر روی سرطان پستان می‌باشد. تحلیل بقا: تعریف نظری: تحلیل بقا مجموعه‌ای از روش‌های آماری برای تحلیل داده‌هایی است که متغیر برآیند آن‌ها "زمان مورد نیاز برای رخداد یک پیشامد" است [57]. تعریف عملی: در مطالعه حاضر منظور از تحلیل بقا، مجموعه‌ای از روش‌هایی برای تحلیل داده‌های "زمان تا رخداد مرگ به دلیل سرطان پستان" است. سانسور: تعریف نظری: سانسور به طور کلی به ندانستن زمان دقیق بقا (امکان عدم رخداد پیشامد مورد نظر در زمان تعیین شده برای مطالعه) اطلاق می‌شود [57]. تعریف عملی: در این مطالعه منظور از سانسور ندانستن زمان دقیق مرگ به دلیل سرطان پستان می‌باشد. روش یادگیری ماشین: تعریف نظری: روش یادگیری ماشین زمینه‌ای از هوش مصنوعی است که با استفاده از تکنیک‌های آماری، بدون برنامه‌ریزی صریح، به سیستم کامپیوتری توانایی یادگیری از داده‌ها می‌دهد تا به کمک آن یک مسئله طبقه‌بندی یا پیش‌بینی حل شود [58]. تعریف عملی: در این مطالعه منظور از روش یادگیری ماشین، روش‌های Decision trees، KNN، GAM می‌باشد. وزن‌دهی احتمال معکوس سانسور (IPCW): تعریف نظری: روش IPCW روشی است که با دادن وزن بیشتر به افراد سانسور نشده باعث کاهش اریبی و برآورد بهتر برای ریسک می‌شود [29, 30]. تعریف عملی: در این مطالعه منظور از IPCW اینست که افراد سانسور شده وزن صفر و سایر افراد وزنی متناسب با معکوس احتمال سانسور شدگی بعد از زمان پیگیری مشاهده شده‌شان می‌گیرند.
ذینفعان نتایج طرح ذینفعان نتایج این طرح بیماران و دست‌اندرکاران سلامت مرتبط با آن‌ها یا پزشکان هستند که با استفاده از نتایج این طرح بیماران می‌توانند به طور دقیق‌تر از میزان بقایشان اطلاع داشته باشند و دست‌اندرکاران سلامت مرتبط با آن‌ها یا پزشکان نیز اطلاعات دقیق‌تری از بقا بدست می‌آورند که می‌تواند برای تصمیم‌گیری صحیح‌تر مورد استفاده قرار گیرد.

اطلاعات مجری و همکاران
hide/show

نام و نام‌خانوادگی سمت در طرح
محمد اصغری جعفرآبادیاستاد راهنمای اول (آموزشی )
توحید جعفری کشکیاستاد راهنما دوم (آموزشی )
رویا دولت خواهمشاور
زینب ایرجیدانشجوی مالک پایان نامه

اطلاعات تفضیلی
hide/show

حوزه خبر خبر
رسانه ها و مردم
عنوان خبر
بیماران مرد با سن بالاتر، درجه تومور بالاتر و مورفولوژی از نوع خاص میزان بقای کمتری دارند.
متن خبر
سرطان پستان یکی از شایع‌ترین سرطان‌هاست که روند رو به رشدی برای شیوع و مرگ و میر حاصل از آن وجود دارد به طوریکه میزان بروز استاندارد شده سنی سالانه 12% افزایش می‎یابد. در مطالعه‌ای که در مرکز ثبت سرطان مبتنی بر جمعیت آذربایجان شرقی انجام شد، تعداد 1154 بیمار در مطالعه شرکت کردند. نتایج تحلیل بقا با استفاده از روش‌های یادگیری ماشین نشان داد که جنسیت مرد، بیماران با سنین بالاتر، بیماران با درجه تومور بالاتر و بیمارانی که مورفولوژی خاصی داشتند، میزان بقای کمتری داشتند. بر اساس نتایج بدست آمده توصیه می‌شود که مراقبت¬های پزشکی بیشتری برای بیماران مرد با سن بالاتر، درجه تومور بالاتر و مورفولوژی غیر از نوع خاصی دارند، که در معرض خطر مرگ بالایی قرار دارند، در نظر گرفته شود تا حدالامکان مرگ و میر ناشی از سرطان پستان در این بیماران کاهش یابد.
متخصصان و پژوهشگران
عنوان خبر
متن خبر
سیاستگذاران درمانی
عنوان خبر
متن خبر
سیاستگذاران پژوهشی
عنوان خبر
متن خبر
لینک (URL) مقاله انگلیسی مرتبط منتشر شده 1