بهینه سازی خرید دارو با استفاده از داده کاوی
توسعهی استفاده از فناوری اطلاعات در بهداشت و درمان علاوه بر مزایای فراوان باعث می شود تا حجم زیادی از دادههای مرتبط، در دسترس قرار بگیرند. با بکارگیری داده کاوی بر روی داده های موجود می توان تصمیم گیریها و فرایندهای مدیریتی را بهبود بخشید. در این پایان نامه تلاش شده است ضمن بررسی الگوریتمهای مختلف داده کاوی مدلی جهت پیش بینی مصرف دارو در داروخانههای بیمارستانها ارائه گردد. مجموعه داده در نظر گرفته شده مربوط به سیستم اطلاعات بیمارستان پاستور شهرستان بم می باشد که در مدت 5 سال در پایگاه داده سیستم اطلاعات این بیمارستان ذخیره شده است. برای پیش بینی مصرف دارو عملکرد مدلهای MLP، SVR، ADABOOST.R، BAGTREE، LR، LSSVR مورد بررسی قرار می گیرد. دقت پیش بینی بر اساس معیارها MSE ,RMSE ,MAE وR2 ارزیابی می گردد. طبق نتایج بدست آمده عملکرد مدل BAGTREE در روش های مختلف بهتر از سایر مدل ها بوده است.
واژگان کلیدی : سیستم های اطلاعات بیمارستان، پیش بینی، خرید دارو، داروخانه
فهرست مطالب
عنوان صفحه
فصل 1- مقدمه.. 2
1-1- فناوری اطلاعات در بهداشت و درمان.. 2
1-2- داروخانه های بیمارستانی.. 3
1-3- داده کاوی.. 3
1-3-1- داده کاوی چیست؟. 3
1-3-2- تكنیك های مختلف داده كاوی.. 4
1-3-2-1-انواع تکنیک داده کاوی. 5
1-4- بیان مسئله. 6
1-5- اهداف تحقیق.. 8
1-6- سوالات وفرضیات تحقیق.. 9
1-6-1- سوالات.. 9
1-6-2- فرضیات تحقیق.. 9
1-7- فصول پایان نامه. 9
فصل 2- پیشینه پژوهشی… 12
2-1- جمع بندی.. 24
فصل 3- مروری بر ادبیات تحقیق و مبانی نظری… 26
3-1- سیستم های اطلاعات بیمارستان.. 26
3-2- تعریف و مفهوم سیستم اطلاعات بیمارستانی.. 28
3-2-1– اهداف سیستم اطلاعات بیمارستانی.. 29
3-2-2- اهمیت و ضرورت راهاندازی سیستم اطلاعات بیمارستانی.. 30
3-2-3- مزایایی سیستم اطلاعات بیمارستانی.. 31
3-3- داده کاوی.. 32
3-4- مراحل داده کاوی.. 33
3-4-1- پیش پردازش داده ها 35
3-4-2- پاکسازی داده ها 35
3-4-3-یکپارچه سازی داده ها 36
3-4-4- تبدیل دادهها 36
3-4-5- تلخیص داده ها 37
3-5- وظایف داده کاوی.. 37
3-5-1- دسته بندی.. 38
3-5-2- تخمین.. 39
3-5-3- پیش بینی.. 39
3-5-4- گروه بندی شباهت یا قوانین وابستگی.. 40
3-5-5- خوشه بندی.. 40
3-5-6- نمایه سازی.. 41
3-6- كاربرد های داده كاوی.. 41
3-7- رویکردهای مسائل داده کاوی در پزشکی.. 42
3-8- مدلها و الگوریتمهای داده کاوی.. 43
3-8-1- شبکه های عصبی مصنوعی.. 43
3-8-1-1-ساختار شبکه عصبی… 44
3-8-1-2-معماری شبکه عصبی… 45
3-8-1-3-آموزش شبکه های عصبی مصنوعی… 46
3-8-1-4-انواع یادگیری در شبکه های عصبی مصنوعی… 47
3-8-2- درخت های انتخاب.. 47
3-8-3- Bagging & Boosting. 48
3-8-3-1-Bagging.. 55
3-8-1-1-Boosting.. 44
3-8-1-1-الگوریتم های Boosting.. 44
3-8-4- Adaptive Boosting(Adaboost) 50
3-8-5- رگرسیون بردار پشتیبان. 51
3-8-6- رگرسیون خطی.. 52
نرم افزارهای داده کاوی.. 54
3-10- فرایند خرید دارو 55
3-11- جمع بندی.. 56
فصل 4- روش انجام پژوهش…. 58
4-1- مقدمه. 58
4-2- الگوریتم پیشنهادی.. 59
4-3- پیش پردازش دادهها 60
4-3-1- ساخت ماتریس داده 60
4-3-1-1-روش ماههای متوالی… 67
4-3-1-2-روش ماههای یکسان… 44
4-3-1-3-روش فصول متولی… 69
4-4- الگوریتمهای Prediction. 63
4-4-1- روش NN. 64
4-4–2-روش SVR. 64
4-4-3– روش LSSVR. 67
4-4-4- AdaBoost.R. 69
4-5- مجموعه داده 70
4-5-1- پاکسازی داده 72
4-6- معیارهای ارزیابی.. 72
4-7- جمع بندی.. 74
فصل 5- بحث و نتیجهگیری… 76
5-1- مقایسه روشهای مورد بررسی.. 76
5-1-1- ارزیابی الگوریتم با روش ماههای متوالی.. 77
5-1-2- ارزیابی الگوریتم با روش ماههای یکسان.. 83
5-2- جمع بندی.. 93
فصل 6- پیشنهادهاو فرصتهای پژوهشی آینده. 95
فهرست جداول
عنوان صفحه
جدول 2- 1تکنیک های مهم داده کاوی در بخش دارویی[21] 21
جدول 4- 1 ماتریس داده بصورت ماههای متوالی60
جدول 4- 2 ماتریس داده بصورت ماههای یکسان61
جدول 4- 3 ماتریس داده بصورت فصول متوالی2
جدول 5- 1 نتایج اعمال الگوریتم های معرفی شده بر روی داده های Cream Calamine 77
جدول 5- 2 نتایج اعمال الگوریتم های معرفی شده بر روی داده های Vialdioxin81
جدول 5- 3 نتایج اعمال الگوریتم های معرفی شده بر روی داده های Syrup Sulbutamol82
جدول 5- 4 نتایج اعمال الگوریتم های معرفی شده بر روی داده های Cream Calamine 82
جدول 5- 5 نتایج اعمال الگوریتم های معرفی شده بر روی داده های Vialdioxin 85
جدول 5- 6 نتایج اعمال الگوریتم های معرفی شده بر روی داده های Syrup Sulbutamol86
جدول 5- 7نتایج اعمال الگوریتم های معرفی شده بر روی داده های Cream Calamine 91
جدول 5 – 8 نتایج اعمال الگوریتم های معرفی شده بر روی داده های Syrup Sulbutamol 93
فهرست شکل ها و نمودارها
عنوان صفحه
شکل 2- 1 مدل پیش بینی با شبکه عصبی[4]12
شکل 2- 2 شبکه عصبی [14] BP 12
شکل 2- 3 مدل بهینه سازی خرید دارو[15]14
شکل 2- 4 مدل استخراج دانش [26] 16
شکل 2- 5 جریان عملیات در داروخانه[17] 17
شکل 2- 6 دسته بندی اهدا بکارگیری داده کاوی[15]19
شکل 2- 7 روند بکارگیری داده کاوی در پزشکی[20]20
شکل3- 1 مراحل داده کاوی[40]32
شکل3- 2 ساختار شبکه عصبی[47]43
شکل3- 3 مثالی از درخت تصمیم[41]55
شکل 3- 4 واسط کاربری سیستم اطلاعات بیمارستان55
شکل 4- 1 دیاگرام چاچوب تحقیق58
شکل4- 2 پارامترهای مورد استفاده در SVM64
شکل4- 3 گزارش تهیه شده با کریستال ریپورت70
شکل4- 4 خروجی گزارش تهیه شده با کریستال ریپورت71
شکل5- 1 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم AdaBoost.R78
شکل5- 2 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم LR78
شکل5- 3 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم BAGTREE79
شکل5- 4 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم LSSVR80
شکل5- 5 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم SVR80
شکل5- 6 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم BAGTREE83
شکل5- 7 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم LR83
شکل5- 8 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم SVR84
شکل 5- 9 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم AdaBoost.R84
شکل5- 10 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم SVR85
شکل 5- 11 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم AdaBoost.R86
شکل5- 12 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم LR87
شکل5- 13 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم SVR87
شکل5- 14 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم LSSVR88
شکل5- 15 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم AdaBoost.R89
شکل5- 16 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم NN90
شکل5- 17 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم LSSVR90
شکل5- 18 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم LSSVR92
شکل5- 19 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم BAGTREE93
شکل5- 20 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم LSSVR94
شکل5- 21 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم BAGTREE94
1-1- فناوری اطلاعات در بهداشت و درمان
در سالهای اخیر مراکز بهداشتی ودرمانی کشورمان به ویژه بیمارستانها درصدد مکانیزه کردن سیستمهای اطلاعاتی خود برآمدهاند. در ابتدا مقصود از چنین فعالیتهایی کاهش هزینههای ناشی ازکاغذ بازی موجود در سیستمهای دستی و اداری بوده است، اما اکنون به مرحله ای رسیدهایم که بهبود کیفیت ارائه خدمات درمانی اهمیتی روزافزون مییابد و در این راستا بکارگیری سیستم های اطلاعات بیمارستانها بسیار مرسوم شده است.
بکارگیری سیستم اطلاعات بیمارستان علاوه بر مزایای فراوان از جمله کاهش زمان پذیرش، زمان ترخیص، زمان اخذ جوابها، زمان مراجعه به اطلاعات قبلی پرونده، بالا بردن میزان دقت در درج اطلاعات و درخواستها كه در حالت دستی می تواند ناخوانا باشد، همچنین می تواند موجب تسریع ارتباطات بین بخشی و در نهایت بالابردن میزان رضایت بیمار، ارائه خدمات بهتر، دریافت آمار و گزارشات روزانه و زمانی گردد. در نهایت بکارگیری سیستم های اطلاعات بیمارستان، حجم زیادی از داده های مرتبط با درمان را در دسترس قرار می دهد [1]. با استفاده از تکنیک های داده کاوی می توان از دادههای موجود در این سیستمها در جهت پشتیبانی از تصمیم و مدیریت و در نهایت پیشبرد اهداف اقتصادی و درمانی سود جست .[2] دادهکاوی یکی از ده دانش در حال توسعه است و در سالهای اخیر در دنیا گسترش فوقالعاده سریعی داشته است. دادهکاوی فرآیند کشف الگوها و روابط موجود بین داده ها در پایگاه داده های بزرگ است که با برخورداری از دامنه وسیع زیر زمینههای تخصصی با توصیف، تشریح، پیشبینی و کنترل پدیدههای گوناگون پیرامون، امروزه کاربرد بسیار وسیع در حوزههای مختلفی ازجمله پزشکی و تجارت دارد [3].
1-2- داروخانه های بیمارستانی
افزایش هزینههای بیمارستانی در سالهای اخیر و نیز اجرای طرح خودگردانی و ادارهی بیمارستانها به وسیلهی درآمد اختصاصی آنها، بیمارستانها را با مشکلات مالی جدی رو به رو ساخته است. داروخانه یکی از بخشهای مهم و درآمدزا در بیمارستان ها می باشد که می توان با بهبود خرید دارو و افزایش بهره وری آن، بنحوی به وضعیت اقتصادی بیمارستان ها کمک کرد. این حقیقت که مصرف دارو بر اساس شیوع بیمارها در فصول مختلف تغییر می کند و نیز در نظر گرفتن این نکته که برخی داروها برای درمان یک بیماری مکمل یکدیگرند، از جمله فاکتورهایی هستند که باید در خرید دارو درنظر گرفته شوند [4]. به عبارتی با توجه به بیماریهای بسیار متنوع، و تجویز داروهای مختلف برای آنها، میتوان بر اساس سابقه مصرف دارو، نیاز های دارویی در آینده را پیش بینی کرد در نتیجه، در صورت بکارگیری تکنیکهای داده کاوی بر روی اطلاعات موجود در سیستم اطلاعات بیماستان می توان خرید دارو را بر اساس پیش بینی صورت گرفته توسط داده کاوی بهینه کرد.
لذا بر آن شدیم تا با انجام این مطالعه به پیش بینی مصرف دارو، با استفاده از تکنیکهای داده کاوی، در داروخانه یک بیمارستان بزرگ به منظور افزایش بهره وری مالی آن بپردازیم.
1-3- داده کاوی
1-3-1- داده کاوی چیست؟
داده کاوی به بررسی و تجزیه و تحلیل مقادیر عظیمی از داده ها به منظور کشف الگوها و قوانین معنی دار اطلاق میشود.[5] کشف دانش و داده کاوی امروزه یک حوزه جدید میان رشته ای و در حال رشد است که حوزه های مختلفی همچون پایگاه داده، آمار، یادگیری ماشین و سایر زمینه های مرتبط را با هم تلفیق کرده تا اطلاعات و دانش ارزشمند نهفته در حجم بزرگی از دادهها را استخراج نماید و استفاده از آن در دو دهه اخیر تقریبا در جهان در همه سازمانها که با حجم عظیمی از داده در پایگاه داده خود مواجه هستند، رواج یافته است [6]. شناسایی مشکالت کاوش و یا برآورد وابستگیها از داده ها یا کلاً کاوش داده های جدید تنها قسمتی ازشیوههای تجربی مورد استفاده دانشمندان، مهندسین و دیگر کسانی است که روشهای استانداردی را برای کسب نتایج داده ها به کار می برند. درتطبیق روشهای تجربی معمول با مسائل داده کاوی میتوان به مراحل بیان مسأله و فرموله کردن فرضیه، جمع آوری دادهها، پیش پردازش دادهها شامل آشکارسازی و حذف دادههای غیر عادی و مقیاس بندی،رمزگذاری و انتخاب، برآورد و ارزیابی مدل و در نهایت تفسیر مدل ورسیدن به نتایج اشاره نمود [7].
1-3-2- تكنیك های مختلف داده كاوی
تكنیكهای مختلف داده كاوی را میتوان بر اساس نوع عملیاتی كه انجام میدهند به دو دسته « پیش بینی كننده » و « تشریح كننده » تقسیم كرد. تكنیكهای پیش بینی كننده با ساخت مدلی برای پایگاه داده، وظیفه پیش بینی موارد ناشناخته را بر عهده دارند. در حالی كه تكنیكهای تشریح كننده ، الگوهایی قابل فهم از داده ها را برای انسان كشف می كنند [8].در بین این الگوریتمها و مدلها، بهترین وجود ندارد و با توجه به دادهها و کارایی مورد نظر باید مدل انتخاب گردد.
1-3-2-1-انواع تکنیک داده کاوی [9]
قواعد انجمنی [1]: قوانین انجمنی در دسته تکنیک های تشریح کننده قرار می گیرد و به پیدا كردن وابستگیها و همبستگیهای موجود در بین داده ها، یافتن الگوهایی كه غالبا در بین دادهها وجود دارند و همچنین پیدا كردن یك سری ساختار سببی در بین آیتمها و اشیای موجود در پایگاه دادههای تعاملی و رابطهای اشاره كرد.
پیش بینی :[2] دراین روش هدف، پیش بینی یک متغیر پیوسته می باشد. مانند پیش بینی نرخ ارز یا هزینه های درمانی. اینجا ﻣﻘـﺎﺩﻳﺮ ﻣﻤﻜـﻦ ﺑـﺮﺍﻱ ﻣﺘﻐﻴﺮﻫﺎﻱ ﻧﺎﻣﻌﻠﻮﻡ ﭘﻴﺶ ﺑﻴﻨﻲ ﻣﻲ ﺷﻮﻧﺪ. ﺩﺭ پیش بینی ﺍﺑﺘﺪﺍ ﺩﺍﺩﻩ ﻫﺎﻳﻲ ﻛﻪ ﺑﻪ ﻣﺘﻐﻴﺮ ﻧـﺎﻣﻌﻠﻮﻡ ﻣﺮﺑـﻮﻁ ﻫﺴﺘﻨﺪ ﺑﻮﺳﻴﻠﻪ ﻱ ﺑﺮﺧﻲ ﺗﺤﻠﻴﻞ ﻫﺎﻱ ﺁﻣﺎﺭﻱ ﭘﻴﺪﺍ ﻣﻲ ﺷﻮﻧﺪ. ﺳـﭙﺲ ﺍﺯ ﺑﺮﺧـﻲ ﺭﻭﺵ ﻫـﺎﻱ ﻫﻮﺷـﻤﻨﺪ ﻣﺎﻧﻨﺪ ﺷﺒﻜﻪ ﻫﺎﻱ ﻋﺼﺒﻲ ﻭ ﺍﻟﮕﻮﺭﻳﺘﻢ ﮊﻧﺘﻴﻚ ﺑﺮﺍﻱ ﺍﻧﺠﺎﻡ ﭘﻴش بینی ﺍﺳﺘﻔﺎﺩﻩ ﻣﻲ ﺷﻮﺩ.
رده بندی یا طبقه بندی[3] : فرآیندی برای پیدا کردن مدلی است که رده های موجود در دادهها را تعریف می نماید و متمایز می کند، با این هدف که بتوان از این مدل برای پیش بینی رده رکوردهایی که برچسب رده آنها (متغیر هدف) ناشناخته می باشد، استفاده نمود. در رده بندی بر خلاف پیش بینی، هدف پیش بینی مقدار یک متغیر گسسته است. روش های مورد استفاده در پیش بینی و رده بندی عموما یکسان هستند. و در دسته تکنیک های پیش بینی کننده قرار می گیرند.
خوشه بندی[4] : گروه بندی مجموعه ای از اعضاء، رکوردها یا اشیاء به نحوی که اعضای موجود در یک خوشه بیشترین شباهت را به یکدیگر و کمترین شباهت را به اعضای خوشه های دیگر داشته باشند.
در این پایان نامه جهت پیش بینی مصرف دارو از تکنیک های پیش بینی استفاده می شود و با بررسی الگوریتمهای مختلف این تکنیک تلاش می شود مدلی مناسب جهت پیش بینی مصرف دارو در داروخانههای بیمارستانهای ایران معرفی گردد. همچنین از دادههای واقعی بیمارستان پاستور شهر تاریخی بم که در پایگاه داده SQL SERVER سیستم اطلاعات بیمارستان با حجمی در حدود GB220 و در مدت 5 سال ذخیره شدهاند جهت استفاده در مدلها و تکینیک های دادهکاوی استفاده خواهد شد.
1-4- بیان مسئله
در حال حاضر بیمارستان های دولتی کشور ما از کمبود منابع مالی ونقدینگی بشدت رنج می برند. یکی از بخش های تاثیر گذار بر وضعیت مالی بیمارستان ها داروخانه می باشد که در صورت افزایش سودآوری این بخش می توان به نحوی به وضعیت مالی بیمارستان ها کمک کرد
در ادامه به اختصار به گزیده هایی از اعتراف برخی از روسای بیمارستانهای بزرگ کشور توجه کنیم:
بیمارستانهای دولتی در صورت عدم رسیدگی تعطیل خواهند شد .[10]