در پست قبل به بررسی این موضوع پرداختیم که چه زمانی با نمونههای تکمیل نشده مواجه میشویم. در نگاه اول وجود این نمونهها در مجموعه دادهی مورد بررسی مشکل ساز نمیباشند. این پدیده واقعیت موجود در دادههاست مگر نه اینست که ما میخواهیم بدانیم دقیقا چه اتفاقی افتاده است؟
خیر، اینگونه نیست حداقل اگر وجود این نمونهها به 2 دلیل اول ذکر شده در پست قبل باشد، این نمونههای تکمیل نشده واقعیت فرآیند را بیان نمیکنند و آنها به دلیل نحوهی جمعآوری دادههای ما به وجود آمدهاند.
شکل 1 که نشاندهنده فرآیند بازپرداخت پول یک مشتری است را نگاه کنید. خط چین هایی که به نقطهی پایانی فرآیند (دایره نشان داده شده در پایین مدل فرآیند ) ختم میشوند، مشخص کنندهی فعالیتهایی است که در انتهای فرآیند میبایست انجام پذیرد. بطور مثال در 333 نمونه “order completed” آخرین گام ثبت شد و از فرآیند است. (به دایره شماره 1 در شکل1 توجه کنید.) این یعنی یکی از گامهای پایانی متصور برای فرآیند همین فعالیت است. همچنین 20 نمونه وجود دارد که فعالیت “Invoice Modified” فعالیت پایانی آنها ثبت شده است. (به دایره 2 در شکل 1 توجه کنید) به نظر میرسد که این فعالیت پایانی آنها ثبت شدهاست. (به دایره شماره 3 در شکل 1 توجه کنید.)
به نظر میرسد که این فعالیت نمیتواند آخرین فعالیت فرآیند باشد.
توضیح شکل 1: به نظر میرسد نمونههایی که به فعالیت “Order completed” ختم شدهاند پایان یافته و نمونههایی که به فعالیت “Invoice Modified” ختم شدهاند، هنوز در جریان اند.
اگر در مجموعه دادهها به دنبال نمونهای بگردیم که با فعالیت “Invoice Modified” خاتمه یافته است، آنگاه خواهیم فهمید که فعالیت در تاریخ 20 ژانویه 2012 اتفاق افتاده و زمان کل مجموعه دادهها در 23 ژانویه 2012 پایان یافته است. اگر مجموعه دادهی ما شامل تمام اتفاقات تا پایان ماه مارس 2012 بود نیز این مشکل وجود داشت؟ آیا در این صورت نیز “Invoice Modified” آخرین گام فرآیند بوده است؟توضیح شکل 2: اگر یک نمونهی تکمیل نشده در گام مشخصی متوقف شده است، احتمالا به این معنی خواهد بود که مابقی فعالیتها در مجموعه داده ثبت نشدهاند.
بنابراین مشخص شد که تمام نقاط پایانی به دست آمده از طریق فرآیندکاوی میتوانند معنادار نباشند. برخی از نمونهها ممکن است به دلیل نحوهی جمعآوری داده یا عدم نمایش دانش ما نسبت به تمام حالات پایان یا آغاز فرآیند نمونههای تکمیل نشدهای از مجموعه دادهی مورد بررسی شما باشند. پس زمانی که به نقشهی فرآیند مجموعه دادهای که شامل نمونههای تکمیل نشده است نگاه میکنید، آن نقطهی فرآیند نشاندهندهی نقاط شروع و پایان فرآیند مورد بررسی نیست بلکه نقاط شروع و پایان مجموعه دادهی مورد بررسی را نشان میدهد.
یکی دیگر از مشکلات بررسی مجموعه دادههای شامل نمونههای تکمیل نشده اینست که زمان اجرای فرآیند ممکن است اشتباه و گمراه کننده باشد. ابزارهای فرآیندکاوی درک نمیکنند که کدام نمونهها خاتمه یافته و کدام نمونهها “تکمیل نشده” هستند و ابزارها زمان اجرای فرآیند را زمان بین فعالیت آغازین و فعالیت پایانی درنظر گرفته و گزارش میدهد.
بنابراین زمان اجرای نمونههای تکمیل نشده کمتر از نمونههای واقعی محاسبه میگردند.
یک مثال دیگر را در نظر بگیرید. نمونه شماره 72 که در شکل 3 نشان داده شده است را نگاه کنید. فقط دو فعالیت “missing document requested” و “order created” تنها سه دقیقه زمان برای آن ثبت شده است. اما زمانی که متوجه میشویم که “ missing document requested” فعالیت آخر نبوده و فرآیند در میان زمان اجرای خود قرار دارد، متوجه میشویم که این نمونه بیش از یک ماه به طول نمیانجامد و زمان اجرای واقعی آن بیش از یک ماه و سه دقیقه خواهد بود.زمان اجرای نمونههای تکمیل نشده بسیار کمتر از زمان واقعی اجرا میتواند باشد.
پس اگر نمونههای تکمیل نشده را در مجموعه داده رها کنید آنگاه محاسبات شما مانند میانگین و مد مدت زمان اجرای فرآیند تحت تأثیر این زمانهای بسیار پایین قرار خواهد گرفت. فراموش نکنید که پارامترهای اندازهگیری کارایی فرآیند نیز متأثر واقع خواهند شد. بنابراین شما باید پیش از شروع تحلیل فرآیندکاوی خود، نمونههای تکمیل نشدهی موجود در مجموعه داده خود را بررسی نمایید. شما باید بدانید که شما چند و چه نمونههای تکمیل نشدهای در مجموعه داده خود دارید؟ ممکن است لازم باشد آن نمونهها را پیش از شروع تحلیلهای خود از مجموعه دادهی خود حذف نمایید.
چگونگی این کار را در پستهای آتی به تفصیل توضیح خواهیم داد.
ترجمه و تنظیم: دکتر مهرداد کرمانی
بدون دیدگاه