چکیده متن
در پست قبل به بررسی این موضوع پرداختیم که چه زمانی با نمونه‎های تکمیل نشده مواجه می‎شویم. در نگاه اول وجود این نمونه‎ها در مجموعه داده‎ی مورد بررسی مشکل ساز نمی‌باشند. این پدیده واقعیت موجود در داده‎هاست مگر نه اینست که ما می‎خواهیم بدانیم دقیقا چه اتفاقی افتاده است؟ خیر، اینگونه نیست حداقل اگر وجود [...]
اشتراک گذاری

چرا نمونه‎های تکمیل نشده ممکن است در فرآیندکاوی مشکل‌ساز شوند؟


در پست قبل به بررسی این موضوع پرداختیم که چه زمانی با نمونه‎های تکمیل نشده مواجه می‎شویم. در نگاه اول وجود این نمونه‎ها در مجموعه داده‎ی مورد بررسی مشکل ساز نمی‌باشند. این پدیده واقعیت موجود در داده‎هاست مگر نه اینست که ما می‎خواهیم بدانیم دقیقا چه اتفاقی افتاده است؟

خیر، اینگونه نیست حداقل اگر وجود این نمونه‎ها به ۲ دلیل اول ذکر شده در پست قبل  باشد، این نمونه‎های تکمیل نشده واقعیت فرآیند را بیان نمی‎کنند و آنها به دلیل نحوه‎ی جمع‌آوری داده‎های ما به وجود آمده‎اند.

شکل ۱ که نشان‎دهنده فرآیند بازپرداخت پول یک مشتری است را نگاه کنید. خط چین هایی که به نقطه‎ی پایانی فرآیند (دایره نشان داده شده در پایین مدل فرآیند ) ختم می‎شوند، مشخص کننده‎ی فعالیت‎هایی است که در انتهای فرآیند می‎بایست انجام پذیرد. بطور مثال در ۳۳۳ نمونه “order completed” آخرین گام ثبت شد و از فرآیند است. (به دایره شماره ۱ در شکل۱ توجه کنید.) این یعنی یکی از گام‎های پایانی متصور برای فرآیند همین فعالیت است. همچنین ۲۰ نمونه وجود دارد که فعالیت “Invoice Modified” فعالیت پایانی آنها ثبت شده ‎است. (به دایره ۲ در شکل ۱ توجه کنید) به نظر می‎رسد که این فعالیت پایانی آنها ثبت شده‎است. (به دایره شماره ۳ در شکل ۱ توجه کنید.)

به نظر می‎رسد که این فعالیت نمی‎تواند آخرین فعالیت فرآیند باشد.

توضیح شکل ۱: به نظر می‎رسد نمونه‎هایی که به فعالیت “Order completed” ختم شده‎اند پایان یافته و نمونه‎هایی که به فعالیت “Invoice Modified” ختم شده‎اند، هنوز در جریان اند.

اگر در مجموعه داده‎ها به دنبال نمونه‎ای بگردیم که با فعالیت “Invoice Modified” خاتمه یافته است، آنگاه خواهیم فهمید که فعالیت در تاریخ ۲۰ ژانویه ۲۰۱۲ اتفاق افتاده و زمان کل مجموعه داده‎ها در ۲۳ ژانویه ۲۰۱۲ پایان یافته است. اگر مجموعه داده‎ی ما شامل تمام اتفاقات تا پایان ماه مارس ۲۰۱۲ بود نیز این مشکل وجود داشت؟ آیا در این صورت نیز “Invoice Modified” آخرین گام فرآیند بوده است؟

توضیح شکل ۲: اگر یک نمونه‎ی تکمیل نشده در گام مشخصی متوقف شده ‎است، احتمالا به این معنی خواهد بود که مابقی فعالیت‎ها در مجموعه داده ثبت نشده‎اند.

بنابراین مشخص شد که تمام نقاط پایانی به دست آمده از طریق فرآیندکاوی می‎توانند معنادار نباشند. برخی از نمونه‎ها ممکن است به دلیل نحوه‎ی جمع‌آوری داده‎ یا عدم نمایش دانش ما نسبت به تمام حالات پایان یا آغاز فرآیند نمونه‎های تکمیل نشده‎ای از مجموعه داده‎ی مورد بررسی شما باشند. پس زمانی که به نقشه‎ی فرآیند مجموعه داده‎ای که شامل نمونه‎های تکمیل نشده ‎است نگاه می‎کنید، آن نقطه‎ی فرآیند نشان‌دهنده‎ی نقاط شروع و پایان فرآیند مورد بررسی نیست بلکه نقاط شروع و پایان مجموعه داده‎ی مورد بررسی را نشان می‎دهد.

یکی دیگر از مشکلات بررسی مجموعه داده‏‎های شامل نمونه‎های تکمیل نشده اینست که زمان اجرای فرآیند ممکن است اشتباه و گمراه کننده باشد. ابزارهای فرآیندکاوی درک نمی‎کنند که کدام نمونه‎ها خاتمه یافته و کدام نمونه‎ها “تکمیل نشده” هستند و ابزارها زمان اجرای فرآیند را زمان بین فعالیت آغازین و فعالیت پایانی درنظر گرفته و گزارش می‎دهد.

بنابراین زمان اجرای نمونه‎های تکمیل نشده کمتر از نمونه‎های واقعی محاسبه می‎گردند.

یک مثال دیگر را در نظر بگیرید. نمونه شماره ۷۲ که در شکل ۳ نشان داده شده است را نگاه کنید. فقط دو فعالیت “missing document requested” و “order created”  تنها سه دقیقه زمان برای آن ثبت شده ‎است. اما زمانی که متوجه می‎شویم که “ missing document requested” فعالیت آخر نبوده و فرآیند در میان زمان اجرای خود قرار دارد، متوجه می‎شویم که این نمونه بیش از یک ماه به طول نمی‎انجامد و زمان اجرای واقعی آن بیش از یک ماه و سه دقیقه خواهد بود.

زمان اجرای نمونه‎های تکمیل نشده بسیار کمتر از زمان واقعی اجرا می‎تواند باشد.

پس اگر نمونه‎های تکمیل نشده را در مجموعه داده رها کنید آنگاه محاسبات شما مانند میانگین و مد مدت زمان اجرای فرآیند تحت تأثیر این زمان‎های بسیار پایین قرار خواهد گرفت. فراموش نکنید که پارامترهای اندازه‌گیری کارایی فرآیند نیز متأثر واقع خواهند شد. بنابراین شما باید پیش از شروع تحلیل فرآیندکاوی خود، نمونه‎های تکمیل نشده‎ی موجود در مجموعه داده خود را بررسی نمایید. شما باید بدانید که شما چند و چه نمونه‎های تکمیل نشده‎ای در مجموعه داده خود دارید؟ ممکن است لازم باشد آن نمونه‎ها را پیش از شروع تحلیل‎های خود از مجموعه داده‎ی خود حذف نمایید.

چگونگی این کار را در پست‎های آتی به تفصیل توضیح خواهیم داد.

 

ترجمه و تنظیم: دکتر مهرداد کرمانی

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *