داده کاوی (Data Mining):
یکی از فناوریهای نوین که امید به پیشرفت تکنولوژی و بشر را در زمینههای متفاوت افزایش میدهد دانش و فرآیندهای داده کاوی است. در حقیقت داده کاوی علم بهره بردن از دادهها و اطلاعات گستردهای است که در حوزهها و پایگاههای دادهای متفاوت انبار شدهاند.
در فرآیندهای داده کاوی با استفاده از ابزارهای نوین و بدون دخالت بشر یعنی فناوریهای پیشرفته هوش مصنوعی، دادههای آماری و الگوریتمها و یادگیری ماشین به تجزیه و تحلیل دادهها میپردازیم.
داده کاوی مختص و منحصر به سازمان و یا محصولی بهخصوص نیست. این فناوری روز دنیا به تدریج در حال پیشرفتهتر شدن و نفوذ به تمام صنایع، مشاغل و سازمانهاست. امروز سازمانهای بزرگی در دنیا از ویژگیهای منحصربهفرد فناوری داده کاوی در حوزههای متفاوت و گسترده همچون هوا فضا، تولید، بازاریابی، مواد شیمیایی و … برای افزایش و بهبود راندمان کاری و کیفیت عملکرد تجاری خود استفاده میکنند.بنابر این استفاده از فرآیندهای داده کاوی هرگز در یک زمان به پایان نمیرسد و چون همواره در حال رشد است میتوان از آن برای پیشرفت در ابعاد متفاوت استفاده کرد.
البته برای اینکه فناوری داده کاوی به یک راه حل قابل اطمینان تبدیل شود میبایست به دفعات توسط سازمانهای کوچک و بزرگ مورد استفاده قرار میگرفت تا بالاخره در سال ۱۹۹۰ پس از آزمونهای زیاد و همکاری سازمانهای بیشمار به عنوان یک حل کننده مسائل استاندارد به صنایع بزرگ معرفی شد.
انواع فرآیندهای داده کاوی :
اما داده کاوی خود فرآیند و جزئیاتی دارد که خوب است بیشتر وارد آن شده و فرایند داده کاوی را مورد تحلیل و بررسی قرار دهیم:
شناخت کسب و کار برای داده کاوی:
در نخستین مرحله این نیاز ضروری احساس میشود که حتما احتیاجهای تجارت مورد نظر سازمان به روشنی تعیین شوند، اهداف سازمان طبقهبندی شود و شناخت کافی از این برنامهها بدست آید.
سپس لازم است که با بدست آوردن محدودیتها و فرصتها، حدسیات و فرضیات و منابعی که در دسترس هستند وضعیت اکنون را مورد بررسی قرار دهیم.
در مرحله بعد از اهداف کسبوکار و به صورت کلی تجارتی که در حال حاضر داریم بهره میجوییم و برای داده کاوی اهدافی تعیین میکنیم و با استفاده حساب شده از دادهها از فرآیندهای داده کاوی برای اتخاذ اهداف مهمتر استفاده میکنیم.
بالاخره در مرحله آخر زمان آن میرسد که یک برنامه مدون و قابل اجرا با استفاده از داده کاوی طرحریزی کنیم تا به اهداف بلندمدت سازمان دست یابیم.
بیشتر بخوانید: معرفی ابزارهای برتر داده کاوی در سال ۲۰۲۰
شناخت داده ها برای داده کاوی:
شناخت درست داده ها با بدست آوردن استخراج اطلاعات شروع خواهد شد. با استفاده از این پایگاههای اطلاعاتی میتوانیم شناخت درستی از داده ها داشته باشیم. در این مرحله چند فرآیند بارگذاری دادهها و هماهنگ سازی داده ها برای بهبود عملکرد ذخیره داده ها باید انجام گیرد.
سپس لازم است ویژگیهای سطح اطلاعاتی که بدست آوردیم را مورد تحلیل قرار دهیم و گزارشی صحیح و دقیق از آن گردآوری کنیم.
در مرحله بعد داده ها سوالات، گزارشها و تجسم های داده کاوی را پشت سر میگذارند و مورد کاوش قرار میگیرند و بالاخره این پروسه با مطرح شدن و پاسخ دادن به سوالاتی همچون آیا دادههای جمعآوری شده کامل هستند؟ و یا دادههایی که از بین رفتند در دادههای فعلی وجود دارد؟ به پایان میرسد.
تهیه اطلاعات برای داده کاوی:
- طبقهبندی و آماده کردن داده ها در حالت طبیعی ۹۰% وقت پروژه را به خود اختصاص میدهد و در نهایت به دادههای نهایی دست پیدا میکنیم.
- بعد از اینکه پایگاههای دادهای مورد نظر را طبق فرآیندهای داده کاوی پیدا کردیم آنها را طبقهبندی و مرتب میکنیم و به فرم مورد نظر خود در میآوریم.
- در این مرحله تمرکز بر داده ها دقیقتر میشود، بنابراین به درک بهتری از الگویهای شناخت تجاری میرسیم.
مدلسازی برای داده کاوی:
- در مرحله نخست روشها و فنون مدلسازی مورد گزینش و انتخاب قرار میگیرند تا از آنها در داده ها استفاده کنیم.
- مرحله دوم به پروسه آزمون و امتحان کردن مدل ارائه شده اختصاص پیدا میکند. در این مرحله میتوان اعتبار و کیفیت مدل را مورد بررسی و تایید قرار داد.
- در مرحله بعد از ابزارهای موجود جهت مدلسازی استفاده میکنیم، آنها را در دادههای بدست آمده اعمال کرده و به چند مدل نهایی میرسیم.
- در نهایت مدلهای بدست آمده توسط ذینفعان مورد ارزیابی قرار میگیرند و با اهداف و روشهای تجاری سازمان مطابقت داده میشوند.
ارزیابی برای داده کاوی:
در این مرحله از فرآیندهای داده کاوی نتایج بدست آمده از مدلها را با اهداف مرحله اول مقایسه میکنیم.
ممکن است در این برهه لازم باشد چند الگوی تازه در نتیجه بررسی مدلهای و دادههای بدست آمده اتخاذ شود. در واقع این بخش از کسب و کار و تجارت یعنی درک کسب و کار به صورت مداوم در داده کاوی تکرار میشود. چنانچه نخواهیم بار دیگر وارد این مرحله شویم باید پرش مجدد به این مرحله را ممنوع کنیم.
گسترش داده کاوی:
- نتیجه و برآیند فرآیندهای داده کاوی باید به صورتی باشد که ذینفعان بتوانند آن را مورد استفاده قرار دهند.
- میتوانیم مرحله استقرار را ساده سازی کنیم و به یک گزارش خاتمه پیدا کند و یا آن را همچون یک فرایند کامل داده کاوی پیچیده نماییم تا بار دیگر در تجارت تکرار شود.
- در مرحله استقرار برای پشتیبانیهای بعدی و اجرایی کردن اهداف بعدی از برنامههای استقرار، نظارت و نگهداری استفاده میشود.
- درضمن میتوان با استفاده از تجربیات پروژه و تحلیل و بررسی آن یاد گرفت که در آینده سازمان به چه تکنیکهای دیگری احتیاج دارد و یک گزارش نهایی بدست آورد.