صفحه اصلی > داده کاوی و علم داده : فرآیندهای داده کاوی

فرآیندهای داده کاوی

Data mining process

داده کاوی (Data Mining):

یکی از فناوری‌های نوین که امید به پیشرفت تکنولوژی و بشر را در زمینه‌های متفاوت افزایش می‌دهد دانش و فرآیندهای داده کاوی است. در حقیقت داده کاوی علم بهره بردن از داده‌ها و اطلاعات گسترده‌ای است که در حوزه‌ها و پایگاه‌های داده‌ای متفاوت انبار شده‌اند.

در فرآیندهای داده کاوی با استفاده از ابزارهای نوین و بدون دخالت بشر یعنی فناوری‌های پیشرفته هوش مصنوعی، داده‌های آماری و الگوریتم‌ها و یادگیری ماشین به تجزیه و تحلیل داده‌ها می‌پردازیم.

داده کاوی مختص و منحصر به سازمان و یا محصولی به‌خصوص نیست. این فناوری روز دنیا به تدریج در حال پیشرفته‌تر شدن و نفوذ به تمام صنایع، مشاغل و سازمان‌هاست. امروز سازمان‌های بزرگی در دنیا از ویژگی‌های منحصربه‌فرد فناوری داده کاوی در حوزه‌های متفاوت و گسترده همچون هوا فضا، تولید، بازاریابی، مواد شیمیایی و … برای افزایش و بهبود راندمان کاری و کیفیت عملکرد تجاری خود استفاده می‌کنند.بنابر این استفاده از فرآیندهای داده کاوی هرگز در یک زمان به پایان نمی‌رسد و چون همواره در حال رشد است می‌توان از آن برای پیشرفت در ابعاد متفاوت استفاده کرد.

البته برای اینکه فناوری داده کاوی به یک راه حل قابل اطمینان تبدیل شود می‌بایست به دفعات توسط سازمان‌های کوچک و بزرگ مورد استفاده قرار می‌گرفت تا بالاخره در سال ۱۹۹۰ پس از آزمون‌های زیاد و همکاری سازمان‌های بیشمار به عنوان یک حل کننده مسائل استاندارد به صنایع بزرگ معرفی شد.

انواع فرآیندهای داده کاوی :

اما داده کاوی خود فرآیند و جزئیاتی دارد که خوب است بیشتر وارد آن شده و فرایند داده کاوی را مورد تحلیل و بررسی قرار دهیم:

شناخت کسب و کار برای داده کاوی:

در نخستین مرحله این نیاز ضروری احساس می‌شود که حتما احتیاج‌های تجارت مورد نظر سازمان به روشنی تعیین شوند، اهداف سازمان طبقه‌بندی شود و شناخت کافی از این برنامه‌ها بدست آید.

سپس لازم است که با بدست آوردن محدودیت‌ها و فرصت‌ها، حدسیات و فرضیات و منابعی که در دسترس هستند وضعیت اکنون را مورد بررسی قرار دهیم.

در مرحله بعد از اهداف کسب‌و‌کار و به صورت کلی تجارتی که در حال حاضر داریم بهره می‌جوییم و برای داده کاوی اهدافی تعیین می‌کنیم و با استفاده حساب شده از داده‌ها از فرآیندهای داده کاوی برای اتخاذ اهداف مهمتر استفاده می‌کنیم.

بالاخره در مرحله آخر زمان آن می‌رسد که یک برنامه مدون و قابل اجرا با استفاده از داده کاوی طرح‌ریزی کنیم تا به اهداف بلند‌مدت سازمان دست یابیم.

بیشتر بخوانید: معرفی ابزارهای برتر داده کاوی در سال ۲۰۲۰

 

شناخت داده ها برای داده کاوی:

شناخت درست داده ها با بدست آوردن استخراج اطلاعات شروع خواهد شد. با استفاده از این پایگاه‌های اطلاعاتی می‌توانیم شناخت درستی از داده ها داشته باشیم. در این مرحله چند فرآیند بارگذاری داده‌ها و هماهنگ سازی داده ها برای بهبود عملکرد ذخیره داده ها باید انجام گیرد.

سپس لازم است ویژگی‌های سطح اطلاعاتی که بدست آوردیم را مورد تحلیل قرار دهیم و گزارشی صحیح و دقیق از آن گردآوری کنیم.

در مرحله بعد داده ها سوالات، گزارش‌ها و تجسم های داده کاوی را پشت سر می‌گذارند و مورد کاوش قرار می‌گیرند و بالاخره این پروسه با مطرح شدن و پاسخ دادن به سوالاتی همچون آیا داده‌های جمع‌آوری شده کامل هستند؟ و یا داده‌هایی که از بین رفتند در داده‌های فعلی وجود دارد؟ به پایان می‌رسد.

تهیه اطلاعات برای داده کاوی:

  • طبقه‌بندی و آماده کردن داده ها در حالت طبیعی ۹۰% وقت پروژه را به خود اختصاص می‌دهد و در نهایت به داده‌های نهایی دست پیدا می‌کنیم.
  • بعد از اینکه پایگاه‌های داده‌ای مورد نظر را طبق فرآیندهای داده کاوی پیدا کردیم آن‌ها را طبقه‌بندی و مرتب می‌کنیم و به فرم مورد نظر خود در می‌آوریم.
  • در این مرحله تمرکز بر داده ها دقیق‌تر می‌شود، بنابراین به درک بهتری از الگوی‌های شناخت تجاری می‌رسیم.

مدل‌سازی برای داده کاوی:

  • در مرحله نخست روش‌ها و فنون مدل‌سازی مورد گزینش و انتخاب قرار می‌گیرند تا از آن‌ها در داده ها استفاده کنیم.
  • مرحله دوم به پروسه آزمون و امتحان کردن مدل ارائه شده اختصاص پیدا می‌کند. در این مرحله می‌توان اعتبار و کیفیت مدل را مورد بررسی و تایید قرار داد.
  • در مرحله بعد از ابزارهای موجود جهت مدل‌سازی استفاده می‌کنیم، آنها را در داده‌های بدست آمده اعمال کرده و به چند مدل نهایی می‌رسیم.
  • در نهایت مدل‌های بدست آمده توسط ذینفعان مورد ارزیابی قرار می‌گیرند و با اهداف و روش‌های تجاری سازمان مطابقت داده می‌شوند.

ارزیابی برای داده کاوی:

در این مرحله از فرآیندهای داده کاوی نتایج بدست آمده از مدل‌ها را با اهداف مرحله اول مقایسه می‌کنیم.

ممکن است در این برهه لازم باشد چند الگوی تازه در نتیجه بررسی مدل‌های و داده‌های بدست آمده اتخاذ شود. در واقع این بخش از کسب و کار و تجارت یعنی درک کسب و کار به صورت مداوم در داده کاوی تکرار می‌شود. چنانچه نخواهیم بار دیگر وارد این مرحله شویم باید پرش مجدد به این مرحله را ممنوع کنیم.

گسترش داده کاوی:

  • نتیجه و برآیند فرآیندهای داده کاوی باید به صورتی باشد که ذینفعان بتوانند آن را مورد استفاده قرار دهند.
  • می‌توانیم مرحله استقرار را ساده سازی کنیم و به یک گزارش خاتمه پیدا کند و یا آن را همچون یک فرایند کامل داده کاوی پیچیده نماییم تا بار دیگر در تجارت تکرار شود.
  • در مرحله استقرار برای پشتیبانی‌های بعدی و اجرایی کردن اهداف بعدی از برنامه‌های استقرار، نظارت و نگهداری استفاده می‌شود.
  • درضمن می‌توان با استفاده از تجربیات پروژه و تحلیل و بررسی آن یاد گرفت که در آینده سازمان به چه تکنیک‌های دیگری احتیاج دارد و یک گزارش نهایی بدست آورد.
من پانتـه‌آ پایـدار کارشناس ارشد مهندسی آی تی در گرایش کسب و کار الکترونیکی هستم. علاقمند به هر فناوری و تکنیک جدیدی در حوزه آی‌تی و هر چه به این حوزه کمک می‌کند. به تحقیق و پژوهش و تولید محتوا در زمینه دنیای دیجیتال و آی تی مشغولم.
مقالات مرتبط

گزارش دیتاک از صنعت لوازم خانگی در ایران

کلان‌داده شبکه اجتماعی درباره نگرش ایرانیان به برندهای لوازم خانگی ایرانی و…

واکاوی نگرش ایرانیان به اتباع افغان بر اساس داده‌کاوی شبکه‌های اجتماعی (افکارسنجی و رسانه‌سنجی)

موضوع حضور مهاجران یا اتباع افغان در ایران در یکی دو سال گذشته تبدیل به یک بحران اجتماعی شده و بخش بزرگی از جامعه ایران و مهاجران را درگیر خود کرده است.

دیدگاهتان را بنویسید