صفحه اصلی > داده کاوی و علم داده : معماری داده کاوی

معماری داده کاوی

معماری داده کاوی

فناوری نوین داده کاوی علمی جدید و پرکاربرد است که در تمام حوزه‌های کسب کار به‌خصوص علوم روز دنیا به کار گرفته می‌شود. در واقع با کشف و به کارگیری داده کاوی بهبود چشمگیری در کسب و کارها و تجارت‌ها مشاهده می‌شود، چرا که سازمان‌ها با استفاده از این فناوری به میزان قابل توجهی از اشتباهات تکرارشونده‌شان کاسته شده است.

استفاده از فناوری‌های هوش مصنوعی و یادگیری ماشین در فرآیند داده کاوی، سبب می‌شود که الگوریتم‌ها و مدل‌های سازنده و بدون خطا در اختیار صاحبان تجارت ها، صنایع و علوم مختلف قرار بگیرید. جالب‌تر اینکه در فناوری داده کاوی نقطه پایان مطرح نیست و الگوها و مدل بر اساس چشم اندازها و اهداف مورد نظر سازمان تغییر می‌کنند و می‌توان با استفاده از داده بهترین تکنیک‌ها و مدلسازی‌ها را انجام داد. در نتیجه همواره صنایع رو به جلو در حرکت خواهند بود.

داده کاوی:

اگر خلاصه‌تر بخواهیم داده کاوی را توضیح دهیم، این فناوری از فرآیندی شامل یافتن و جمع‌آوری اطلاعات مورد نیاز تجارت و علم مورد نظر شکل گرفته است. در داده کاوی، اطلاعات و دیتاهای مورد نیاز جهت تعیین اهداف و مدلسازی را از میان بی‌شمار داده‌های متفاوت نهفته در پایگاه‌های اطلاعاتی همچون انبارها، فایل و بلوک‌های مشخص استخراج و طبقه‌بندی و ذخیره می‌کنیم.

استفاده از فناوری داده کاوی تنها به چند صنعت محدود نمی‌شود بشر در تمام حوزه‌ها اعم از علمی، پزشکی، تجاری و تحقیقاتی و حتی در اتخاذ تصمیمات سیاسی از آن استفاده خواهد کرد.

در حال حاضر داده‌ها در حوزه‌های تجاری به صورت تصاعدی و با انجام هر معامله خودکار در حال ذخیره در منابع و حوزه‌های رابطه‌ای هستند. از این پایگاه‌های داده‌ای برای تهیه گزارش‌ها و عملکرد تجاری و بررسی انبارها توسط کاربران استفاده می‌کنند. در واقع این پایگاه‌های داده هستند که تصمیم گیری‌های بعدی را راحت‌تر و کم خطاتر می کنند.

چگونه از سیستم داده کاوی استفاده کنیم؟

طرح این سوال سبب می شود که برای دسترسی به پایگاه های داده سیستمی مبتنی بر چهار معماری احتمالی ترسیم کنیم که در فرآیند داده کاوی می‌توان از آن‌ها استفاده کرد:

مدل‌های معماری داده کاوی:

  1. مدل عدم اتصال:

در این مدل معماری داده کاوی، سیستم هیچ استفاده و کاربری از عملکردها و نتایج انبارها و حوزه‌های ذخیره داده نخواهد داشت. مدل بدون اتصال به این صورت عمل می‌کند که یک پایگاه داده خاص را بازیابی کرده، سپس از الگوریتم‌های بزرگ استفاده کرده و داده ها را پردازش می‌کند. در مرحله بعد نتایج و برآیند حاصل این پردازش را در سیستم ذخیره می‌نماید.

  • این مدل معماری در واقع هیچ فایده و مزیتی برای پایگاه های داده نخواهد داشت.
  • از این مدل معماری به عنوان یک نوع سست و ضعیف سیستم داده کاوی یاد می‌شود.
  • از مدل معماری بدون اتصال می‌توان در داده‌کاوی‌های ساده استفاده کرد.

بیشتر بخوانید: مدل های یادگیری ماشینی به زبان ساده

 

  1. مدل اتصال سست:

در این مدل معماری برخلاف مدل معماری بدون اتصال تکیه سیستم داده کاوی و فرآیند آن بر پایه استفاده و بهره بردن از انبار داده ها و یا پایگاه‌های اطلاعات است. در واقع مدل اتصال سست از پایگاه های داده استفاده کرده و اطلاعات مورد نظر خود را بازیابی می کند.

عملکرد کلی مدل اتصال سست به اینصورت است که:

  • ابتدا سیستم اطلاعات و داده ها را از انبار و یا حوزه داده‌ای مورد نظر بازیابی می کند.
  • سپس برای پردازش داده از الگوریتم های داده کاوی تعیین شده استفاده می‌کند.
  • پس از پردازش داده ها و کسب نتیجه و تهیه گزارش از آن‌ها، برآیند و گزارش را داخل سیستم ذخیره می‌نماید.
  • سیستم‌های داده کاوی که مبتنی بر حافظه هستند و به عملکرد ویژه و مقیاس بالا احتیاجی ندارند از معماری اتصال سست استفاده می‌کنند.
  1. مدل کوپلینگ نیمه تنگ:

مدل سوم معماری داده کاوی پیشرفته‌تر از مدل اتصال سست عمل می‌کند. مدل کوپلینگ نیمه تنگ به حوزه‌ها و انبارهای داده اتصال کامل دارند و علاوه بر اتصال این سیستم از چند مزیت و عملکرد دیگر همچون نمایه‌سازی، جمع‌آوری اطلاعات و مرتب‌سازی و طبقه‌بندی آن‌ها نیز پشتیبانی می‌کند.

کاربر و یا سیستم تجاری می‌تواند با استفاده از این مدل معماری داده کاوی برخی از نتایج پردازش داده ها را در سیستم انبار و حوزه‌ها ذخیره نماید.

  1. مدل اتصال تنگ:

در مدل سیستم داده کاوی فشرده انبار داده ها جزء شناخته می‌شوند. در این سیستم یکپارچه‌سازی داده ها همان بازیابی اطلاعات است. در این مدل از تمام ویژگی‌های انبار داده استفاده می‌شود. تجارت‌هایی که اهداف و تصمیمات با عملکرد بالا، مقیاس‌پذیری بالا و اطلاعات یکپارچه نیاز دارند از این مدل استفاده می‌کنند.

در ضمن خوب است بدانید که مدل داده کاوی فشرده و یا اتصال تنگ خود از چند لایه: داده، لایه کاربرد داده کاوی و لایه جلویی شکل می‌گیرد:

  • لایه داده: همانطور که اشاره کردیم در تمام سیستم‌ها داده ها به عنوان منابع داده ها مورد استفاده قرار می‌گیرند و پردازش‌ها و گزارش‌ها را در خود حفظ می‌کنند.
  • لایه کاربرد داده کاوی: تغییرات، بازیابی‌ها و اصلاحات دلخواه را می‌توان در این لایه انجام داد و یکبار دیگر فرایند پردازش را در سیستم تکرار کرد.
  • لایه جلویی: این لایه در واقع یک رابط دیداری برای کاربر نهایی محسوب می‌شود. کاربر می‌تواند خیلی راحت با استفاده از این لایه رابطه با سیستم داده کاوی در ارتباط باشد. در واقع کاربر نتایج پردازش‌ها و داده‌کاوی‌ها را در لایه جلویی مشاهده می‌کند.
من پانتـه‌آ پایـدار کارشناس ارشد مهندسی آی تی در گرایش کسب و کار الکترونیکی هستم. علاقمند به هر فناوری و تکنیک جدیدی در حوزه آی‌تی و هر چه به این حوزه کمک می‌کند. به تحقیق و پژوهش و تولید محتوا در زمینه دنیای دیجیتال و آی تی مشغولم.
مقالات مرتبط

گزارش دیتاک از صنعت لوازم خانگی در ایران

کلان‌داده شبکه اجتماعی درباره نگرش ایرانیان به برندهای لوازم خانگی ایرانی و…

واکاوی نگرش ایرانیان به اتباع افغان بر اساس داده‌کاوی شبکه‌های اجتماعی (افکارسنجی و رسانه‌سنجی)

موضوع حضور مهاجران یا اتباع افغان در ایران در یکی دو سال گذشته تبدیل به یک بحران اجتماعی شده و بخش بزرگی از جامعه ایران و مهاجران را درگیر خود کرده است.

دیدگاهتان را بنویسید