اگر با هوش مصنوعی آشنایی نسبی داشته باشید، حتما در مورد پرکاربردترین شاخه آن، یعنی یادگیری ماشین چیزهایی شنیدهاید. در واقع هدف یادگیری ماشینی درک ساختار دیتا و قرار دادن این دیتاها در مدلهایی مناسب برای سیستم است، به نحوی که قابل فهم و استفاده باشند. در اصل اگر یک سیستم بتواند به صورت خودکار از محیط اطراف خود چیزی یاد بگیرد و طبق آن عملکرد خود را بهبود دهد، میتوان گفت یادگیری توسط سیستم صورت گرفته است.
یک مدل ریاضی براساس دادههای احتمالی، الگوریتمهای یادگیری ماشین را تشکیل میدهد. این الگوریتمها برای پیشبینی یا تصمیمگیری سیستم ایجاد میشوند.
ماشین لرنینگ یک فرآیند و تخصص در حال پیشرفت است و جهت وارد شدن به آن باید اصطلاحات مهم آن را فرا بگیرید. هر مدیری برای اینکه بتواند یادگیری ماشین را در مسائل فنی و تجاری استفاده کند باید با این اصطلاحات آشنا باشد. در ادامه مهم ترین اصطلاحات یادگیری ماشینی را به شما آموزش خواهیم داد.
پرکاربردترین و مهم ترین اصطلاحات یادگیری ماشینی
۱) پردازش زبان طبیعی
در واقع پردازش زبان طبیعی یا همان NLP یک مفهوم اشتراکی برای متدهای متنوع یادگیری ماشین است. که برای کامپیوتر این قابلیت را فراهم میسازد تا دستورات انسان را متوجه شده و همان گونه اجرا کند.
کاربرد پردازش طبیعی
- طبقهبندی و رتبه بندی متون ( Text Classification and Ranking)
- تحلیل احساسات ( Sentiment Analysis)
- خلاصه سازی اسناد (Document Summarization)
- تشخیص موجودیتهای اسمی (Named Entity Recognition)
- تشخیص گفتار (Speech Recognition)
- درک و تبدیل زبان طبیعی (Natural Language Understanding and Generation)
- ترجمه ماشینی (Machine Translation)
با پردازش زبان طبیعی آشنا شوید: پردازش زبان طبیعی یا Natural Language Processing چیست؟
۲) مجموعه داده
داده یا Dataset یکی از مهم ترین اصطلاحات و بخشهای یادگیری ماشینی است. اگر قصد دارید یک سیستم یادگیری ماشینی راه اندازی کنید، باید حتماً داده دریافت کنید (مثلا از منابع عمومی داده بگیرید) یا اینکه خودتان دادهها را جمعآوری نمایید. به تمامی دادههایی که برای ایجاد یا تست مدلهای یادگیری ماشینی استفاده میشود، مجموعه داده یا دیتاست گفته میشود.
تقسیمبندی مجموعه دادهها
دیتاستها به سه دسته تقسیمبندی میشوند:
- دادههای آموزشی
- دادههای اعتبارسنجی
- دادههای آزمایشی
۳) بینایی کامپیوتر
بینایی کامپیوتر یا به اختصار همان CV یکی از حوزههای اصلی هوش مصنوعی است. این حوزه مربوط به ارائه ابزار برای تحلیل و درک دادههای تصاویر و ویدئوهاست.
مهمترین قابلیتهای CV ها
الف) طبقهبندی تصاویر (Image classification)
ب) تشخیص اشیا (Object detection)
ج) بخشبندی تصاویر (Image segmentation)
د) تشخیص نکات برجسته (Saliency detection)
۴) یادگیری با نظارت
یادگیری با نظارت یا Supervised learning یکی از زیرشاخههای خانواده یادگیری ماشین است که موجب میشود مدلها با استفاده از مثال آموزش ببینند. به این معنی که دیتاها برای یک یادگیری ماشینی با نظارت به برچسب نیاز خواهند داشت.
برای درک بهتر موضوع با مثال توضیح خواهیم داد. اگر قصد دارید مدلی تهیه کنید که متنی را در مورد بازاریابی تشخیص دهد باید یک مدل با مجموعهای از نمونههای برچسبگذاری شده را ارائه دهید. یعنی متن همراه با اطلاعاتی که نشان دهد نمونه در مورد بازاریابی است یا نه.
این مطلب را از دست ندهید: یادگیری ماشین یا ماشین لرنینگ چیست؟ | کاربردها و ویژگیها
۵) یادگیری بدون نظارت
این اصطلاح (Unsupervised learning) برخلاف یادگیری با نظارت موجب میشود مدلها بر اساس مشاهدات خود فرآیند یادگیری را انجام دهند. به این معنی که دادههای ارائه شده به مدل دارای الگوریتم بدون برچسب است. این نوع مدلها توانایی پیدا کردن ساختار یا روابط بین ورودیهای مختلف را دارند. یکی از مهمترین تکنیکهای یادگیری بدون نظارت، خوشهبندی است. در خوشهبندی با توجه به دادهها، ورودیها در خوشههای مختلف قرار خواهند گرفت.
۶) یادگیری تقویتی
یادگیری تقویتی یا Reinforcement Learning در واقع الگوریتم یک بازی را انجام میدهد. در این بازی هدف کسب بیشترین مقدار جایزه است. این الگوریتم به این صورت عمل میکند که حرکتهای مختلف را با آزمایش و خطا بررسی کرده و در آخر بهترین گزینه را با بیشترین منفعت انتخاب میکند. یکی از بارزترین و مشخصترین مثالهای یادگیری تقویتی حل مکعب روبیک و یا بازی شطرنج در کامپیوتر است. البته یادگیری تقویتی فقط برای بازی نیست و در قیمتگذاری لحظهای نیز از آن استفاده میشود.
۷) شبکه عصبی
شبکه عصبی یا Neural Networks یکی از بزرگترین مجموعههای مدل یادگیری ماشین است که هدف آن تقلید رفتار مغز انسان در زمان پردازش دادههاست. شبکههای مصنوعی همچون شبکههای اتصال سلولهای عصبی واقعی در مغز انسان از لایههایی تشکیل شدهاند که هر کدام مجموعهای از سلولهای عصبی است. در این مجموعه هر سلول وظیفه تشخیص موارد مختلفی را بر عهده دارند.
هر شبکه عصبی مدام در حال پردازش است. به این صورت که تنها لایه اول به صورت مستقیم به ورودی متصل است. لایههای بعدی مطابق خروجی لایه قبل، ویژگیها را تشخیص میدهند. زمانی که تعداد لایهها افزایش مییابد، این مدل به عنوان مدل یادگیری عمیق نامیده میشود. البته نمیتوان گفت که وجود چه تعداد لایه موجب به وجود آمدن مدل یادگیری عمیق خواهد شد.
نمونههای مختلف شبکههای عصبی
- شبکههای عصبی پیچشی (Convolutional Neural Networks)
- شبکههای عصبی بازگشتی (Recurrent Neural Networks)
- شبکههای عصبی تماماً متصل (Fully Connected Neural Networks)
۸) بیش برازش
اگر چندین بار به یک فروشگاه مراجعه کنید و محصول مورد نظر شما را نداشته باشد حتما با خود میگویید این فروشگاه مناسب نیست و یا از آن نا امید خواهید شد. البته این شرایط در حالی اتفاق میافتد که هزاران مشتری دیگر از این فروشگاه رضایت کامل دارند. حالا اگر شما را یک مدل یادگیری ماشین فرض کنیم میتوان ادعا کرد شما با توجه به تعداد کم نمونه بیس برازش انجام دادهاید. یعنی مدل ساخته شده دارای انحراف است و بر اساس تصور غلط شما ایجاد شده است و اصلاً دقیق نیست. بیش برازش یا Over Fitting در اصل یعنی یادگیری به خوبی انجام شده اما قدرت تعمیمپذیری ندارد.
این اصطلاحات و عبارات جزء مهم ترین اصطلاحات یادگیری ماشینی هستند که هر مدیری برای ارتقاء کسب و کار خود باید با آنها آشنا باشد و قدرت پیادهسازی آنها را داشته باشد تا بتواند عملکردی موفق داشته باشد.