اکسل به دلیل سهولت استفاده و توانایی انجام عملکردهای سبک آمادهسازی دادهها ، جاذبه قابل توجهی دارد و در بین سازمانها محبوبیت زیادی پیدا کرده است. همچنین اکسل به عنوان ابزاری پیشگام برای دموکراتیزهسازی دادهها در شرکتها، زمینه را هموار کرد. با گذشت زمان، با ادامه پیشرفت علم و مهارتهای پیشرفته و پیچیدهتر شدن هوش مصنوعی، صفحات گسترده به سرعت به سقفی شیشهای برای بسیاری از سازمانهای امروزی تبدیل شدند که قصد دارند واقعاً داده محور باشند.
از آنجایی که مدیران و مدیران دادهها قصد دارند تیمهای خود را با استفاده از فرایندها و ابزارهایی برای ارتقا سطح آموزش دادهها و همزمان افزایش بلوغ هوش مصنوعی سازمان (که منجر به موارد استفاده بیشتر، مدلهای تولید، ROI بالاتر و غیره) مسلح سازند، بسیار مهم است که آنها انتقال را به دور از صفحات گسترده و با یک ابزار مقیاس پذیر، مانند یک سیستم عامل علوم داده end-to-end، تجربه کنند. علت چیست؟ صفحات گسترده مانع پیشرفت داده محور میشوند، آنها مستعد خطا هستند، نگهداری آنها دست و پا گیر است و در نهایت منبعی برای از دست دادن بهرهوری هستند.
صفحات گسترده و کرونا
به تازگی، BBC News فاش کرد که یک خطای صفحه گسترده باعث شده است که تقریباً ۱۶۰۰۰ مورد COVID-19 در انگلیس گزارش نشود در نتیجه این افراد بدون اینکه بدانند به دیگران نزدیک شدند و خود را قرنطینه کردند و این امر موجب افزایش ویروس کرونا و به خطر افتادن جان افراد زیادی شد. علاوه بر اینکه این خدمات باعث نگرانیهای آشکار بهداشتی و اجتماعی میشود، تأثیرات مخرب (به دلیل عدم حاکمیت دادهها و خطاهای انسانی) دیگری هم در صفحات گسترده وجود دارد.
برای اینکه از ایجاد گزارشهای زمانبر در صفحه گسترده یا ماکروهای درحال اجرا که در طی یک دهه اخیر به روز نشدهاند، عبور کنید، چند نکته وجود دارد که در اختیارتان قرار خواهیم داد:
- آمادگی دادهها را به همان مکانی که یادگیری ماشین در پروژهها اتفاق میافتد بیاورید.
- با استفاده از ابزارها، نگرانیهای اعتماد و امنیت را برطرف کنید.
- به دنبال سکویی باشید که به شما کمک کند زمان ارزشگذاری را تسریع کنید، نه اینکه آن را طولانی کنید.
تنها راهی که تیمهای امروزی (یعنی تحلیلگران یا سایر افراد تجاری) قادر به همکاری واقعی در پروژههای داده درجه یک با مجموعه دادههای پیچیده هستند، سادهسازی کار در یک ابزار است تا همه چیز از آمادگی دادهها تا مدلسازی و موارد دیگر، قابل مشاهده باشد. در یک مکان نیازی به جابجایی بین ابزارها نیست. در نتیجه، تیمها میتوانند زمان از دست رفته خود را بازیابند، از کارهای تکراری جلوگیری کنند و از استفاده مجدد بهره ببرند در نتیجه با سرعت بالاتری به کمک هوش مصنوعی به سودآوری برسند.
بیشتر بخوانید: یادگیری ماشین یا ماشین لرنینگ چیست؟
چرا صفحات گسترده برای شرکتهای علم داده کاربردی نیستند؟
منبع غیرقابل اعتماد
از آنجا که معیشت یک سازمان به اعتماد کاربران آن بستگی دارد، در نتیجه ضروری است که دادهها محافظت و اداره شوند. بسیاری از شرکتها بر اساس صفحه گسترده، تصمیمات اساسی میگیرند و بیش از حد به ماکروهای تولید شده نزدیک به دو دهه پیش اعتماد دارند. برای منابع دادهای که حاوی اطلاعات حساس هستند، صفحات گسترده به طور قابل ملاحظهای خطرناک هستند زیرا هیچ دنباله حسابرسی واقعی وجود ندارد. در نتیجه این صفحات گسترده مرکز قابل اعتمادی برای ذخیرهی دادهها نخواهند بود.
مجموعهای از ناکارآمدیها
بخش قابل توجهی از علم داده شامل شناسایی داده و بینش است که در آن میتوان کاراییها را شناسایی کرد. اگرچه کار با صفحات گسترده کاملاً معکوس این پیشرفت است، زیرا مملو از ناکارآمدیهای فراوان است. مشخصاً، سازمانها مجبور خواهند بود تا کارمندان بیشتری را استخدام کنند زیرا صفحات گسترده، از نظر نیروی انسانی و از نظر خروجی واقعی ناکارآمد هستند. صفحات گسترده برای پروژههای پیچیده هوش مصنوعی مفید نیستند زیرا به دستیابی و پردازش مقادیر زیادی از دادهها، انتقال دادهها از یک مخزن به مخزن دیگر و سپس استفاده از منابع محاسباتی نیاز دارند.
رویکرد قدیمی
صفحات گسترده مانع همکاری و توانایی به اشتراک گذاری ایدهها در زمان واقعی میشوند. برای ارگانیک شدن همکاری، تیمها باید تجزیه و تحلیل خود را متمرکز کنند. از سوی دیگر آمادگی دادهها در صفحات گسترده زمان زیادی را از توسعه ایدههای جدید و کار بر روی پروژههای جدید میگیرد، در حالی که در یک ابزار علم داده میتوان برای کاهش وقت تلف شده و افزایش کارایی، در پروژههای آینده صرفهجویی و استفاده مجدد کرد. در واقع اگر همه چیز در یک مکان باشد، کسانی که با داده کار میکنند میتوانند به راحتی از تجزیه و تحلیل دیگران استفاده کرده و سریعتر با هوش مصنوعی به سود برسند.