چقدر بزرگ؟ محدوده کلان داده کجاست؟

چقدر بزرگ؟ محدوده کلان داده کجاست؟



یکی از سوالاتی که بارها در حوزه کلان داده از من پرسیده شده است این است که " چقدر بزرگ؟". یعنی اینکه یک سازمان حجم داده هایش چقدر باید باشد که وارد حوزه کلان داده و راه حلهای آن شود.


براستی واقعا بزرگ معادل چه عددی است؟ آیا اصلا می توان برای این سوال پاسخ مشخصی و واحدی داد؟
می گویند مردمان قدیم و دوران باستان تا یک عدد خاصی را می توانستند شمارش کنند و بیشتر از آن را با لفظ "زیاد" جایگزین می کردند. زمانی می گفتند هرکس میلیون تومان داشته باشد پولدار است. الان هم اینگونه است؟ اگر با سنجه آن موقع بخواهیم افراد پولدار را شناسایی کنیم بسیاری از افراد در این گروه قرار خواهند گرفت.
واژه "بزرگ" واژه ای است نسبی که در فرهنگ واژگان معین بدین صورت تعریف شده است:"1 - دارای حجم ، وسعت یا کمیت زیاد."

ممکن است برای یک سازمان داده های با اندازه یک ترابایت بزرگ باشد(مانند یک شرکت خدمات حسابداری) و برای سازمانی دیگر 10 ترابایت هم بزرگ نباشد(همانند سرویس های ایندکس گذاری محتوا).


موضوع مهم برای ورود به تکنولوژی های این حوزه این است که شما در بهره برداری از داده های موجود سازمانتان با تکنولوژی های مرسوم به مشکل برخورده باشید. مثلا اگر شما برای استخراج آمار برخط از داده های شش ماه گذشته خود دچار کندی هستید و روشهای مرسوم نیز نتوانسته اند مشکل را ریشه ای حل کنند و یا اینکه تنوع داده های شما به حدی است که برای برقراری ارتباط بین این داده ها و استخراج برخی الگوها که شما را برای استخراج دانش کمک می کنند دچار مشکل شده اید، احتمالا باید به تکنولوژی ها و راه حلهای کلان داده هم فکر کنید.
زمانی که شما به سراغ کلان داده می روید باید از مرحله نگاه هدف محور به "داده" عبور کرده باشید و به دنبال تبدیل داده به اطلاعات و دانش باشید. در واقع نکته ای که اهمیت دارد این است که در این حوزه نباید به دنبال "پردازش کلان" داده بود بلکه هدف پردازش "کلان داده" است. به عبارتی استفاده از این ابزار ها زمانی کاملا مفید خواهد بود که برای پردازش داده هایی که نیازمند دانش نهفته در آنها بوده و برای دستیابی به این دانش با محدودیتهای تکنولوژیکی مواجه ایم استفاده شود.

 

 

منبع: