Big Data چیست؟

کلمه ی بیگ دیتا (Big Data) یک اصطلاح جدید می باشد که اخیرا زیاد به گوش می رسد. در گذشته این واژه به معنا میزان عظیمی داده های ساختاربندی شده و نشده بود. این داده ها انقدر زیاد بودند که پردازش آنها به وسیله دیتابیس های سنتی و نرم افزارهای موجود دشوار بود. در اکثر سازمان ها میزان داده ها خیلی بزرگ است یا با سرعت زیادی حرکت می کند و ظرفیت پردازش فعلی سازمان ها را رد کرده است. در کنار این مشکلات بیگ دیتا پتانسیل این را دارد که به شرکت ها کمک کند تا عملیات های خود را بهبود بخشیده و تصمیمات سریعتر و هوشمندانه تری اتخاذ نمایند.

BigData-001

بیگ دیتا یک میزان و حجم است یا یک فناوری؟

علی رغم اینکه واژه به نظر می رسد که به حجم داده اشاره می کند اما همیشه اینگونه نیست. اصطلاح بیگ دیتا، مخصوصا وقتی به وسیله ارائه دهنده خدمات میزبانی به کار می رود، ممکن است به فناوری اشاره کند (شامل ابزار ها و فرآیندها) که سازمان برای رسیدگی به حجم عظیم داده و ذخیره سازی انها بدان نیاز دارند. این باور وجود دارد که واژه ی بیگ دیتا از شرکت های جستجوی وبی منشا گرفته است که می بایست داده های بی ساختار خیلی بزرگی را کوئری نمایند.

مثالی برای بیگ دیتا

یک مثال برای بیگ دیتا می تواند پتابایت ها (Petabytes) یا اگزابایت ها (Exabytes) شامل میلیاردها تا تیلیاردها رکورد از میلیون ها نفر باشد که هرکدام از انها در منابع مختلف (مانند وب سایت، حراجی ها، مراکز خدمات مشتریان، شبکه های اجتماعی و غیره) وجود دارند. این داده ها عموما بدون ساختار مشخصی می باشند و یا ناقص هستند یا دسترسی به آنها مقدور نیست.

بیگ دیتا و دیتابیس ها تجاری

وقتی در تعامل با دیتابیس های حجیم هستیم، سازمان ها در ایجاد، تغییر و مدیریت بیگ دیتا ها با مشکلاتی مواجه می شوند. بیگ دیتا به خصوص در بخش آمار و تحلیل داده مشکل ساز می باشد، زیرا ابزارهای استاندارد و روال های فعلی برای جستجو و آنالیز دیتابیس های عظیم طراحی نشده اند.

 

ساختار بیگ دیتا

بیگ دیتا می تواند با سه وجه توصیف گردد: ۱) حجم عظیم داده ۲) تنوع بسیار گسترده ی داده ها ۳) سرعتی که می بایست داده ها پردازش شوند. با وجود اینکه بیگ دیتا به حجم مشخصی اشاره نمی کند، اما عموما واژه زمانی به کار می رود که در مورد پتابایت و اگزابایت داده صحبت می کنیم.

از انجاییکه بیگ دیتا زمان و هزینه ی زیادی برای بارگذاری در دیتابیس های منطقی سنتی برای تحلیل در بر دارد، روش های نوینی برای تحلیل و ذخیره سازی داده ها به وجود آمده اند که کمتر به الگو و حجم داده توجه می کنند. در عوض داده ی خام در محلی جمع اوری شده و به وسیله ی ماشین های یادگیرنده و هوش مصنوعی بررسی می شوند تا بتوانند به وسیله استفاده از الگوریتم های بسیار پیچیده الگوهای تکرار شونده ای را بیابند. سپس این الگوریتم های تکرار شونده مورد استفاده قرار گرفته و اقدام به تحلیل داده می نمایند. با این روش بار پردازش کامل داده های بزرگ کم می شود.

 

منتشر شده در بلاگ ایران هاست توسط: نصیری

ایران هاست، ارائه دهنده سرويس های ثبت دامنه، ميزباني وب، میزبانی ایمیل، میزبانی اختصاصی و سرورهای اختصاصی و مجازی مطابق با استانداردهای جهانی

شما ممکن است علاقه داشته باشید:

0 تفکر بر روی “Big Data چیست؟”

پاسخ دهید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

شبکه های مجازی ما

دسته بندی ها