کلان داده یا بیگ دیتا چیست؟ (+کاربردهای Big Data)
- مطالعه درس داده و فراداده / دیتا و متادیتا (باید به خوبی درک کنید که دیتا چیست)
- بتوانند به صورت مختصر توضیح دهند که کلان داده یا بیگ دیتا چیست.
- مدلهای 3V و 4V را در تعریف کلان داده توصیف کنند.
- بتوانند چند مثال از کاربردهای کلان داده را فهرست کنند.
کلان داده یا بیگ دیتا (Big Data) را میتوان یکی از اصطلاحات پُرتکرار در حرفها و نوشتههای مربوط به فناوری اطلاعات دانست.
اگر جستجوهای مربوط به کاربرد کلان داده را در گوگل بررسی کنید، میبینید که کاربرد کلان داده در پزشکی، اقتصاد، بانکداری و نیز حسابداری و حسابرسی، صرفاً بخش کوچکی از سوالها و دغدغههای علاقهمندان این حوزه را به خود اختصاص میدهد.
همهی ما با شنیدن بیگ دیتا یا کلان داده تا حدی میتوانیم معنای آن را حدس بزنیم: ظاهراً به زبان ساده میتوان گفت موضوع بیگ دیتا، به حجم زیاد دادهها مربوط است؛ حجمی که هر روز نیز رو به افزایش است و هر یک از ما، در هر مقیاسی که فعال باشیم، جلوههایی از آن را مشاهده و تجربه کردهایم.
اما اجازه بدهید برای آشنایی با یک تعریف دقیقتر، به سراغ موسسه گارتنر برویم و تعریف گارتنر را از بیگ دیتا بخوانیم (+):
تعریف کلان داده (گارتنر)
بیگ دیتا (Big Data) به معنای داراییهای اطلاعاتی [یک مجموعه یا سازمان] است که:
- حجم بالا دارند
- با سرعت زیاد تولید میشوند و / یا تنوع گسترده دارند
و نیازمند شیوههای پردازش نوآورانه با هزینهی مناسب هستند تا بتوان از آن برای اتوماسیون فرایندها، تصمیم گیری و بهبود شهود و بینش [در سازمان] بهره گرفت.
مدل ۳V بیگ دیتا (Big 3V Model)
در اغلب تعریف های کلان داده، سه اصطلاح حجم (Volume) و سرعت (Velocity) و تنوع (Variety) را میبینید. در حدی که گاهی برای تعریف بیگ دیتا از اصطلاح ۳V استفاده میکنند.
به عنوان مثال، شرکت PWC هم که از بزرگان مشاوره مدیریت در جهان است، بیگ دیتا را با همین ۳V تعریف میکند (+).
اکثر مقالات کتابِ راهنمای کاربردهای بیگ دیتا هم همین تعریف ۳V را مبنای بحث خود قرار دادهاند (+).
فرانسیس باتل نیز در کتاب مدیریت ارتباط با مشتری خود، هنگامی که به بحث CRM تحلیلی میرسد، به سراغ همین الگوی ۳V میرود.
شرکت ارنست اند یانگ هم در راهنمای خود برای آشنایی با کلان داده، همین تعریف را مورد اشاره قرار داده و البته برای اینکه حرف تازهای هم زده باشد، یک V چهارم هم به آن افزوده است (V چهارم، حرف اول Veracity است و به اهمیت دقیق بودن و قابلاتکا بودن دادهها اشاره دارد).
قاعدتاً با این توضیحات، باید قانع شده باشید که الگوی ۳V (یا ۴V) مدل رایج و شناختهشدهای برای تعریف بیگ دیتا است و اکنون میتوانیم به سراغ تعریف دقیقتر این هر یک از این مولفهها برویم.
کاربردهای کلان داده چیست؟
وقتی از بیگ دیتا صحبت میکنیم، بیشتر از یک وضعیت حرف میزنیم؛ وضعیتی که در آن حجم زیادی از دادهها، با سرعت زیاد و تنوع گسترده تولید میشوند.
اما اینکه از چنین وضعیتی چگونه میتوان استفاده کرد، نیازمند دانشهای دیگری است. دانشمندان علوم دادهها (Data Scientists)، متخصصان هوش مصنوعی (Artificial Intelligence) و فعالان داده کاوی (Data-mining) از جمله کسانی هستند که میتوانند کاربردهای Big Data را در حوزههای مختلف بیابند و توسعه دهند.
بنابراین با وجودی که اصطلاح کاربردهای کلان داده (Big Data Applications) در فارسی و انگلیسی رایج است و ما هم آن را بهکار میبریم، همواره بهخاطر داشته باشید که منظور، کاربردهای تحلیل کلان دادههاست؛ وگرنه حجم و تنوع دادهها، به خودی خود کاربردی ندارد و اگر تحلیل و پردازش مناسب روی داده های حجیم انجام نشود، این دادهها از منظر مدیریت منابع، با سایر منابع هرز سازمانی تفاوتی نخواهند داشت.
قاعدتاً پرداختن به جزئیات این کاربردها، بحثی تخصصی بوده و فراتر از حوزهی تعریف شده برای درس سواد دیجیتال است. اما شاید نکات زیر بتواند سرنخی برای جستجوهای بیشتر و مطالعات کاملتر شما باشد:
کاربرد Big Data چیست؟ بررسی چند نمونه ساده
از جمله کاربردهای بیگ دیتا در زندگی روزمره میتوان به سرویس های مسیریابی مانند Waze و بخش Navigation در Google Maps اشاره کرد. حجم قابل توجهی از دادههای مربوط به وسایل نقلیهی در حال حرکت (در واقع: موبایلهای در حال حرکت) به صورت پیوسته و در لحظه، پردازش میشوند و مسیرهای مناسب بر اساس مقصد تعیین شده و ترجیحات کاربران به آنها پیشنهاد میشود.
در بحث مدیریت ارتباط با مشتری هم، CRM تحلیلی یکی از حوزههایی است که کاربرد کلان داده در آن کاملاً مشخص است و مرور درس CRM تحلیلی میتواند در این زمینه کمی به شما دید بدهد.
اگر با بخش بندی بازار و بررسی رفتار مشتریان هم آشنا باشید، بیتردید میتوانید تصور کنید که تحلیل بیگ دیتا چقدر میتواند مفید باشد و در این زمینه به کمک تصمیمگیران بیاید.
اگر با بحث شخصی سازی (Personalization) هم آشنا باشید، میتوانید حدس بزنید که تحلیل دادهها در حجم بالا، چگونه میتواند به برنامه ریزی برای شخصی سازی خدمات کمک کند.
البته شخصی سازی خدمات، حتی بدون تحلیل کلان داده هم امکانپذیر است. اما وقتی گزینههای پیش روی شما زیاد و منابعتان محدود باشد، طبیعی است که شخصی سازی بر اساس تحلیل بیگ دیتا میتواند اثربخشترین گزینهها را (در مقایسه با هزینهی هر گزینه) برای شما تخمین زده و برآورد کند.
سیستم های توصیه گر (Recommendation Engines) هم از جمله کاربردهای کلان داده ها در کسب و کارهای دیجیتال هستند و استفاده از Big Data در این زمینه، نتایج محسوس و ملموسی به همراه داشته است.
یکی از حوزههایی که همواره در بحث بیگ دیتا مورد توجه بوده، حوزه پزشکی است. علل مختلفی را برای این مسئله میتوان ذکر کرد:
- اطلاعات عددی گسترده و متنوعی که میتوان از بیماران به دست آورد (در مقایسه با حوزههای کیفی)
- میل انسانها به همکاری در حوزهی سلامت (با این فرض که میتواند برایشان دستاوردهای مفید داشته باشد)
- اپلیکیشنها و ابزارهای متعددی که امروزه در حوزهی سلامت استفاده میشوند و دادههای فراوانی که تولید میکنند (فقط کافی است به سنسور شتابسنج موبایل خود فکر کنید که در بخش زیادی از روز، حرکتهای شما را ثبت میکند)
اما در بررسی کاربرد بیگ دیتا در پزشکی، مهم است که حوزههای مختلف را از یکدیگر تفکیک کنیم. مثلاً شاخهی پیش بینی از جمله حوزههایی است که امید نسبتاً بیشتری به آن وجود دارد و پیشرفتهای جالبتوجهی هم داشته است (شاید پروژهی Google Flu را بشناسید که هدف آن، پیشبینی آمار و روند شیوع آنفولانزا در نقاط مختلف، بر اساس میزان جستجوی کاربران بود).
شاخهی عارضهیابی و Diagnose، دومین حوزهای است که رشد محسوسی داشته است و امکان پردازش حجم زیاد تصاویری که از بیماران ثبت میشود، این امید را ایجاد کرده که بتوان در آینده فرصتهای ارزشمندی برای عارضهیابی خلق کرد.
حوزهی درمان و تصمیم گیریهای مربوط به آن، دشوارترین شاخه است و هنوز، باید زمان زیادی منتظر بمانیم تا دستاوردهای محسوس آن را مشاهده و تجربه کنیم.
اگر علاقهمند به مطالعهی بیشتر در زمینه کاربرد کلان داده در پزشکی و بهطور کلی حوزهی سلامت هستید، دو مقالهی زیر میتوانند نقطهی شروع مناسبی باشند:
Big Data Revolution in Healthcare (PDF)
Big Data Analytics in Healthcare (PDF)
فایل اول توسط مک کنزی تهیه شده و کمی عمومیتر است. فایل دوم، بیشتر از نظر منابعی که معرفی کرده مفید است. اغلب رفرنسهای معرفی شده، مطالب مفید و آموزنده و سادهای دارند. البته طبیعی است هر دو فایل با در نظر گرفتن مخاطب مبتدی معرفی کردهایم و اگر قصد داشته باشید به شکل تخصصی در این حوزه مطالعه کنید، باید به سراغ ژورنالهای تخصصی بروید.
سئو هم حوزهی دیگری است که به صورت گسترده از تحلیل Big Data استفاده کرده و نتایج آن را نیز همهی ما تجربه کردهایم.
در تاریخچه سئو اشاره کردیم که عبور از دوران تکیهی صِرف بر تحلیل کلمات کلیدی و رسیدن به الگوریتم های تحلیل رفتاری، باعث شده که روشهای سنتی سئوی کلاه سیاه دیگر به سادگی اثربخش نباشند. بخش مهمی از این دستاورد را باید به توانایی تحلیل رفتار کاربران در مقیاس گسترده نسبت داد.
این روزها اگر هم سایتها بتوانند با تکنیکهای سیاه، جایی در رتبههای برتر نتایج جستجو به دست بیاورند، موتورهای جستجو (خصوصاً گوگل) به سرعت پس از فرستادن بازدیدکنندگان به این صفحات و بررسی رفتار آنها، نامناسب بودن و کیفیت پایین این صفحات را تشخیص داده و نتایج خود را اصلاح میکنند.
دوست عزیز. دسترسی کامل مجموعه درسهای سواد دیجیتال برای اعضای ویژهی متمم در نظر گرفته شده است.
تعداد درسها: ۷۷ عدد
دانشجویان این درس: ۷۰۰۰ نفر
تمرینهای ثبتشده: ۳۹۱۸ مورد
البته با عضویت ویژه، به مجموعه درسهای بسیار بیشتری به شرح زیر دسترسی پیدا میکنید:
البته اگر به تسلط بر تکنولوژی و سواد دیجیتال علاقه دارید، احتمالاً مطالعهی مباحث زیر برایتان در اولویت خواهد بود:
آموزش CRM | اتوماسیون بازاریابی
استراتژی محتوا | آموزش بازاریابی محتوا | دیجیتال مارکتینگ
آموزش سئو | ایمیل مارکتینگ | شبکه های اجتماعی
شبکه های اجتماعی | تولید محتوا
دوره MBA (پیگیری منظم مجموعه درسها)
اگر با فضای متمم آشنا نیستید و دوست دارید دربارهی متمم بیشتر بدانید، میتوانید نظرات دوستان متممی را دربارهی متمم بخوانید و ببینید متمم برایتان مناسب است یا نه. این افراد کسانی هستند که برای مدت طولانی با متمم همراه بوده و آن را به خوبی میشناسند:
طبیعتاً کاربرد کلان داده در حوزههای مختلف، بسیار فراتر از چند مورد محدودی است که در اینجا اشاره شد و در هر مورد، حتی کتابهای اختصاصی هم تألیف و منتشر شده است.
اما به طور کلی، باید به خاطر داشته باشید که Big Data هنوز بسیار جوان است و راهی بسیار طولانی در پیش است تا کاربردهای آن را به شکل تجاری و گسترده، در همهی زندگی خود ببینیم و تجربه کنیم.
میتوانید معرفی کتاب همه دروغ می گویند را هم بخوانید. این کتاب، میتواند برای کسانی که هیچ نوع آشنایی با بیگ دیتا و کاربردهای کلان داده ندارند مفید باشد.
گوگل یک بار سعی کرد با استفاده از بیگ دیتا شیوع بیماری آنفولانزا را ارزیابی کند که در این کار شکست خورد. مطالعهٔ داستان این پروژه که به GFT مشهور است میتواند برایتان آموزنده باشد: پروژهٔ گوگل برای پیشبینی پاندمیها
ترتیبی که متمم برای خواندن مطالب سری علم داده به شما پیشنهاد میکند:
- علم داده چیست | کاربردهای رشته دیتا ساینس
- بازار کار علم داده | چند مثال از کاربرد علم داده به زبان ساده
- فراداده یا متادیتا چیست؟ | تفاوت داده با اطلاعات
- کلان داده یا بیگ دیتا چیست؟ (+کاربردهای Big Data)
- کتاب همه دروغ می گویند | کتابی ضعیف اما خواندنی درباره بیگ دیتا
- تاریخچه هوش مصنوعی | چگونه از زمستان هوش مصنوعی فاصله بگیریم؟
- هوش مصنوعی و استراتژی کسب و کار | مروری بر کتاب استراتژی همجوشی
- انسانها و نکته ای در کاربرد هوش مصنوعی
- پروژه GFT | چرا گوگل در پیشبینی اپیدمی و پاندمی موفق نشد؟
- پیتر تیل | کارآفرین، بنیانگذار پی پل و از صاحبنظران حوزه تکنولوژی
- شرکت پالانتیر (Palantir) | داده کاوی در مقیاس بزرگ برای پرسشهای خاص
- Clearview AI | آیا با اینکه هوش مصنوعی تصویر شما را تشخیص دهد موافقید؟
- انسان در برابر هوش مصنوعی | آیا کاسپاروف درباره خیانت IBM به علم درست میگوید؟
- عاملیت و اراده در هوش مصنوعی | کدام ماشین، جراح، معلم و قاضی را ترجیح میدهید؟
- هوش مصنوعی و صنعت نشر کتاب | گام جدید مایکروسافت؛ انتشارات ۸۰۸۰
- مقاله آلن تورینگ (تست تورینگ) | نقطه آغاز دوران مدرن هوش مصنوعی
- کتاب اهمیت آموزش پذیری (لزلی ولینت) | کمکی برای فهم بهتر هوش مصنوعی
- هوش یار | کتابی درباره چت جی پی تی و [کمی] هوش مصنوعی
چند مطلب پیشنهادی از متمم:
سوالهای پرتکرار دربارهٔ متمم
متمم مخففِ عبارت «محل توسعه مهارتهای من» است: یک فضای آموزشی آنلاین برای بحثهای مهارتی و مدیریتی.
برای آشنا شدن بیشتر با متمم به صفحهٔ درباره متمم سر بزنید و فایل صوتی معرفی متمم را دانلود کنید و گوش دهید.
فهرست دوره های آموزشی متمم را کجا ببینیم؟
هر یک از دوره های آموزشی متمم یک «نقشه راه» دارد که مسیر یادگیری آن درس را مشخص میکند. با مراجعه به صفحهٔ نقشه راه یادگیری میتوانید نقشه راههای مختلف را ببینید و با دوره های متنوع متمم آشنا شوید.
همچنین در صفحههای دوره MBA و توسعه فردی میتوانید با دوره های آموزشی متمم بیشتر آشنا شوید.
هزینه ثبت نام در متمم چقدر است؟
شما میتوانید بدون پرداخت پول در متمم به عنوان کاربر آزاد عضو شوید. اما به حدود نیمی از درسهای متمم دسترسی خواهید داشت. پیشنهاد ما این است که پس از ثبت نام به عنوان کاربر آزاد، با خرید اعتبار به عضو ویژه تبدیل شوید.
اعتبار را میتوانید به صورت ماهیانه (۱۶۰ هزار تومان)، فصلی (۴۲۰ هزار تومان)، نیمسال (۷۵۰ هزار تومان) و یکساله (یک میلیون و ۲۰۰ هزار تومان) بخرید.
توجه داشته باشید که خرید ششماهه و یکساله بهترتیب معادل ۲۰٪ و ۳۸٪ تخفیف (نسبت به خرید یکماهه) محسوب میشوند.برای اطلاعات بیشتر به صفحه ثبت نام مراجعه کنید.
آیا در متمم فایل های صوتی رایگان برای دانلود وجود دارد؟
مجموعه گسترده و متنوعی از فایلهای صوتی رایگان در رادیو متمم ارائه شده که میتوانید هر یک از آنها را دانلود کرده و گوش دهید.
همچنین دوره های صوتی آموزشی متنوعی هم در متمم وجود دارد که فهرست آنها را میتوانید در فروشگاه متمم ببینید.
با متمم همراه شوید
آیا میدانید که فقط با ثبت ایمیل و تعریف نام کاربری و رمز عبور میتوانید به جمع متممیها بپیوندید؟
نویسندهی دیدگاه : جواد عزیزان
همان طور که در درس اشاره شد کلان داده کاربردهای متعددی دارد.از دیگر کاربردهای آن موارد زیر است:
☼ صنعت بانکداری (مانند پیش بینی رفتار مشتریان، بررسی روی گردانی مشتریان، پردازش اطلاعات کارت اعتباری مشتریان، تحلیل های مربوط به پولشویی، ...)
☼ شبکه های مجازی (مانند بررسی توییت های افراد و تحلیل رفتار انها، بررسی احتمال وقوع جرم و جنایت با کمک داده های تولید شده در شبکه های مجازی، ...)
☼ صنعت بیمه (تحلیل رفتار مشتریان بیمه شده، ...)
☼ بخش های عمومی (مانند استفاده دولت ها از داده های مالی مشتریان برای محاسبه مالیات، پیش بینی وضعیت آب و هوا، استفاده شرکت های معروف آمازون و نت فیلیکس به منظور تحلیل رفتار مراجعین سایت و ارائه پیشنهادهای لازم و ...)