Generic selectors
Exact matches only
Search in title
Search in content
Menu
شرایط دریافت هدیه نوروزی متمم: دوره صوتی آموزش هدف‌گذاری (کلیک کنید)


کلان داده یا بیگ دیتا چیست؟ (+کاربردهای Big Data)


اهداف و انتظارات آموزشی متمم در این درس
کد درس: ۱۱۴۱۸۶
پیش نیاز مطالعه درس کلان داده (بیگ دیتا) از دوستان عزیز متممی انتظار می‌رود پس از مطالعه این درس بتوانند
  • بتوانند به صورت مختصر توضیح دهند که کلان داده یا بیگ دیتا چیست.
  • مدل‌های 3V و 4V را در تعریف کلان داده توصیف کنند.
  • بتوانند چند مثال از کاربردهای کلان داده را فهرست کنند.
فشار ذهنی هنگام مطالعه
نیاز به مشارکت شما
کسب و کار
زندگی
تعریف بیگ دیتا یا کلان داده چیست؟ بررسی کاربردهای Big Data

کلان داده یا بیگ دیتا (Big Data) را می‌توان یکی از اصطلاحات پُرتکرار در حرف‌ها و نوشته‌های مربوط به فناوری اطلاعات دانست.

اگر جستجوهای مربوط به کاربرد کلان داده را در گوگل بررسی کنید، می‌‌بینید که کاربرد کلان داده در پزشکی، اقتصاد، بانکداری و نیز حسابداری و حسابرسی، صرفاً  بخش کوچکی از سوال‌ها و دغدغه‌های علاقه‌مندان این حوزه را به خود اختصاص می‌دهد.

همه‌ی ما با شنیدن بیگ دیتا یا کلان داده تا حدی می‌توانیم معنای آن را حدس بزنیم: ظاهراً به زبان ساده می‌توان گفت موضوع بیگ دیتا، به حجم زیاد داده‌ها مربوط است؛ حجمی که هر روز نیز رو به افزایش است و هر یک از ما، در هر مقیاسی که فعال باشیم، جلوه‌هایی از آن را مشاهده و تجربه کرده‌ایم.

اما اجازه بدهید برای آشنایی با یک تعریف دقیق‌تر، به سراغ موسسه گارتنر برویم و تعریف گارتنر را از بیگ دیتا بخوانیم (+):

تعریف کلان داده (گارتنر)

بیگ دیتا (Big Data) به معنای دارایی‌های اطلاعاتی [یک مجموعه یا سازمان] است که:

  • حجم بالا دارند
  • با سرعت زیاد تولید می‌شوند و / یا تنوع گسترده دارند

و نیازمند شیوه‌های پردازش نوآورانه با هزینه‌ی مناسب هستند تا بتوان از آن‌ برای اتوماسیون فرایندها، تصمیم گیری و بهبود شهود و بینش  [در سازمان] بهره گرفت.

مدل ۳V بیگ دیتا (Big 3V Model)

در اغلب تعریف های کلان داده، سه اصطلاح حجم (Volume) و سرعت (Velocity) و تنوع (Variety) را می‌بینید. در حدی که گاهی برای تعریف بیگ دیتا از اصطلاح ۳V استفاده می‌کنند.

به عنوان مثال، شرکت PWC هم که از بزرگان مشاوره مدیریت در جهان است، بیگ دیتا را با همین ۳V تعریف می‌کند (+).

اکثر مقالات کتابِ راهنمای کاربردهای بیگ دیتا هم همین تعریف ۳V را مبنای بحث خود قرار داده‌اند (+).

فرانسیس باتل نیز در کتاب مدیریت ارتباط با مشتری خود، هنگامی که به بحث CRM تحلیلی می‌رسد، به سراغ همین الگوی ۳V می‌رود.

شرکت ارنست اند یانگ هم در راهنمای خود برای آشنایی با کلان داده، همین تعریف را مورد اشاره قرار داده و البته برای این‌که حرف تازه‌‌ای هم زده باشد، یک V چهارم هم به آن افزوده است (V چهارم، حرف اول Veracity است و به اهمیت دقیق بودن و قابل‌اتکا بودن داده‌ها اشاره دارد).

قاعدتاً با این توضیحات، باید قانع شده باشید که الگوی ۳V (یا ۴V) مدل رایج و شناخته‌شده‌ای برای تعریف بیگ دیتا است و اکنون می‌توانیم به سراغ تعریف دقیق‌تر این هر یک از این مولفه‌ها برویم.

تعریف کلان داده - در تعریف بیگ دیتا سه مولفه وجود دارد: سرعت - حجم و تنوع

کاربردهای کلان داده چیست؟

وقتی از بیگ دیتا صحبت می‌کنیم، بیشتر از یک وضعیت حرف می‌زنیم؛ وضعیتی که در آن حجم زیادی از داده‌ها، با سرعت زیاد و تنوع گسترده تولید می‌شوند.

اما این‌که از چنین وضعیتی چگونه می‌توان استفاده کرد، نیازمند دانش‌های دیگری است. دانشمندان علوم داده‌ها (Data Scientists)، متخصصان هوش مصنوعی (Artificial Intelligence) و فعالان داده کاوی (Data-mining) از جمله کسانی هستند که می‌توانند کاربردهای Big Data را در حوزه‌های مختلف بیابند و توسعه دهند.

بنابراین با وجودی که اصطلاح کاربردهای کلان داده (‌Big Data Applications) در فارسی و انگلیسی رایج است و ما هم آن را به‌کار می‌بریم، همواره به‌خاطر داشته باشید که منظور، کاربردهای تحلیل کلان داده‌هاست؛ وگرنه حجم و تنوع داده‌ها، به خودی خود کاربردی ندارد و اگر تحلیل و پردازش مناسب روی‌ داده های حجیم انجام نشود، این داده‌ها از منظر مدیریت منابع، با سایر منابع هرز سازمانی تفاوتی نخواهند داشت.

قاعدتاً پرداختن به جزئیات این کاربردها، بحثی تخصصی بوده و فراتر از حوزه‌ی تعریف شده برای درس سواد دیجیتال است. اما شاید نکات زیر بتواند سرنخی برای جستجوهای بیشتر و مطالعات کامل‌تر شما باشد:

کاربرد Big Data چیست؟ بررسی چند نمونه ساده

از جمله کاربردهای بیگ دیتا در زندگی روزمره می‌توان به سرویس های مسیریابی مانند Waze و بخش Navigation در Google Maps اشاره کرد. حجم قابل توجهی از داده‌های مربوط به وسایل نقلیه‌ی در حال حرکت (در واقع: موبایل‌های در حال حرکت) به صورت پیوسته و در لحظه، پردازش می‌شوند و مسیرهای مناسب بر اساس مقصد تعیین شده و ترجیحات کاربران به آن‌ها پیشنهاد می‌شود.

در بحث مدیریت ارتباط با مشتری هم، CRM تحلیلی یکی از حوزه‌هایی است که کاربرد کلان داده در آن کاملاً مشخص است و مرور درس CRM تحلیلی می‌تواند در این زمینه کمی به شما دید بدهد.

اگر با بخش بندی بازار و بررسی رفتار مشتریان هم آشنا باشید، بی‌تردید می‌توانید تصور کنید که تحلیل بیگ دیتا چقدر می‌تواند مفید باشد و در این زمینه به کمک تصمیم‌گیران بیاید.

اگر با بحث شخصی سازی (Personalization) هم آشنا باشید، می‌توانید حدس بزنید که تحلیل داده‌ها در حجم بالا، چگونه می‌تواند به برنامه ریزی برای شخصی سازی خدمات کمک کند.

البته شخصی سازی خدمات، حتی بدون تحلیل کلان داده هم امکان‌پذیر است. اما وقتی گزینه‌های پیش روی شما زیاد و منابع‌تان محدود باشد، طبیعی است که شخصی سازی بر اساس تحلیل بیگ دیتا می‌تواند اثربخش‌ترین گزینه‌ها را (در مقایسه با هزینه‌ی هر گزینه) برای شما تخمین زده و برآورد کند.

سیستم های توصیه گر (Recommendation Engines) هم از جمله کاربردهای کلان داده ها در کسب و کارهای دیجیتال هستند و استفاده از Big Data در این زمینه، نتایج محسوس و ملموسی به همراه داشته است.

یکی از حوزه‌هایی که همواره در بحث بیگ دیتا مورد توجه بوده، حوزه پزشکی است. علل مختلفی را برای این مسئله می‌توان ذکر کرد:

  • اطلاعات عددی گسترده و متنوعی که می‌توان از بیماران به دست آورد (در مقایسه با حوزه‌‌های کیفی)
  • میل انسان‌ها به همکاری در حوزه‌ی سلامت (با این فرض که می‌تواند برایشان دستاوردهای مفید داشته باشد)
  • اپلیکیشن‌ها و ابزارهای متعددی که امروزه در حوزه‌ی سلامت استفاده می‌شوند و داده‌های فراوانی که تولید می‌کنند (فقط کافی است به سنسور شتاب‌سنج موبایل خود فکر کنید که در بخش زیادی از روز، حرکت‌های شما را ثبت می‌کند)

اما در بررسی کاربرد بیگ دیتا در پزشکی، مهم است که حوزه‌های مختلف را از یکدیگر تفکیک کنیم. مثلاً شاخه‌ی پیش بینی از جمله حوزه‌هایی است که امید نسبتاً بیشتری به‌ آن وجود دارد و پیشرفت‌های جالب‌توجهی هم داشته است (شاید پروژه‌ی Google Flu را بشناسید که هدف آن، پیش‌بینی آمار و روند شیوع آنفولانزا در نقاط مختلف، بر اساس میزان جستجوی کاربران بود).

شاخه‌ی عارضه‌یابی و Diagnose، دومین حوزه‌ای است که رشد محسوسی داشته است و امکان پردازش حجم زیاد تصاویری که از بیماران ثبت می‌شود، این امید را ایجاد کرده که بتوان در آینده فرصت‌های ارزشمندی برای عارضه‌یابی خلق کرد.

حوزه‌ی درمان و تصمیم گیری‌های مربوط به آن، دشوارترین شاخه است و هنوز، باید زمان زیادی منتظر بمانیم تا دستاوردهای محسوس آن را مشاهده و تجربه کنیم.

اگر علاقه‌مند به مطالعه‌ی بیشتر در زمینه کاربرد کلان داده در پزشکی و به‌طور کلی حوزه‌ی سلامت هستید، دو مقاله‌ی زیر می‌توانند نقطه‌ی شروع مناسبی باشند:

Big Data Revolution in Healthcare (PDF)

Big Data Analytics in Healthcare (PDF)

فایل اول توسط مک کنزی تهیه شده و کمی عمومی‌تر است. فایل دوم، بیشتر از نظر منابعی که معرفی کرده مفید است. اغلب رفرنس‌های معرفی شده، مطالب مفید و آموزنده و ساده‌ای دارند. البته طبیعی است هر دو فایل با در نظر گرفتن مخاطب مبتدی معرفی کرده‌ایم و اگر قصد داشته باشید به شکل تخصصی در این حوزه مطالعه کنید، باید به سراغ ژورنال‌های تخصصی‌ بروید.

سئو هم حوزه‌ی دیگری است که به صورت گسترده از تحلیل Big Data استفاده کرده و نتایج آن را نیز همه‌ی ما تجربه کرده‌ایم.

در تاریخچه سئو اشاره کردیم که عبور از دوران تکیه‌ی صِرف بر تحلیل کلمات کلیدی و رسیدن به الگوریتم های تحلیل رفتاری، باعث شده که روش‌های سنتی سئوی کلاه سیاه دیگر به سادگی اثربخش نباشند. بخش مهمی از این دستاورد را باید به توانایی تحلیل رفتار کاربران در مقیاس گسترده نسبت داد.

این روزها اگر هم سایت‌ها بتوانند با تکنیک‌های سیاه، جایی در رتبه‌های برتر نتایج جستجو به دست بیاورند، موتورهای جستجو (خصوصاً گوگل) به سرعت پس از فرستادن بازدیدکنندگان به این صفحات و بررسی رفتار آن‌ها، نامناسب بودن و کیفیت پایین این صفحات را تشخیص داده و نتایج خود را اصلاح می‌کنند.

محدودیت در دسترسی کامل به درس‌های سواد دیجیتال

دوست عزیز. دسترسی کامل مجموعه درس‌های سواد دیجیتال برای اعضای ویژه‌ی متمم در نظر گرفته شده است.

  تعداد درس‌ها: ۷۴ عدد

  دانشجویان این درس: ۶۶۴۲ نفر

  تمرین‌های ثبت‌شده: ۳۶۸۷ مورد

 البته با عضویت ویژه، به مجموعه درس‌های بسیار بیشتری به شرح زیر دسترسی پیدا می‌کنید:

 فهرست درس‌های متمم

البته اگر به تسلط بر تکنولوژی و سواد دیجیتال علاقه دارید، احتمالاً مطالعه‌ی مباحث زیر برایتان در اولویت خواهد بود:

  آموزش CRMاتوماسیون بازاریابی

  استراتژی محتوا | آموزش بازاریابی محتوا | دیجیتال مارکتینگ

  آموزش سئو | ایمیل مارکتینگ | شبکه های اجتماعی

  شبکه های اجتماعی | تولید محتوا

  دوره MBA (پیگیری منظم مجموعه درس‌ها)

اگر با فضای متمم آشنا نیستید و دوست دارید درباره‌ی متمم بیشتر بدانید، می‌توانید نظرات دوستان متممی را درباره‌ی متمم بخوانید و ببینید متمم برایتان مناسب است یا نه. این افراد کسانی هستند که برای مدت طولانی با متمم همراه بوده و آن را به خوبی می‌شناسند:

طبیعتاً کاربرد کلان داده در حوزه‌های مختلف، بسیار فراتر از چند مورد محدودی است که در اینجا اشاره شد و در هر مورد، حتی کتابهای اختصاصی هم تألیف و منتشر شده است.

اما به طور کلی، باید به خاطر داشته باشید که Big Data هنوز بسیار جوان است و راهی بسیار طولانی در پیش است تا کاربردهای آن را به شکل تجاری و گسترده، در همه‌ی زندگی خود ببینیم و تجربه کنیم.

بعد از خواندن این درس چه کار کنم؟

  می‌توانید معرفی کتاب همه دروغ می گویند را هم بخوانید. این کتاب، می‌تواند برای کسانی که هیچ نوع آشنایی با بیگ دیتا و کاربردهای کلان داده ندارند مفید باشد.

  گوگل یک بار سعی کرد با استفاده از بیگ دیتا شیوع بیماری آنفولانزا را ارزیابی کند که در این کار شکست خورد. مطالعهٔ داستان این پروژه که به GFT مشهور است می‌تواند برایتان آموزنده باشد: پروژهٔ گوگل برای پیش‌بینی پاندمی‌ها

      شما تاکنون در این بحث مشارکت نداشته‌اید.  

     تعدادی از دوستان علاقه‌مند به این مطلب:    شهرزاد ، حمید طهماسبی ، سید حسین نوری ، امین کاکاوند ، معصومه شیخ مرادی

ترتیبی که متمم برای خواندن مطالب سری سواد دیجیتال به شما پیشنهاد می‌کند:

سری مطالب حوزه سواد دیجیتال
 

برخی از سوالهای متداول درباره متمم (روی هر سوال کلیک کنید)

متمم چیست و چه می‌کند؟ (+ دانلود فایل PDF معرفی متمم)
چه درس‌هایی در متمم ارائه می‌شوند؟
هزینه ثبت‌نام در متمم چقدر است؟
آیا در متمم فایل‌های صوتی رایگان هم برای دانلود وجود دارد؟

۱۱ نظر برای کلان داده یا بیگ دیتا چیست؟ (+کاربردهای Big Data)

    پرطرفدارترین دیدگاه به انتخاب متممی‌ها در این بحث

    نویسنده‌ی دیدگاه : جواد عزیزان

    همان طور که در درس اشاره شد کلان داده کاربردهای متعددی دارد.از دیگر کاربردهای آن موارد زیر است:

    ☼ صنعت بانکداری (مانند پیش بینی رفتار مشتریان، بررسی روی گردانی مشتریان، پردازش اطلاعات کارت اعتباری مشتریان، تحلیل های مربوط به پولشویی، ...)

    ☼ شبکه های مجازی (مانند بررسی توییت های افراد و تحلیل رفتار انها، بررسی احتمال وقوع جرم و جنایت با کمک داده های تولید شده در شبکه های مجازی،  ...)

    ☼ صنعت بیمه (تحلیل رفتار مشتریان بیمه شده، ...)

    ☼ بخش های عمومی (مانند استفاده دولت ها از داده های مالی مشتریان برای محاسبه مالیات، پیش بینی وضعیت آب و هوا، استفاده شرکت های معروف آمازون و نت فیلیکس به منظور تحلیل رفتار مراجعین سایت و ارائه پیشنهادهای لازم و ...)

     

     
    تمرین‌ها و نظرات ثبت شده روی این درس صرفاً برای اعضای متمم نمایش داده می‌شود.
    .