کتاب همه دروغ می گویند | کتابی ضعیف اما خواندنی درباره بیگ دیتا
شاید برای شما هم پیش آمده باشد که با مراجعه به گوگل ترندز (Google Trends)، روند جستجوی کلمات مختلف را بررسی کرده باشید. مثلاً ببینید که پس از رویدادهای تلخ اجتماعی، جستجوی کلمهی مهاجرت یا یادگیری زبان انگلیسی چگونه تغییر کرده است.
همچنین شاید سرویس «کاملکنندهی عبارت جستجو» در گوگل، شما را هم سرگرم کرده باشد. مثلاً احتمالاً کلماتی مانند چرا یا چگونه یا می خواهم را تایپ کردهاید و منتظر ماندهاید تا ببینید گوگل، سوال شما را چگونه تکمیل میکند.
دیویدویتس (Davidowitz) نویسندهی کتاب همه دروغ می گویند (Everybody Lies) هم، در این زمینه به شما شبیه است و چنین جستجوهایی را انجام داده است. اما یک تفاوت مهم با شما دارد: او همهی این جستجوها را کنار هم قرار داده و از آنها یک کتاب ساخته است!
منصفانه نیست که تمام کار او را به گزارش چند جستجو در گوگل محدود کنیم، اما واقعیت این است که سهم قابلتوجهی از کتاب او را همین سطح از «دادهها و داستانها» تشکیل میدهد.
اجازه بدهید قبل از توضیحات بیشتر دربارهی کتاب همه دروغ می گویند، چند جمله از ابتدای فصل چهارم آن را با هم بخوانیم:
همه دروغ میگویند. مردم در مورد تعداد نوشیدنیهایی که در راه خانه خوردهاند راست نمیگویند. دربارهی اینکه چند وقت یکبار باشگاه میروند، قیمت کفشهای جدیدی که خریدهاند چقدر بوده، یا اینکه فلان کتاب را خواندهاند یا نه دروغ میگویند. آدمها میگویند «در تماس خواهیم بود» در صورتی که دیگر خبری ازشان نمیشوند. میگویند از دست تو ناراحت نیستند ولی هستند. میگویند دوستت دارند در حالی که ندارند. با اینکه در لجن دست و پا میزنند میگویند خوشحالند. میگویند زنها را دوست دارند حال آنکه در حقیقت از مردها خوششان میآید.
مردم به دوستها دروغ میگویند؛ به رئیسها دروغ میگویند؛ به بچهها دروغ میگویند؛ به پدر و مادرها دروغ میگویند؛ به دکترها دروغ میگویند؛ به همسرها دروغ میگویند؛ حتی به خودشان هم دروغ میگویند. و بیبرو برگرد به پیمایشها [مطالعات، پرسشنامهها و نظرسنجیها] هم دروغ میگویند.
ست استیونز دیویدُویتس که از این به بعد او را ست صدا میکنیم به این نکته اشاره میکند که بسیاری از پرسشنامهها، نظرسنجیها و ورودیهای مطالعات دانشگاهی، با اطلاعات و دادههایی تکمیل میشوند که واقعی نیستند.
او مثلاً به مطالعهای مربوط به سال ۱۹۵۰ اشاره میکند که در شهر دِنوِر آمریکا انجام شده و در آن سوالهای مختلفی از مردم پرسیدهاند. از جمله اینکه:
- آیا برای رأی دادن ثبتنام کردهاند؟
- آیا در انتخابات ریاستجمهوری قبلی شرکت کردهاند؟
- آیا در یک مراسم خیریه، کمک مالی کردهاند؟
- آیا کارت عضویت کتابخانه دارند؟
در مورد این سوالها، دادههای واقعی (Hard Data) وجود دارد. یعنی میتوان واقعاً آمار ثبتنامکنندگان یا کمککنندگان را داشت. مقایسهی دادههای واقعی با آنچه مردم در پاسخ به سوالات پرسشنامهها مطرح کردهاند نشان میدهد که مردم، تصویری غیرواقعی از خود ترسیم میکنند.
این مسئله از نظر سِت آنقدر مهم است که (با کمی بیدقتی و بدون استناد دقیق که در تمام کتاب او مشهود است) میگوید: «مردم در زندگی واقعی حدوداً یک سوم اوقات دروغ میگویند. این عادت به پیمایشها هم راه پیدا میکند.»
آیا مردم واقعاً دروغ میگویند؟
اصطلاح دروغ گفتن، کمی تجاری است و برای فروش بیشتر کتاب انتخاب شده است. این کار برای ست چندان دشوار نیست. چنانکه او برای انتخاب عنوان کتاب ، حتی حاضر بوده از بعضی اندامهای کاملاً شخصی خودش هم مایه بگذارد که ناشر او را منصرف کرده است (+).
اصل حرف ست این است که اطلاعاتی مردم دربارهی خود دارند و ابراز میکنند، الزاماً دقیق یا درست نیست.
او مثال میزند که مردم، فیلمهای کلاسیک و ارزشمند سینما را در Wishlist نتفلیکس ثبت میکنند تا بعداً ببینند، اما در نهایت، فیلمهای سطحی و مسخره را میبینند. یا مثلاً میگوید که ۹۰٪ اساتید دانشگاه فکر میکنند بالاتر از حد متوسط هستند.
اینکه مردم دوست دارند فیلمهای آبرومند و فاخر ببینند اما در عمل به سراغ فیلمهای کمدی میروند را نمیتوانیم به سادگی به عنوان دروغگویی در نظر بگیریم.
یا اینکه اعتماد به نفس بیش از حد (Overconfidence) را (که یک خطای شناختی کاملاً معروف و آشناست) نمیتوانیم به سادگی به عنوان مصداقی از دروغ گویی فرض کنیم.
این همان حرفی است که کریس آرجریس با عنوان تفاوت میان نظریه مورد حمایت و نظریه مورد دفاع مطرح میکند.
[ مطالعهی بیشتر: فاصله میان دانستن و عمل کردن ]
کتاب همه دروغ می گویند چه راهکاری را پیشنهاد میدهد؟
سِت در اینجا یک پیشفرض را مطرح میکند (البته او این را یک اصل میداند و نه یک فرض): مردم در فضای دیجیتال، رد پای بسیار قابلاطمینانی از واقعیتهای زندگی خود به جا میگذارند.
ست معتقد است که به جای اینکه از مردم بپرسید «آیا افسرده هستی» بهتر است ببینید آیا تا کنون، دربارهی روشهای غلبه بر افسردگی در گوگل جستجو کردهاند؟
یا به جای اینکه از هزار نفر بپرسید که آیا از بچهدار شدن پشیمان هستند، بهتر است ببینید چند درصد مردم، چنین عبارتی را در گوگل جستجو میکنند.
او از اینجا وارد بحث علم داده و همینطور موضوع کلان داده یا بیگ دیتا میشود. اگر بخواهیم به طور خلاصه صحبت کنیم، حرف ست این است که دانشمندان علوم اجتماعی، بهتر است به جای طراحی پرسشنامه و سوال کردن مستقیم از مردم، دادههای عظیمی را که از رفتار مردم در اینترنت، سایتها و شبکههای اجتماعی وجود دارد بررسی کنند:
علوم اجتماعی کمکم دارد به علمی واقعی تبدیل میشود.
… چه عاملی پوپر را تحریک کرد که علیه دانشمندان علوم اجتماعی عَلَم جنگ بردارد؟
وقتی پوپر با بهترین روشنفکران زمانش معاشرت میکرد – بهترین فیزیکدانان، بهترین تاریخدانان، بهترین روانشناسان – توجهش به تفاوت جالبی جلب شد. وقتی فیزیکدانان حرف میزدند، پوپر به کارشان باور داشت. بیتردید آنها هم گاهی دچار اشتباه میشدند یا از سوگیری ناخودآگاهشان فریب میخوردند. اما فیزیکدانان درگیر فرایندی بودند که مشخصاً حقایق عمیقی دربارهی جهان برملا میکرد و در نظریهی نسبیت انیشتین به اوج میرسید. در مقابل وقتی مشهورترین دانشمندان علوم اجتماعی جهان حرف میزدند، پوپر احساس میکرد به مشتی یاوه گوش میدهد.
پوپر تنها کسی نیست که میان دانشمندان علوم اجتماعی و دانشمندان فیزیک تفاوت قائل میشود. تقریباً همه اتفاقنظر دارند که فیزیکدانان، شیمیدانان و زیستشناسان دانشمند واقعیاند. آنها برای شناخت عملکرد جهان فیزیکی از آزمایشهای دقیق علمی بهره میگیرند. در مقابل، بسیاری از مردم معتقدند اقتصاددانان، جامعهشناسان و روانشناسان، دانشمندان علوم انسانی هستند که اصطلاحات بیمعنی بلغور میکنند تا به کرسی استادی برسند.
ست در اینجا، ضمن همدلی با پوپر، تأکید میکند که آن دوران به تدریج به پایان خود نزدیک میشود و علوم اجتماعی هم، با حجم بسیار زیادی از دادهها که هر روز تولید میشود، به آزمایشگاهی به وسعت جهان دست پیدا کرده است. فقط کافی است که دانشمندان علوم انسانی این مسئله را جدی بگیرند:
معروفترین زبانشناسان جهان متنهای منفرد را تحلیل میکنند، اما کمتر پیش میآید به الگوهایی توجه کنند که در میلیاردها کتاب میشود دید. بخش اعظم روش تحقیقی که به دانشجویان کارشناسی ارشد در رشتههای روانشناسی، علوم سیاسی و جامعهشناسی آموزش داده میشود، هیچ سنخیتی با انقلاب دیجیتال ندارد.
… ما میتوانیم اسم این کار را علم در مقیاس بزرگ بگذاریم، یعنی بهکارگیری روشی ساده، و سپس استفاده از کلانداده برای اجرای دوباره و چندباره و چندصدبارهی یک تحلیل در یک بازهی زمانی کوتاه.
روزهایی که محققان برای انجام آزمونی ساده ماههای متمادی را صرف استخدام چند دانشجوی کارشناسی میکنند به سر خواهد آمد. در عوض، محققان از دادههای دیجیتال برای آزمون چندصد یا چندهزار ایده، آنهم تنها در عرض چند ثانیه، بهره خواهند برد. با استفاده از این دادهها قادر خواهیم بود در زمانی بسیار کوتاهتر آموزههای بسیار بیشتری فرا بگیریم.
ضعفهای تحلیلی در کتاب همه دروغ میگویند
اگر بخواهیم دربارهی کتاب همه دروغ میگویند قضاوت کنیم، باید فصلهای اول تا پنجم را از فصلهای ششم به بعد، جدا کنیم.
نیمهی دوم کتاب (از فصل ششم تا آخر) قابل استنادتر است و با دقت بیشتری نوشته شده است. اما در نیمهی اول، ضعفهای استدلالی بسیاری به چشم میخورد. با وجودی که در نیمهی دوم کتاب، ست تأکید کرده که صرفاً به اتکای کلاندادهها نمیتوان روابط علی را کشف و استخراج کرد، در نیمهی اول کتاب، میتوانید نمونههای فراوانی از این نوع حدسها و استنتاجها را ببینید.
ست به راحتی با کولیس اندازه میگیرد و حاصل را با گچ، علامتگذاری میکند.
مثلاً آمار سایتهای پورنوگرافیک را بررسی میکند و بر اساس آنها، در مورد ترجیحات زنان و مردان قضاوت میکند. اما فراموش میکند که افراد بسیاری در این سایتها، جنسیت خود را متفاوت از واقعیت اعلام میکنند.
یا مثلاً سوالهای تعداد تکرار زنان و مردان را در گوگل با هم مقایسه میکند، اما فراموش میکند که یک متغیر مهم را مد نظر قرار دهد: چند درصد زنان، برای سوالات خود به گوگل مراجعه میکنند؟ چند درصد مردان این کار را انجام میدهند؟ آیا دو جنس در این زمینه رفتار مشابهی دارند؟
در بعضی موارد هم – مانند انتخابات آمریکا – کاملاً میکوشد انتظارات خود را از دادهها استخراج کند و به همین علت، در تطبیق رأی آوردن یک سیاهپوست (اوباما) و رأی آوردن یک مشوق نژادپرستی (ترامپ) با چالش مواجه میشود.
ضمن اینکه جستجو از سر کنجکاوی را با جستجو از سر نیاز اشتباه میگیرد. مثلاً اگر در استانهایی از ایران، مردم دربارهی خطر آنفولانزا سرچ میکنند، الزاماً به این معنا نیست که آنفولانزا در آنجا جدیتر است. شاید صرفاً پوشش خبری آنفولانزا در آن استانها بیشتر باشد و از آن مهمتر، ضریبنفوذ اینترنت در همه جا یکسان نیست تا مردم دغدغههای خود را با گوگل مطرح کنند.
او همچنین به این جنبه از ماجرا هم توجه نمیکند که رد پای دیجیتال، الزاماً صادقانهتر از واقعیتهای دنیای فیزیکی نیست. مثلاً شکلی از زندگی که در اینستاگرام و فیس بوک منتشر میشود، الزاماً واقعگرایانهتر از رفتارها و ادعاهایی نیست که در پرسشنامهها اظهار میشود.
جالب اینجاست که او تحقیقاتش را برای چند ژورنال معتبر فرستاده و وقتی آنها حاضر نشدهاند تحقیقاتش را چاپ کنند، فکر میکند نتایج تحقیقاتش با مفروضات کارشناسان آن ژورنالها تطبیق نداشته و باز هم، متوجه نشده (یا نخواسته بشود) که معیار اصلی در رد شدن این نوع کارها، ضعف در متود علمی است.
اما با همهی اینها، کتاب ست میتواند برای کسی که با بیگ دیتا آشنایی ندارد، نقطهی شروع خوبی باشد.
به هر حال، نویسنده در این کتاب، این مباحث را بدون مراجعه به فرمولها و محاسبات ریاضی، و با حذف تمام پیچیدگیها مطرح کرده و از این نظر، میتوان کتاب را ساده و روان توصیف کرد.
اما اگر اندک آشنایی با بیگ دیتا و الگوریتمها و برنامهنویسی و علم داده داشته باشید، احتمالاً نگاه سطحی کتاب و عبور نویسنده از کنارِ «اما و اگرها» شما را آزرده خواهد کرد.
ترجمه فارسی کتاب همه دروغ می گویند
این کتاب توسط ریحانه عبدی به فارسی ترجمه شده و #نشر گمان آن را به بازار عرضه کرده است.
ترجمه به قضاوت متمم، کاملاً روان است و ما هم، عباراتی را که در متن آوردیم، از نسخهی فارسی کتاب برداشتهایم. با توجه به اینکه نویسنده، همهی کنجکاویهای جنسی خود در گوگل را در کتاب خود آورده است، ترجمه و انتشار کتاب با توجه به محدودیتهای موجود در کشور، کار سادهای نبوده است.
اما تا جایی که ما متن فارسی را با متن انگلیسی تطبیق دادیم، به نتیجه رسیدیم که ترجمه کاملاً امانتدارانه است و از این منظر، خواندن این ترجمه با این حد از اشاره به موضوعات و عبارات مطرود یا ممنوعه، برای ما جالب بود.
البته ترجمهی دیگری هم از کتاب وجود دارد که انتشارات شفاف آن را منتشر کرده است. این ترجمه توسط طناز کاوسی ، مهدی حبیب الهی و هانودین ابراهیم بابرودی انجام شده و در فیدیبو نیز عرضه شده است.
اما در زمان تألیف و تدوین این مطلب، از میان ترجمههای فارسی ما صرفاً به ترجمهی ریحانه عبدی دسترسی داشتیم.
بنابراین سپاسگزار میشویم اگر ترجمهی دیگر را هم خواندهاید، دربارهی آن برایمان بنویسید.
خرید کتاب همه دروغ می گویند (ترجمه ریجانه عبدی)
دانلود نسخه الکترونیکی کتاب همه دروغ می گویند (فیدیبو – انتشارات شفاف)
کتاب همه دروغ می گویند نوشته ست استیونس دیویدویتس از جمله کتابهایی است که دوستان متممی در نظرسنجی سالانه متمم به عنوان یکی از کتابهای پیشنهادی برای مطالعه به سایر دوستانشان معرفی کردهاند.
ما در یکی از درسهای مجموعهٔ داستان کسب و کار به پروژهٔ گوگل دربارهٔ پیشبینی اپیدمیها بر اساس جستجوهای کاربران پرداختهایم. آن درس کاملاً مکمل این کتاب است و پیشنهاد میکنیم برای مطالعهاش وقت بگذارید: پروژهٔ GFT گوگل.
چند تذکر درباره بخش معرفی کتاب
متمم سایت فروش کتاب نیست. و جز کتاب «از کتاب» محمدرضا شعبانعلی - که خود متمم آن را منتشر کرده - صرفاً به معرفی، بررسی و نقد کتاب میپردازد.
صِرف معرفی کتاب در متمم لزوماً به معنای تأیید محتوای آن کتاب نیست. پس حتماً متن معرفی را کامل بخوانید. ممکن است نقاط ضعف برخی کتابها پررنکتر از نقاط قوتشان باشد.
معرفی کتاب در متمم لزوماً به این معنا نیست که آن کتاب جزو منابع تدوین درسها بوده است (مگر این که صریحاً به این نکته اشاره شده باشد). در باقی موارد صرفاً ممکن است با هدفی مشخص (نقل یک مطلب از کتاب، نقد کتاب، آشنایی با نویسنده و ...) به کتاب اشاره شده باشد.
متمم برای معرفی کتابها هیچ نوع هزینهای دریافت نمیکند و صرفاً اهداف آموزشی خود را مد نظر قرار میدهد.بنابراین اگر ناشر هستید و کتابی در متمم معرفی شده، کتاب مرتبط دیگری را که در آن حوزه ترجمه یا تألیف کردهاید (یا اگر ترجمه دیگری از همان کتاب را عرضه کردهاید) در کامنتها معرفی کنید. متمم ممکن است بعد از بررسی کتاب را به متن بیفزاید یا معرفی آن را در قالب مطلبی مستقل منتشر کند.
دستهبندی موضوعی کتاب های مدیریت
دستهبندی کتاب های روانشناسی و توسعه فردی
فهرست کامل کتاب های روانشناسی | نقد و خلاصه کتاب
کتابهایی در مورد یادگیری و مدل ذهنی
چند کتاب درباره بهبود مهارت های ارتباطی
مطالب، فایلها و کتابهای مربوط به کتابخوانی
خرید کتاب از کتاب نوشته محمدرضا شعبانعلی
راهنمای خواندن و خریدن کتاب (فایل صوتی)
کتابخوانی | چگونه کتابخوان شویم؟
فهرست کتابهای پیشنهادی برای ترجمه
پاراگراف فارسی | جملات منتخب کتابها
دوست عزیز. دسترسی کامل مجموعه درسهای سواد دیجیتال برای اعضای ویژهی متمم در نظر گرفته شده است.
تعداد درسها: ۷۶ عدد
دانشجویان این درس: ۶۹۴۳ نفر
تمرینهای ثبتشده: ۳۸۹۴ مورد
البته با عضویت ویژه، به مجموعه درسهای بسیار بیشتری به شرح زیر دسترسی پیدا میکنید:
البته اگر به تسلط بر تکنولوژی و سواد دیجیتال علاقه دارید، احتمالاً مطالعهی مباحث زیر برایتان در اولویت خواهد بود:
آموزش CRM | اتوماسیون بازاریابی
استراتژی محتوا | آموزش بازاریابی محتوا | دیجیتال مارکتینگ
آموزش سئو | ایمیل مارکتینگ | شبکه های اجتماعی
شبکه های اجتماعی | تولید محتوا
دوره MBA (پیگیری منظم مجموعه درسها)
اگر با فضای متمم آشنا نیستید و دوست دارید دربارهی متمم بیشتر بدانید، میتوانید نظرات دوستان متممی را دربارهی متمم بخوانید و ببینید متمم برایتان مناسب است یا نه. این افراد کسانی هستند که برای مدت طولانی با متمم همراه بوده و آن را به خوبی میشناسند:
ترتیبی که متمم برای خواندن مطالب سری علم داده به شما پیشنهاد میکند:
- علم داده چیست | کاربردهای رشته دیتا ساینس
- بازار کار علم داده | چند مثال از کاربرد علم داده به زبان ساده
- فراداده یا متادیتا چیست؟ | تفاوت داده با اطلاعات
- کلان داده یا بیگ دیتا چیست؟ (+کاربردهای Big Data)
- کتاب همه دروغ می گویند | کتابی ضعیف اما خواندنی درباره بیگ دیتا
- هوش مصنوعی و استراتژی کسب و کار | مروری بر کتاب استراتژی همجوشی
- انسانها و نکته ای در کاربرد هوش مصنوعی
- پروژه GFT | چرا گوگل در پیشبینی اپیدمی و پاندمی موفق نشد؟
- پیتر تیل | کارآفرین، بنیانگذار پی پل و از صاحبنظران حوزه تکنولوژی
- شرکت پالانتیر (Palantir) | داده کاوی در مقیاس بزرگ برای پرسشهای خاص
- Clearview AI | آیا با اینکه هوش مصنوعی تصویر شما را تشخیص دهد موافقید؟
- انسان در برابر هوش مصنوعی | آیا کاسپاروف درباره خیانت IBM به علم درست میگوید؟
- مقاله آلن تورینگ (تست تورینگ) | نقطه آغاز دوران مدرن هوش مصنوعی
- کتاب اهمیت آموزش پذیری (لزلی ولینت) | کمکی برای فهم بهتر هوش مصنوعی
چند مطلب پیشنهادی از متمم:
سوالهای پرتکرار دربارهٔ متمم
متمم مخففِ عبارت «محل توسعه مهارتهای من» است: یک فضای آموزشی آنلاین برای بحثهای مهارتی و مدیریتی.
برای کسب اطلاعات بیشتر میتوانید به صفحهٔ درباره متمم سر بزنید و فایل صوتی معرفی متمم را دانلود کرده و گوش دهید.
فهرست دوره های آموزشی متمم را کجا ببینیم؟
هر یک از دوره های آموزشی متمم یک «نقشه راه» دارد که مسیر یادگیری آن درس را مشخص میکند. با مراجعه به صفحهٔ نقشه راه یادگیری میتوانید نقشه راههای مختلف را ببینید و با دوره های متنوع متمم آشنا شوید.
همچنین در صفحههای دوره MBA و توسعه فردی میتوانید با دوره های آموزشی متمم بیشتر آشنا شوید.
هزینه ثبت نام در متمم چقدر است؟
شما میتوانید بدون پرداخت پول در متمم به عنوان کاربر آزاد عضو شوید. اما به حدود نیمی از درسهای متمم دسترسی خواهید داشت. پیشنهاد ما این است که پس از ثبت نام به عنوان کاربر آزاد، با خرید اعتبار به عضو ویژه تبدیل شوید.
اعتبار را میتوانید به صورت ماهیانه (۱۶۰ هزار تومان)، فصلی (۴۲۰ هزار تومان)، نیمسال (۷۵۰ هزار تومان) و یکساله (یک میلیون و ۲۰۰ هزار تومان) بخرید. لطفاً برای اطلاعات بیشتر به صفحه ثبت نام مراجعه کنید.
آیا در متمم فایل های صوتی رایگان هم برای دانلود وجود دارد؟
مجموعه گسترده و متنوعی از فایلهای صوتی رایگان در رادیو متمم ارائه شده که میتوانید هر یک از آنها را دانلود کرده و گوش دهید.
همچنین دوره های صوتی آموزشی متنوعی هم در متمم وجود دارد که فهرست آنها را میتوانید در فروشگاه متمم ببینید.
با متمم همراه شوید
آیا میدانید که فقط با ثبت ایمیل و تعریف نام کاربری و رمز عبور میتوانید به جمع متممیها بپیوندید؟
نویسندهی دیدگاه : مریم رئیسی
من کتاب همه دروغ میگویند رو تازه خوندم و اتفاقا همین چند روز پیش تمومش کردم.
کلا انتشارات گمان رو دوست دارم و معمولا حواسم به کتابهای تازه منتشر شدهشون هست؛ و چه خوب که متمم هم این کتاب رو معرفی کرد.
از خوندن این کتاب خیلی زیاد لذت بردم؛ یه دلیلش اینه که به مباحث بیگ دیتا و علم داده علاقه دارم و چون در آغاز راه و مبتدی هستم، بیان ساده و روان تحقیقات توسط نویسنده، برام جذاب بود.
البته فکر میکنم این کتاب برای کسانی که به تحلیل داده علاقه نداشته باشند هم جذاب باشه، چون سبک داستانی کتاب اون رو خواندنی کرده.
نویسنده، علاقهی زیادی به داستان گویی داره و معتقده پشت هر مجموعه دادهای که گردآوری میکنیم داستانی وجود داره، و حتی یک جایی در کتاب میگه وقتی مردم دربارهی نتایج بعضی نظرسنجیها با من صحبت میکنند این دادهها برام خشک و خسته کنندهست؛ چون داستانی برای تعریف کردن ندارند.
که خب البته به نظرم این خشک و ملالآور بودن در ذات داده و تحلیل داده هست چون همش محاسبات ریاضیه؛ و یک متخصص داده باید با این موضوع کنار بیاد.
حدس میزنم هم به این دلیل و هم به علت اینکه میخواسته خواننده رو در فصلهای ابتدایی بیشتر تحت تاثیر قرار بده و مجذوب قدرت دادهها بکنه، در این فصول از دقت علمی و بیان روابط علی و اما و اگرها صرفنظر کرده.
اما همونطور که در درس هم اشاره شده در فصلهای پایانی استدلالهای قویتری وجود داره.
و جالبه که بعضی مباحثی که در پایان مطرح میکنه، برخی مثالهای اولیهاش رو نقض میکنه؛
مثلا یک موضوع جالبی که در فصل هفتم در موردش صحبت میکنه، «معضل بُعد» هست؛ به این معنیکه وقتی متغیرهای بسیار زیادی رو آزمون کنید بالاخره بعضیهاشون به تصادف با هم همبستگی پیدا میکنند؛
اما در فصل سوم یک مثالی داره که در یک بازهی زمانی مشخص، همبستگی نرخ بیکاری رو با میلیاردها عبارت جستجو در این بازه بررسی کرده، و به این نتیجه رسیده که جستجوی اسم یک سایت پورنوگرافی بیشترین همبستگی رو با نرخ بیکاری داره؛
که به نظرم این مثال نمونهای از معضل بعد هست که در فصل هفتم بهش میپردازه.
و یا مورد دیگه اینکه در فصل هشتم به آمار بالای جستجوی خودکشی، اما آمار پائینِ عمل به اون اشاره میکنه، و توضیح میده که فکر خودکشی عمومیت داره اما اقدام به خودکشی اونقدر زیاد نیست؛
این مثال هم نشون میده که خیلی از جستجوها از روی کنجکاوی هست و نشون دهندهی افکار واقعی نیست و ایشون در فصلهای اولیه به این موضوع چندان توجه نکرده.
اما با همهی این موارد خوندن این کتاب همچنان برای من لذتبخش بود. و کلا فصلهای پایانی رو بیشتر دوست داشتم؛
چون مثالهایی که میزنه و سعی در نشون دادن تفاوت همبستگی و علیت داره برام جذاب بود.
به طور مثال نشون میده که همبستگی بالایی با رتبهی دانشگاه فرد (مثل هاروارد و پرینستون) و موفقیت و درآمدِ بالاش در آینده وجود داره؛ اما این رابطه فقط همبستگیه و رابطهی علی نیست؛ و افراد موفق در هر موقعیتی فرصتی برای پیشرفت پیدا میکنند.
یک نکتهی دیگه رو هم بگم و اون اینکه نویسنده اتفاقا به دادههایی که از فیسبوک جمعآوری میشه چندان اعتماد نداره و معتقده که مردم در شبکههای اجتماعی مثل زندگی واقعی دروغ میگن و واقعیت خودشون رو بیان نمیکنند.
و برای همین در تحقیقاتی که مثلا مربوط به احساسات هست از دادههای فیسبوک و توئیتر استفاده نمیکنه. کلا بیشترین تاکیدش روی استفاده از دادههای گوگل و سرچهایی هست که افراد انجام میدن.
همونطور که نویسنده هم در جاهای مختلف کتاب بیان کرده، به نظرم آشنایی با علم تحلیل داده، دیدِ ما رو وسیعتر میکنه و کمک میکنه که خیلی جاها رفتار مردم و گروهها رو بهتر درک و تحلیل کنیم و به چیزهایی پی ببریم که در حالت عادی از دیدمون پنهان مونده؛
همچنین به نظرم نشون میده که چقدر پیشفرضهایی که در مورد دیگران و رفتار و افکارشون داریم ممکنه نادرست و اشتباه باشه.
من به کاربرد بیگ دیتا در این مورد، یعنی تحلیل رفتار آدمها، خیلی علاقه دارم. فکر میکنم دلیلش هم اینه که من آدم مشاهدهگری هستم.
همیشه یکی از مهمترین منابع یادگیری برای من، مشاهدهی رفتار آدمها و تحلیل اونها بوده و خیلی چیزها از این طریق یاد میگیرم.
و بنابراین اینکه امروزه جمعآوری دادهها و تبدیلشون به اعداد و ارقام و تحلیل اونها راحت و امکانپذیر شده برام هیجان انگیزه.
یک موضوع جالب دیگه اینه که نویسنده میگه اینکه بدونیم چه دادههایی میتونن برامون مفید باشن و باید جمعآوریشون کنیم، خودش یک هنره و نیاز به خلاقیت داره.
خیلی باهاش موافقم و به نظرم هم نیاز به خلاقیت داره و هم اینکه مشاهده کنندهی خوبی باید باشیم تا متوجه بشیم چه دادههایی بیشترین کاربرد رو برامون دارند.
به طور کلی من خوندن این کتاب رو پیشنهاد میکنم و به نظرم خوراک فکری خوبی برامون فراهم میکنه:).