داده نگاری

روزنامه‌نگار اکونومیست از اشتباهات خود در ترسیم نمودارها می‌گوید

در نشریه‌ی اکونومیست، تصویرسازی داده موضوعی مهم و جدی است و هر هفته حدود ۴۰ نمودار در نسخه‌ی چاپی مجله، وب‌سایت و اپلیکیشن آن منتشر می‌شود. سارا لئو، دیتاژورنالیست در مطلبی که در وب‌سایت مدیوم منتشر کرده به اشتباه‌هایی که در اکونومیست مرتکب شده‌اند اشاره می‌کند و از تجربیات خود در این زمینه می‌گوید که در ادامه به مهمترین مباحث آن می‌پردازیم.

 

نمودارهایی که بر اثر اشتباه در تصویرسازی داده طراحی می‌شوند را می‌توان به سه دسته تقسیم کرد:

  • گمراه‌کننده
  • گیج‌کننده
  • ناموفق در انتقال پیام مورد نظر

 

نمودارهای گمراه‌کننده

بدترین گناه در تصویرسازی داده گمراه کردن مخاطب است. ما این کار را هیچ وقت به طور عمد انجام نمی‌دهیم ولی این اتفاق بعضی وقت‌ها رخ می‌دهد. به این سه مثال توجه کنید.

 

اشتباه: ناقص کردن درجه‌بندی‌ها

 

این نمودار، میانگین تعداد لایک‌های صفحه‌های فیسبوک افراد و احزاب/گروه‌های سیاسی چپ‌گرا در بریتانیا را نشان می‌دهد. نمودار اصلی نه تنها تعداد لایک‌های جرمی کوربین(رهبر حزب کارگر) را کم اهمیت جلوه می‌دهد، بلکه در اعلام تعداد لایک‌های صفحه‌های دیگر نیز اغراق می‌کند. در نسخه‌ی بازطراحی شده از این نمودار ما بخش مربوط به کوربین را به طور کامل و بدون دست‌کاری نشان دادیم و مقادیر دیگر نیز همچنان قابل مشاهده هستند.

 

موضوع غیرعادی دیگر، انتخاب رنگ‌هاست. در انتخاب رنگ، ما از رنگ حزب کارگر الگو گرفتیم و سه رنگ از طیف نارنجی/قرمز را برای تمایز بین جرمی کوربین، سایر نمایندگان و احزاب/گروه‌ها انتخاب کردیم، اما علت آن را توضیح ندادیم. به نظر می‌رسد منطق پشت انتخاب رنگ‌ها برای کسانی که با مسائل سیاسی در بریتانیا آشنایی ندارند کمتر قابل درک است، در صورتی که دلیل انتخاب رنگ در نمودارها می‌بایست برای تعداد زیادی از مخاطبان روشن باشد.

 

اشتباه: ایجاد رابطه‎‌ی غیرواقعی بین متغیرها با استفاده از درجه‌بندی‌ و مقیاس گزینشی

 

این نمودار همراه با گزارشی درباره کاهش وزن سگ‌ها(از سال ۲۰۰۶ تا ۲۰۱۵) منتشر شده است. در نگاه اول به نظر می‌رسد وزن سگ‌ها و اندازه گردن آنها کاملاً با هم همبستگی دارند. اما آیا این درست است؟ تاحدودی.

در نمودار اصلی، درجه‌بندی روی هر دو محور عمودی با فاصله‌ی ۳ واحد انجام شده است(از ۲۱ تا ۱۸ در چپ و از ۴۵ تا ۴۲ در راست). اگر تغییرات را به صورت درصدی محاسبه کنیم در سمت چپ ۱۴ درصد کاهش داریم در حالیکه این میزان در سمت راست ۷ درصد است. در نمودار بازطراحی شده نسبت دو برابری تغییرات را حفظ کرده‌ام اما دامنه‌ی آنها را طوری تنظیم کردم تا تغییرات قابل مقایسه‌ای را نشان بدهد.

موضوع این نمودار آنقدر بامزه است که چنین اشتباهی، کوچک به نظر می‌رسد. پیام این نمودار هر چه که باشد در هر دو نسخه یکسان است. اما نتیجه‌گیری از این بحث اهمیت دارد: اگر دو متغیر همدیگر را خیلی نزدیک دنبال می‌کنند، شاید بهتر باشد که نگاهی به مقیاس آنها بیاندازید.

 

اشتباه: انتخاب نادرست روش تصویرسازی

 

این نمودار را در اپلیکیشن خبری‌مان منتشر کردیم. این نمودار خطی، نشان‌دهنده‌ی نظرات مردم بریتانیا درباره‌ی نتایج رفراندوم خارج شدن کشورشان از اتحادیه‌ی اروپاست. به داده‌ها نگاه کنید. اینطور به نظر می‌رسد که پاسخ‌دهندگان، نظرات نسبتاً متغیری دارند و دمدمی‌مزاج هستند، به طوریکه از یک هفته به هفته‌ی بعد بین دو نقطه افزایش و کاهش داریم.

ما به جای اینکه نتیجه‌ی نطرسنجی‌‌های جداگانه را با یک منحنی هموار شده طراحی کنیم تا روند تغییرات نشان داده شود، نتایج واقعی هر کدام از رای‌گیری‌ها را به هم وصل کردیم. این اتفاق اساساً به این دلیل اتفاق افتاد که نرم‌افزاری که درون سازمان‌مان از آن استفاده می‌کردیم خط‌های هموار شده رسم نمی‌کرد. تا همین چند وقت پیش کار کردن با نرم‌افزار آماری‌ای(مانند ‌R) که اجازه بدهد تصویرسازی پیچیده‌تری انجام بدهیم برایمان چندان راحت نبود. اما حالا همه‌ی ما می‌توانیم یک نمودار نظرسنجی مانند نمونه‌ی بازطراحی‌شده‌ی بالا را رسم کنیم.

 

نکته‌ی دیگری که در این نمودار می‌بایست به آن توجه کرد نحوه‌ی انتخاب کردن محدوده‌ی درجه‌بندی‌ است. در نمودار اصلی، داده‌ها بیشتر از آنچه باید پراکنده شده‌اند. در نسخه‌ی بازطراحی شده فضای بیشتری بین نقطه‌ی شروع درجه‌بندی و کوچکترین نقطه‌داده قرار دادم. فرانسیس گنیو برای این موضوع فرمول جالبی ساخته: در نمودارهای خطی‌ای که درجه‌بندی آنها از صفر شروع نمی‌شود، بگذارید پایین نمودار به اندازه‌‌ی ۳۳ درصد کل فضای طرح، خالی باقی بماند.

 

نمودارهای گیج‌کننده

این نمودارها به اندازه‌ی نمودارهای گمراه‌کننده محکوم نیستند اما نموداری که به سختی بتوان مفهوم آنها را درک کرد نشانه‌‌ای است از اینکه کار تصویرسازی بد انجام شده است.

 

اشتباه: مغز مخاطب را بیش از حد به کار گرفتن

اشتباه: مغز مخاطب را بیش از حد به کار گرفتن 

 

نمودار بالا کسری تجاری و تعداد افراد شاغل در صنعت آمریکا را نشان می‌دهد. اول اینکه مقادیر یک مجموعه داده(کسری تجاری) همگی منفی هستند، در حالیکه تمام مقادیر مجموعه‌ی دیگر (اشتغال در صنعت) مثبت هستند. ترکیب دو مجموعه‌ی داده‌ای که همخوان نیستند در یک نمودار بدون شبیه کردن دو مجموعه به هم چالش‌برانگیز است. همچنین این دو مجموعه‌ داده یک خط مبنای مشترک ندارند که با هم از آن استفاده کنند. خط مبنای کسری تجاری در بالای نمودار قرار دارد(بالای نیمی از نمودار با رنگ قرمز مشخص شده) و خط مبنای درجه‌بندی سمت راست در پایین طرح قرار گرفته است.

نمودار بازطراحی‌شده نشان می‌دهد که نیازی به ترکیب کردن دو نمودار نیست. رابطه‌ی بین کسری تجارت و اشتغال در صنعت واضح باقی می‌ماند و فضای اضافی خیلی کوچکی را اشغال می‌کند.

 

اشتباه: استفاده‌‌ی گیج‌کننده از رنگ

اشتباه: استفاده‌‌ی گیج‌کننده از رنگ  

 

 

این نمودار، مخارج دولت‌ها برای تامین مزایای بازنشستگی افراد بالای ۶۵ سال را در تعدادی از کشورهای جهان با تمرکز بر برزیل نشان می‌دهد. برای کوچک نگه داشتن نمودار، تصویرساز فقط نام چند کشور را نوشته و آنها را با رنگ آبی براق مشخص کرده است. نرخ متوسط کشورهای عضو سازمان همکاری و توسعهٔ اقتصادی(OECD) هم با رنگ آبی کم‌رنگ متمایز شده است.

روزنامه‌نگار این حقیقت را نادیده گرفته است که تغییر رنگ، اغلب به معنی تغییر قیاسی(تغییر دسته‌بندی، مقدار و …) است. در نگاه اول به نظر می‌رسد که دایره‌های به رنگ آبی براق و آبی تیره متعلق به گروه‌هایی متفاوت هستند اما تنها دلیل این بود که نقاطی که رنگ آبی براق داشتند انتخاب شده بودند تا برچسب‌گذاری شوند.

در نسخه‌ی بازطراحی‌شده رنگ دایره‌ها برای همه‌ی کشورها یکسان در نظر گرفته شد. میزان شفافیت(opacity) دایره‌‌هایی که برچسب‌گذاری نشده‌اند تغییر کرد تا سایر دایره‌ها بهتر دیده شوند. بقیه‌ی موارد هم تلاش شد با استفاده از نویسه‌نگاری(Typography) مشخص شود: برزیل، کشوری که روی آن تاکید است، بصورت درشت(bold) و نرخ متوسط OECD بصورت خوابیده(italic) نوشته شد.

 

نمودارهایی که هدف‌شان نمایان نمی‌شود

در این دسته از نمودارها، اشتباه‌ها کمتر به چشم می‌آید. نمودارهایی نظیر اینها نه گمراه‌کننده هستند و نه خیلی گیج‌کننده. آنها فقط در توجیه کردن وجودشان ناکام هستند چرا که یا تصویرسازی به درستی انجام نشده و یا اطلاعات بیش از حدی را در فضایی خیلی کوچک جا داده‌ایم.

 

اشتباه: بیش از حد جزئیات داشتن

اشتباه: بیش از حد جزئیات داشتن

 

چه رنگین‌کمانی! ما نمودار بالا را در یکی از ستون‌های مجله درباره مازاد بودجه‌ی آلمان منتشر کردیم. این نمودار توازن بودجه و توازن حساب جاری را برای ده کشور حوزه‌ی یورو نشان می‌دهد. به وسیله‌ی ستون‌هایی با تعداد رنگ‌های زیاد – که تشخیص بعضی از آنها بسیار دشوار است یا حتی نمی‌توان آنها را دید، چرا که مقادیر متناظر با آنها بسیار کوچک هستند – پیام نمودار منتقل نمی‌شود. در واقع این نمودار شما را ترغیب می‌کند که آن را نادیده بگیرید و مهمتر اینکه وقتی ما تمام کشورهای حوزه‌ی یورو را در این طرح در نظر نگرفته‌ایم انباشته کردن این همه اطلاعات، بی‌معنی است.

از آنجا که در آن مقاله به کشورهای آلمان، یونان، هلند، اسپانیا و کل حوزه‌ی یورو اشاره شده بود، در نسخه‌ی بازطراحی شده برای ساده‌تر کردن نمودار فقط همین موارد برجسته شد. برای حل مشکل انتخاب تعداد معدودی کشور، یک دسته‌ی جدید با عنوان «سایر»(Others) شامل همه‌ی کشورهای دیگر عضو حوزه‌ی یویرو اضافه شد.

 

منبع: medium.economist.com

عضویت در خبرنامه

جدیدترین مطالب را به صورت هفتگی دریافت کنید