در نشریهی اکونومیست، تصویرسازی داده موضوعی مهم و جدی است و هر هفته حدود ۴۰ نمودار در نسخهی چاپی مجله، وبسایت و اپلیکیشن آن منتشر میشود. سارا لئو، دیتاژورنالیست در مطلبی که در وبسایت مدیوم منتشر کرده به اشتباههایی که در اکونومیست مرتکب شدهاند اشاره میکند و از تجربیات خود در این زمینه میگوید که در ادامه به مهمترین مباحث آن میپردازیم.
نمودارهایی که بر اثر اشتباه در تصویرسازی داده طراحی میشوند را میتوان به سه دسته تقسیم کرد:
- گمراهکننده
- گیجکننده
- ناموفق در انتقال پیام مورد نظر
نمودارهای گمراهکننده
بدترین گناه در تصویرسازی داده گمراه کردن مخاطب است. ما این کار را هیچ وقت به طور عمد انجام نمیدهیم ولی این اتفاق بعضی وقتها رخ میدهد. به این سه مثال توجه کنید.
اشتباه: ناقص کردن درجهبندیها
این نمودار، میانگین تعداد لایکهای صفحههای فیسبوک افراد و احزاب/گروههای سیاسی چپگرا در بریتانیا را نشان میدهد. نمودار اصلی نه تنها تعداد لایکهای جرمی کوربین(رهبر حزب کارگر) را کم اهمیت جلوه میدهد، بلکه در اعلام تعداد لایکهای صفحههای دیگر نیز اغراق میکند. در نسخهی بازطراحی شده از این نمودار ما بخش مربوط به کوربین را به طور کامل و بدون دستکاری نشان دادیم و مقادیر دیگر نیز همچنان قابل مشاهده هستند.
موضوع غیرعادی دیگر، انتخاب رنگهاست. در انتخاب رنگ، ما از رنگ حزب کارگر الگو گرفتیم و سه رنگ از طیف نارنجی/قرمز را برای تمایز بین جرمی کوربین، سایر نمایندگان و احزاب/گروهها انتخاب کردیم، اما علت آن را توضیح ندادیم. به نظر میرسد منطق پشت انتخاب رنگها برای کسانی که با مسائل سیاسی در بریتانیا آشنایی ندارند کمتر قابل درک است، در صورتی که دلیل انتخاب رنگ در نمودارها میبایست برای تعداد زیادی از مخاطبان روشن باشد.
اشتباه: ایجاد رابطهی غیرواقعی بین متغیرها با استفاده از درجهبندی و مقیاس گزینشی
این نمودار همراه با گزارشی درباره کاهش وزن سگها(از سال ۲۰۰۶ تا ۲۰۱۵) منتشر شده است. در نگاه اول به نظر میرسد وزن سگها و اندازه گردن آنها کاملاً با هم همبستگی دارند. اما آیا این درست است؟ تاحدودی.
در نمودار اصلی، درجهبندی روی هر دو محور عمودی با فاصلهی ۳ واحد انجام شده است(از ۲۱ تا ۱۸ در چپ و از ۴۵ تا ۴۲ در راست). اگر تغییرات را به صورت درصدی محاسبه کنیم در سمت چپ ۱۴ درصد کاهش داریم در حالیکه این میزان در سمت راست ۷ درصد است. در نمودار بازطراحی شده نسبت دو برابری تغییرات را حفظ کردهام اما دامنهی آنها را طوری تنظیم کردم تا تغییرات قابل مقایسهای را نشان بدهد.
موضوع این نمودار آنقدر بامزه است که چنین اشتباهی، کوچک به نظر میرسد. پیام این نمودار هر چه که باشد در هر دو نسخه یکسان است. اما نتیجهگیری از این بحث اهمیت دارد: اگر دو متغیر همدیگر را خیلی نزدیک دنبال میکنند، شاید بهتر باشد که نگاهی به مقیاس آنها بیاندازید.
اشتباه: انتخاب نادرست روش تصویرسازی
این نمودار را در اپلیکیشن خبریمان منتشر کردیم. این نمودار خطی، نشاندهندهی نظرات مردم بریتانیا دربارهی نتایج رفراندوم خارج شدن کشورشان از اتحادیهی اروپاست. به دادهها نگاه کنید. اینطور به نظر میرسد که پاسخدهندگان، نظرات نسبتاً متغیری دارند و دمدمیمزاج هستند، به طوریکه از یک هفته به هفتهی بعد بین دو نقطه افزایش و کاهش داریم.
ما به جای اینکه نتیجهی نطرسنجیهای جداگانه را با یک منحنی هموار شده طراحی کنیم تا روند تغییرات نشان داده شود، نتایج واقعی هر کدام از رایگیریها را به هم وصل کردیم. این اتفاق اساساً به این دلیل اتفاق افتاد که نرمافزاری که درون سازمانمان از آن استفاده میکردیم خطهای هموار شده رسم نمیکرد. تا همین چند وقت پیش کار کردن با نرمافزار آماریای(مانند R) که اجازه بدهد تصویرسازی پیچیدهتری انجام بدهیم برایمان چندان راحت نبود. اما حالا همهی ما میتوانیم یک نمودار نظرسنجی مانند نمونهی بازطراحیشدهی بالا را رسم کنیم.
نکتهی دیگری که در این نمودار میبایست به آن توجه کرد نحوهی انتخاب کردن محدودهی درجهبندی است. در نمودار اصلی، دادهها بیشتر از آنچه باید پراکنده شدهاند. در نسخهی بازطراحی شده فضای بیشتری بین نقطهی شروع درجهبندی و کوچکترین نقطهداده قرار دادم. فرانسیس گنیو برای این موضوع فرمول جالبی ساخته: در نمودارهای خطیای که درجهبندی آنها از صفر شروع نمیشود، بگذارید پایین نمودار به اندازهی ۳۳ درصد کل فضای طرح، خالی باقی بماند.
نمودارهای گیجکننده
این نمودارها به اندازهی نمودارهای گمراهکننده محکوم نیستند اما نموداری که به سختی بتوان مفهوم آنها را درک کرد نشانهای است از اینکه کار تصویرسازی بد انجام شده است.
اشتباه: مغز مخاطب را بیش از حد به کار گرفتن
نمودار بالا کسری تجاری و تعداد افراد شاغل در صنعت آمریکا را نشان میدهد. اول اینکه مقادیر یک مجموعه داده(کسری تجاری) همگی منفی هستند، در حالیکه تمام مقادیر مجموعهی دیگر (اشتغال در صنعت) مثبت هستند. ترکیب دو مجموعهی دادهای که همخوان نیستند در یک نمودار بدون شبیه کردن دو مجموعه به هم چالشبرانگیز است. همچنین این دو مجموعه داده یک خط مبنای مشترک ندارند که با هم از آن استفاده کنند. خط مبنای کسری تجاری در بالای نمودار قرار دارد(بالای نیمی از نمودار با رنگ قرمز مشخص شده) و خط مبنای درجهبندی سمت راست در پایین طرح قرار گرفته است.
نمودار بازطراحیشده نشان میدهد که نیازی به ترکیب کردن دو نمودار نیست. رابطهی بین کسری تجارت و اشتغال در صنعت واضح باقی میماند و فضای اضافی خیلی کوچکی را اشغال میکند.
اشتباه: استفادهی گیجکننده از رنگ
این نمودار، مخارج دولتها برای تامین مزایای بازنشستگی افراد بالای ۶۵ سال را در تعدادی از کشورهای جهان با تمرکز بر برزیل نشان میدهد. برای کوچک نگه داشتن نمودار، تصویرساز فقط نام چند کشور را نوشته و آنها را با رنگ آبی براق مشخص کرده است. نرخ متوسط کشورهای عضو سازمان همکاری و توسعهٔ اقتصادی(OECD) هم با رنگ آبی کمرنگ متمایز شده است.
روزنامهنگار این حقیقت را نادیده گرفته است که تغییر رنگ، اغلب به معنی تغییر قیاسی(تغییر دستهبندی، مقدار و …) است. در نگاه اول به نظر میرسد که دایرههای به رنگ آبی براق و آبی تیره متعلق به گروههایی متفاوت هستند اما تنها دلیل این بود که نقاطی که رنگ آبی براق داشتند انتخاب شده بودند تا برچسبگذاری شوند.
در نسخهی بازطراحیشده رنگ دایرهها برای همهی کشورها یکسان در نظر گرفته شد. میزان شفافیت(opacity) دایرههایی که برچسبگذاری نشدهاند تغییر کرد تا سایر دایرهها بهتر دیده شوند. بقیهی موارد هم تلاش شد با استفاده از نویسهنگاری(Typography) مشخص شود: برزیل، کشوری که روی آن تاکید است، بصورت درشت(bold) و نرخ متوسط OECD بصورت خوابیده(italic) نوشته شد.
نمودارهایی که هدفشان نمایان نمیشود
در این دسته از نمودارها، اشتباهها کمتر به چشم میآید. نمودارهایی نظیر اینها نه گمراهکننده هستند و نه خیلی گیجکننده. آنها فقط در توجیه کردن وجودشان ناکام هستند چرا که یا تصویرسازی به درستی انجام نشده و یا اطلاعات بیش از حدی را در فضایی خیلی کوچک جا دادهایم.
اشتباه: بیش از حد جزئیات داشتن
چه رنگینکمانی! ما نمودار بالا را در یکی از ستونهای مجله درباره مازاد بودجهی آلمان منتشر کردیم. این نمودار توازن بودجه و توازن حساب جاری را برای ده کشور حوزهی یورو نشان میدهد. به وسیلهی ستونهایی با تعداد رنگهای زیاد – که تشخیص بعضی از آنها بسیار دشوار است یا حتی نمیتوان آنها را دید، چرا که مقادیر متناظر با آنها بسیار کوچک هستند – پیام نمودار منتقل نمیشود. در واقع این نمودار شما را ترغیب میکند که آن را نادیده بگیرید و مهمتر اینکه وقتی ما تمام کشورهای حوزهی یورو را در این طرح در نظر نگرفتهایم انباشته کردن این همه اطلاعات، بیمعنی است.
از آنجا که در آن مقاله به کشورهای آلمان، یونان، هلند، اسپانیا و کل حوزهی یورو اشاره شده بود، در نسخهی بازطراحی شده برای سادهتر کردن نمودار فقط همین موارد برجسته شد. برای حل مشکل انتخاب تعداد معدودی کشور، یک دستهی جدید با عنوان «سایر»(Others) شامل همهی کشورهای دیگر عضو حوزهی یویرو اضافه شد.
منبع: medium.economist.com