چهار کاربرد اصلی اکسل در داده نگاری

نرم‌افزار مایکروسافت اکسل ابزاری قدرتمند است که می‌تواند اکثر کارهایی را که یک روزنامه‌نگار برای تحلیل داده نیاز دارد تا الگو‌های جذاب را کشف کند، انجام دهد. این کارها شامل چهار مورد زیر می‌شوند:

  • مرتب‌سازی
  • جدا کردن(فیلتر کردن)
  • استفاده از توابع ریاضی و متنی
  • استفاده از جداول محوری
معرفی اکسل

اکسل می‌تواند عملیات متعددی را روی مقادیر زیادی داده که در قالب یک جدول(با ستون و ردیف) سازمان یافته‌اند اجرا کند. در ستون‌ها(که با حروف …,A,B,C نمایش داده می‌شوند) معمولا متغیرها(مانند اسم، سن، تعداد جنایت و …) قرار می‌گیرند و در ردیف اول نام متغیرها نوشته می‌شود. ردیف‌های دیگر برای اطلاعات ثبت شده‌ی(record) افراد یا مواردی است که تحلیل می‌شوند. در هر سلول بخشی از مجموعه داده ثبت می‌شود.

معرفی اکسل

نسخه‌های جدید اکسل می‌توانند ۱۰۴۸۵۷۶ رکورد همراه با ۱۶۳۸۴ متغیر را در خود جای دهند. صفحه گسترده‌ی(spreadsheet) اکسل همچنین می‌تواند چندین جدول را در صفحه‌های جداگانه ذخیره کند. این صفحه‌ها در پایین صفحه به صورت تب(tab) قابل دسترسی هستند.

معرفی اکسل

مرتب‌سازی(Sorting)

یکی از پرکاربردترین قابلیت‌های اکسل، مرتب کردن داده‌ها به صورتی است که اطلاعات بیشتری از درون آن نمایان شود. اغلب اوقات، ما فهرست‌هایی را دریافت می‌کنیم که براساس ترتیب حروف الفبایی مرتب شده‌اند. ترتیب الفبایی تنها برای پیدا کردن یک رکورد مشخص در یک فهرست طولانی کاربرد دارند. در روزنامه‌نگاری، ما معمولا به اکسترمم‌ها علاقه‌مندیم: بزرگترین، کوچکترین، بیشترین، کمترین، بهترین، بدترین.

در مجموعه‌ داده‌ای که در این مطلب از آن استفاده می‌شود، فهرستی از استان‌های ایتالیا وجود دارد که در آن تعداد انواع جرم‌های رخ داده شده در هر کدام از آنها در سال ۲۰۱۴ به نمایش گذاشته شده است. در اینجا می‌بینید که این فهرست چطور به ترتیب حروف الفبا مرتب شده‌ است.

مرتب‌سازی

این فهرست وقتی جذاب‌تر می‌شود که بر اساس تعداد قتل‌های رخ داده، از زیاد به کم مرتب شود و خشن‌ترین شهر در بالای فهرست قرار گیرد.

برای مرتب‌سازی دو روش وجود دارد. از اولین روش که سریع هم است می‌توان برای مرتب‌سازی داده‌های یک متغیره استفاده کرد. یکی از سلول‌های ستونی که می‌خواهید مرتب شود را انتخاب کنید(در این مثال “Murders”(قتل‌ها)) سپس روی آیکون Sort & Filter کلیک کنید و به هر صورت که علاقه‌مندید آن را مرتب کنید(از کوچک به بزرگ، از بزرگ به کوچک و …).

حواستان باشد که یکی از سلول‌ها را انتخاب کنید و نه حرف ستون(در این مورد D) را. به مثال زیر توجه کنید:

اگر حرف ستون را انتخاب کنید با یک پیام هشدار مواجه می‌شوید. در این حالت گزینه‌ی Continue with the current selection را انتخاب نکنید، چرا که فقط مقادیر همان ستون انتخابی مرتب می‌شود و در نتیجه، داده‌های شما به هم می‌ریزد. روش دیگر مرتب‌سازی زمانی به کار می‌آید که شما می‌خواهید داده‌هایتان را بر اساس بیشتر از یک متغیر مرتب کنید. به عنوان مثال فرض کنید که می‌خواهیم اطلاعات جرائم(crime) را ابتدا بر اساس ترتیب الفبایی مناطق(territory) انجام دهیم و سپس بر اساس تعداد قتل‌ها(murders) و از زیاد به کم. ابتدا در نوار ابزار روی تب data و بعد از آن روی آیکون sort کلیک می‌کنیم. بعد از آن هر کدام از متغیرها را که می‌خواهیم مرتب شود را انتخاب می‌کنیم. با کلیک بر روی add level، سطح(متغیر) جدیدی برای مرتب‌سازی اضافه خواهد شد.

و در نهایت این نتیجه حاصل می‌شود:

 

جدا کردن(Filtering)

بعضی اوقات شما می‌خواهید بخش بخصوصی از رکوردهای یک مجموعه‌ی بزرگ داده را بررسی کنید. برای این کار می‌توانید از ابزار فیلتر اکسل استفاده کنید. در toolbar روی تب Data بروید و سپس روی آیکون Filter کلیک کنید. دکمه‌های کوچکی بالای هر ستون ظاهر می‌شوند.

فیلتر کردن در اکسل

فرض کنید می‌خواهیم فقط اطلاعات مربوط به منطقه‌ی «لاتزیو»(Lazio) را مشاهده کنیم. روی دکمه‌ی مربوط به ستون منطقه(territory) کلیک می‌کنیم. نشان «انتخاب همه‌ی گزینه‌ها»(Select All) را بر می‌داریم و سپس Lazio را از لیست انتخاب می‌کنیم، مانند تصویر زیر:

فیلتر کردن در اکسل

حاصل کار اینگونه می‌شود:

فیلتر کردن در اکسل

ملاحظه کنید که شما در حال حاضر فقط ردیف‌های ۳۶، ۴۴، ۷۸، ۸۰ و ۱۰۴ را می‌بینید. ردیف‌های دیگر هم همچنان وجود دارند ولی دیده نمی‌شوند. امکان اعمال فیلترهای پیچیده‌تری هم وجود دارد. به طور مثال فرض کنید می‌خواهید رکوردهایی را ببینید که در آنها تعداد «دزدی از خانه»(burglaries) بزرگتر یا مساوی ۵۰۰۰ فقره و تعداد «سرقت اتومبیل»(car thefts) کمتر از ۲۰۰۰ فقره باشد. ابتدا با فیلتر کردن «دزدی از خانه» شروع می‌کنیم:

فیلتر کردن در اکسل

سپس…

فیلتر کردن در اکسل

همین کار را برای «سرقت اتومبیل» انجام دهید، در نهایت به اطلاعات مورد نظرمان دست پیدا می‌کنیم.

فیلتر کردن در اکسل

استفاده از توابع ریاضی و متنی(math and text functions)

اکسل تعداد زیادی تابع آماده و کاربردی برای اجرای عملیات ریاضی و کار با تاریخ‌ها(ِdate) و متون(text) دارد. برای مثال فرض کنید می‌خواهیم مجموع تعداد قتل‌ها در هر استان را محاسبه کنیم. برای انجام آن باید به پایین ستون D برویم، یک ردیف را خالی بگذاریم و در سلول D106 فرمول (SUM(D2:D104= را بنویسیم. قرار دادن علامت مساوی (=) برای همه‌ی توابع ضروری است. علامت دو نقطه (:) به معنی تمام عددهای بین D2 تا D114 است. بعد از نوشتن فرمول، کلید Enter را فشار دهید، نتیجه‌ی کار به این صورت می‌شود:

استفاده از توابع ریاضی و متنی در اکسل

دلیل اینکه یک ردیف را خالی می‌گذاریم اینست که عدد مجموع از جدول اصلی جدا باشد تا در موقع مرتب‌سازی، داخل جدول به حساب نیاید و عملیات به درستی انجام شود. اغلب اوقات شما می‌خواهید که محاسبه را برای همه‌ی ردیف‌های داده‌ی خود انجام دهید. برای مثال شاید بخواهید برای مقایسه‌ی معضل سرقت اتومبیل در شهرهایی با وسعت مختلف، نرخ سرقت اتومبیل(تعداد اتومبیل‌هایی که به ازای هر ۱۰۰هزار نفر جمعیت دزدیده شده‌اند) را محاسبه کنید. برای این کار باید در ستون J (اولین ستون خالی) یک متغیر جدید به نام «نرخ سرعت اتومبیل به ازای ۱۰۰هزار نفر»(Car Theft Rate per 100k) بسازیم. بنابراین در سلول J2 این فرمول را وارد می‌کنیم: G2/C2)*100000)=
فرمول مورد نظر تعداد اتومبیل‌های سرقت شده را بر جمعیت شهر تقسیم می‌کند، سپس حاصل را در ۱۰۰۰۰۰ ضرب می‌کند. نتیجه اینگونه خواهد شد:

استفاده از توابع ریاضی و متنی در اکسل

همچنین روی تب Home می‌توانید نوع اعداد(Numbers Format) را تعیین کنید:

استفاده از توابع ریاضی و متنی در اکسل

نوشتن این فرمول برای همه‌ی ۱۰۳ ردیف داده کاری خسته‌کننده است. خوشبختانه اکسل برای کپی کردن سریع فرمول راه میان‌بری را در اختیار کاربران قرار داده است. برای این کار باید نشانگر(cursor) ماوس را روی نقطه‌‌ای که در گوشه‌ی پایین سمت راست سلولی که فرمول در آن نوشته شده قرار دهید. وقتی که نشانگر در جای درستی قرار گرفت به یک علامت مثبت کوچک سیاه‌رنگ(+) تغییر شکل می‌دهد. در همین نقطه با دبل کلیک کردن، فرمول برای همه‌ی سلول‌های پایینی تا اولین سلول خالی ستون سمت چپ اعمال می‌شود. اگر قصد داشتید فرمول فقط تا ردیفی خاص تکرار شود علامت + را تا ردیف مورد نظرتان بکشید. نتیجه‌ی کار در تصویر زیر به نمایش در آمده است:

استفاده از توابع ریاضی و متنی در اکسل

دقت کنید که فرمول برای هر ردیف فرق می‌کند یعنی در ردیف ۵ فرمول به این صورت نوشته می‌شود: G5/C5*100000= و به همین ترتیب برای سایر ردیف‌ها، بنابراین این راه جایگزین کار را بسیار ساده می‌کند. حالا اگر «نرخ سرقت اتومبیل» را بصورت نزولی(از زیاد به کم) مرتب کنیم شهرهایی که بیشترین مشکل «سرقت اتومبیل» را دارند مشاهده خواهیم کرد.

استفاده از توابع ریاضی و متنی در اکسل

با مرتب کردن به صورت صعودی(از کم به زیاد)، شهرهایی که کمترین جرایم در آنها رخ می‌دهد را خواهیم دید:

استفاده از توابع ریاضی و متنی در اکسل

در این جا چند مورد از تابع‌های کاربردی دیگر را که به شکل‌های مشابه می‌توان از آنها استفاده کرد معرفی می‌کنیم.
(شما می‌توانید عملیات جمع، تفریق، ضرب و تقسیم را با استفاده از علامت‌های +، –،* و / انجام دهید.)

  • AVERAGE=: محاسبه‌ی میانگین اعداد یک ردیف یا ستون یا مجموعه‌ای از اعداد
  • MEDIAN=: پیدا کردن میانه‌ در یک ردیف یا ستون یا مجموعه‌ای از اعداد
  • COUNT=: شمارش تعداد آیتم‌های موجود در یک ردیف یا ستون یا مجموعه‌ای از اعداد
  • MAX=: پیدا کردن بزرگترین عدد در یک ردیف یا ستون یا مجموعه‌ای از اعداد
  • MIN=: پیدا کردن کوچکترین عدد در یک ردیف یا ستون یا مجموعه‌ای از اعداد

همچنین در اکسل توابع متنی متنوعی هم وجود دارند که می‌توانند رشته‌متن‌‌ها(text strings) را به هم وصل کند و یا از هم جدا کند، به طور مثال:

اگر “Steve” در سلول B2 و “Doig” در سلول C2 قرار داشته باشند، فرمول B2&” “&C2= نتیجه‌اش می‌شود: “Steve Doig” و  C2&”, “&B2= برابر می‌شود با “Doig, Steve”. سایر توابع متنی عبارتند از:

  • SEARCH=: پیدا کردن یک رشته‌ متن در یک رشته‌ی بزرگتر و تشخیص موقعیت قرارگیری آن
  • LEN=: شمارش تعداد کاراکترهای موجود در یک رشته متن
  • LEFT=: جدا کردن تعداد کاراکترهای معین از سمت چپ رشته متن
  • RIGHT=: جدا کردن تعداد کاراکترهای معین از سمت راست رشته متن
  • MID=: جدا کردن تعداد کاراکترهای معین از قسمت مورد دلخواه شما از یک رشته متن

همچنین می‌توانید روی تاریخ هم محاسباتی را انجام دهید، مانند محاسبه‌ی تعداد روزها یا سال‌های بین دو تاریخ یا ساعت‌ها، دقیقه‌ها و/یا ثانیه‌های بین دو زمان مختلف. به عنوان نمونه اگر تاریخ امروز را ۲۴ آوریل ۲۰۱۹ در نظر بگیریم، برای محاسبه‌ی سن(بر اساس تعداد سال) کسی که تاریخ تولدش در سلول B2 ثبت شده است می‌توان از این فرمول استفاده کرد:

(DATE(2019,4,24)-B2)/365.25=

اولین قسمت فرمول تعداد روزهای بین دو تاریخ را محاسبه می‌کند و سپس حاصل آن بر ۳۶۵/۲۵ تقسیم می‌شود(۰/۲۵ برای محاسبه سال‌های کبیسه در نظر گرفته شده) تا تعداد سال بدست بیاید.
یک تابع مفید دیگر WEEKDAY= است که به شما می‌گوید تاریخ مورد نظر شما چه روزی از هفته(از ۱:یکشنبه تا ۷:شنبه) است. برای مثال اگر تاریخ تولد یک نفر بیست و یکم آوریل ۱۹۴۸ میلادی باشد با استفاده از این تابع ((WEEKDAY(DATE(1948,4,21= که خروجی آن در این مورد عدد ۴ می‌شود می‌توان فهمید که او در روز چهارشنبه به دنیا آمده‌ است.

جداول محوری(pivot tables)

یکی از هنرهای اکسل قابلیت خلاصه کردن اطلاعات دسته‌بندی شده است. ابزاری که این کار را انجام می‌دهد جدول محوری(Pivot Table) نام دارد که می‌تواند جداول متقاطع تعاملی، داده‌ها را بر اساس دسته‌بندی آنها بسازد. برای ساختن جداول محوری، هر ستون از داده‌ی شما باید عنوان داشته باشد. در حقیقت بهتر است همیشه بلافاصله بعد از اینکه یک ستون جدید ساختید عنوان متعیر را هم به آن اضافه کنید.
ابتدا مطمئن شوید که نشانگر ماوس روی یکی از سلول‌های جدول قرار گرفته باشد. به tool bar بروید و اول روی تب Insert و بعد از آن روی آیکون Pivot Table کلیک کنید. پنجره‌ای شبیه تصویر زیر باز می‌شود:

جدول محوری

روی OK کلیک کنید تا یک صفحه‌ی جدید شبیه تصویر زیر باز شود.

جدول محوری

در داده‌ی مثال ما، اطلاعات ۱۰ استان(Province) در ۲۰ منطقه‌ی(Territory) ایتالیا دیده می‌شود. فرض کنید که می‌خواهیم مجموع تعداد قتل‌ها(murders) در هر منطقه(Territory) را بدست بیاوریم. برای این کار باید فهرستی درست کنیم که در آن مجموع تعداد قتل‌ها کنار هر منطقه نوشته شده باشد. برای ساختن این جدول محوری(pivot table)، با استفاده از ماوس، Territory را از لیست متغیرها بر می‌داریم و آن را در بخش Row Labels(عنوان ردیف‌ها) قرار می‌دهیم. پس از آن متغیر Murders را به بخش Values(متغیرها) منتقل می‌کنیم. حاصل کار این گونه می‌شود:

جدول محوری

اگر ستون Sum of murders(مجموع قتل‌ها) را به صورت نزولی مرتب‌ کنید این نتایج به دست می‌آید:

جدول محوری

امکان ساختن جداول محوری خیلی پیچیده‌تری هم وجود دارد، اما بهتر است برای بدست آوردن پاسخ هر پرسش یک جدول محوری جدید بسازید. تعداد زیادی جدول ساده قابل قهم‌تر از یک جدول خیلی پیچیده است که می‌خواهد جواب چندین سوال را یک جا به شما ارائه بدهد.
دکمه‌ی فلش‌مانند کوچک سیاه روی بخش Values(مقادیر) پنجره‌ای را به نمایش می‌گذارد که به شما اجازه می‌دهد برای خلاصه کردن و نمایش نتایج، انتخاب‌های متنوعی داشته باشید. روی Value Field Settings(تنظیمات بخش مقادیر) کلیک کنید تا پنجره‌ی زیر باز شود.

جدول محوری

چند نکته‌ی دیگر

اکسل به جز فرمت‌های اصلی خودش(xls. یا xlsx.) توانایی خواندن فرمت‌های متنوع دیگری را هم دارد. برای مثال می‌توانید فایل‌های متنی را که در آنها ستون‌های داده به وسیله‌ ویرگول(،)، تب(tab) و سایر کاراکترها از یکدیگر جدا شده‌اند را وارد(import) اکسل کنید، مانند این:

فرمت‌های داده در اکسل

اگر شما یک صفحه‌ی وب پیدا کردید که درون آن اطلاعاتی به شکل جدول(ستون‌ها و ردیف‌ها) وجود داشت، اکسل قادر است آن را در قالب یک صفحه گسترده باز کند. جدول را copy و سپس در اکسل paste کنید، بیشتر وقت‌ها اطلاعات در ستون‌های درست جایگذاری می‌شوند.

پیدا کردن داده

چند سالی است در بسیاری از کشورهای جهان، سازمان‌های دولتی دسترسی عمومی به داده‌های خود را در قالب فایل اکسل و سایر فرمت‌ها امکان‌پذیر کرده‌اند. این حرکت در ایران هم آغاز شده است و به طور مثال شهرداری تهران در وب‌سایت داده‌نمای تهران، اطلاعات آماری مرتبط با پایتخت را به صورت فایل‌های اکسل در اختیار مخاطبان خود قرار داده است.

یک ترفند برای پیدا کردن داده‌های جذاب در سازمان‌های دولتی و وب‌سایت‌های ایرانی، استفاده از گوگل و اضافه کردن عبارت (gov.ir. یا org.ir. یا ir. یا) site:.gov به همراه filetype:xls است.

پیدا کردن داده

 

 

منبع: schoolofdata

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *