Data Science
دیتا ساینس چیست؟
دیتا ساینس یا علم داده عبارت است از بهکارگیری ابزارها، الگوریتمها و اصول مختلف یادگیری ماشین برای کشف الگوهای پنهان در دادههای خام. اما این کار با آنچه که سالهاست متخصصین آمار و تحلیلگران داده انجام میدهند، چه تفاوتی دارد؟ پاسخ این سؤال در تفاوت بین «توضیح» و «پیشبینی» نهفته است.
یک تحلیلگر داده معمولاً با بررسی و مطالعهی تاریخچهی دادهها توضیح میدهد که در حال حاضر وضعیت چگونه است. در صورتی که یک دانشمند داده (Data Scientist) علاوه بر انجام تحلیلهای اکتشافی (Exploratory Analysis) برای کشف اینسایتها، از الگوریتمهای مختلف یادگیری ماشین برای پیشبینی وقوع یک رویداد خاص در آینده استفاده میکند.
علم داده از تحلیلهای پیشبینیکننده (Predictive Analytics) و تجویزی (Prescriptive Analytics) و مدلهای یادگیری ماشین (Machine Learning) برای پیشبینی و تصمیمگیری استفاده میکند. اما هر یک از این اصطلاحات دقیقاً چه معنایی دارند. در ادامه درمورد هر یک از این روشها توضیحاتی خواهیم داد:
تحلیلهای پیشبینیکننده (Predictive Analytics) به شما کمک میکنند تا بتوانید احتمال وقوع یک رویداد خاص را در آینده پیشبینی کنید. بهعنوان مثال اگر شما شرکتی داشته باشید که پولی را بهصورت اعتباری در اختیار مشتریانش قرار میدهد، برای شما مهم است که مطمئن شوید آنها در آینده بازپرداختهای بهموقعی داشته باشند. برای این منظور میتوانید مدلی بسازید که میتواند روی تاریخچهی پرداخت مشتریها تحلیلهای پیشبینیکننده انجام داده و پیشبینی کند که آیا آنها بازپرداخت بهموقعی خواهند داشت یا خیر.