علم داده­ها ،  در حوزه­های مختلف علوم و فناوری در خصوص مطالعه ساختار و چگونگی تولید داده­هاست.  رویکرد پژوهشگران به علم داده­ها با این نگرش است که چگونه می‌تواند علم داده­ها به یک منبع ارزشمند در ایجاد استراتژی‌های کسب‌وکار و فناوری اطلاعات تبدیل شود. استخراج مقادیر زیادی داده ساختار یافته [1]و ناساختار[2] برای شناسایی الگوها می‌تواند به سازمان­ها و دستگاه­های تصمیم­گیر کمک کند که  هزینه‌ها را مهارکرده، بازده را افزایش داده، فرصت‌های بازار جدید را شناسایی نماید و مزیت رقابتی سازمان را افزایش دهد. علم داده­ها یکی از علوم بین­رشته­ای است که از روش­های علمی، فرآیندها، الگوریتم­ها و سیستم­ها برای استخراج دانش و بینش از داده­ها در اشکال مختلف، ساختار یافته و ناساختاری شبیه به داده­کاوی استفاده می­کند. به منظور "درک و تجزیه و تحلیل پدیده­های واقعی" با داده­ها، "علم داده­ها" یک مفهوم برای متحد کردن آمار، تجزیه و تحلیل داده­ها، یادگیری ماشین و روش­های مرتبط با آن است. این روش­ها و نظریه­ها از مفاهیم مختلف در زمینه ریاضیات، آمار، علم اطلاعات و علوم رایانه سرچشمه میگیرد تا بتواند در مطالعه داده­ها با نگاه جدیدی توسعه یابد.

آمار و استفاده از مدل­های آماری، به شدت در زمینه علم داده­ها مورد استفاده قرار می­گیرد. علم داده­ها با آمار شروع شده و به مفاهیم یا شیوه­هایی مانند هوش مصنوعی، یادگیری ماشین، و اینترنت اشیاء پرداخته است. با رشد اینترنت، اینترنت اشیاء و رشد چشم­گیر حجم داده­های در دسترس برای شرکت­ها، یک سیل اطلاعات جدید یا داده­های بزرگ به وجود آمد. در دهه گذشته، پژوهشگران علم داده­ها  به دارایی­های مهمی تبدیل شده‌اند و تقریبا در تمام سازمان‌ها وجود دارند. این افراد دارای مهارت‌های فنی با سطح بالا هستند که قادر به ساخت الگوریتم­های کمّی پیچیده برای سازماندهی و ترکیب مقادیر زیادی از اطلاعات مورد استفاده برای پاسخ به سوالات و هدایت استراتژی در سازمان خود هستند. این مساله همراه با تجربه در ارتباط و رهبری موردنیاز برای ارایه نتایج ملموسی به سهامداران مختلف در یک سازمان و یا کسب‌وکار، همراه است.

داده‌ها در همه جا گسترده است. اکوسیستم داده­ها بدون آنکه اطلاع داشته باشیم خواسته و یا ناخواسته در اطرافمان ایجاد شده است. انواع اصطلاحات مرتبط با  تنظیم، تحلیل و تفسیر داده‌ها اغلب به جای یکدیگر مورد استفاده قرار می‌گیرند، اما در واقع می‌توانند شامل مجموعه‌های مهارتی مختلف و پیچیدگی اطلاعات باشند.

جان توکی [3]در سال 1962 در مورد تغییر در دنیای آمار نوشت و گفت: «... همانطور که مشاهده کردم آمار ریاضی در حال تکامل است، من دلیلی برای شگفتی و تعجب داشتم ... من احساس می­کردم که علاقه من به مطالعه در داده­ها و مصور سازی آن ها است ...» توکی به ادغام آمارها و کامپیوترها اشاره دارد، در زمانی که نتایج آماری در کوچکترین زمان، به جای روزها و یا  هفته ها که با دست انجام می‌شود، در حال ارایه و تفسیر هستند. 

با این نگاه  شناخت الگوهای مناسب با تفکر توکی هر روز در اطرافمان  گسترش می­یابد. در این مجال پژوهشگران   در ایران نیز  به صورت الزام در این اکوسیستم داده­ها که توسط ابزار مختلف در اطرافمان ایجاد شده است قرار دارند و نظام مند نمودن این داده­ها در این شبکه داده­ها  بخش عمده­ای از مطالعات پژوهشگران را به خود اختصاص داده است.

به همین منظور ارایه سمینار علم داده­ها برای هم فکری در این باره امری ضروری و اجتناب ناپذیر است. در این راستا اولین سمینار علم داده ها و کار بردهای آن توسط گروه آمار دانشگاه علامه طباطبایی و با همکاری انجمن آمار ایران و همت و یاری پژوهشگران عزیزی که دردانشگاه­های مختلف ایران و خارج از کشور همراهی نمودند شکل گرفته است تا بخش کوچکی از این دریای بیکران علم را مورد نقد و بررسی قرار دهد. امید که نتایج و یافته­های این سمینار بتواند در خدمت علم و فناوری نوین قرار بگیرد

 

با احترام اسکندری

 

دبیر سمینار

  

 

 



[1] structured

[2] unstructured

[3] John Tukey