علم دادهها ، در حوزههای مختلف علوم و فناوری در خصوص مطالعه ساختار و چگونگی تولید دادههاست. رویکرد پژوهشگران به علم دادهها با این نگرش است که چگونه میتواند علم دادهها به یک منبع ارزشمند در ایجاد استراتژیهای کسبوکار و فناوری اطلاعات تبدیل شود. استخراج مقادیر زیادی داده ساختار یافته [1]و ناساختار[2] برای شناسایی الگوها میتواند به سازمانها و دستگاههای تصمیمگیر کمک کند که هزینهها را مهارکرده، بازده را افزایش داده، فرصتهای بازار جدید را شناسایی نماید و مزیت رقابتی سازمان را افزایش دهد. علم دادهها یکی از علوم بینرشتهای است که از روشهای علمی، فرآیندها، الگوریتمها و سیستمها برای استخراج دانش و بینش از دادهها در اشکال مختلف، ساختار یافته و ناساختاری شبیه به دادهکاوی استفاده میکند. به منظور "درک و تجزیه و تحلیل پدیدههای واقعی" با دادهها، "علم دادهها" یک مفهوم برای متحد کردن آمار، تجزیه و تحلیل دادهها، یادگیری ماشین و روشهای مرتبط با آن است. این روشها و نظریهها از مفاهیم مختلف در زمینه ریاضیات، آمار، علم اطلاعات و علوم رایانه سرچشمه میگیرد تا بتواند در مطالعه دادهها با نگاه جدیدی توسعه یابد.
آمار و استفاده از مدلهای آماری، به شدت در زمینه علم دادهها مورد استفاده قرار میگیرد. علم دادهها با آمار شروع شده و به مفاهیم یا شیوههایی مانند هوش مصنوعی، یادگیری ماشین، و اینترنت اشیاء پرداخته است. با رشد اینترنت، اینترنت اشیاء و رشد چشمگیر حجم دادههای در دسترس برای شرکتها، یک سیل اطلاعات جدید یا دادههای بزرگ به وجود آمد. در دهه گذشته، پژوهشگران علم دادهها به داراییهای مهمی تبدیل شدهاند و تقریبا در تمام سازمانها وجود دارند. این افراد دارای مهارتهای فنی با سطح بالا هستند که قادر به ساخت الگوریتمهای کمّی پیچیده برای سازماندهی و ترکیب مقادیر زیادی از اطلاعات مورد استفاده برای پاسخ به سوالات و هدایت استراتژی در سازمان خود هستند. این مساله همراه با تجربه در ارتباط و رهبری موردنیاز برای ارایه نتایج ملموسی به سهامداران مختلف در یک سازمان و یا کسبوکار، همراه است.
دادهها در همه جا گسترده است. اکوسیستم دادهها بدون آنکه اطلاع داشته باشیم خواسته و یا ناخواسته در اطرافمان ایجاد شده است. انواع اصطلاحات مرتبط با تنظیم، تحلیل و تفسیر دادهها اغلب به جای یکدیگر مورد استفاده قرار میگیرند، اما در واقع میتوانند شامل مجموعههای مهارتی مختلف و پیچیدگی اطلاعات باشند.
جان توکی [3]در سال 1962 در مورد تغییر در دنیای آمار نوشت و گفت: «... همانطور که مشاهده کردم آمار ریاضی در حال تکامل است، من دلیلی برای شگفتی و تعجب داشتم ... من احساس میکردم که علاقه من به مطالعه در دادهها و مصور سازی آن ها است ...» توکی به ادغام آمارها و کامپیوترها اشاره دارد، در زمانی که نتایج آماری در کوچکترین زمان، به جای روزها و یا هفته ها که با دست انجام میشود، در حال ارایه و تفسیر هستند.
با این نگاه شناخت الگوهای مناسب با تفکر توکی هر روز در اطرافمان گسترش مییابد. در این مجال پژوهشگران در ایران نیز به صورت الزام در این اکوسیستم دادهها که توسط ابزار مختلف در اطرافمان ایجاد شده است قرار دارند و نظام مند نمودن این دادهها در این شبکه دادهها بخش عمدهای از مطالعات پژوهشگران را به خود اختصاص داده است.
به همین منظور ارایه سمینار علم دادهها برای هم فکری در این باره امری ضروری و اجتناب ناپذیر است. در این راستا اولین سمینار علم داده ها و کار بردهای آن توسط گروه آمار دانشگاه علامه طباطبایی و با همکاری انجمن آمار ایران و همت و یاری پژوهشگران عزیزی که دردانشگاههای مختلف ایران و خارج از کشور همراهی نمودند شکل گرفته است تا بخش کوچکی از این دریای بیکران علم را مورد نقد و بررسی قرار دهد. امید که نتایج و یافتههای این سمینار بتواند در خدمت علم و فناوری نوین قرار بگیرد
با احترام اسکندری
دبیر سمینار