سخنرانان اصلی

09:30 - 10:10

Class A: Blockchain Applications in Government and Agriculture

Professor Ahmad Ihsan bin Mohd Yassin
Abstract Blockchain Technology is an online digital tamper-proof and transparent ledger founded based on the principles of cryptography and peer-to-peer networking. The technology has various useful applications, particularly in digital transfer and exchange of value, and failure-proof storage of information. In this talk, we will be discussing the foundations of Blockchain Technology, how it is different from traditional database models. Additionally, potential applications of Blockchain in Finance and Agriculture is discussed.

 

 

10:15 - 10:55

Class A: ‌‌Big Healthcare Data : Survey of Challenges and Privacy

Ts. Dr. Mohd Arfian Bin Ismail
Abstract: The last century witnessed a dramatic leap in the shift towards digitizing the healthcare workflow and moving to e-patients' records. Health information is consistently becoming more diverse and complex, leading to the so-called massive data. Additionally, the demand for big data analytics in healthcare organizations is increasingly growing with the aim of providing a wide range of unprecedented potentials that are considered necessary for the provision of meaningful information about big data and improve the quality of healthcare delivery. It also aims to increase the effectiveness and efficiency of healthcare organizations; provide doctors and care providers better decision-making information and help them in the early detection of diseases. It also assists in evidence-based medicine and helps to minimize healthcare costs. However, a clear contradiction exists between the privacy and security of big data and its widespread usage. In this situation, the focus is on big data with respect to its characteristics, trends, and challenges. Additionally, the risks and benefits associated with data analytics also need to be considered

 

 

11:00 - 11:40

کلاس B: استفاده از الگوریتم‌های یادگیری آماری رده‌بندی و متن کاوی در آمار رسمی

دکتر زهرا رضائی قهرودی

دانشیار دانشکده‌ی ریاضی، آمار و علوم کامپیوتر دانشگاه تهران

چکیده: در سال‌های اخیر شاهد گستردگی، تنوع و سرعت تولید اطلاعات در حوزه‌های مختلف از جمله آمار رسمی هستیم. با توجه به ضرورت مدرن‌سازی نظام آماری کشورها و جایگزینی پردازش محاسباتی ارزا‌ن‌تر، سریعتر و دقیق‌تر رایانه‌ها به جای انسا‌ن‌ها، استفاده از روش‌های یادگیری آماری در فرایند تولید آمار رسمی امری ضروری است. از طرفی پردازش زبان‌های طبیعی و متن‌کاوی، نقش مهمی در پردازش نیمه‌خودکار متون در پرسش‌نامه‌ها دارد. بنا بر این، ضرورت انجام فعالیت‌هایی چون جورسازی داده‌ها، اتصال پایگاه‌ داده‌های مختلف، کدگذاری، شناسایی داده‌های دورافتاده‌ و جانهی با استفاده از روش‌های یادگیری آماری و متن‌کاوی به جای روش‌های سنتی از اهمیت به‌سزایی برخوردار است. در این مقاله ضمن مرور تجربیات کشورهای مختلف در استفاده از روش‌های یادگیری آماری در آمار رسمی، به چند کاربرد از روش‌های یادگیری آماری در آمار رسمی، شامل کدگذاری و اتصال منابع اطلاعاتی مختلف پرداخته می‌شود.

 

 

11:00 - 11:40

کلاس A: نقش داده ها در فناوری های مالی

آقای وحید غفارپور

قائم مقام مدیرعامل شرکت خدمات هوشمند همراه لوتوس (همپا)

چکیده: پس از خلق پول، صنعت مالی و بانک‌داری شاهد تحولات بسیار متنوعی گردید، اما تحولات عصر دیجیتال و فناوری براین صنعت را به جرات می‌توان سریع‌ترین و تاثیرگذارترین تغییرات این صنعت دانست. فناوری مالی یا فین‌تک کلیدواژه‌ای است که به کاربردها و تحولات فناوری در ارائه خدمات مالی اطلاق می شود. حضور استارت‌آپ‌های چابک در صنعت سنتی مالی و بانک‌داری بدون بهره‌برداری از حجم عظیم داده‌های موجود در این صنعت توان رقابت و مقیاس‌پذیری ندارد و لذا بانک‌داری داده محور، یا به عبارت ساده، استفاده از داده‌ها برای ایجاد تغییر در فرایند تولید، ارائه و مدیریت خدمات مالی، چشم‌اندازی نوین به سوی فرصت‌های جدید و سودآور، بسیار فراتر از ماموریت فعلی بانکداری می باشد. بدین منظور با بررسی اجمالی تاریخچه فناوری‌های مالی و بررسی موردهای کاربردی تحلیل داده‌ها در بخش‌های کلیدی صنعت مالی می‌پردازیم که تا پیش از این بدلایل مختلف دوراز دسترس انسان بوده است و در موارد معدودی که وجود داشته امکان بهره برداری بلادرنگ وجود نداشته است. نقش‌آفرینی داده‌ها در صنعت مالی کمک کرده است تا قانون‌گذاری داده‌ها در ابعاد مختلف مانند شاخه‌بندی ذی‌نفعان داده‌ها، اخلاق داده‌ها، مالکیت داده و استحکام داده‌ها مورد توجه ویژه قرارگیرد و در کنار هم مفاهیم جدیدی در قالب بانک‌داری باز ایجاد نمایند.

 

 

14:00 - 14:40

کلاس A: کاربرد شبکه های عصبی برای پیش بینی میزان بارش در ایران و نواحی اطراف آن

دکتر آرزو حبیبی راد

دانشیار گروه آمار دانشگاه فردوسی مشهد

چکیده: داده‌کاوی، به مفهوم استخراج اطلاعات نهان یا دست یابی به الگوها و روابط مشخص در حجم زیادی از داده‌ها در یک یا چند بانک اطلاعاتی بزرگ گفته می‌شود. شبکه های عصبی، سیستم ها و روش های محاسباتی نوینی هستند که برای یادگیری ماشینی، نمایش دانش، و در انتها اعمال دانش به دست آمده در جهت پیش بینی پاسخ های خروجی از سامانه های پیچیده استفاده می شوند. ایده اصلی این گونه شبکه ها تا حدودی الهام گرفته از سیستم عصبی زیستی برای پردازش داده ها به منظور یادگیری و ایجاد دانش می باشد. داده های مورد استفاده در این تحقیق، داده های مرکز هواشناسی (مربوط به میزان بارندگی) است که از دو طریق سازمان هواشناسی و دانلود از سایت های مربوطه جمع آوری و در دسترس قرار گرفته اند . داده ها شامل ستون برچسب یا همان متغیر هدف (میزان بارندگی) و متغیر های مستقل تاریخ، طول و عرض جغرافیایی و دوازده ستون که شامل داده هایی که از مدل های دینامیکی استخراج میشوند می باشد. سپس داده ها جهت استفاده و برازش مدل طی چند مرحله آماده سازی شده و در ادامه پنج مدل شبکه عصبی که مناسب با داده های سری زمانی می باشند به داده ها برازش داده می شوند. در قسمت ارزیابی، مدلی که اکثر معیارهای ارزیابی آن نسبت به سایر مدل ها بهینه باشد جهت پیش بینی میزان بارندگی مورد استفاده قرار می گیرد.

 

 

14:45 - 15:25

Class A: Are sex and drug essential in modeling Primary Biliary Cirrhosis data

دکتر محمد آرشی

دانشیار گروه آمار، دانشگاه فردوسی مشهد

Abstract: We analyze primary clinical Biliary Cirrhosis sequential (PBCseq) data in an R-package from a data science angle in this talk. The problem under focus is when commonly, practitioners register the sex and drug variables; and benefit from the descriptive analysis. The question that arises here is whether we need these critical variables in modeling. By regression modeling, we talk about the pros and cons. We conduct a penalized estimation for the longitudinal data and efficiently select important variables in the multivariate regression modeling. We found drugs and sex can be eliminated from the PBCseq analysis when both serum bilirubin and serum albumin are measured as responses, and over time the disease progresses. This study shows the critical and significant role of statistics in data science for correct decision-making.

 

 

15:30 - 16:10

کلاس A: روش جدید یادگیری ماشین برای بیگ دیتای برخط مالی

دکتر افشین آشفته

مدرس علم داده مالی و بیگ دیتا - دانشگاه نووای لیسبون.

چکیده: بحران های اخیر مانند بحران مالی سال 2007-2008 باعث ایجاد قوانین نظارتی شدیدی شد که لزوم و اهمیت این قوانین با وقایعی مانند همه گیری کروناویروس بیش از گذشته مورد توجه قرار گرفته است. اجرای این قوانین که برای مدیریت بهتر انواع ریسک ایجاد شدند به افشای کافی اطلاعات شرکت های مالی نیاز دارند. اخیراً، با مفاهیم جدیدی مانند بانکداری باز مواجه هستیم که داده های مالی جدید آنلاین و منابع بزرگ داده را برای کنترل انواع مختلف ریسک فراهم می کنند. با این حال ، روش های موجود یادگیری ماشین و هوش مصنوعی برای تشخیص و کنترل ریسک های اعتباری، بازار و عملیاتی به اندازه کافی کارا نیستند. این مسئله مخصوصا در محیط های مالی و اقتصادی نامتعادل و پرریسک بیشتر نمود پیدا می کند. در این سخنرانی، راه حلی بر اساس مباحث یادگیری ماشین، بیگ دیتا و مباحث مدیریت ریسک مالی ارایه می شود که بصورت مقاله در یکی از مجلات علمی حوزه هوش مصنوعی و علوم کامپیوتر با رتبه پنج درصد برتر این حوزه به چاپ رسیده است . کد و برنامه رایانه ای این مقاله نیز که توسط زبان برنامه نویسی پای اسپارک نوشته شده در اختیار علاقه مندان قرار داده شده است . همچنین نسخه ای از این متدولوژی و الگوریتم جدید موفق به اخذ جایزه اول کنفرانس بین المللی تجزیه و تحلیل ریسک در کشور اتریش شد.

 

 

16:15 - 17:00

Class A: Functional Singular Spectrum Analysis

Dr. Mehdi Maadooliat

Department of Mathematical and Statistical Sciences, Marquette University, Wisconsin, USA

Abstract: In this paper, we introduce a new extension of the Singular Spectrum Analysis (SSA) called functional SSA to analyze functional time series. The new methodology is developed by integrating ideas from functional data analysis and univariate SSA. We explore the advantages of the functional SSA in terms of simulation results and two real data applications. We compare the proposed approach with Multivariate SSA (MSSA) and dynamic Functional Principal Component Analysis (dFPCA). The results suggest that further improvement to MSSA is possible, and the new method provides an attractive alternative to the dFPCA approach that is used for analyzing correlated functions. We implement the proposed technique to an application of remote sensing data and a call center dataset. We have also developed an efficient and user-friendly R package and a shiny web application to allow interactive exploration of the results.

 

 

 

08:30 - 09:20

Class A: A Robust High Dimensional Estimation of Multinomial Mixture Models

دکتر فرزاد اسکندری

استاد گروه آمار، دانشکده آمار، ریاضی و رایانه دانشگاه علامه طباطبایی

‎َAbstract: In this paper‎, ‎we are concerned with a robustifying high-dimensional (RHD) structured estimation in finite mixture of multinomial models(FMMM)‎. ‎This method has been used in many applications that often involve outliers and data corruption‎. ‎Thus‎, ‎we introduce a class of the multinomial logistic mixture models(MLMM) for dependent variables having two or more discrete categorical levels‎. ‎Through the optimization with the expectation maximization (EM) algorithm‎, ‎we study two distinct ways to overcome sparsity in FMMM; i.e.‎, ‎in the parameter space‎, ‎or in the output space‎. ‎It is shown that the new method is consistent for RHD structured estimation‎. ‎Finally‎, ‎we will implement the proposed method on real data‎.

 

 

09:30 - 10:10

کلاس A: نحوه استفاده از علم داده در فناوری‌های مالی

دکتر عبدالساده نیسی
چکیده: فناوری مالی ، که معمولا به اختصار فین-تک (Fintech ) نامیده می شود، یکی از حوزه های با رشد سریع در نوآوری و فناوری بوده که مورد علاقه سرمایه گذاران خطرپذیر و بانک ها می باشد. به طور کلی Fintech به مجموعه فناوری هایی اشاره دارد که بر روی روش های جدید ارائه خدمات بانکی و مالی به مصرف کنندگان تمرکز دارند. برای نمونه پی پال (PayPal) که یکی از امن ترین ابزارها برای پرداختهای آنلاین ارزی در اینترنت است هنگام استفاده از آن، شرکت تجارت الکترونیکی و همچنین بانک همه از Fintech برای انجام معامله استفاده می کنند، اما با گذشت زمان، Fintech تقریباً همه جنبه های خدمات مالی از جمله پرداخت ها، سرمایه گذاری ها، منابع مالی مصرف کننده، بیمه، تسویه اوراق بهادار و ارزهای رمزنگاری شده همه تحت تاثیر و دچار تغییرات قرار می گیرند و بایستی به روشهای پیچیده ریاضیات مالی و روشهای عددی تحلیل و تکامل یابند که این امر علاوه بر دانش ریاضیات مالی نیازمند تکنیکهای یادگیری ماشین، علم داده و مدلهای پیش بینی تصادفی می باشد. شرکتهای Fintech ی برای ساده سازی تصمیم گیری های مالی و ارائه راهکارهای برتر به شدت به مدلهای پیشرفته ریاضیات مالی، یادگیری ماشین، هوش مصنوعی، تجزیه و تحلیل داده های مالی، پیش بینی تصادفی و علم داده وابسته هستند. که در این پژوهش درنظر دارم جند نمونه از Fintech ها و چگونگی استفاده از علم داده در هرکدام را به اختصار بیان کنم.

 

 

10:15 - 10:55

Class A: Application of Structural Equation Modelling (SEM) in mHelath Studies

Dr. Hashem Salarzadeh Jenatabadi

Department of Science and Technology Studies, Faculty of Science, Universiti Malaya, Kuala Lumpur; 50603; Malaysia

Abstract mHealth has been identified as a health application and public medical which is to be paired with mobile devices (Chandler et al., 2019). Some literatures in this area concentrated on mHealth apps for health purposes. The potential benefits in precautionary health, containing healthcare and the challenges of using the apps (Bol, Helberger, & Weert, 2018; Furlong, Morris, Serry, & Erickson, 2018). Most statistical analyses of fitness apps interconnect other aspects (e.g. users’ perceptions, health behavior, trajectories of app use, quality assessment, app evaluation, and purpose of downloading the apps) that mostly include descriptive statistics (Bender et al., 2014; Chen, Cade, & Allman-Farinelli, 2015; Payne, Moxley, & MacDonald, 2015; Sama, Eapen, Weinfurt, Shah, & Schulman, 2014) and regression (Goh et al., 2015). Along with prior studies, a few types of research on mHealth apps with Structural Equation Modelling (SEM) technique have been explored (Hoque, Karim, & Amin, 2015; Lee, Han, & Jo, 2017; Mburu, 2017). This study is about some lessons of SEM in mHealth Studies. We introduce a new framework of fitness apps associated with obesity modeling by using SEM and examining data of postpartum women through moderation and mediation analysis. Fitness mHealth apps are considered the moderator in the research framework. Online questionnaires were sent to Malaysian postpartum women within one year after pregnancy and 468 completed questionnaires were returned. The frequency of mHealth fitness app use was categorized into four groups: daily, weekly, rarely and never. Therefore, four models were considered for the final analysis. This study will help data scientists to interpret their modeling with application of SEM.

 

 

11:00 - 11:40

کلاس A: مدل آمیخته متناهی رگرسیون مدال

دکتر احسان ارمز
در این مقاله کلاس جدیدی از مدل رگرسیون آمیخته را ارائه می دهیم، که در آن مد توزیع پاسخ به شرط متغیر توضیحی مدل بندی می شود. در این راستا یک روش تخمین مدال موضعی برای تابع رگرسیون در مدل رگرسیون ناپارامتری ارائه می دهیم. به منظور به دست آوردن بهترین متغیرهای کمکی تأثیر گذار بر متغیر پاسخ تحت شرایطی تابع تاوانیده در مدل پیشنهادی وجود دارد. برای برآورد پارامترهای کلی و توابع رگرسیون مدال، یک الگوریتم EM پیشنهاد می دهیم، در ادامه خواص مجانبی برآوردگرها را در قالب ٢ قضیه مطرح می کنیم.