Seminar Thống kê Ứng dụng T9.2021
Thời gian: 14:00 đến 17:00 ngày 01/09/2021, 14:00 đến 17:00 ngày 08/09/2021, 14:00 đến 17:00 ngày 15/09/2021, 14:00 đến 17:00 ngày 22/09/2021,
Địa điểm: Online
Seminar Thống kê Ứng dụng
Thời gian: 14:00 Chiều thứ 4 hằng tuần
Website: https://sites.google.com/view/tkud/home
Thời gian |
Giảng viên |
Tên bài giảng |
1/9/21 |
TS. Hoàng Văn Hà ĐHKHTN TP Hồ Chí Minh |
Xử lý dữ liệu khuyết với phân tích thành phần chính |
8/9/21 |
TS. Hoàng Văn Hà ĐHKHTN TP Hồ Chí Minh |
Xử lý dữ liệu khuyết với phân tích thành phần chính |
15/9/21 |
Nguyễn Thị Nhung Đại học Thăng Long TS. Trịnh Thị Hường Trường ĐH Thương Mại |
Xử lý số liệu thô với R: Bộ số liệu Điều tra mức sống dân cư 2016 |
22/9/21 |
ThS. Nguyễn Thanh Nga Học viện Ngân Hàng |
Mô hình hồi quy bội |
29/9/21 |
TS. Hoàng Văn Hà ĐHKHTN TP Hồ Chí Minh |
Introduction to Causal Inference and its applications |
------------------------------
Hoàng Văn Hà - hvha@hcmus.edu.vn
Khoa Toán-Tin học, Đại học Khoa học Tự nhiên, ĐHQG TP. HCM
Dữ liệu khuyết xuất hiện trong hầu hết các bài toán về phân tích và xử lý số liệu thống kê, và xảy ra trong nhiều lĩnh vực. Dữ liệu khuyết nếu không được xử lý một cách đúng đắn, sẽ cho kết quả sai lệch và dẫn tới những suy diễn không chính xác về dữ liệu. Trong bài nói này, chúng tôi trước tiên sẽ trình bày các nguyên nhân và những cơ chế gây ra sự khuyết dữ liệu. Tiếp theo, chúng tôi sẽ giới thiệu một vài phương pháp xử lý dữ liệu khuyết, trong đó sẽ đi sâu khảo sát về phương pháp phân tích thành phần chính (PCA).
Missing data occurs in almost all statistical analysis and arise in all application domains. If the missing values are not handled properly, this can produce biased estimates and lead to inaccurate inference about the data. In this talk, we first study problem caused missing data and the mechanisms of missingness. Then we consider several imputation techniques. Finally, we focus on the Principal Component Analysis (PCA) to handling the missing values.
------------------------------
Nguyễn Thị Nhung - nhungnt@thanglong.edu.vn
Đại học Thăng Long
Trịnh Thị Hường - Trinhthihuong@tmu.edu.vn
Trường ĐH Thương Mại
Trong quá trình tiến hành một nghiên cứu khoa học thực nghiệm, xử lý số liệu thô là một bước bắt buộc và quan trọng. Quá trình xử lý thô số liệu sẽ xử lý các “lỗi” trong quá trình thu thập số liệu, tổng hợp câu trả lời thành các biến để phục vụ câu hỏi nghiên cứu. Đồng thời, quá trình này cũng bao gồm quá trình ghép nối số liệu từ các nguồn khác nhau. Chúng tôi minh họa quá trình xử lý thô trong chủ đề nghiên cứu “Yếu tố ảnh hưởng đến chi tiêu cho giáo dục ” tại Việt Nam, trên bộ số liệu Điều tra mức sống dân cư 2016. Phần mềm R được sử dụng để tiến hành các bước xử lý thô để chuẩn bị cho quá trình tiến hành nghiên cứu. Một số thống kê mô tả từ bộ số liệu sạch cũng được minh họa.
------------------------------
ThS. Nguyễn Thanh Nga - ngant@hvnh.edu.vn
Học viện Ngân Hàng
Mô hình hồi qui bội (Multiple Linear Regresstion model– MLR) là mô hình mở rộng của mô hình tuyến tính đơn biến (Simple Linear Regresstion model) nhằm mục đích mô tả mối quan hệ tuyến tính giữa một biến phụ thuộc (Y) và nhiều biến độc lập (). Báo cáo trình bày tóm lược về mô hình hồi qui bội, các nội dung liên quan và thực hành trên R.
------------------------------
TS. Hoàng Văn Hà - hvha@hcmus.edu.vn
Khoa Toán-Tin học, Đại học Khoa học Tự nhiên, ĐHQG TP. HCM
Causal inference has attracted a lot of attention in the literature of statistics for years. It has a wide range of applications in medicine, economy, social science, image processing, AI, etc. In this talk, we first present a brief introduction about causal inference via the approach using Directed Acyclic Graphs (DAGs). Then we discuss about several recent applications of Causal Inference.