Seminar Thống kê Ứng dụng T9.2021

Time:

Venue/Location: Online

Seminar Thống kê Ứng dụng

Thời gian: 14:00 Chiều thứ 4 hằng tuần

Link zoom: https://latrobe.zoom.us/j/7612382472

Website: https://sites.google.com/view/tkud/home

Thời gian

Giảng viên

Tên bài giảng

1/9/21

TS. Hoàng Văn Hà

ĐHKHTN TP Hồ Chí Minh

Xử lý dữ liệu khuyết với phân tích thành phần chính

8/9/21

TS. Hoàng Văn Hà

ĐHKHTN TP Hồ Chí Minh

Xử lý dữ liệu khuyết với phân tích thành phần chính

15/9/21

Nguyễn Thị Nhung

Đại học Thăng Long

TS. Trịnh Thị Hường

Trường ĐH Thương Mại

Xử lý số liệu thô với R: Bộ số liệu Điều tra mức sống dân cư 2016

22/9/21

ThS. Nguyễn Thanh Nga

Học viện Ngân Hàng

Mô hình hồi quy bội

29/9/21

TS. Nguyễn Mạnh Thế

Trường Đại học kinh tế quốc dân

Mô hình tuyến tính suy rộng (Generalized linear models) và ứng dụng

------------------------------

Hoàng Văn Hà - hvha@hcmus.edu.vn

Khoa Toán-Tin học, Đại học Khoa học Tự nhiên, ĐHQG TP. HCM 

Dữ liệu khuyết xuất hiện trong hầu hết các bài toán về phân tích và xử lý số liệu thống kê, và xảy ra trong nhiều lĩnh vực. Dữ liệu khuyết nếu không được xử lý một cách đúng đắn, sẽ cho kết quả sai lệch và dẫn tới những suy diễn không chính xác về dữ liệu. Trong bài nói này, chúng tôi trước tiên sẽ trình bày các nguyên nhân và những cơ chế gây ra sự khuyết dữ liệu. Tiếp theo, chúng tôi sẽ giới thiệu một vài phương pháp xử lý dữ liệu khuyết, trong đó sẽ đi sâu khảo sát  về phương pháp phân tích thành phần chính (PCA). 

Missing data occurs in almost all statistical analysis and arise in all application domains. If the missing values are not handled properly, this can produce biased estimates and lead to inaccurate inference about the data. In this talk, we first study problem caused missing data and the mechanisms of missingness. Then we consider several imputation techniques. Finally, we focus on the Principal Component Analysis (PCA) to handling the missing values.

 ------------------------------

Nguyễn Thị Nhung - nhungnt@thanglong.edu.vn

Đại học Thăng Long

Trịnh Thị Hường - Trinhthihuong@tmu.edu.vn

Trường ĐH Thương Mại

Trong quá trình tiến hành một nghiên cứu khoa học thực nghiệm, xử lý số liệu thô là một bước bắt buộc và quan trọng. Quá trình xử lý thô số liệu sẽ xử lý các “lỗi” trong quá trình thu thập số liệu, tổng hợp câu trả lời thành các biến để phục vụ câu hỏi nghiên cứu. Đồng thời, quá trình này cũng bao gồm quá trình ghép nối số liệu từ các nguồn khác nhau. Chúng tôi minh họa quá trình xử lý thô trong chủ đề nghiên cứu “Yếu tố ảnh hưởng đến chi tiêu cho giáo dục ” tại Việt Nam, trên bộ số liệu Điều tra mức sống dân cư 2016. Phần mềm R được sử dụng để tiến hành các bước xử lý thô để chuẩn bị cho quá trình tiến hành nghiên cứu. Một số thống kê mô tả từ bộ số liệu sạch cũng được minh họa.

------------------------------ 

ThS. Nguyễn Thanh Nga - ngant@hvnh.edu.vn

Học viện Ngân Hàng

Mô hình hồi qui bội (Multiple Linear Regresstion model– MLR) là mô hình mở rộng của mô hình tuyến tính đơn biến (Simple Linear Regresstion model) nhằm mục đích mô tả mối quan hệ tuyến tính giữa một biến phụ thuộc (Y) và nhiều biến độc lập (). Báo cáo trình bày tóm lược về mô hình hồi qui bội, các nội dung liên quan và thực hành trên R.