Khóa học ngắn hạn: Hình học số chiều cao và ứng dụng trong dữ liệu lớn

Sáng ngày 14/7/2014, tại Hội trường C2, Viện nghiên cứu cao cấp về Toán đã tổ chức khóa học ngắn hạn “Hình học số chiều cao và ứng dụng trong dữ liệu lớn” do GS. Vũ Hà Văn từ Đại học Yale, Mỹ giảng dạy. Đây là hoạt động tiếp theo của nhóm Toán rời rạc do PGS. TS. Phan Thị Hà Dương làm trưởng nhóm diễn ra tại Viện từ tháng 5 tới nay.

Đã có trên 30 người tới tham dự và nghe giảng bài. Theo GS. Vũ Hà Văn thì các cơ sở dữ liệu cực lớn (big data) là tiêu điểm của khoa học trong vòng mười năm gần đây và tiếp tục giữ vai trò này trong nhiều năm tới.

Dữ liệu thường được biểu diễn dưới dạng ma trận (chẳng hạn một bức ảnh 1GB là một ma trận có một tỷ phần tử). Bài toán chính trong xử lý dữ liệu là làm sau có thể tính toán trên những ma trận này và tìm được thông tin cần tìm thật nhanh và chính xác. Vấn đề ở đây là các ma trận không những có kích thước cực lớn mà còn bị nhiễu và nó dẫn tới cả rất nhiều bài toán mới, hữu ích, khó và thú vị.

Trong những bài giảng này, GS. Văn sẽ giới thiệu một số công cụ toán học thường dùng trong phân tích dữ liêu. Các công cụ này là kết quả từ nhiều ngành khác nhau của toán học hiên đại (hình học trong không gian nhiều chiều, ma trận ngẫu nhiên, xác suất, giải tích hàm vv), với mỗi kết quả có một lịch sử phát triển riêng và được tìm ra dưới những mục đích hoàn toàn mang tính lý thuyết. GS cũng sẽ dùng các công cụ này để nghiên cứu một số ứng dụng thực tế, chẳng hạn bài toán tìm các nhóm (communities) trên mạng xã hội, hoặc bổ sung các dữ liệu còn thiếu cho một bảng thống kê.

Với một loạt liên tiếp 10 bài giảng diễn ra từ ngày 14/7 đến 18/7 sẽ phần nào trả lời cho những câu hỏi thường ngày trên các mặt báo là: Ích lợi của toán học hiện đại là thế nào?