Phân đoạn ngữ nghĩa ảnh với mạng nơ-ron nhân chập

Thời gian: 14:30 đến 17:00 Ngày 30/11/2019

Địa điểm: C2-714, VIASM

Báo cáo viên: Nguyễn Đức Dũng

Tóm tắt:
Phân đoạn ngữ nghĩa (semantics segmentation) là bài toán gán nhãn đối tượng cho từng điểm ảnh và từ đó có thể phân biệt chính xác ảnh của đối tượng cần quan tâm so với ảnh của các đối tượng khác hoặc ảnh nền. Trong bài trình bày này, hai mô hình mã-giải mã (encoder-deconder) và mô hình cửa sổ trượt (sliding-window)sử dụng mạng nơ-ron tích chập (CNN) được trình bày và trao đổi. Một số ví dụ về mạng U-Net, mạng Mask R-CNN được dùng để minh họa.
Bio: Tiến sĩ Nguyễn Đức Dũng tốt nghiệp ngành Khoa học Tri thức từ Viện Khoa học và Công nghệ tiên tiến Nhật Bản năm 2006. Ông làm việc tại Viện Công nghệ thông tin, Viện Hàn lâm Khoa học và Công nghệ Việt Nam từ năm 1994, sau khi tốt nghiệp ngành Toán ở bậc đại học. Từ năm 2007 đến năm 2009, ông làm việc tại Công ty nghiên cứu và phát triển KDDI Labs, Nhật Bản. Ông là tác giả và đồng tác giả của 2 bằng sáng chế được đăng ký tại Mỹ và trên 50 bài báo được đăng tại những hội nghị và tạp chí khoa học chuyên ngành, trong đó có những hội nghị và tạp chí hàng đầu thế giới như ICML, KDD, IEEE Trans. on Neural Networks. Ông được tặng thưởng Huy chương Tuổi trẻ sáng tạo năm 1998 cho thành tích phát triển phần mềm chữ Việt in đầu tiên tại Việt Nam (VnDOCR) và giải thưởng Thành tựu trong hỗ trợ kỹ thuật tại công ty KDDI Labs năm 2008. Những lĩnh vực nghiên cứu chính của ông bao gồm học máy, nhận dạng mẫu và khai phá tri thức từ dữ liệu.