Nhóm tác giả AI Lab trình bày nghiên cứu tại Hội thảo hàng đầu thế giới về Computer Vision

Bài nghiên cứu của nhóm tác giả AI Lab với chủ đề “Class Similarity Weighted Knowledge Distillation for Continual Semantic Segmentation” (tạm dịch: “Tương quan giữa các nhóm đối tượng giúp mô hình phân mảng ảnh hoạt động tốt với dữ liệu mới tăng dần theo thời gian”) vinh dự là một trong những bài nghiên cứu sẽ được trình bày tại Hội nghị về Thị giác Máy tính và Nhận dạng mẫu (CVPR) diễn ra vào tháng 6 tới tại New Orleans, Louisiana.

Hội nghị về Thị giác Máy tính và Nhận dạng mẫu (Conference on Computer Vision and Pattern Recognition –  CVPR) là hội nghị hàng đầu thế giới về Computer Vision, được tổ chức định kỳ hàng năm bởi IEEE Computer Society và Computer Vision Foundation. Đây là nơi các nhà nghiên cứu chia sẻ những công trình nghiên cứu mới nhất về nhận dạng vật thể, phân đoạn ảnh, ước lượng chuyển động, tái tạo vật thể 3D…

Bài báo nghiên cứu do nhóm tác giả Tạ Thế Anh, Trần Thanh Long, Phan Minh Hiếu, Phùng Sơn Lâm thực hiện. Điểm đặc biệt mà công trình của AI Lab đã giải quyết được là xây dựng một phương pháp mới giúp cho việc phân mảng ảnh với data cập nhật thêm có hiệu quả tốt hơn so với các mô hình trước đây.

Cụ thể, các mô hình Deep Learning cho thấy rõ những hạn chế khi chúng được tiếp cận với những lớp mới. Phân đoạn liên tục hình ảnh theo ngữ nghĩa (CSS) là một lĩnh vực mới nổi trong thị giác máy tính. Một vấn đề mà nhóm tác giả nhận thấy trong CSS là sự nhầm lẫn khi phân biệt các lớp cũ và các lớp mới, do chúng đều tương đối giống nhau về mặt trực quan. Để giải quyết vấn đề này, nhóm nghiên cứu đề xuất một framework CSS mới, áp dụng phương thức truyền đạt kiến thức về tương quan giữa các nhóm đối tượng (class similarity weighted knowledge distillation – CSW-KD). CSW-KD sẽ giúp lựa chọn ra những kiến thức của mô hình cũ, trên các lớp cũ – cái mà cũng đồng thời xuất hiện trên mô hình mới.

Những lợi ích mà phương pháp này mang lại gồm sửa đổi có chọn lọc các dữ liệu cũ có khả năng bị bỏ quên và giúp cho việc học tập các lớp mới được tốt hơn nhờ vào việc liên kết chúng với các lớp đã thấy trước đó. Các thử nghiệm rộng trên bộ dữ liệu Pascal-VOC 2012 và ADE20k cho thấy rằng phương pháp này hoạt động hiệu quả hơn các phương pháp hiện đại khác trên các cài đặt CSS tiêu chuẩn lần lượt 7,07% và 8,9%.

Nói về dự định tiếp theo trong việc phát triển dự án, anh Tạ Thế Anh – đại diện nhóm tác giả chia sẻ: “Cả nhóm hi vọng sẽ có thể phát triển các mô hình cho bài toán phân mảng ảnh trên dữ liệu gắn nhãn bị thiếu và hướng tới các trường hợp phù hợp với ứng dụng thực tế hơn”.

Theo AIC

Tags
Show More

Leave a Reply

Your email address will not be published.

Related Articles

Close