Nhóm tác giả AI Lab trình bày nghiên cứu tại Hội thảo hàng đầu thế giới về Computer Vision

Anh Le Minh 31/03/2022

Bài nghiên cứu của nhóm tác giả AI Lab với chủ đề “Class Similarity Weighted Knowledge Distillation for Continual Semantic Segmentation” (tạm dịch: “Tương quan giữa các nhóm đối tượng giúp mô hình phân mảng ảnh hoạt động tốt với dữ liệu mới tăng dần theo thời gian”) vinh dự là một trong những bài nghiên cứu sẽ được trình bày tại Hội nghị về Thị giác Máy tính và Nhận dạng mẫu (CVPR) diễn ra vào tháng 6 tới tại New Orleans, Louisiana.

Hội nghị về Thị giác Máy tính và Nhận dạng mẫu (Conference on Computer Vision and Pattern Recognition – CVPR) là hội nghị hàng đầu thế giới về Computer Vision, được tổ chức định kỳ hàng năm bởi IEEE Computer Society và Computer Vision Foundation. Đây là nơi các nhà nghiên cứu chia sẻ những công trình nghiên cứu mới nhất về nhận dạng vật thể, phân đoạn ảnh, ước lượng chuyển động, tái tạo vật thể 3D…

Bài báo nghiên cứu do nhóm tác giả Tạ Thế Anh, Trần Thanh Long, Phan Minh Hiếu, Phùng Sơn Lâm thực hiện. Điểm đặc biệt mà công trình của AI Lab đã giải quyết được là xây dựng một phương pháp mới giúp cho việc phân mảng ảnh với data cập nhật thêm có hiệu quả tốt hơn so với các mô hình trước đây.

Cụ thể, các mô hình Deep Learning cho thấy rõ những hạn chế khi chúng được tiếp cận với những lớp mới. Phân đoạn liên tục hình ảnh theo ngữ nghĩa (CSS) là một lĩnh vực mới nổi trong thị giác máy tính. Một vấn đề mà nhóm tác giả nhận thấy trong CSS là sự nhầm lẫn khi phân biệt các lớp cũ và các lớp mới, do chúng đều tương đối giống nhau về mặt trực quan. Để giải quyết vấn đề này, nhóm nghiên cứu đề xuất một framework CSS mới, áp dụng phương thức truyền đạt kiến thức về tương quan giữa các nhóm đối tượng (class similarity weighted knowledge distillation – CSW-KD). CSW-KD sẽ giúp lựa chọn ra những kiến thức của mô hình cũ, trên các lớp cũ – cái mà cũng đồng thời xuất hiện trên mô hình mới.

Những lợi ích mà phương pháp này mang lại gồm sửa đổi có chọn lọc các dữ liệu cũ có khả năng bị bỏ quên và giúp cho việc học tập các lớp mới được tốt hơn nhờ vào việc liên kết chúng với các lớp đã thấy trước đó. Các thử nghiệm rộng trên bộ dữ liệu Pascal-VOC 2012 và ADE20k cho thấy rằng phương pháp này hoạt động hiệu quả hơn các phương pháp hiện đại khác trên các cài đặt CSS tiêu chuẩn lần lượt 7,07% và 8,9%.

Nói về dự định tiếp theo trong việc phát triển dự án, anh Tạ Thế Anh – đại diện nhóm tác giả chia sẻ: “Cả nhóm hi vọng sẽ có thể phát triển các mô hình cho bài toán phân mảng ảnh trên dữ liệu gắn nhãn bị thiếu và hướng tới các trường hợp phù hợp với ứng dụng thực tế hơn”.

Theo AIC

Nhóm tác giả AI Lab trình bày nghiên cứu tại Hội thảo hàng đầu thế giới về Computer Vision

Leave a Reply Cancel reply

Check Also

Công nghệ

AI in ACTION: Hai hoạt động nổi bật trong tuần này dành cho cộng đồng AI4PM

JOIN US

FPT Japan trở thành Microsoft Managed Partner, mở rộng vị thế tại thị trường chiến lược Nhật Bản

FPT Software đón đoàn cán bộ và cố vấn Hoa Kỳ, tăng cường hợp tác và kết nối quốc tế

FPT và VCBS khởi động dự án xây dựng nền tảng dữ liệu tích hợp AI

AI in ACTION: Hai hoạt động nổi bật trong tuần này dành cho cộng đồng AI4PM

Tăng tốc hành trình AI Transformation cùng Microsoft 365 Copilot

Từ câu chuyện “chỉ tiêu” đào tạo đến áp lực bão hòa kiến thức

Trò chuyện về Axie Infinity trong 'Cờ dẫn lối' số mới nhất cùng anh Nguyễn Thành Lâm

Chàng SE trẻ với hành trình mới tại Nhật

Leave a Reply Cancel reply

Related Articles

Check Also

Công nghệ

JOIN US

Log In