TÌM HIỂU VỀ THUẬT TOÁN DSSD - DECONVOLUTIONAL SINGLE SHOT DETECTOR

Uniduc JSC - 2020-04-01 13:49:58 | 66 lượt xem

Mục lục

Trong bài viết này, mình sẽ cùng các bạn tìm hiểu về thuật toán DSSD (Deconvolutional Single Shot Detector). Với thành phần Deconvolution, nó có thể cải thiện hơn về độ chính xác so với thuật toán SSD trước đó. 

Kiến trúc mạng DSSD

 

    - Convs màu trắng: Có thể là mạng VGG hoặc mạng Resnet để extract feature

    - Convs màu xanh: Đây chính là phần SSD, trong đó, các fully connected layers cuối cùng của VGG hoặc ResNet sẽ được loại bỏ, thay vào đó là một conv layers.

    - Convs còn lại: Nó bao gồm các deconvolution module và predict module, phần này mình sẽ nói kỹ hơn ở mục tiếp theo

Deconvolution Module

    - Các feature maps tại deconvolution sẽ được upsampled lên bằng Deconv kernel 2x2 và theo sau đó là một lớp conv kernel 3x3, cuối cùng là một lớp Batch nomalization

    - Song song với nó, một feature map tương ứng từ SSD được đưa qua các lớp Conv 3x3 + BN + Relu + Conv 3x3 + BN

    - Cuối cùng, chúng sẽ được nhân lại với nhau (Eltw Product), và theo sau đó là một Relu layer. Kết quả của quá trình trên sẽ được chuyển qua Predict Module

Prediction Module

    - Các prediction module khác nhau sẽ được test

    - Kiến trúc của Predict Module được sử dụng trong thuật toán SSD, nó sẽ predict ra object class và bounding box

    - Trong mỗi Predict Module sẽ là một tập hợp cái lớp Conv 1x1 có tác dụng để tăng chiều lên.

Training

Các giai đoạn training

    - ImageNet pre-train được đào tạo bằng mạng SSD sẽ được sử dụng

    - Ở giai đoạn đầu tiên, chỉ có deconvolution được train

    - Ở giai đoạn tiếp theo, toàn bộ network sẽ được fine-tuned

Data augmentation

    - Bao gồm randomly cropping, flipping, random photometric distortion sẽ được sử dụng để tăng thêm dữ liệu 

    - Sau khi phân tích bằng thuật toán K-means clustering, các hộp có tỷ lệ khung hình 1.6 sẽ được thêm vào, tức là {1.6, 2.0, 3.0} sẽ được sử dụng. 

Kết quả

PASCAL VOC 2007

PASCAL VOC 2012

MS COCO

So sánh kết quả với SSD

Bạn có thể xem các công việc Xử lý ảnh và điều khiển robot tại đây.

Chúc bạn thành đạt trong công việc và hạnh phúc trong cuộc sống!

UNIDUC - Chuyên Robot, Dây Chuyền Sản Xuất Công Nghiệp tự động

  • Địa chỉ: 22 Đường 54, Thảo Điền, Quận 2, TP Hồ Chí Minh, Việt Nam
  • Hotline Tư Vấn Miễn Phí: 089 6688 629 (Mr Đức)
  • Email: [email protected]
  • Website: https://uniduc.com/vi/

Đăng kí nhận tin mới



Đánh giá bài viết

0%

0 Tổng người đánh giá
5
0%
4
0%
3
0%
2
0%
1
0%