HOG là viết tắt của Histogram of Oriented Gradient - một một số loại “feature descriptor”. Mục đích của “featura descriptor” là trừu tượng hóa đối tượng người dùng bằng phương pháp trích xuất ra hồ hết đặc thù của đối tượng người sử dụng đó với bỏ đi đầy đủ thông tin không bổ ích. Vì vậy, HOG được thực hiện đa phần để biểu hiện kiểu dáng với sự mở ra của một đối tượng người tiêu dùng vào hình họa.

Bạn đang xem: Histogram of oriented gradients là gì

*

Bản hóa học của phương thức HOG là áp dụng lên tiếng về sự phân bổ của những độ mạnh gradient (intensity gradient) hoặc của phía biên (edge directins) nhằm bộc lộ các đối tượng người tiêu dùng tổng thể vào hình họa. Các tân oán tử HOG được thiết lập bằng phương pháp chia nhỏ một bức ảnh thành những vùng nhỏ, được Điện thoại tư vấn là “tế bào” (cells) cùng với mỗi cell, ta và tính tân oán một histogram về các hướng của gradients cho những điểm nằm trong cell. Ghxay những histogram lại với nhau ta sẽ có một màn biểu diễn đến bức ảnh ban đầu. Để tăng tốc hiệu năng nhận dạng, những histogram toàn thể rất có thể được chuẩn hóa về độ tương phản nghịch bằng phương pháp tính một ngưỡng cường độ trong một vùng to hơn cell, Gọi là các khối (blocks) cùng thực hiện cực hiếm ngưỡng đó nhằm chuẩn hóa tất cả những cell trong khối hận. Kết trái sau bước chuẩn hóa đã là một trong những vector đặc trưng có tính không thay đổi cao hơn đối với những biến hóa về điều kiện ánh sáng.

Có 5 bước cơ bản để xây đắp một vector HOG mang đến hình ảnh, bao gồm:

Tiền xử lýTính gradientTính vector đặc thù mang đến từng ô (cells)Chuẩn hóa kăn năn (blocks)Tính tân oán vector HOG

1. Tiền xử lý

Trong bài xích toán này, để dễ dãi mang lại vấn đề phân tách đa số hình hình họa thành các khối hận, ô với tính toán thù đặc thù ở quá trình tiếp theo, bọn họ nên reform size form size toàn bộ các hình ảnh trong tập dữ liệu về một size thông thường.

*

Trong các ví dụ được trình bày trong bài viết này, form size bình thường cho một hình ảnh đang khoác định là 64x128

2. Tính Gradient

Đây là bước thứ nhất, được triển khai bởi nhì phnghiền nhân chập hình họa nơi bắt đầu với 2 chiều, tương xứng với các tân oán tử rước đạo hàm theo hai hướng Ox cùng Oy. Trong đó, 2 phía tương xứng đó là:

*

T là phxay toán chuyển vị ma trận.

Nghe có vẻ khó khăn phát âm nhỉ, coi hình hình họa tiếp sau đây để sở hữu tầm nhìn trực quan tiền hơn nhé.

*

Và nếu bạn bao gồm một hình ảnh input là I, ta sẽ có 2 hình họa đạo hàm riêng rẽ theo 2 hướng kia, theo công thức:

*

lúc kia, bạn cũng có thể tính được Gradient bao hàm nhị nhân tố cường độ(Gradient Magnitude) cùng hướng(Gradient Derection) theo công thức (*):

*

Ví dụ: Giả sử ta có một điểm ảnh nhỏng sau

*

Chúng ta đã áp dụng các phương pháp bên trên để tính được gradient của điểm hình ảnh này:

*

Đối với hình hình họa color, gradient của ba kênh(red, green cùng blue) được reviews. Độ lớn của gradient trên một điểm hình họa là quý giá lớn số 1 của độ mạnh gradient của ba kênh, và góc là góc tương ứng cùng với gradient tối đa.

Xem thêm: Tải Driver Booster Pro 8 - Iobit Driver Booster Sinhvienit

Sau công đoạn này, kết quả chiếm được đang là:

*

3. Tính vector đặc thù đến từng ô (cells)

Để tính tân oán vector đặc trưng mang đến từng ô (cell), họ đề nghị phân chia hình ảnh thành các bloông xã, mỗi blochồng lại phân tách đa số thành các cell. Để khẳng định được số bloông xã, bọn họ đang áp dụng phương pháp sau:

*

Các blochồng rất có thể xếp ông chồng lên nhau nlỗi hình:

*

Sau khi xác minh số bloông xã cùng size từng block, cell, nhằm tính toán vector đặc trưng đến từng cell, chúng ta cần:Chia không khí phía thành p bin(số chiều vector đặc trưng của ô).Rời rạc hóa góc phía nghiêng trên mỗi điểm hình ảnh vào trong các bin.

Giả sử góc phía nghiêng tại px ở trong phần (x,y) có độ lớn là alpha(x,y)

Trường thích hợp rời rạc hóa unsigned-HOG với p=9:

*

Trường phù hợp tách rộc rạc hóa signed-HOG với p=18:

*

Giá trị bin được định lượng bởi tổng cường độ vươn lên là thiên của những pixels trực thuộc về bin kia.Sau khi tính tân oán đặc trưng ô, ta vẫn nối những vector đặc thù ô để chiếm được vector đặc trưng kân hận. Số chiều vector đặc thù khối hận tính theo cách làm :

*

Ví dụ: Trong ngôi trường hòa hợp này, hình hình ảnh của chúng ta tất cả kích cỡ là 64x128, ta vẫn phân tách mỗi hình hình họa thành các bloông xã bao gồm size 16x16. Mỗi bloông chồng đã bao hàm 4 cell, từng cell có size là 8x8.

*

Tiếp theo, triển khai tính toán thù đặc thù HOG tại từng cell sử dụng không gian hướng 9 bin, trường phù hợp “unsigned-HOG”. Hướng gradient đã chạy trong khoảng 0 độ đến 180 độ, mức độ vừa phải 20 độ mỗi bin.

Tại từng cell, sản xuất một biểu đồ dùng độ mạnh gradient bằng cách vote các px vào biểu vật. Trọng số vote của mỗi pixel dựa vào hướng cùng cường độ gradient (được xem toán thù tự bước 2) của px đó. Ví dụ:

*

*

Như vào hình hình ảnh bên trên, đầu tiên là pixel gồm bao quanh màu xanh da trời lam. Nó được bố trí theo hướng 80 độ và độ mạnh là 2, bởi vậy ta thêm 2 vào bin vật dụng 5 (hướng 80 độ). Tiếp theo là pixel gồm bảo phủ màu đỏ. Nó được bố trí theo hướng 10 độ cùng cường độ 4. Vì không có bin 10 độ, yêu cầu ta vote mang lại bin 0 độ và đôi mươi độ, mỗi bin thêm 2 đơn vị chức năng.Sau khi vote hết những px trong một cell form size 8x8 vào 9 bin, ta rất có thể chiếm được hiệu quả nhỏng sau:

*

4. Chuẩn hóa kân hận (blocks)

Để tăng tốc hiệu năng thừa nhận dạng, các histogram toàn cục sẽ được chuẩn hóa về độ tương phản bằng phương pháp tính một ngưỡng cường độ trong một khối hận cùng sử dụng quý giá kia để chuẩn hóa toàn bộ các ô vào kăn năn. Kết trái sau bước chuẩn chỉnh hóa đang là một trong những vector đặc trưng bao gồm tính không bao giờ thay đổi cao hơn so với các biến đổi về điều kiện ánh nắng.

Trước hết, hãy chú ý ảnh hưởng của Việc chuẩn chỉnh hóa tới những vector gradient vào ví dụ sau:

*

Trong hình hình họa bên trên, ngôi trường thích hợp thứ nhất là 1 trong những ô của hình hình họa ban sơ. Trường hợp thứ hai, tất cả những giá trị pixel đã làm được tạo thêm 50. Trong trường thích hợp sản phẩm công nghệ tía, toàn bộ các quý hiếm pixel được nhân với một.5.Dễ dàng thấy được, ngôi trường đúng theo máy cha hiển thị độ tương phản ngày càng tăng. Hình ảnh hưởng của phnghiền nhân là có tác dụng những điểm hình ảnh sáng sủa trsống phải sáng sủa hơn những, trong lúc các điểm hình ảnh về tối chỉ sáng sủa hơn một ít, cho nên vì vậy làm tăng cường mức độ tương phản bội thân các phần sáng cùng tối của hình hình ảnh.

Hãy quan sát vào các quý giá px thực tiễn cùng sự biến hóa của vector gradient của tía trường đúng theo bên trên trong hình ảnh sau:

*

Các con số trong số ô là quý giá pixel của những điểm hình họa cạnh bên điểm hình ảnh được lưu lại màu đỏ.Delta F là đạo hàm theo riêng nhì vị trí hướng của điểm hình ảnh ()| Delta F| là cực hiếm cường độ điểm hình ảnh (Gradient Magnitude), tính theo bí quyết (*)

Trong ngôi trường hòa hợp một với nhì, quý giá cường độ vector gradient của bọn chúng tương tự nhau, mà lại vào ngôi trường hợp thiết bị tía, cường độ vector gradient đang tăng thêm 1.5 lần. Nếu phân tách tía vector bởi độ Khủng tương xứng, ta sẽ nhận thấy những tác dụng tương đương cho cả ba trưởng phù hợp. Vì vậy, vào ví dụ bên trên, bọn họ thấy rằng bằng phương pháp phân tách những vector gradient theo độ mập của bọn chúng, bạn cũng có thể thay đổi chúng thành không bao giờ thay đổi nhằm thay đổi độ trương bội nghịch.

Có nhiều phương pháp hoàn toàn có thể được dùng làm chuẩn chỉnh hóa khối hận. Gọi v là vector cần chuẩn chỉnh hóa chứa tất cả các histogram của mội kân hận.‖v(k)‖ là giá trị chuẩn chỉnh hóa của v theo các chuẩn k=1, 3 và e là một trong những hằng số bé dại. Khi đó, những quý giá chuẩn hóa có thể tính bởi một trong số những bí quyết sau:

*

Ghnghiền những vector đặc trưng kân hận vẫn chiếm được vector đặc trưng R-HOG mang lại hình ảnh. Số chiều vector đặc thù ảnh tính theo bí quyết :

*

5. Tính tân oán vector đặc thù HOG

*

Với từng hình hình ảnh form size 64x128, tạo thành những block 16x16 ông xã nhau, sẽ có 7 bloông xã ngang cùng 15 bloông xã dọc, cần sẽ sở hữu 7x15 = 105 blocks.Mỗi bloông xã có 4 cell. lúc vận dụng biểu đồ gia dụng 9-bin cho mỗi cell, mỗi blochồng sẽ tiến hành thay mặt vị một vector tất cả kích cỡ 36x1.Vì vậy, Lúc nối toàn bộ các vector trong một blochồng lại cùng nhau, ta vẫn nhận được vector đặc trưng HOG của ảnh gồm size 105x36x1 = 3780x1.Link tài liệu tmê say khảo:

Histogram of Oriented Gradients

Bài viết liên quan

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *