Convolutional neural network là gì

Bài này đang reviews về convolutional neural network, sẽ tiến hành cần sử dụng Lúc input của neural network là hình ảnh. Mọi người đề xuất đọc trước bài bác neural network và giải pháp xử lý hình họa trước khi bắt đầu bài bác này.

Bạn đang xem: Convolutional neural network là gì


Thiết lập bài xích toán

Gần trên đây vấn đề kiểm tra mã captphụ thân để xác minh không hẳn robot của google bị bao gồm robot vượt qua


*
Mô hình neural network.

Mỗi hidden layer được Hotline là fully connected layer, tên thường gọi theo như đúng ý nghĩa, mỗi node vào hidden layer được kết nối với tất cả các node vào layer trước. Cả mô hình được điện thoại tư vấn là fully connected neural network (FCN).

Vấn đề của fully connected neural network với giải pháp xử lý ảnh

Nhỏng bài xích trước về xử trí hình ảnh, thì hình họa màu 64*64 được màn trình diễn bên dưới dạng 1 tensor 64*64*3. Nên nhằm bộc lộ hết câu chữ của bức ảnh thì nên cần truyền vào input layer toàn bộ những pixel (64*64*3 = 12288). Nghĩa là đầu vào layer giờ đồng hồ tất cả 12288 nodes.


*

Tuy nhiên hình ảnh màu sắc tất cả tới 3 channels red, green, blue nên những khi trình diễn ảnh bên dưới dạng tensor 3D. Nên ta cũng trở thành định nghĩa kernel là 1 trong tensor 3 chiều size k*k*3.

Xem thêm: Chuyên Mục: Tìm Hiểu Bộ Luật Hàng Hải Việt Nam 2005 /Qh11 Hàng Hải Việt Nam


*
Sau pooling layer (2*2).Source: http://cs231n.github.io/convolutional-networks/

Có 2 loại pooling layer thịnh hành là: max pooling và average pooling.


*
Ví dụ quy mô convolutional neural network. Source: https://www.easy-tensorflow.com/tf-tutorials/convolutional-neural-nets-cnns

Có thể xem chi tiết trong từng layer ở đây.


Mạng VGG 16

VGG16 là mạng convolutional neural network được đề xuất do K. Simonyan và A. Zisserman, University of Oxford. Model sau thời điểm train bởi mạng VGG16 đạt độ đúng đắn 92.7% top-5 chạy thử vào tài liệu ImageNet bao gồm 14 triệu hình hình ảnh nằm trong 1000 lớp không giống nhau. Giờ vận dụng kiến thức ngơi nghỉ trên nhằm so với mạng VGG 16.


Phân tích:

Convolutional layer: kích thước 3*3, padding=1, stride=1. Tại sao ko ghi stride, padding nhưng mà vẫn biết? Vì khoác định đã là stride=1 cùng padding làm cho output thuộc width với height với input đầu vào.Pool/2 : max pooling layer với kích cỡ 2*23*3 conv, 64: thì 64 là số kernel vận dụng trong layer đấy, tuyệt depth của output của layer đấy.Càng các convolutional layer sau thì kích cỡ width, height càng giảm dẫu vậy depth càng tăng.Sau khá nhiều convolutional layer với pooling layer thì tài liệu được flatten và bỏ vào fully connected layer.

Xem thêm: Hiện Nay, Thời Hạn Giải Quyết Thuận Tình Ly Hôn Là Bao Lâu? ?

Bài sau mình đã giới thiệu về keras và giải đáp cần sử dụng keras để áp dụng convolutional neural vào các ứng dụng như dấn diện số viết, dự đoán góc dịch chuyển vào ô tô từ lái.



Search for:

Bài viết ngay sát đây


Mục bài bác viết


Deep Learning cơ phiên bản ©2021. All Rights Reserved. Powered by WordPress.Theme by Phoenix Web Solutions

Chuyên mục: Blogs