Back

什麼是AI CNN卷積神經網路呢? 這是個影像辨識的好幫手?!

深度學習的CNN影像辨識原理:

一般的神經網路由三個部分組成,分別是輸入層(Input Layers)、隱藏層(Hidden Layers)以及輸出層 (Output Layers)。

下面開始做解釋  以BMI計算為例

輸入層

輸入層顧名思義就是將資料輸入(Data)的特徵值 (Features),例如,今天要預測一個人是否有過重或是過輕的問題,我們有的資料會是這個人的身高、體重,而「身高、體重」就是你要放入輸入層的特徵值。

隱藏層

隱藏層也就是在做運算的工作,由神經元所組成,計算出我們的輸出值。

在BMI計算的例子中,隱藏曾就是 BMI = 體重(公斤) / 身高2(公尺2)

輸出層

而輸出層則是透過輸入特徵,經過隱藏層的運算所得到的數值,經過訓練,最終訓練出一組權重。

進入正題  卷積神經網路:

CNN 是模仿人類大腦的認知方式,例如我們看見一隻狗,會先注意到顏色鮮明的點、線、面,之後由這些點線面特徵構成形狀(眼睛、鼻子等等),這種抽象化的辨識過程就是CNN建立模型的方式。

卷積層 就是由點的比對轉成局部的比對,透過小區塊讀取,可以得到較精準的辨識。

而卷積層在這邊卷積其實就是兩個步驟組成的運算 : 滑動 + 內積,滑動就是一個區塊一個區塊辨識的意思。

舉的最簡單的例子,我今天畫了個叉叉,由卷積層辨識後會將有特徵處(筆畫的叉叉)標示為與其他區塊不相同的數字作區分,最後由這些特徵輸出為叉叉符號。

實際應用:

1.利用影像辨識,判別象棋正反面,求出機率問題。

2.防疫期間利用影像辨識與人臉識別,加上機器學習技術,判別出是否有戴口罩。

3.利用影像辨識與機器學習,可自動將較不清楚的X光影像提高解析度與對比度以利於判別,或是判別出腫瘤位置等等。

尚未經調整的胸腔辨識影像

提升解析度和對比度

Ricky Chen
Ricky Chen

Leave a Reply

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *