內容目錄 Toggle 深度學習的CNN影像辨識原理:進入正題 卷積神經網路:實際應用: 深度學習的CNN影像辨識原理: 一般的神經網路由三個部分組成,分別是輸入層(Input Layers)、隱藏層(Hidden Layers)以及輸出層 (Output Layers)。 下面開始做解釋 以BMI計算為例 輸入層輸入層顧名思義就是將資料輸入(Data)的特徵值 (Features),例如,今天要預測一個人是否有過重或是過輕的問題,我們有的資料會是這個人的身高、體重,而「身高、體重」就是你要放入輸入層的特徵值。 隱藏層隱藏層也就是在做運算的工作,由神經元所組成,計算出我們的輸出值。在BMI計算的例子中,隱藏曾就是 BMI = 體重(公斤) / 身高2(公尺2) 輸出層而輸出層則是透過輸入特徵,經過隱藏層的運算所得到的數值,經過訓練,最終訓練出一組權重。 進入正題 卷積神經網路:CNN 是模仿人類大腦的認知方式,例如我們看見一隻狗,會先注意到顏色鮮明的點、線、面,之後由這些點線面特徵構成形狀(眼睛、鼻子等等),這種抽象化的辨識過程就是CNN建立模型的方式。卷積層 就是由點的比對轉成局部的比對,透過小區塊讀取,可以得到較精準的辨識。 而卷積層在這邊卷積其實就是兩個步驟組成的運算 : 滑動 + 內積,滑動就是一個區塊一個區塊辨識的意思。 舉的最簡單的例子,我今天畫了個叉叉,由卷積層辨識後會將有特徵處(筆畫的叉叉)標示為與其他區塊不相同的數字作區分,最後由這些特徵輸出為叉叉符號。 實際應用: 1.利用影像辨識,判別象棋正反面,求出機率問題。 2.防疫期間利用影像辨識與人臉識別,加上機器學習技術,判別出是否有戴口罩。 3.利用影像辨識與機器學習,可自動將較不清楚的X光影像提高解析度與對比度以利於判別,或是判別出腫瘤位置等等。 尚未經調整的胸腔辨識影像 提升解析度和對比度