簡單範例 - 判斷圖片是否為貓 - part2

在part1已經學到如何得到Feature與Label陣列本節就準備使用這個陣列進行訓練

訓練模型

直接看sample code

"""Train MLP Model
Using MLP Model to Train Picture Recognition Model.
"""
from keras.utils import np_utils
from keras.models import Sequential
from keras.layers import Dense, Dropout

import numpy as np


# 設定 np 亂數種子
np.random.seed(10)

# 載入訓練資料集
n = 10000
img_feature = np.fromfile("./your/image/training/array.features", dtype=np.uint8)
img_feature = img_feature.reshape(n, 30, 30, 3)
img_label = np.fromfile("./your/image/training/array.labels", dtype=np.uint8)
img_label = img_label.reshape(n, 1)

# 打散資料集
indexs = np.random.permutation(img_label.shape[0])
rand_img_feature = img_feature[indexs]
rand_img_label = img_label[indexs]

# 資料正規化
# 將 feature 數字轉換為 0~1 的浮點數，能加快收斂，並提升預測準確度
# 把維度 (n,30,30,3) => (n, 30*30*3)後，再除255
img_feature_normalized = rand_img_feature.reshape(n, 30*30*3).astype('float32') / 255

# 將 label 轉換為 onehot 表示
img_label_onehot = np_utils.to_categorical(rand_img_label)

# 建立一個線性堆疊模型
model = Sequential()

# 建立輸入層與隱藏層
model.add(Dense(input_dim = 30*30*3, # 輸入層神經元數
                units = 1000, # 隱藏層神經元數
                kernel_initializer = 'normal', # 權重和誤差初始化方式:normal，使用常態分佈產生出始值
                activation = 'relu')) # 激活函數:relu函數，忽略掉負數的值

# 建立輸出層
model.add(Dense(units = 2, # 輸出層神經元數 (即[True, False])
                kernel_initializer = 'normal',
                activation = 'softmax')) # 激活函數:softmax函數，使輸出介於 0~1 之間

# 定義訓練方式
model.compile(loss='categorical_crossentropy', # 損失函數
             optimizer='adam', # 最佳化方法
             metrics=['accuracy']) # 評估方式:準確度

# 顯示模型摘要
print(model.summary())

# 開始訓練模型
train_history = model.fit(x=img_feature_normalized, # 指定 feature
                          y=img_label_onehot, # 指定 label 
                          validation_split=0.2, # 分80%訓練，20%驗證
                          epochs=5, # 執行 5 次訓練
                          batch_size=200, # 批次訓練，每批次 200 筆資料
                          verbose=2) # 顯示訓練過程

# 儲存模型
model.save("./your/image/training/models.dat")

第一步：feature, label陣列
使用np.fromfile()讀檔即可
讀完檔案後記得reshape()成當初你建立的陣列大小
因為訓練的資料愈平均愈好，所以可用np.random.permutation()打散資料

第二步：正規化
我們不希望算到最後正無限大或負無限大這種無意義的數字
所以建議資料都要正規化成0~1之間，讓運算時可以得到比較恰當的數字

假設一張圖是(30, 30)的維度，考慮RGB，我們會存成(30, 30, 3)
在丟進訓練系統時，會將每一張圖用一維陣列表示，即(30*30*3, 1)
因為要正規化RGB，所以為除255。即：

.reshape(n, 30*30*3).astype('float32') / 255

每張圖對應的label陣列也需處理成機器學習的格式(稱為One-Hot Encoding)
例如判斷數字的圖片，label由[1,2,3,...,9,0]組成，但這樣的資料機器無法辨識
所以必須:
將1變成[1,0,0,0,0,0,0,0,0,0],
將2變成[0,1,0,0,0,0,0,0,0,0],
...
將10變成[0,0,0,0,0,0,0,0,0,1].
如此機器學習才能處理。最後我們的one-shot資料就成了:

label = [
  [0,0,0,0,1,0,0,0,0,0],
  [0,0,0,1,0,0,0,0,0,0],
  [0,0,1,0,0,0,0,0,0,0],
  ...
]

這樣代表第一張圖是數字5，第二張圖是數字4，以此類推
可以簡單理解成：第一張是數字5的機率為100%，其他數字的機率是0%

那以上的工作，都可以交給keras的np_utils.to_categorical()函數直接完成
它很神奇的是，會判斷label array的所有內容，最後正規化成我們要的

第三步：定義神經網路
其實keras已經幫我們封裝了tensorflow，所以code讀起來就很簡單
只要幾個步驟就可以完成定義

# 建立模型
model = Sequential()
# 定義input維度為30*30*3，即一張圖。定義隱藏層為1000個神經元
model.add(Dense(input_dim=30*30*3, units=1000, ...))
# 定義output神經元數為2，代表正規化後的label arry，即[1,0]
model.add(Dense(units=2))
# 定義訓練方式
model.compile()
# 開始訓練
model.fit()
# 存檔
model.save("/your/path")

很多不懂的參數可以先照抄就可以了。

訓練結果不理想？

此時您應該會發現，好像不論參數怎麼調整，結果都不是很理想
原因在於本例是講解一個通式而已
真正在進行圖形訓練，我們會使用CNN演算法。請見下節。

ch6 - 範例:圖片辨識-part2

簡單範例 - 判斷圖片是否為貓 - part2

訓練模型

訓練結果不理想？

results matching ""

No results matching ""