pythonによる物体検知は、どのようにしたらできるのでしょうか。
このような疑問にお答えします。
物体検知は、openCVを使えば実現することができます。openCVは、コンピュータで動画像を処理するための機能を提供するライブラリです。
pythonでも使用することができ、opencv-pythonとして提供されています。
opencv-pythonは、以下のコマンドでインストールできます。
1 |
pip install opencv-python |
pythonプロンプトを起動し、以下のプログラムを実行してimportエラーが発生しなければインストール成功です。
1 |
import cv2 |
実際に物体検知をしてみます。今回は、物体検知として顔検出を行ってみたいと思います。
opencvでは、学習済みの顔検出用のデータが提供されていますので、こちらのデータを使用します。
githubのリポジトリからダウンロードしたデータを任意の場所に置いてください。本記事では、pythonの実行ファイルと同一のディレクトリに置きました。
- haarcascade_frontalface_default.xml 顔検出用に使用
- haarcascade_eye.xml 瞳検出用に使用
顔検出で使用するデータは、以下のwebページの素材を使用しました。
フリー素材ぱくたそ
顔検出手順
detectMultiScaleで検出します。
1 |
faces = face_cascade.detectMultiScale(igray) |
検出箇所に対して、様々な画像処理を実施します。
0:検出箇所を囲む、1:検出箇所に色を塗る、2:検出箇所にモザイク処理をする、3:輪郭を抽出する
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 |
selected_process = input("process select 0:detect normal, 1:fill, 2:mosaic 3: edge->") if selected_process == '0': for x, y, w, h in faces: img = cv2.rectangle(img, (x, y), (x+w, y+h), (255, 0, 0), 2) face_gray = igray[y:y+h, x:x+w] face_color = img[y:y+h, x:x+w] eyes = eye_cascade.detectMultiScale(face_gray) for ex, ey, ew, eh in eyes: cv2.rectangle(face_color, (ex, ey), (ex + ew, ey + eh), (0, 255, 0), 2) elif selected_process == '1': # 顔検出後、該当箇所色塗り for x, y, w, h in faces: img[y:y+h, x:x+w] = [220, 20, 60] elif selected_process == '2': # 顔検出後、モザイク処理 ratio = 0.05 for x, y, w, h in faces: small = cv2.resize(img[y:y+h, x:x+w], None, fx=ratio, fy=ratio, interpolation=cv2.INTER_NEAREST) img[y:y+h, x:x+w] = cv2.resize(small, (w, h), interpolation=cv2.INTER_NEAREST) elif selected_process == '3': # エッジ抽出 ret, thresh = cv2.threshold(igray, 88, 255, 0) contours, hierarchy = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE) img = cv2.drawContours(img, contours, -1, (0, 0, 255), 3) else: pass |
以下にソースコードの全体を示します。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 |
# coding: utf-8 import numpy as np import cv2 import matplotlib.pyplot as plt def fn_face_detect(): face_cascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml') eye_cascade = cv2.CascadeClassifier('haarcascade_eye.xml') filename = input("image name ->") img = cv2.imread(filename) igray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) faces = face_cascade.detectMultiScale(igray) selected_process = input("process select 0:detect normal, 1:fill, 2:mosaic 3: edge->") if selected_process == '0': for x, y, w, h in faces: img = cv2.rectangle(img, (x, y), (x+w, y+h), (255, 0, 0), 2) face_gray = igray[y:y+h, x:x+w] face_color = img[y:y+h, x:x+w] eyes = eye_cascade.detectMultiScale(face_gray) for ex, ey, ew, eh in eyes: cv2.rectangle(face_color, (ex, ey), (ex + ew, ey + eh), (0, 255, 0), 2) elif selected_process == '1': # 顔検出後、該当箇所色塗り for x, y, w, h in faces: img[y:y+h, x:x+w] = [220, 20, 60] elif selected_process == '2': # 顔検出後、モザイク処理 ratio = 0.05 for x, y, w, h in faces: small = cv2.resize(img[y:y+h, x:x+w], None, fx=ratio, fy=ratio, interpolation=cv2.INTER_NEAREST) img[y:y+h, x:x+w] = cv2.resize(small, (w, h), interpolation=cv2.INTER_NEAREST) elif selected_process == '3': # エッジ抽出 ret, thresh = cv2.threshold(igray, 88, 255, 0) contours, hierarchy = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE) img = cv2.drawContours(img, contours, -1, (0, 0, 255), 3) else: pass cv2.imshow('img', img) cv2.waitKey(0) cv2.destroyAllWindows() if __name__ == '__main__': fn_face_detect() |
出力結果としては、以下のようになりました。
【元画像】
data:image/s3,"s3://crabby-images/d74a3/d74a38383b698d972eddddb50fedd40754e49c70" alt=""
data:image/s3,"s3://crabby-images/bc60d/bc60d78817c9a60b919a0fc32a1a0889ff38a203" alt=""
data:image/s3,"s3://crabby-images/bfcf1/bfcf13a767a08b8305d45515517b644da283abc0" alt=""
【検出箇所を囲む】
data:image/s3,"s3://crabby-images/f9cfa/f9cfa0cdc80d49a3b4abe9e3941e2c46889e1dd3" alt=""
data:image/s3,"s3://crabby-images/b65e4/b65e4f2b0a5fbe661d56fa35acff97345cf2fa23" alt=""
data:image/s3,"s3://crabby-images/99dde/99ddef247de9f9b6658a767584a1d31b7daa66b0" alt=""
【検出箇所に色を塗る】
data:image/s3,"s3://crabby-images/569db/569db5825c0b15850fa40dd3d3a9cc53585c4394" alt=""
data:image/s3,"s3://crabby-images/f3944/f3944ab9b09f6ea8b8808ad76577204b1c125c24" alt=""
data:image/s3,"s3://crabby-images/eb7ce/eb7ceeb225e48a519c9760d56f3f74afe861ed18" alt=""
【検出箇所にモザイク処理をする】
data:image/s3,"s3://crabby-images/a2885/a288554c77aeda9b550bd4a28e4657969096d8ee" alt=""
data:image/s3,"s3://crabby-images/2811c/2811ccb02fe3633bb96ae23fbceffd07c0018ff0" alt=""
data:image/s3,"s3://crabby-images/b6cc2/b6cc246b3f7d278f6a9f4b3361e43fd6b44b85ba" alt=""
【輪郭を抽出する】
data:image/s3,"s3://crabby-images/08b82/08b82a7049716a42a76bc8dfa6ed22cc53b240ee" alt=""
data:image/s3,"s3://crabby-images/0b37f/0b37f24c7f9517030e7466fea787c871e60f20ec" alt=""
data:image/s3,"s3://crabby-images/99902/9990297906d5e441d570ed6f63e06d19f9bcfef4" alt=""
どうでしょうか?
このように、pythonでもopenCVを使用することができ、簡単に物体検知を実現し、応用的な処理ができます。これを機会にpythonによるopenCVを試してみてはいかがでしょうか。