PyTorchによる物体検出

前表紙
株式会社 オーム社, 2020/09/19 - 192 ページ

PyTorchで物体検出アルゴリズムを実装しよう!

本書は、PyTorchを利用して、物体検出のアルゴリズムと実装方法を解説する書籍です。


・ PyTorch(パイトーチ)とは?

2018年にFacebook が発表した、ディープラーニングのフレームワークです。世界的にユーザーが多く、GitHubで公開されるディープラーニングのプログラムもPyTorchで作られたものが多数存在します。


・ 物体検出とは?

画像認識の一分野で、画像から特定の物体の位置と、その物体のカテゴリ(クラスタ)を検出する技術です。


ディープラーニングは当初、物体の識別において従来手法を大きく上回る精度を出したことから注目されました(例:2012年の画像認識コンテストILSVRC)。ただし物体識別自体はどちらかといえば要素技術であるため、そのまま現実のシステムに応用することは多くありません。実際に必要とされるものは、多くの場合、物体識別を発展させた物体検出です。自動運転・外観検査・医療分野の画像診断など、どれも物体識別ではなく物体検出の技術が使われています。

本書は、PyTorchの使いかたを習得することと、物体検出の各種アルゴリズムを理解して自力でプログラムを作れるようになることを目的とします。前半はPyTorchについて解説し、後半は物体検出の代表的なアルゴリズムを解説しながら、PyTorchでの実装例を示します。


<本書の特徴>

PyTorchを使って物体検出アルゴリズムを実装できるようになります。

・Pythonによるサンプルコードを例示&配布し、自分で手を動かしながら理解を深められます。


このような方におすすめ

◎ 物体検出に携わるエンジニア

○ 深層学習を学んでいる学生

○ PyTorchの使いかたを習得したい方

主要目次

第1章 PyTorch によるプログラミング

第2章 物体検出アルゴリズムSSDの実装

第3章 SSDに関連した話題

 

レビュー - レビューを書く

レビューが見つかりませんでした。

ページのサンプル

目次

24 特徴量マップと領域
78
25 SSDの処理の概要
80
26 SSDのネットワークモデル
81
27 SSDモデルの実装
84
272 extrasネットワークの実装
86
274 confネットワークの実装
87
275 L2Normの実装
88
28 DBoxの実装
90

132 計算グラフを利用した勾配計算
16
133 Definebyrun
17
14 TensorとNumPy
18
142 Tensorと数値の四則演算
20
143 Tensorどうしの四則演算
21
144 Tensorの行列積
22
145 Tensorのバッチの行列積
23
146 Tensorを扱う関数
25
147 Tensorの型と型の変換
26
148 TensorとNumPyと相互変換
27
1410 Tensorの軸の操作
28
1411 Tensorと自動微分
29
15 PyTorchの学習プログラムの作成
33
152 ライブラリの読み込み
34
153 学習データの準備
35
154 モデルの設定
36
155 モデルの生成最適化アルゴリズムと損失関数の設定
38
156 学習
39
157 テスト
40
158 ミニバッチ
41
159 クロスエントロピー
42
1510 nnSequentialによるモデル設定と生成
43
1511 nnModuleListによるモデル設定と生成
44
1512 GPUの利用
45
16 畳み込みニューラルネットワーク
47
162 畳み込み
48
163 Max Pooling
51
164 学習の対象
52
166 CNNによる画像識別
55
167 Dropout
58
17 複雑なネットワークの学習
60
172 複数のモデルの混在
65
第2章物体検出アルゴリズムSSDの実装
71
21 物体検出
72
22 ボックスの形式
74
23 デフォルトボックスとオフセット
77
29 SSDのforward関数
92
210 損失関数の実装
97
2101 IOUによるDBoxの選択
98
2102 match関数の実装
99
2103 利用するNegative DBoxの選択
101
2104 SmoothL1Lossと交差エントロピーによる損失値算出
102
211 学習プログラム全体の実装
104
2112 入力画像の前処理
107
2113 学習プログラム
108
212 モデル出力からの物体検出処理
111
2122 detectionの実装
112
213 推論プログラムの実装
115
第3章 SSDに関連した話題
119
31 既存の画像識別モデルの利用
120
32 SSDのDataLoader
121
322 自前のcollate_fn
124
323 DataLoaderを使った学習のループ部分
125
33 SSDのData Augmentation
127
34 物体検出システムの評価方法
132
342 mAPmean Average Precision
133
35 アノテーションツールLabelImg
141
36 既存モデルの利用
144
37 SSDの転移学習
145
38 SSDの動画への適用
150
39 弱教師あり学習
154
310 他モデルの利用
156
3102 M2Det
161
3103 Detectron2
164
付録A プログラミング環境の構築Windows
171
A1 Anaconda
172
A3 wget
173
A5 PyTorch
175
参考文献
176
索引
178
奥付
183
著作権

著者について (2020)

新納浩幸(しんのう ひろゆき)

1961 年生まれ。

1985 年 東京工業大学理学部情報科学科卒業

1987 年 東京工業大学大学院理工学研究科情報科学専攻修士課程修了

現在、茨城大学工学部情報工学科教授、博士(工学)。専門は自然言語処理。

〈主な著書〉

『数理統計学の基礎―よくわかる予測と確率変数』森北出版(2004)

『入門RSS―Web における効率のよい情報収集/ 発信』毎日コミュニケーションズ(2004)

『Excel で学ぶ確率論』オーム社(2004)

『入門Common Lisp―関数型4 つの特徴とλ計算』毎日コミュニケーションズ(2006)

『R で学ぶクラスタ解析』オーム社(2007)

『Chainer による実践深層学習』オーム社(2016)

『ニューラルネットワーク自作入門』(Tariq Rashid 著)監修・翻訳 マイナビ出版(2017)

『Chainer v2 による実践深層学習』オーム社(2017)

書誌情報