こんにちは、機械学習の講師をしているキカガクの木下です!
写真を入力すると、ある画家風の画像に変換できる画風変換など、近年、様々な画像処理技術が注目を集めています。
このような画像処理は一見難しそうに見えますが、近年では Google Colaboratory やクラウドサービスを用いると簡単に実装できます。
画像を扱う画像処理・コンピュータビジョンは様々な書籍・サイトが存在し、どの情報源を参考にすればよいか悩む機会も多いのではないでしょうか。
今回は、そのような技術を実装してみたい、理解したい皆様に役立つ画像処理・コンピュータビジョンのおすすめ書籍を紹介します。
- 古典的な手法から最先端の技術までカバー!
- それぞれの書籍で講師が感動したポイントを複数ご紹介!
- 全ての書籍に簡単に実装できるコードが含まれており、すぐに実践できる!
これまでのおすすめ書籍は以下のリンクから御覧ください。
ディープラーニングを用いた画像処理技術のおすすめ本!
画像処理はディープラーニングの台頭前後で、用いられる技術が大きく変化しました。
まずは、ディープラーニングを用いた画像処理技術のおすすめ本を紹介します!
コンピュータビジョン最前線 Winter 2021
1 冊目は最先端の研究領域までカバーした書籍を紹介します。この本は、学会誌のあり方を問い直し、情報共有を第一に考え発行されている雑誌です。
まだ書籍化されていない技術に関して簡潔にまとめられており、研究者でなくとも読んでおいて損のない一冊となっています。
まだ創刊されたばかりですが、各季ごとに発刊されるようなので、今から要チェックです!
ここに感動!!
最先端の技術が最小限の数式で説明されており、非常に明瞭な記述である!
まだ日本語の文献が非常に少ない分野まで網羅されている!
定期的に発刊され、常に最先端の情報に触れることができる!
物体検出と GAN、オートエンコーダー、画像処理入門 PyTorch/TensorFlow2 による発展的・実装ディープラーニング
この書籍は、物体検出や GAN、オートエンコーダーといった、近年流行している画像処理技術の実装方法が一通り記載されている素晴らしい書籍です。
ここで、一通りの技術に触れたあと、各技術をより細かく学んでいくことが学習の近道だと思います。
また、PyTorch と TensorFlow 双方のコードが書かれていることも非常に貴重な書籍です。
ここに感動!!
画像処理分野の網羅には一番の書籍である!
少しマニアックで、他の書籍では扱われていないものも掲載!
メジャーなフレームワーク2 つの実装が含まれており、比較できる!
GAN ディープラーニング実装ハンドブック
先程の書籍で GAN に興味を持たれた方やスタイル変換などを実装してみたい方におすすめの書籍がこちらになります。Google Colaboratory を用いた実装のため、誰でもすぐに実装できます。
GAN は近年最も注目を集めている画像処理技術の一つで、その中の最先端の手法である CycleGAN なども実装できます。これだけで面白いアプリや機械学習システムが作れること間違いなしです!
ここに感動!!
最先端の技術まで簡単な実装で紹介されている!
一つの技術に特化して紹介されており、他の書籍では得られにくい情報まで網羅されている!
誰でもすぐに実装できるような工夫がなされている!
BERT/GPT-3/DALL-E 自然言語処理・画像処理・音声処理 人工知能プログラミング実践入門
現在、機械学習界隈を席巻しているのは Transformer と呼ばれる技術です。この技術は自然言語処理を中心に発展してきましたが、近年 Vision Transformer という画像処理用の Transformer も非常に高精度であることが知られてきました。
この本では、自然言語などを含めて Transformer を簡潔に理解することが可能な上に、コードまで多数掲載されている素晴らしい書籍です。
世界最先端の技術を実装してみたい方におすすめです!
ここに感動!!
世界最先端の技術を簡単に再現できる!
一見難しい知識をイラストを用いてわかりやすく説明されている!
他の書籍には載っていない技術が多数含まれている!
物体・画像認識と時系列データ処理入門 [TensorFlow2/PyTorch 対応第2版] NumPy/TensorFlow2(Keras)/PyTorch による実装ディープラーニング
この本はこれまで紹介した書籍よりも、ニューラルネットワークの理論的な部分や基礎的な部分が多く説明されていることが特徴です。
基礎から学び、物体検出まで実装したい方に特におすすめです!
ここに感動!!
ディープラーニング基礎からしっかり学べる!
数理的な部分もイラストを用いてわかりやすく説明されている!
最後はある程度ライブラリに依存しないでコーディングが可能になる!
本稿の続きおよび、転載元の記事は「キカガクの技術ブログ」にてご覧ください。