Pythonでバラバラな画像をいい感じに詰め合わせる

python 画像処理

はじめに今回は、サイズの異なる複数枚の画像をいい感じに1枚の画像にする方法を考えていきます。画像サイズが同じであれば簡単に画像を並べる事が出来るのですが、今回はもう少しおしゃれな感じにしたいです。こうでなくこう！右の画像は適当に手で並…

2021-11-06

pythonでPDFから画像を抽出する

python

はじめに論文のサーベイを効率化するツールを作成しています。今回は論文のpdfファイルから図を抽出してみたいと思います。 nsr-9.hatenablog.jp

2021-10-29

pythonでPDFからテキストデータを抽出する

python 自然言語処理

やりたいこと論文サーベイ支援アプリを作成するに当たり，論文のPDFからテキストデータを抽出する必要があります．今回は論文のPDFファイルからテキストデータを抽出する方法を実装します．

2021-10-21

自然言語処理をやってみたい

python 自然言語処理

はじめにこのブログのタイトルにもあるように、平日は企業で研究開発業務に携わっています。研究を生業にしていく為には、日々投稿される最新の研究論文を常にインプットしていかなくてはならないのですが、研究以外の業務も沢山あるので中々に難しい問題…

2021-10-11

Python+Pytorchでイラストの生成

python pytorch 画像処理

はじめにブログを執筆したり職場で研究内容を人に伝える際に、積極的にイラストを用いるようにしています。イラストを用いる事で、言葉で伝えるにはややこしい内容であっても、直感的に理解してもらえる事が多いためです。しかしながら僕は，単純な図表な…

2021-10-03

pythonで逆位相音楽

python 音声信号処理

はじめに音楽を聴いている時にイヤフォンジャックを上手に半抜きにすると、伴奏だけが聞こえる現象があります。イヤフォンジャックのR/Lチャンネルが接続、GNDが未接続状態になった時に、RもしくはLが逆位相になり※それぞれの音を打ち消し合うことで生じる…

2021-09-29

pythonで擬似的な立体音響

python 音声信号処理

はじめに pythonを用いてモノラル音源から、擬似的な立体音響音声を生成してみます。立体音響とは人間は、目をつむっていても周囲の音が何処からなっているのか判断する事が出来ます。これは、音が空気を伝搬する際にかかる時間や音の減衰などを、両耳の…

2021-09-27

pythonで音声信号のリアルタイム周波数解析

python 音声信号処理

やりたいこと pydubで読み込んだ音声信号に対し、Sliding Windowしながら周波数スペクトラムを表示したい。

2021-09-24

pythonで音声信号のリアルタイムプロット

python 音声信号処理

やりたいこと pydubで読み込んだ音声信号に対し、Sliding Windowをしながら波形をプロットしたい。音声信号処理を行う場合は、読み込んだ信号全体に対して一気に処理を施すのではなく、短い時間の区間ごとに処理を施すそうです。 Computer Visionで言うなら…

2021-09-21

pythonで音声ファイルの読み込み

音声信号処理 python

やりたいこと pythonで音声ファイル(mp3, wav)を読み込み、時系列情報(numpy array)にしたい。

2021-09-16

CHWとHWCの相互変換

pytorch python

やりたいこと opencvの画像は縦(Height)×横(Width)×チャンネル(Channel)のいわゆるHWC形式になっています。それとは異なり、pytorchの画像ではチャンネル(Channel)×縦(Height)×横(Width)のCHW形式になっています。 numpy arrayとtorch tensorにおいて、HWC…

2021-09-11

Image Registrationによる外観検査

python 画像処理

はじめに前回、位相限定相関法によるImage Registration手法で遊んでみました。 nsr-9.hatenablog.jp Image Registrationの一つの応用先として、外観検査装置があります。外観検査装置は、工場のラインで流れてくる製品を高速度カメラで撮影し、傷や付着物…

2021-09-10

位相限定相関法による画像の位置合わせ（Image Registration）

python 画像処理

はじめに画像の位置合わせ（Image Registration）とは、異なる視点で撮影された2枚の画像の位置をいい感じにフィッティングする事です。以下にサーベイ論文[1]にわかりやすい画像があったので、参照させてもらいます。左上と右上の画像について、それぞれ…

2021-09-08

Pytorchでグレースケール画像の着色

python pytorch

はじめに pytorchでGANをやっているのですが、乱数源から顔画像を生成するtutorialを繰り返すのも芸がないので、白黒画像（グレースケール）からカラー画像を復元するタスクをやろうと思いました。今回は、GANで取り組む前にPix2Pixという教師ありの画像生…

2021-09-06

PytorchによるGAN（１）：全体像の把握

python pytorch

GAN GAN(generative adversarial networks)[1]とは、2014年に登場したNeural Networkの学習スキームです。一般的なNeural Networkは入力ベクトルとそれに対応する正解ベクトルの写像（対応）関係を回帰する学習を行うのですが、GANでは敵対的学習という画期…

2021-09-05

PytorchによるImage Segmentation（３）

python pytorch 画像処理

はじめに nsr-9.hatenablog.jp PytorchによるU-NetのImage Segmentationの続きです。前回はDataLoader部分を実装したので、今回はLoss Functionを実装して実際に学習、推論をやっていきます。

2021-09-04

PytorchによるImage Segmentation（２）

pytorch 画像処理 python

はじめに nsr-9.hatenablog.jp この記事の続きです。 Pytorchを用いてU-NetのImage Segmentationをやっていきます。前回はU-Netのモデルを定義したので、今回はDataLoader部分を作っていきます。

2021-09-02

index画像からone-hotベクトル画像を作る方法

pytorch python 画像処理

やりたいこと Image Segmentationはpixel単位でカテゴリIDを予測するタスクです。教師画像の形式はLoss関数の関係上、カテゴリIDをそのまま扱うのではなく、One-Hot-Vectorで扱います。 One-Hot-VectorはカテゴリIDを2進数の様に扱うデータ表現であり、Neur…