[論文メモ] Instance-Conditioned GAN

arxiv.org Facebook AI Research画像インスタンスを生成時の条件として入力するノンパラメトリックなconditional GANの提案。 概要 class-conditional GANはクラスラベルを条件として受け取ることで複雑な分布にも対応したがデータセットを作成するコストが…

音楽用OSのDaphileをインストールした

今までの音楽を聞くのにvolumioというOSを利用していた。 volumio.org 音楽を聞くだけの最低限の構成で、日本語も対応しているしsshもできるしで特に不満はなかった。 ただ、DACとしてTopping D90をUSB接続で利用していたのだがある時、急に認識しなくなって…

[論文メモ] ConvMLP: Hierarchical Convolutional MLPs for Vision

arxiv.org 個人的なメモレベル 概要 最近流行り始めているMLP-basedなアーキテクチャは固定サイズの入力とFC層による高計算コストでobject detection等にしても使いにくい。 提案するConvMLPは軽量でステージに分割(ダウンサンプリングをする)といった畳み込…

[論文メモ] Sparse MLP for Image Recognition: Is Self-Attention Really Necessary?

arxiv.org あくまで個人的メモレベル 概要 ViTのように近年ではTransformerのCV分野への応用が活発だが、画像認識においてself-attentionが高パフォーマンスを得るための鍵なのか調査し、最近また再燃しているMLPモデルを改良したattention-freeなsMLPNetを…

[論文メモ] Panoptic SegFormer

arxiv.orgtransformerを使ってPanoptic Segmentation(PSと略す)を行った論文。テクニカルレポート。 PAはSemantic Segmentation(画像中の全てのピクセルをクラス分類. SSと略す)とInstance Segmentation(物体毎に領域分割しインスタンスを区別する. ISと略す…

[論文メモ] Fully Transformer Networks for Semantic Image Segmentation

arxiv.org図・表は論文から引用しています。 概要 NLPで使われているtransformerがsemantic segmentationでどれだけ有効なのかを調査した論文。 encoder-decoder basedなFully Transformer Networks(FTN)を提案。Transformer basedな手法としては3種類ほどあ…

[論文メモ]ConvNets vs. Transformers: Whose Visual Representations are More Transferable?

arxiv.org ICCV2021 Workshop 画像は論文より引用あくまでメモ。興味ある人は論文を読んでください。 間違い等の指摘は大歓迎です。タイトルどおりConvNetとTransformerでどちらがTransfer Learningに適しているのかを調査した論文。 概要 最近ではNLPで良い…

VolumioでSambaサーバーをマウントするときError when adding network drive (95): Operation not supported Refer to the mount.cifs(8) manual page (e.g. man mount.cifs)のエラーが出る

タイトルの通り、VolumioでSambaサーバーをマウントするときに「Error when adding network drive (95): Operation not supported Refer to the mount.cifs(8) manual page (e.g. man mount.cifs)」が出て困っている人のために。Volumioを使って音楽を聞いて…

HAP-S1のUSBデジタル出力でTopping D90に出力したかった話

現在、自宅のメインのオーディオシステムはraspberry pi(Volumio) -> Topping D90 -> アンプという流れなのだが、Volumioがどうにも繋がりにくい。 VolumioはIPを固定して使用時に電源を入れ使用後は電源を毎回落としている。 起動して少ししてもブラウザか…

Volumioをディスプレイに出力してマウス操作する

自分は音楽を聞くときにメインでVolumioを利用している。 メインで1台、テレワーク用のデスク用に1台、それぞれraspberry pi 3で運用している。 Volumioにはプラグインでタッチディスプレイに出力しタッチ操作できるようにすることができる。デスクではネッ…

MacBook Pro 13inch late2018で3台の外部ディスプレイを使用する

MacBook Pro 13inch late2018から外部ディスプレイ3台を接続するために試したこと・解決策について、同じことをしようとしている人たちのために。自宅の環境を整えウルトラワイドの大きめのディスプレイを2台購入した結果、MacBook Pro本体が邪魔になりクラ…

AdaCos: Adaptively Scaling Cosine Logits for Effectively Learning Deep Face Representationsを読んだ

詳細はこちら qiita.com以前からArcFaceというmetric learningの手法が優秀なので使っていたが、AdaCosはArcFaceのハイパーパラメータを調整してくれるということで使ってみた。そしたら想像以上に優秀だったのでAdaCosが自分のデファクトスタンダードになっ…

Invertible Grayscale

Invertible Grayscaleを読んで、実装、実験をした。詳細はこちら。qiita.comコードなどについてはtrain部分はあまり必要ない気がし、model.pyについてのみ載せた 。 正直需要もない気がする(手法が手法ゆえ)。 グレースケールに見えれば良いという考えはな…

Learning Confidence for Out-of-Distribution Detection in Neural Networks

クラス分類などで実際にニューラルネットを実際に使うとわかるが、ある入力が特定のクラスである確率が9割を超えていても間違えている事がある。 Adversarial Attackなどを考えればよく分かる。 この論文では、入力に対してクラスラベルの推定と共にその予測…

Born Again Neural Networks

[1805.04770] Born Again Neural Networks本来Knowledge distillation (KD) はモデルの圧縮に使われているが、そうではなくKDによって教師モデルより高いパフォーマンスの生徒モデルを作ることを試みたのがこの論文。 自分の記憶だとKD的なものは2014年あた…

Learn to Pay Attention

https://arxiv.org/abs/1804.02391 ICLR2018。 CNNにおけるチャンネル方向ではなく空間方向へのAttentionモデルの提案。タイトルがいいよね。 図を見たほうが早い。 決められたそれぞれの特徴量マップに対してAttentionを行う。画像のどこに注目するかという…

Raspberry Piとpyenv

当然Pythonを入れねばならない。Pythonならpyenvである。 git clone https://github.com/pyenv/pyenv.git $HOME/.pyenvして.zshrcとかに export PYENV_ROOT=${HOME}/.pyenv if [ -d ${PYENV_ROOT} ]; then export PATH=${PYENV_ROOT}/bin:$PATH export PYTHO…

Raspberry Piの設定の備忘録

Rapberry Piを買った。単純にRaspberry Pi が欲しかったのとSwitch Botのためだ。ninhydrin.hatenablog.comデスクトップ用途ではなくサーバー用途なのでそのために幾つか設定を行った。思っていた以上に良かったので今後も購入する可能性がある。そのときの…

Raspberry PiとGoogle HomeとSwitch Botと

Switch Botに興味があったので買ってしまった。2個で7000円なので一つあたり3500円。これぐらいの値段なら買ってもいいかなと思える。【2個セット】Glappy / Switch Bot|ボタンを押してくれる超小型指ロボット (ワイヤレス / スイッチボット)出版社/メー…

pythonでターミナル上のカーソルを上に移動する

プログレスバーなどを作りたいときにsys.stdout.write("~\r") のような感じでキャリッジリターンを使っていたがこれだとカーソルを行頭には戻せるがn行上には戻せない。なので全ての情報を1行に記述するしかなく表示する情報に限界がある。カーソルの移動く…

numpyのRandomStateとmultiprocessing使用時のseed値の罠

numpyとmultiprocessingでシミュレーション的なことをしていた。思ったより良い感じにならなかったしなんとなくおかしいなと思って調査。 numpy.randomとmultiprocessingを使って並列に乱数生成する。適当にその乱数を出力してみる。コード import os import…