2021-09-01から1ヶ月間の記事一覧

[論文メモ] DyStyle: Dynamic Neural Network for Multi-Attribute-Conditioned Style Editing

arxiv.orgGANの生成結果を操作する系の論文。 StyleGANなどは高精細な画像の生成を可能にしたが、生成結果のコントロールが難しい。 生成結果のコントロールするためにスタイル編集ネットワーク(StyleGANのlatent codeを生成する)を作成する手法がある。 し…

[論文メモ] Instance-Conditioned GAN

arxiv.org NeurIPS2021 Facebook AI Research画像インスタンスを生成時の条件として入力するノンパラメトリックなconditional GANの提案。 概要 class-conditional GANはクラスラベルを条件として受け取ることで複雑な分布にも対応したがデータセットを作成…

音楽用OSのDaphileをインストールした

今までの音楽を聞くのにvolumioというOSを利用していた。 volumio.org 音楽を聞くだけの最低限の構成で、日本語も対応しているしsshもできるしで特に不満はなかった。 ただ、DACとしてTopping D90をUSB接続で利用していたのだがある時、急に認識しなくなって…

[論文メモ] ConvMLP: Hierarchical Convolutional MLPs for Vision

arxiv.org 個人的なメモレベル 概要 最近流行り始めているMLP-basedなアーキテクチャは固定サイズの入力とFC層による高計算コストでobject detection等にしても使いにくい。 提案するConvMLPは軽量でステージに分割(ダウンサンプリングをする)といった畳み込…

[論文メモ] Sparse MLP for Image Recognition: Is Self-Attention Really Necessary?

arxiv.org あくまで個人的メモレベル 概要 ViTのように近年ではTransformerのCV分野への応用が活発だが、画像認識においてself-attentionが高パフォーマンスを得るための鍵なのか調査し、最近また再燃しているMLPモデルを改良したattention-freeなsMLPNetを…

[論文メモ] Panoptic SegFormer

arxiv.orgtransformerを使ってPanoptic Segmentation(PSと略す)を行った論文。テクニカルレポート。 PAはSemantic Segmentation(画像中の全てのピクセルをクラス分類. SSと略す)とInstance Segmentation(物体毎に領域分割しインスタンスを区別する. ISと略す…

[論文メモ] Fully Transformer Networks for Semantic Image Segmentation

arxiv.org図・表は論文から引用しています。 概要 NLPで使われているtransformerがsemantic segmentationでどれだけ有効なのかを調査した論文。 encoder-decoder basedなFully Transformer Networks(FTN)を提案。Transformer basedな手法としては3種類ほどあ…