arutema47's blog

書いたり書かなかったり。

2020-01-01から1年間の記事一覧

Pytorch高速化 (3) TensorRTで推論を10倍高速化

TLdr; torch2trtというpytorchモデルをTensorRTに簡単に変換するライブラリを使い、Jetson nano+xavier上で画像認識とセグメンテーションの推論処理を10倍高速化できることを確認しました。 ただtorch2trtはカスタムモデルには対応していないため(resnetなど…

Github Actionsでpypiのパッケージを発行

なぜgithub actionsで発行できると楽か 自作ライブラリ開発しているとすると普通ならコーディング、setup.pyを記述、pypiにtwineでアップロードという流れになります。 blog.amedama.jp ただこのpypiへのアップロードが意外に面倒くさい。。!毎回pypiアカウ…

Pytorch高速化 (2)Mixed Precision学習を試す

Qiitaからのお引越しです。 前編 aru47.hatenablog.com TLDR; (2021/06/17) resnet50でCIFAR10をFP16により学習を2倍高速化でき、メモリ使用量も半分にできる。 pytorch1.6からデフォルトでMixed Precision学習をサポートしており、画像認識なら大抵これで上…

Pytorch高速化 (1)Multi-GPU学習を試す

Qiitaからのお引越しです。 Pytorch Advent Calender 2018 3日目の記事です。 はじめに 学生に"Pytorchのmulti-GPUはめっちゃ簡単に出来るから試してみ"と言われて重い腰を上げた。 複数GPU環境はあったのだが、これまでsingle GPUしか学習時に使ってこなか…

ハードウェアの速度をどう評価するか考える(2) ~メモリ、メモリ律速~

前回のあらすじとこの記事の目的 前編: ハードウェアの速度をどう評価するか考える(1) ~クロック、OPS~ 現代ハードウェアの計算性能を評価する尺度であるメモリ律速の概念とルーフラインモデルについて理解を深めることです。 本記事を通し、あるアルゴリ…

Reposado

久々にシリコンバレーレストランの記事。 www.reposadorestaurant.com google maps パロアルトでちょっといいレストラン(会食、パーティ)を予約しないとなーって時に役立つレストラン。 Fine Mexican Diningの名前の通り、洗練された高級志向のメキシコ料…

ハードウェアの速度をどう評価するか考える(1) ~クロック、OPS~

この記事の目的 現代ハードウェアの計算性能を評価する尺度であるメモリ律速の概念とルーフラインモデルについて理解を深めること。 対象読者はメモリバンド幅やOPSなどの概念があまりわかっていない人です。例えば本記事を通し、あるアルゴリズムが速度が十…

Kaggle戦記~Kaggle Masterになるまでを振り返る~

https://www.kaggle.com/kyoshioka47 目的 この度約10ヶ月間Kaggleに参戦しCompetition Masterになり賞金も獲得できました。本記事では参戦したコンペ中の思考や得られた事を振り返り記録します。これからKaggleを始めMasterを目指す人の参考になればと思い…

RNNからTransformerまでの歴史を辿る ~DNNを使ったNLPを浅く広く勉強~

Amazon Prime 一ヶ月無料 Seq2seqからBERTまでのNLPモデルの歴史をざっとまとめる。 DNNは知ってるけどTransformerってなんだかわからない、って人におすすめです。 Abst. 画像認識にもTransformerが使われることが多く、DeepRLやGPT-3といったNLPモデルも身…

【壁の向こうを見通すNLoSセンシングを野外で実現】Seeing Around Street Corners: Non-Line-of-Sight Detection and Tracking In-the-Wild Using Doppler Radar

ハイライト N ミリ波レーダを使い、Non-line-of-sight(NLoS)センシングを野外で初めて実現。 壁などの裏の死角物体のセンシングを実現。例えば自動運転中にも壁の裏の歩行者などを早期発見できる技術に応用可能。 CVPR 2020 arxiv 著者グループはNLoSセンシ…

nVidia 新GPU A100についての情報まとめ

amzn.to nVidiaの新データセンター用GPU、A100がリリースされました。 このチップをベースとしてコンシューマー用GPU(RTX3xxx)もリリースされるのでしょう。 備忘録的にどのような新機能があるのかまとめてみました。 筆者の使用用途上AI性能にフォーカスし…

Pseudo-LiDAR from Visual Depth Estimation: Bridging the Gap in 3D Object Detection for Autonomous Driving

密、かつ高精度な点群をステレオカメラによって得る研究。Depth prediction Networkの提案により高精度な点群の生成に成功している。 従来のステレオカメラは深度情報(カメラからの距離)のみしか得られなかったが、この研究では3D点群(つまりX,Y,Z座標)…

dToF/iToF LiDARセンサの原理や製品について

記事の目的 本記事ではdToFとiToF LiDARの基本や原理について説明します。 また込み入った理論ではなく、LiDARの大まかな種類や用途を理解するのが目標です。 LiDARセンサはLight Detection and Rangingの略で光を使った距離測定技術の総称です。 RADARが電…

Tracking Objects as Points (CenterTrack)

なんの論文? CenterNetの著者からの最新論文。CenterNetと同様にシンプルなアプローチながら、有効性や応用性が高く様々な研究で使われるようになりそう。 前作CenterNetはPointを用いた物体検出であったが、今回は同様のPoint-baseのネットワークでトラッ…

ステレオカメラの原理、信号処理について

WIP

はじめに ステレオカメラの信号処理について詳細に記述しているメディアは少ない。 一方で現行のステレオカメラで最高の精度を誇るEnsensoのwhitepaperは非常に参考になる。 Obtaining Depth Information from Stereo Images 原理 ステレオカメラ自体の原理…

PointPillars技術について

3D

PointPillars: Fast Encoders for Object Detection from Point Clouds PointPillarsとは2018年に提案された3D物体検出技術、または点群ニューラルネット技術です。 従来技術よりも高速かつ遥かに高精度で精度ー計算量のバランスが良く、現在多くの3D物体検…

Class-balanced Grouping and Sampling for Point Cloud 3D Object Detection

3D

Class-balanced Grouping and Sampling for Point Cloud 3D Object Detection https://arxiv.org/pdf/1908.09492.pdf 現在のNuscenes一位のソリューション。 課題 LiDARデータのaugumentationの提案が主に精度向上の要因。 Nuscenesはクラス間精度の平均が評…

Learning in the Frequency Domain

Learning in the Frequency Domain https://arxiv.org/abs/2002.12416 Alibaba CVPR 2020 accepted 課題 入力画像を空間領域で扱うのはファイルサイズが大きいため、従来ネットワークは224x224x3と小さいサイズに変換。元の画像サイズ(440x440x3)に対し空間…