arutema47's blog

書いたり書かなかったり。

物体検出ライブラリの紹介と所感

記事について 画像はDetectron2より 物体検出をほとんど使っていない方を対象として、2021年末の物体検出ライブラリを俯瞰することが本記事の目的。 ある程度物体検出の経験ある方は学ぶことは少ないと思う。またあくまで書いてあるのは筆者の感想であるので…

2021年面白かった本

実は三体とメダリストを布教する記事なんですが、オマケで今年面白かった技術書もまとめました。 技術書(順不同) ディープラーニング学習する機械 量子コンピュータの進歩と展望 研究者の仕事術 科研費獲得の方法とコツ RISC-V原典 Pythonではじめる数理最…

クソコンペオブザイヤー2021

よくぞこの記事に来てくれた。 褒美としてクソコンペに参加する権利をやろう 本記事について クソコンペを考える クソ要因 どうしたらクソ要因を減らせるのか? Shakeが大きいコンペがクソコンペか? クソコンペを避けるには KCY2021 グランプリ候補 Kaggle …

CPUとGPUのマルチスレッディングの違いについて

"Locality is efficiency, Efficiency is power, Power is performance, Performance is King", Bill Dally マルチスレッディングとは? CPUとGPUのマルチスレッディングの違いをブログにまとめていたけど例によって誰も興味なさそう— arutema47 (@arutema47…

KagglePC、サーバー構成メモ

Kaggleマシンの参考になればと思い執筆しました。 最近はColab Proが月1000円と破格でディープラーニング環境を提供しており、Kaggle Notebookも相当良いです。 感覚的にですが、30万くらいのマシンを組むよりはColab Pro、Kaggle Notebookの方が早く、それ…

論文執筆・研究活動に参考になるページ

論文の書き方 ymatsuo.com あのAIで有名な松尾先生の論文の書き方に関するページ。 論文のストーリー構築の重要さからproof-readingに関する心構えまで全て参考になる。 hontolab.org Stanford大のJennifer WidomのTips for Writing Technical Papersを和訳…

HAQ: Hardware-Aware Automated Quantization with Mixed Precision

HAQ: Hardware-Aware Automated Quantization with Mixed Precision (CVPR 2019 oral), Kuan Wang∗, Zhijian Liu∗,Yujun Lin∗, Ji Lin, and Song Han Paper Codes 課題 量子化はDNNをモバイルデバイスの高速化において重要な技術だが、各レイヤのビット幅な…

Introduction to Distance Sensors (Stereo Camera, Projection, LiDAR)

This is an English translation of aru47.hatenablog.com It's mostly powered by DeepL, so don't count too much on the English. Goals Stereo Cameras Overview Features Products used. Pattern Projection Cameras Overview Products iPhone Industri…

点群DNN、3D DNN入門 -3DYOLO, VoxelNet, PointNet, FrustrumPointNet, Pointpillars

またまたQiitaからのお引越し記事です。 センサについてはこちらをどうぞ。 aru47.hatenablog.com 目的 点群DNNでできること 3Dセンサ 3D DNNの家計図 変更履歴 2Dベースアプローチ Complex YOLO (ECCV workshop 2018), YOLO 3D (ECCV workshop 2018) 手法に…

距離センサ入門(ステレオカメラ、プロジェクション、LiDAR)

Qiitaからのお引越し記事です。 目標 ステレオカメラ 概要 特徴 使用製品 パターンプロジェクションカメラ 概要 使用製品 iPhone ゾゾスーツ 工業製品(Ensenso, キーエンス) Time of Flight LiDAR Time of Flightの原理 特徴 スキャン型LiDAR フラッシュ型Li…

Maskをopencv使って縮小する

目的 このようなMask画像を画像に対して縮小したいというマニアックな事例の備忘録。 これを こうする パイプライン マスクの中心を計算 # 重心を取得 m = cv2.moments(mask) cx = int(m['m10'] // m['m00']) cy = int(m['m01'] // m['m00']) print(cx, cy) …

有名なDeep Learningの特許を調べてみた[WIP]

目的 有名所のDNN特許を調べてみました。ほとんどがGの特許ですがBatchNorm以外日本で登録されていないのが多いですね。 調べたところで力尽きてちゃんとクレームはトップ以外読んでません。随時リストはアップデートしていきます。 参考: www.reddit.com …

Pytorch高速化 (3) TensorRTで推論を10倍高速化

TLdr; torch2trtというpytorchモデルをTensorRTに簡単に変換するライブラリを使い、Jetson nano+xavier上で画像認識とセグメンテーションの推論処理を10倍高速化できることを確認しました。 ただtorch2trtはカスタムモデルには対応していないため(resnetなど…

Github Actionsでpypiのパッケージを発行

なぜgithub actionsで発行できると楽か 自作ライブラリ開発しているとすると普通ならコーディング、setup.pyを記述、pypiにtwineでアップロードという流れになります。 blog.amedama.jp ただこのpypiへのアップロードが意外に面倒くさい。。!毎回pypiアカウ…

Pytorch高速化 (2)Mixed Precision学習を試す

Qiitaからのお引越しです。 前編 aru47.hatenablog.com TLDR; (2021/06/17) resnet50でCIFAR10をFP16により学習を2倍高速化でき、メモリ使用量も半分にできる。 pytorch1.6からデフォルトでMixed Precision学習をサポートしており、画像認識なら大抵これで上…

Pytorch高速化 (1)Multi-GPU学習を試す

Qiitaからのお引越しです。 Pytorch Advent Calender 2018 3日目の記事です。 はじめに 学生に"Pytorchのmulti-GPUはめっちゃ簡単に出来るから試してみ"と言われて重い腰を上げた。 複数GPU環境はあったのだが、これまでsingle GPUしか学習時に使ってこなか…

ハードウェアの速度をどう評価するか考える(2) ~メモリ、メモリ律速~

前回のあらすじとこの記事の目的 前編: ハードウェアの速度をどう評価するか考える(1) ~クロック、OPS~ 現代ハードウェアの計算性能を評価する尺度であるメモリ律速の概念とルーフラインモデルについて理解を深めることです。 本記事を通し、あるアルゴリ…

Reposado

久々にシリコンバレーレストランの記事。 www.reposadorestaurant.com google maps パロアルトでちょっといいレストラン(会食、パーティ)を予約しないとなーって時に役立つレストラン。 Fine Mexican Diningの名前の通り、洗練された高級志向のメキシコ料…

ハードウェアの速度をどう評価するか考える(1) ~クロック、OPS~

この記事の目的 現代ハードウェアの計算性能を評価する尺度であるメモリ律速の概念とルーフラインモデルについて理解を深めること。 対象読者はメモリバンド幅やOPSなどの概念があまりわかっていない人です。例えば本記事を通し、あるアルゴリズムが速度が十…

Kaggle戦記~Kaggle Masterになるまでを振り返る~

https://www.kaggle.com/kyoshioka47 目的 この度約10ヶ月間Kaggleに参戦しCompetition Masterになり賞金も獲得できました。本記事では参戦したコンペ中の思考や得られた事を振り返り記録します。これからKaggleを始めMasterを目指す人の参考になればと思い…

RNNからTransformerまでの歴史を辿る ~DNNを使ったNLPを浅く広く勉強~

Amazon Prime 一ヶ月無料 Seq2seqからBERTまでのNLPモデルの歴史をざっとまとめる。 DNNは知ってるけどTransformerってなんだかわからない、って人におすすめです。 Abst. 画像認識にもTransformerが使われることが多く、DeepRLやGPT-3といったNLPモデルも身…

【壁の向こうを見通すNLoSセンシングを野外で実現】Seeing Around Street Corners: Non-Line-of-Sight Detection and Tracking In-the-Wild Using Doppler Radar

ハイライト N ミリ波レーダを使い、Non-line-of-sight(NLoS)センシングを野外で初めて実現。 壁などの裏の死角物体のセンシングを実現。例えば自動運転中にも壁の裏の歩行者などを早期発見できる技術に応用可能。 CVPR 2020 arxiv 著者グループはNLoSセンシ…

nVidia 新GPU A100についての情報まとめ

amzn.to nVidiaの新データセンター用GPU、A100がリリースされました。 このチップをベースとしてコンシューマー用GPU(RTX3xxx)もリリースされるのでしょう。 備忘録的にどのような新機能があるのかまとめてみました。 筆者の使用用途上AI性能にフォーカスし…

Pseudo-LiDAR from Visual Depth Estimation: Bridging the Gap in 3D Object Detection for Autonomous Driving

密、かつ高精度な点群をステレオカメラによって得る研究。Depth prediction Networkの提案により高精度な点群の生成に成功している。 従来のステレオカメラは深度情報(カメラからの距離)のみしか得られなかったが、この研究では3D点群(つまりX,Y,Z座標)…

dToF/iToF LiDARセンサの原理や製品について

www.amazon.co.jp 記事の目的 LiDARセンサはLight Detection and Rangingの略で光を使った距離測定技術の総称です。 RADARが電磁波を使って距離を測るのに対して、光を使った距離センサを指します。 特に本記事ではdToFとiToF LiDARの基本や原理について説明…

Tracking Objects as Points (CenterTrack)

なんの論文? CenterNetの著者からの最新論文。CenterNetと同様にシンプルなアプローチながら、有効性や応用性が高く様々な研究で使われるようになりそう。 前作CenterNetはPointを用いた物体検出であったが、今回は同様のPoint-baseのネットワークでトラッ…

ステレオカメラの原理、信号処理について

WIP

はじめに ステレオカメラの信号処理について詳細に記述しているメディアは少ない。 一方で現行のステレオカメラで最高の精度を誇るEnsensoのwhitepaperは非常に参考になる。 Obtaining Depth Information from Stereo Images 原理 ステレオカメラ自体の原理…

PointPillars技術について

3D

PointPillars: Fast Encoders for Object Detection from Point Clouds PointPillarsとは2018年に提案された3D物体検出技術、または点群ニューラルネット技術です。 従来技術よりも高速かつ遥かに高精度で精度ー計算量のバランスが良く、現在多くの3D物体検…

Class-balanced Grouping and Sampling for Point Cloud 3D Object Detection

3D

Class-balanced Grouping and Sampling for Point Cloud 3D Object Detection https://arxiv.org/pdf/1908.09492.pdf 現在のNuscenes一位のソリューション。 課題 LiDARデータのaugumentationの提案が主に精度向上の要因。 Nuscenesはクラス間精度の平均が評…

Learning in the Frequency Domain

Learning in the Frequency Domain https://arxiv.org/abs/2002.12416 Alibaba CVPR 2020 accepted 課題 入力画像を空間領域で扱うのはファイルサイズが大きいため、従来ネットワークは224x224x3と小さいサイズに変換。元の画像サイズ(440x440x3)に対し空間…