arutema47's blog

書いたり書かなかったり。

Introduction to Distance Sensors (Stereo Camera, Projection, LiDAR)

This is an English translation of aru47.hatenablog.com It's mostly powered by DeepL, so don't count too much on the English. Goals Stereo Cameras Overview Features Products used. Pattern Projection Cameras Overview Products iPhone Industri…

点群DNN、3D DNN入門 -3DYOLO, VoxelNet, PointNet, FrustrumPointNet, Pointpillars

またまたQiitaからのお引越し記事です。 センサについてはこちらをどうぞ。 aru47.hatenablog.com 目的 点群DNNでできること 3D DNNの家計図 変更履歴 2Dベースアプローチ Complex YOLO (ECCV workshop 2018), YOLO 3D (ECCV workshop 2018) 手法について 俯…

距離センサ入門(ステレオカメラ、プロジェクション、LiDAR)

Qiitaからのお引越し記事です。 目標 ステレオカメラ 概要 特徴 使用製品 パターンプロジェクションカメラ 概要 使用製品 iPhone ゾゾスーツ 工業製品(Ensenso, キーエンス) Time of Flight LiDAR Time of Flightの原理 特徴 スキャン型LiDAR フラッシュ型Li…

Maskをopencv使って縮小する

目的 このようなMask画像を画像に対して縮小したいというマニアックな事例の備忘録。 これを こうする パイプライン マスクの中心を計算 # 重心を取得 m = cv2.moments(mask) cx = int(m['m10'] // m['m00']) cy = int(m['m01'] // m['m00']) print(cx, cy) …

有名なDeep Learningの特許を調べてみた[WIP]

目的 有名所のDNN特許を調べてみました。ほとんどがGの特許ですがBatchNorm以外日本で登録されていないのが多いですね。 調べたところで力尽きてちゃんとクレームはトップ以外読んでません。随時リストはアップデートしていきます。 参考: www.reddit.com …

Pytorch高速化 (3) TensorRTで推論高速化

本記事はPytorch Advent calendar 2020の1日目です。 TensorRTとは TesnorRTを気軽に試す 画像認識 画像セグメンテーション 他高速化シリーズ aru47.hatenablog.com aru47.hatenablog.com TensorRTとは Amazon | NVIDIA Jetson Nano Developer Kit - 強力 AI…

Github Actionsでpypiのパッケージを発行

なぜgithub actionsで発行できると楽か 自作ライブラリ開発しているとすると普通ならコーディング、setup.pyを記述、pypiにtwineでアップロードという流れになります。 blog.amedama.jp ただこのpypiへのアップロードが意外に面倒くさい。。!毎回pypiアカウ…

Pytorch高速化 (2)Mixed Precision学習を試す

Qiitaからのお引越しです。 前編 aru47.hatenablog.com 目的 RTX2080tiを手に入れたのでPytorchにてFP16学習を試す。 Tensorcoreを使うことで演算速度がFP32に対する大幅な高速化が(スペック的に)期待できる。 どれくらい早くなるか、pytorchでどう書けばF…

Pytorch高速化 (1)Multi-GPU学習を試す

Qiitaからのお引越しです。 Pytorch Advent Calender 2018 3日目の記事です。 はじめに 学生に"Pytorchのmulti-GPUはめっちゃ簡単に出来るから試してみ"と言われて重い腰を上げた。 複数GPU環境はあったのだが、これまでsingle GPUしか学習時に使ってこなか…

ハードウェアの速度をどう評価するか考える(2) ~メモリ、メモリ律速~

前回のあらすじとこの記事の目的 前編: ハードウェアの速度をどう評価するか考える(1) ~クロック、OPS~ 現代ハードウェアの計算性能を評価する尺度であるメモリ律速の概念とルーフラインモデルについて理解を深めることです。 本記事を通し、あるアルゴリ…

Reposado

久々にシリコンバレーレストランの記事。 www.reposadorestaurant.com google maps パロアルトでちょっといいレストラン(会食、パーティ)を予約しないとなーって時に役立つレストラン。 Fine Mexican Diningの名前の通り、洗練された高級志向のメキシコ料…

ハードウェアの速度をどう評価するか考える(1) ~クロック、OPS~

この記事の目的 現代ハードウェアの計算性能を評価する尺度であるメモリ律速の概念とルーフラインモデルについて理解を深めること。 対象読者はメモリバンド幅やOPSなどの概念があまりわかっていない人です。例えば本記事を通し、あるアルゴリズムが速度が十…

Kaggle戦記~Kaggle Masterになるまでを振り返る

https://www.kaggle.com/kyoshioka47 目的 この度約10ヶ月間Kaggleに参戦しCompetition Masterになり賞金も獲得できました。本記事では参戦したコンペ中の思考や得られた事を振り返り記録します。これからkaggleを始めMasterを目指す人の参考になればと思い…

RNNからTransformerまでの歴史を辿る ~DNNを使ったNLPを浅く広く勉強~

Amazon Prime 一ヶ月無料 Seq2seqからBERTまでのNLPモデルの歴史をざっとまとめた。 Abst. CVにもTransformer使う流れがきていたり、DeepRLやGPT-3とNLPモデルも身近になってきており、"Attention is 何?"と言えなくなってきたので勉強しました。 Feedforwar…

【壁の向こうを見通すNLoSセンシングを野外で実現】Seeing Around Street Corners: Non-Line-of-Sight Detection and Tracking In-the-Wild Using Doppler Radar

ハイライト N ミリ波レーダを使い、Non-line-of-sight(NLoS)センシングを野外で初めて実現。 壁などの裏の死角物体のセンシングを実現。例えば自動運転中にも壁の裏の歩行者などを早期発見できる技術に応用可能。 CVPR 2020 arxiv 著者グループはNLoSセンシ…

nVidia 新GPU A100についての情報まとめ

amzn.to nVidiaの新データセンター用GPU、A100がリリースされました。 このチップをベースとしてコンシューマー用GPU(RTX3xxx)もリリースされるのでしょう。 備忘録的にどのような新機能があるのかまとめてみました。 筆者の使用用途上AI性能にフォーカスし…

Pseudo-LiDAR from Visual Depth Estimation: Bridging the Gap in 3D Object Detection for Autonomous Driving

密、かつ高精度な点群をステレオカメラによって得る研究。Depth prediction Networkの提案により高精度な点群の生成に成功している。 従来のステレオカメラは深度情報(カメラからの距離)のみしか得られなかったが、この研究では3D点群(つまりX,Y,Z座標)…

dToF/iToF LiDARの原理や製品について

www.amazon.co.jp 記事の目的 LiDARとはLight Detection and Rangingの略で光を使った距離測定技術の総称です。 RADARが電磁波を使って距離を測るのに対して、光を使った距離センサを指していると考えて差し支えないです。 特に本記事ではdToFとiToF LiDARの…

Tracking Objects as Points (CenterTrack)

なんの論文? CenterNetの著者からの最新論文。CenterNetと同様にシンプルなアプローチながら、有効性や応用性が高く様々な研究で使われるようになりそう。 前作CenterNetはPointを用いた物体検出であったが、今回は同様のPoint-baseのネットワークでトラッ…

ステレオカメラの原理、信号処理について

WIP

はじめに ステレオカメラの信号処理について詳細に記述しているメディアは少ない。 一方で現行のステレオカメラで最高の精度を誇るEnsensoのwhitepaperは非常に参考になる。 Obtaining Depth Information from Stereo Images 原理 ステレオカメラ自体の原理…

PointPillars技術について

3D

PointPillars: Fast Encoders for Object Detection from Point Clouds PointPillarsとは2018年に提案された3D物体検出技術、または点群ニューラルネット技術です。 従来技術よりも高速かつ遥かに高精度で精度ー計算量のバランスが良く、現在多くの3D物体検…

Class-balanced Grouping and Sampling for Point Cloud 3D Object Detection

3D

Class-balanced Grouping and Sampling for Point Cloud 3D Object Detection https://arxiv.org/pdf/1908.09492.pdf 現在のNuscenes一位のソリューション。 課題 LiDARデータのaugumentationの提案が主に精度向上の要因。 Nuscenesはクラス間精度の平均が評…

Learning in the Frequency Domain

Learning in the Frequency Domain https://arxiv.org/abs/2002.12416 Alibaba CVPR 2020 accepted 課題 入力画像を空間領域で扱うのはファイルサイズが大きいため、従来ネットワークは224x224x3と小さいサイズに変換。元の画像サイズ(440x440x3)に対し空間…

今年読んで楽しかった技術書10冊

今年読んで楽しかった技術書10冊 リスト 脳・心・人工知能 数理で脳を解き明かす 意味がわかる統計解析 決算書分析2020 つくりながら学ぶ! PyTorchによる発展ディープラーニング Kaggleで勝つデータ分析 はじめてのパターン認識 きつねさんでもわかるLLVM は…

10 computer vision papers I enjoyed reading in 2019.

10 computer vision papers of 2019. I would like to list my 10 computer vision papers I enjoyed reading this year. The papers are picked from favorites from Mendley app (great app!). The papers are picked from my opinions, which I think man…

Shabuway

しゃぶうぇいとは shabu 某サンドウィッチチェーンをもじったくっだらない店名のしゃぶしゃぶチェーン店がシリコンバレーバレーにはある(そしてとても美味しい)。嘘が真かはわからないのだが、しゃぶしゃぶは炙るときに肉の油が湯に溶けるためとてもヘルシ…

Impossible Burger

シリコンバレーのテクノグルメ シリコンバレーグルメの中でも日本で味わえないレストランの一つにインポッシブルバーガーがある。イーロンマスクも投資したImpossible Foodのレストランである。 不可能なハンバーガー この店名は直訳すると”不可能なハンバー…

海外を目指す若者たちへ。

海外を目指す若者たちへ。 私は2017-2018年の間スタンフォード大学に客員研究員として一年間留学していました。海外を目指す若者たちへ、海外留学や就職のススメとして本稿を寄稿します。 実際シリコンバレーという名前はよく聞くものの、どんなところか具体…

Dish'n Dash シリコンバレー中東料理のススメ

What's Dish'n Dash? シリコンバレーに来たら是非挑戦したい中東系レストランの"Dish'n Dash"。 これはSunnyvaleにある予約必須店"Dish Dash"の廉価版。 といっても味のクオリティはかなり高い。 個人的には何を頼んでも美味しく、日本人好みの味なんじゃな…

Orenchi Ramen "Tonkotsu base" Five stars!

ホーム感あふれる看板で出迎えてくれるOrenchi Ramen. 読める人いないんじゃww 寂れたショッピングセンターの一角にあります。 日本州あふれるけど店内のお客様はほとんどnot-japanese。 店内のwaiting space. Credit: Yelp Yelp: https://www.yelp.com/bi…