20220622
予定
CRNN
- とりあえずCRNNの写経をする
- 多分すぐ終わるというか終わりたい。
- GitHub - meijieru/crnn.pytorch: Convolutional recurrent network in pytorch
- https://github.com/clovaai/deep-text-recognition-benchmark
これ読む
サブミットする
集合部分読む
week7の課題を作ってみる。
ありがたい資料です。 課題以外はすべてのweek解いたので一応最後のだけはしたい。 ソフトウェア1 (2021)
draw.ioでモデル図を書く
Draw.ioについて語ります。
導入きっかけ
大学を卒業し無事powerpointが使えなくなってしまったため代用先として何かいいものはないか模索していたのがきっかけです。現状、powerpointはwin用の学生版を買ってしまい、macbookでpowerpoint、デスクで何かするみたいなことができないです。mac用のも買えば済む話ですが、それならoffice365のサブスクを買った方が良かったです。。。
Draw.ioの導入方法
vscodeで書く方法で行いました。
これでいけるはず。
どんな風に書けるの?
こんな感じ。これを書くのに約5-10分程度でした。ショートカットキーとか操作になれればもっと高速だったり綺麗に書けそう。論文に載せれそうな完成度です。学生の頃からモデル図はこれで書けば良かったのでは感があります。
表はこんな感じ。3x3じゃない方法がわかなくておしまい。
終わりに
半日程度で使用にはなれると思います。多分。
ほとんどわかっていないのですが、ctrlキーで矢印をビヨーンとするのがコツだと思います。
今月の課題図書
読む本
はじめに
読むと宣言したほうが読めるのではないかと思いました。
実は今年、読む本は積読状態で(年始のDMMセールで買ったのとか)すでに買っている
のでどんどん読んで消化していきたいです。
今年はおそらく、勉強関係の本はこれと英語の学習書以外買わない予定です。
今月読む本
達人に学ぶDB設計
会社でWeb関係をしているのでDBの知識付けなきゃで読む本です。
実体で学ぶゲーム3D数学
ゲーム?と思いますが中身はCVとCGで扱う線形代数と幾何学とC++のコード
例で構成されています。また、分厚い本だと最初は思いましたが100ページ読んだ感じだと、座標の誕生の歴史とか、線形代数にしてもベクトルの一次元の場合などから始まり中身が丁寧なのでこの厚さでした。そのため、読み進めるのが困難なところは今はないです。
今月読めたらいいなの本
webを支える技術
Web関係をしているので知識をつけるという目的で読む。
www.amazon.co.jp
Effective Python
EffectiveシリーズはEffective C++がありますがそのPython版です。
この本の第一版は大学時代に半分ぐらい読んでいましたが、その第一版から増補されいるようです。前は項目60ぐらいだったし、厚さも半分ぐらいでした。
Pythonicなコードが紹介されいていてpythonで綺麗で効率が良いコードを書く場合は読んでおいて損はなさそうです。ただし、pythonはある程度書けることができるのが前提だと思います。なのでpythonの2冊目以降の本なのかと思います。また、numpy、pandasとかpytorchをEffectiveに書く本でもないです。pythonの組み込みモジュールでEffectiveという本です。
一度はそのケースに関しては実装経験がない場合は難しいと思うのですべて、読めなくてもいいと思っています。しかし、最低でもオブジェクト指向な部分、すなわち5, 6章は読みたいです。
個人的な話ですがWeb関係の仕事ではGoやJavaではなくpythonで実装しているので一石二鳥な本です。
エフォートレス思考
評判だと良さそうな感じなので読もうかなと言う感じです。
推し武道
1巻を見た感じ普通に良かったので通勤途中に読みます
EASTの続き
前回
こんな感じで写経を開始しました。
どんな状況
写経というか学びたいコードが2つあるのですがEASTの方はとりあえず写経と理解はだいたいできたのでまとめたいと思います。
学習に関しては、前にしたことがありでしっかり学習が行えることや可視化して検出できるていることを確認できているので飛ばす予定。
学んでいるなかでData Augmentationのところが難しいので次に学ぶとしたらそこかなと思いました。
EASTは4座標を扱うため必然的にkeypointな画像の加工をする必要がありなかなか大変です。。
予定
目標
2022年の目標として画像認識で強くなりたいのでとりあえず以下をこなす予定
写経-1
EASTは文字検出の深層学習モデルで提案されている。その再現実装コードの理解をして何かまとめようかと思っています。1月中に確実にはできそう。ついでにEASTは角度有りの物体検出ができる。
写経-2
kaggle GMのpudae氏がkaggleコンペのunderstanding_cloudで1stを取ったコードであるがオブジェクト指向で学習パイプラインを作成しているので他コンペでも流用できて良さそう。このようなオブジェクト指向なパイブラインとしてmmdetectionが挙げられるがさすがに大規模すぎる間がある。一方でpudae氏のコードはkaggelのパイプラインとしては十分な書き方であるし、大規模ではないので入門には良さそう。
2021_08_20
何もしていない 寝る
2021_08_18
弓と禅を読んだ。
他何もせず
とりあえずMbnetv2からはじめて書くからTorchで書いている。早い段階でJaxで書きたい。
これの写経、明日には書けるはず
github.comtimm はこのあたりはclass EfficientNetBuilderの部分で実装しているがわかりづらいね。
(EfficientnetとかNAS系でのmodel全部、MVNetv3)使えるっぽいが。
# おカネの消費
0円