mmediting(新mmagic)のインストール方法
最初mmagicをインストールしたのですが、手元の環境ではデモがうまく動作しなかったため、旧体制のmmeditingをインストールすることとしました。
mmagic(mmediting)では、以下のような画像や動画の処理が可能です。
githubからクローンしようとしてくると、新しい体制mmagicのものが得られてしまうので、以下のサイトから落としてきました。
また、mmcv-fullのbuildも私の環境ではエラーを吐いて、すぐには動作しそうになかったため、prebuiltのものをインストールすることとしました。cudaのバージョンが合っていないですが…動いているのでよしとしました。
下記サイトを参考にさせていただきました。
NDLOCR 日本語 OCR を Windows で動かすメモ
いろいろな画像系機械学習機能が手軽に使える mmeditingの使いかた #SuperResolution - Qiita
- conda install -c "nvidia/label/cuda-11.8.0" cuda-toolkit
- pip install torch==1.13.1+cu117 torchvision==0.14.1+cu117 torchaudio==0.13.1 --extra-index-url https://download.pytorch.org/whl/cu117
- pip install mmcv-full==1.7.1 -f https://download.openmmlab.com/mmcv/dist/cu117/torch1.13.0/index.html
- pip3 install openmim
- git clone https://github.com/open-mmlab/mmediting.git
- cd mmediting
- pip3 install -e .
今度、mmagicの方もきちんと試したい。
ありがとうございました。
Stable Diffusionのwebuiの動作が重かった件
Stable Diffusionをローカル環境で試していたのですが、拡張機能を使い始めたあたりからwebuiの反応速度が遅くなり、思うように使えていませんでした…
結論としては、ブラウザのキャッシュが悪さをしていたようで、Chromeのシークレットウィンドウ(EdgeならInPrivateウィンドウ)で開いたら解決しました!
Chromeの拡張機能をオフにしたり、Stable DiffusionのDocker版を試したり、ネットで調べてみたり、諸々試したがなかなか解決せず…ですがBingAIに尋ねたら一発でした(ちなみにBingで表示されたリンク先にはそのような情報は記載されておらず、あくまで一般的な解決方法として、提案された模様)。
同じような状況にある方の参考になればと思い記事にしました。
Stable Diffusionの営利目的の使用は有償化されましたね。デジタルツールでは、まずは無償で使わせて、有償化する流れが結構ありますが、Stable diffusionも遂にという感じです。
ありがとうございました。
画像の次は動画! これから話題となる生成AI ⁈
画像生成AIのStable diffusionやMidjouney、その後、言語生成AIのCHATGPTなどが世間を騒がせてから1年が経ちました。
私は研究対象として身近に感じておりましたが、より多くの方にとって深層学習という技術に基づくAIを身近に感じていただくことが増えたのではないでしょうか?
そして、最近様々な機関から動画に関する発表がなされているので、いくつかまとめて紹介したいと思います。
今回紹介するのは以下の4つです。
- Stable Video Diffusion (2023/11/21)
- MagicAnimate (2023/11/27)
- AnimateAnyone(2023/11/28)、anymate anything(2023/11/21)
- AnimateDiff (2023/06/10)
一つ目の Stable Video Diffusion は、名前からも察せられるかと思いますが、画像生成AIで話題になった Stable Diffusion 、それを開発したStability AIが報告しているツールです。研究用途のみで商用利用はできませんが、静止画像から動画を生成することができます。ただし、動画の動きを指定することは現状できません。Stable Diffusionの印象を損なわないように注意を払っているのか、全体的に動画が綺麗な印象を受けます。
二つ目は、TikTokの運営会社「ByteDance」が開発したMagicAnimateで、商用利用が可能です。これは、1枚の人物の静止画と動作動画を組み合わせることで、被写体を動かすことができるツールです。モナリザが走り出す様は笑えてしまいます。
vid2denseposeというツールを使うことで独自の動作動画が作れます。
三つ目は、中国を代表するテック企業アリババが開発した AnimateAnyone と anymate anything です。AnimateAnyone は、MagicAnimateと似たようなツールですが、コード等まだ公開されていない状況です。anymate anything は 、Stable Video Diffusion と似たようなツールですが、商用利用が可能であり、 labelme というツールと組み合わせて動画化したい場所を指定可能で、言語で動きを指定することができます。生成される絵のクオリティや言語による指定は課題ありという感じですが改良されれば使い勝手は良さそうです。
四つ目は、上海のAI研究機関、中国、アメリカの大学によって報告されている 商用利用可能な AnimateDiff です。時期は他のものと比べて早い時期に報告されており、既にバージョン3となっています。静止画と言語によって動画が生成されます。
私は、画像や動画などの分野に関しては、化合物、自然言語等の領域に比べると勉強が足りておりませんが、これを機に勉強しなければと思いました。
また、動画は何枚もの画像が組み合わされて作られているので生成時間も比較的かかり、よりよいアーキテクチャやGPUが今後も追及されていきそうです。
ありがとうございました。
ポイントサイト利用してますか?
こんにちは。皆さんはポイントサイト利用してますか?
昨今は「ポイ活」という形でメディアに取り上げられることもありますね。
私は高校生時代にパズドラ等アプリを実質無課金でプレイするのに利用しておりました。
大学生になってからはバイトを始めて、そういったサイトはお金がない高校生のものと思って利用していなかったのですが、社会人になったタイミングで再度利用するようになりました。ポイ活サイトは寧ろお金を持っている社会人こそ有効活用することで、ポイント還元の恩恵を受けられます!
私は、moppyというサイトを利用しています。2005年から運営されている日本最大級のポイントサイトです。長くサービスを提供続けていて、学生時代にお世話になったのもこのサイトで非常に安心感があります。ポイントの交換先が充実しているのも重要です!
以下の紹介コードを入会時に入力いただくと紹介特典が双方にもらえますので、記事が参考になった際には、入力いただけますと幸いです!
TVfde166
それでは、ポイントサイトでどのような恩恵が得られるかいくつか例を挙げます。
- Yahoo!ショッピング、楽天市場など、日々のお買い物がよりお得に(+1.0%等)
- 登録、契約をよりお得に(数百~数万ポイント)
- 証券会社登録、クレジットカード発行、不動産投資相談(数千~数万ポイント)
1. はネットショッピング利用者にお勧めの使い方です。ネットショッピングで会計をする前に、ポイントサイトを経由することで、ネットショッピングで貯まるポイントとは別に追加でポイント獲得できます。普段、ネットショッピング使わないよ、という方もふるさと納税を行う際など高単価なものを買う際に使うだけでも恩恵が得られると思います!
2.は何か新しいことを始める、サイトを利用する際に一度ポイントサイトに案件がないかを確認して、あれば利用するというものです。例えば、ネットショッピングサイト、動画サイト(U-NEXT, Diseny+, ABEMAなど)、グルメサイト(ホットペッパー、ペイペイグルメなど)、回線契約など、登録時・契約時にポイントサイトを経由することで、お得に初回利用ができます。
3.はポイ活に興味がある方は、資産運用にも興味がある方も多いと思います。証券会社の登録や利用するクレジットカード、不動産投資などお金に関わることは高単価な案件として掲載されているので、多くのポイントを獲得できます!ただし、ポイント還元の条件が難しいものものあるので、条件は事前に確認が必要です。
その他にも、アンケート回答やゲームでもポイントを貯められるます。上記のような案件の方が効率はいいのですが、学生時代にコツコツポイントを貯める際には利用していました。
私の場合は社会人になってすぐに、年会費無料のクレジットカード発行、証券会社やFX会社は登録自体は無料なので、そのような案件の登録と最小限の取引等を行い、条件を満たしたタイミングで不動産投資の相談などでサイトを利用しました。
FXはレバレッジが効いて思ったよりも多くのお金の損失をしてしまったり、不動産投資で変な物件を勧めたりする場合もありますので、そのあたりは十分に注意したうえでご利用ください!そのような案件を使わずとも十分ポイントサイトの恩恵は受けられると思います。
得られたポイントは現金還元したり、別のポイントに還元できます。多くの場合1ポイント1円相当ですが、いくらかお得に交換できるものもあるので、また時期によって増量することもありますので、適宜サイトをご確認ください。
ありがとうございました。
年金追納(学生納付特例)をするか否か
皆さんは、年金を満額納めていますか?
ここで言う年金は老齢基礎年金のことで、全期間である20~60歳までの40年間(480ヶ月)に支払った月数に応じて、将来受け取ることができる年金です。
式は以下になります。
年間受給額=老齢基礎年金の満額×納付月数÷480ヶ月
もし、満額納めていた場合は、79万5000円(令和5年度老齢基礎年金※)、大学院までの5年間(60ヵ月)を納付しなかった場合は、 7/8 (=87.5%)の額の69万5625円が受け取れる金額に相当します。現在の価値で年間約10万の差が生じます。
※年齢によって多少条件が異なります。詳しくは日本年金機構の情報をご確認ください。
https://www.nenkin.go.jp/index.html
私は学生時代に学生納付特例を申請して、大学院卒業までの5年分、約100万をまだ納めていません。ちなみに追納の期限は10年なので私はそろそろ期限が近いです。
追納をしていない理由としては、下記が挙げられます。
①入社して間もない頃の100万は大金
②追納は社会保険料控除の対象となる
③国に納めるべきか判断に迷う
①については、入社してからNISA(積み立てではない)で投資を始め、100万を運用に回した方が良いと判断したためです。追納が遅くなると支払い額が加算されますが、運用に回して得られる利益の方が大きいだろうと判断しました。
②については、年収が上がってきた頃の方が、税率が上がりやすく、社会保険料控除によって、払う税金を抑える効果がより効果的に働くと判断したためです。
③は超高齢化社会や政治の状況など、年金を払っておく意味があるのか吸われるだけではないのか、社会人を経験して、最終的に判断したかったためです。
単純計算をすると、年金受給開始から10年経てば追納分を回収できることになります。
ただし、資産運用を行った場合、全世界株式の平均利回りは6~7%と言われていますので、30年の運用と考えた場合下記になります。
追納の有無を年間約10万の差で考えると50年以上年金生活しないと、回収しきれない計算になります(-_-;)
実際には、30年の間で円の価値、物価、年金の額も変わるので、何とも言えないとは思いますが。
年金について調べているうちに老齢基礎年金保険料の変遷の資料を見つけました。この資料を見ると、現在年金生活をしている人は、若いうちは数百円~数千円の投資で数万円の基礎年金をもらえており、驚くべき利益率ですね!・・・
結論としては、複利効果による恩恵や年金受給開始年齢の引き上げ、日本への信用を考えると引っかかる部分もありますが、満額投資できるなら念のため追納は行おうと思っています(87.5%⇒100%)。ただし、最終的には別の決断をするかもしれません(笑)
ありがとうございました。
プログラミングの始め方(最初の一歩編)
とにかくよくわからないけど、プログラミングを始めてみたいという方向けに、私の経験を踏まえて方法を3つ紹介します。
一つ目は、ブログを始めるという方法です。
なぜブログかと言いますと、WebページはHTMLというコードで書かれています。今開いているWebページを右クリックで保存してメモ帳で開くと<html></html>のようなコードが確認できると思います。
ブログを書いている人は皆このコードを書いているかというとそうではなく、Wordで文書を作成するように書いている人が多いと思います。しかし、ブログ編集画面では、画像のように「見たまま編集」と「HTML編集」の両方の機能が備わっていることが多く、これらを比較することでプログラムの動作について学ぶことができると思います。まずは、ブログを書きながらところどころ、HTML編集をしてみることで感覚がつかめるのではないかと思います。私は学生時代にサークルでWebページ制作を行っていたことがきっかけでプログラミングを身に付けました。
二つ目は、Google colabというものを使う方法です。
Googleが提供しているツールで、Webブラウザ上でステップバイステップでプログラムを実行できるインターフェースです。プログラミング初心者も学びやすいPythonが実行できます。詳細な使い方は、リンク先に説明があるのでいろいろいじってみてください。ちょっと変にいじってしまっても、リンク先では再読み込みを行えばすぐにリスタートできます。
一つ目のブログ、二つ目のGoogle colab、いずれにも共通することなのですが、いきなりプログラミングに触れるのが特徴です。
本格的にプログラミングを始める場合には、「環境構築」と呼ばれる、プログラムを動かすための実行環境を作るところから始めることが多く、環境構築は使うプログラミング言語やOS(Windows, Mac, Linuxなど)によって異なる場合もあり、これに苦戦して挫折することが多いため、Web上で気軽に行える上記の方法を紹介しました。
最後三つ目は、CHATGPTをはじめとしたLLM(Large Language Model)に教わる方法です。
私は専門が化学なので、プログラミングは学生時代に独学で身に付けたのですが、LLMがある時代であったらどれだけ捗ったことか・・・と思います。悔しくて仕方ありません。
以下は、CHATGPTに始め方を聞いてみた結果です。
複利効果の話
初めての記事。とりあえず発信。
凄く基本的な話で恐縮ですが、「複利効果」は大事なことだと思うので最初の記事にしようと思いました。
ChatGPTに複利効果ついて、説明してもらうと以下のような内容が得られました。
複利効果とは、元金についた利子にさらに利子がついていくことで、お金がどんどん増えていくことを言います。例えば、100円を年利1%で1年間預けると、1年後には101円になります。この101円を再度預けると、次の年には102.01円になります。つまり、元金だけでなく、利子にも利子がつくことで、お金がどんどん増えていくのです。
ちょっと補足すると、1%を2年積み重ねると1%×2年=2%と概算だとなりますが、実際には最初の1年の1%がお釣りとしてもらえて2.01%になるので、+0.01%お得という話です。
たった0.01%ですが、「塵も積もれば山となる」です。
この複利効果を極端に考えて、毎日1%の利益が得られる場合を考えます。
一日1%、一週間7%、一か月35%、三か月145%、半年500%、一年3678%
365%ではなく、3678%と10倍以上になる。極端な例ですが、恐ろしい差ですよね。
一応数式も示しておきます。
固定:
複利:
上記は極端な例ですが、世界のGDPやアメリカの成長率をベースに5, 10, 20, 30年後の利益を算出してみるとより現実的な値が得られます。
最近は生成AIが話題ですが、AI分野ではテック企業は取り貯めてきたデータを基に、データを生み出す資産活用が行われています。既にデジタル分野では大きな国力差が開いていますが、日本が得意としていたモノづくりを中心にきちんとデータ活用していきたいですね。
この記事を見た方々へ。「資産運用」について、一緒に学んでいきましょう!今日が人生で一番若い日です。合言葉は「長期・積立・分散」です。
ありがとうございました。