TECHNOLOGY NLP AI

画像生成AIと代表的なソフトウェア【DALL-E, Midjourney, Stable Diffusion, Adobe Firefly, Bing Image Creator, Leonardo.Ai】

悩んでいる人

画像生成AIと代表的なソフトウェアを教えて!

こういった悩みにお答えします.

本記事の信頼性

  • リアルタイムシステムの研究歴12年.
  • 東大教員の時に,英語でOS(Linuxカーネル)の授業.
  • 2012年9月~2013年8月にアメリカのノースカロライナ大学チャペルヒル校(UNC)コンピュータサイエンス学部で客員研究員として勤務.C言語でリアルタイムLinuxの研究開発.
  • プログラミング歴15年以上,習得している言語: C/C++PythonSolidity/Vyper,Java,Ruby,Go,Rust,D,HTML/CSS/JS/PHP,MATLAB,Assembler (x64,ARM).
  • 東大教員の時に,C++言語で開発した「LLVMコンパイラの拡張」,C言語で開発した独自のリアルタイムOS「Mcube Kernel」GitHubにオープンソースとして公開
  • 2020年1月~現在はアメリカのノースカロライナ州チャペルヒルにあるGuarantee Happiness LLCのCTOとしてECサイト開発やWeb/SNSマーケティングの業務.2022年6月~現在はアメリカのノースカロライナ州チャペルヒルにあるJapanese Tar Heel, Inc.のCEO兼CTO.
  • 最近は自然言語処理AIイーサリアムに関する有益な情報発信に従事.
    • (AI全般を含む)自然言語処理AIの論文の日本語訳や,AIチャットボット(ChatGPT,Auto-GPT,Gemini(旧Bard)など)の記事を50本以上執筆.アメリカのサンフランシスコ(広義のシリコンバレー)の会社でプロンプトエンジニア・マネージャー・Quality Assurance(QA)の業務委託の経験あり.
    • (スマートコントラクトのプログラミングを含む)イーサリアムや仮想通貨全般の記事を200本以上執筆.イギリスのロンドンの会社で仮想通貨の英語の記事を日本語に翻訳する業務委託の経験あり.

こういった私から学べます.

AIのプログラミング言語「C++/Python言語」を学べるおすすめのWebサイトを知りたいあなたはこちらからどうぞ.

独学が難しいあなたは,AIを学べるオンラインプログラミングスクール3社で自分に合うスクールを見つけましょう.後悔はさせません!

国内・海外のAIエンジニアのおすすめ求人サイトを知りたいあなたはこちらからどうぞ.

国内・海外のプロンプトエンジニアのおすすめ求人サイトを知りたいあなたはこちらからどうぞ.

画像生成AIとは

画像生成AIとは,テキストから画像(text-to-image)を生成するAIのことです.

つまり,テキストでどのような画像を作ってほしいのか命令を出すことで,それにマッチした画像をAIが作成します.

画像生成AIはGenerative AIの1つです.

Generative AIを知りたいあなたはこちらからどうぞ.

Generative AIにおける文章作成AIとしてAIチャットボットが挙げられます.

AIチャットボットを知りたいあなたはこちらからどうぞ.

画像生成AIで利用される主な技術

画像生成AIで利用される主な技術を紹介します.

※他にも変分オートエンコーダー(VAE:Variational Autoencoder)自己回帰モデル(Autoregressive Model)など,画像生成AIに使われるモデルがあります.

敵対的生成ネットワーク(GANs:Generative Adversarial Networks)

敵対的生成ネットワーク(GANs:Generative Adversarial Networks)は,2つのニューラルネットワークのGenerator(生成器)とDiscriminator(識別器)を利用して新しい画像を生成する手法です.

Generatorはランダムノイズから始まり,画像を生成しようとします.

Discriminatorは,Generatorが生成した画像と本物の画像を区別するために訓練されます.

Generatorは,Discriminatorが生成した画像を偽物として判定しないように,訓練を繰り返します.

この訓練では,Generatorが本物の画像に近い画像を生成できるようになるまで繰り返されます.

GANsの応用としては,画像生成だけでなく,画像修復,超解像度,画像変換などがあります.

GANsの解説記事です.

GANsの解説動画です.

こちらのGANsの解説動画は英語ですが,GANsの提案者「イアン・グッドフェロー」の動画ですので,是非観ましょう!(スライドはこちら

拡散モデル(Diffusion Model)

拡散モデル(Diffusion Model)とは,画像生成AIで利用される拡散確率モデルです.

拡散モデルの論文は「Denoising Diffusion Probabilistic Model」になります.

拡散モデルの解説記事は以下になります.

拡散モデルの解説動画は以下になります.

画像生成AIの代表的なソフトウェア

画像生成AIの代表的なソフトウェアを紹介します.

これらのソフトウェアは,主に拡散モデルを利用しています.

DALL-E

DALL-Eは,OpenAIが開発した画像生成AIです.

DALL-Eのバージョンは以下になります.

  • 2021年:DALL-Eをリリース
  • 2022年:DALL-E 2をリリース
  • 2023年:DALL-E 3をリリース

DALL-Eの解説動画です.

Midjourney

Midjourneyは,2022年にMidjourney, Inc.が開発した画像生成AIです.

2023年3月にドナルド・トランプのディープフェイクにMidjourneyが利用されたことで話題になりました.

Midjourneyの解説動画です.

Stable Diffusion

Stable Diffusionは,2022年にルートヴィヒ・マクシミリアン大学ミュンヘンのRobin RombachとAndreas Blattmannが開発した画像生成AIです.

Stable Diffusionを利用することで,独自画像を簡単に作成できます.

Stable Diffusionの解説や使い方は以下がわかりやすいです.

Stable Diffusionは以下のサイトで簡単に利用できます.

Adobe Firefly

Adobe Fireflyは,Adobeが提供する画像生成AIです.

Adobe Fireflyの解説動画です.

Bing Image Creator

Bing Image Creatorは,Bingの画像生成AIです.

Bing Image Creatorの解説動画はこちらです.

Leonardo.Ai

Leonardo.Aiは,無料で1日150枚まで画像生成できる画像生成AIです.

また,Leonardo.Aiは商用利用が可能です.

Leonardo.Aiの解説動画はこちらです.

まとめ

画像生成AIと代表的なソフトウェアを紹介しました.

画像生成AIの代表的なソフトウェアは,DALL-E,Midjourney,Stable Diffusionです!

AIのプログラミング言語「C++/Python言語」を学べるおすすめのWebサイトを知りたいあなたはこちらからどうぞ.

独学が難しいあなたは,AIを学べるオンラインプログラミングスクール3社で自分に合うスクールを見つけましょう.後悔はさせません!

国内・海外のAIエンジニアのおすすめ求人サイトを知りたいあなたはこちらからどうぞ.

国内・海外のプロンプトエンジニアのおすすめ求人サイトを知りたいあなたはこちらからどうぞ.

-TECHNOLOGY, NLP AI
-, , , , ,