画像生成AIと代表的なソフトウェア

2023年4月4日 2025年4月12日

悩んでいる人

画像生成AIと代表的なソフトウェアを教えて！

こういった悩みにお答えします．

本記事の信頼性

リアルタイムシステムの研究歴12年．
東大教員の時に，英語でOS（Linuxカーネル）の授業．
2012年9月～2013年8月にアメリカのノースカロライナ大学チャペルヒル校（UNC）コンピュータサイエンス学部で客員研究員として勤務．C言語でリアルタイムLinuxの研究開発．
プログラミング歴15年以上，習得している言語: C/C++，Python，Solidity/Vyper，Java，Ruby，Go，Rust，D，HTML/CSS/JS/PHP，MATLAB，Verse（UEFN）, Assembler (x64，aarch64)．
東大教員の時に，C++言語で開発した「LLVMコンパイラの拡張」，C言語で開発した独自のリアルタイムOS「Mcube Kernel」をGitHubにオープンソースとして公開．
2020年1月～現在はアメリカのノースカロライナ州チャペルヒルにあるGuarantee Happiness LLCのCTOとしてECサイト開発やWeb/SNSマーケティングの業務．2022年6月～現在はアメリカのノースカロライナ州チャペルヒルにあるJapanese Tar Heel, Inc.のCEO兼CTO．
最近は自然言語処理AIとイーサリアムに関する有益な情報発信や，Unreal Editor for Fortnite（UEFN）でゲーム開発に従事．

（AI全般を含む）自然言語処理AIの論文の日本語訳や，AIチャットボット（ChatGPT，Auto-GPT，Gemini（旧Bard）など）の記事を50本以上執筆．アメリカのサンフランシスコ（広義のシリコンバレー）の会社でChatGPT/Geminiを訓練するプロンプトエンジニア・マネージャー・Quality Assurance（QA）の業務委託の経験あり．
（スマートコントラクトのプログラミングを含む）イーサリアムや仮想通貨全般の記事を200本以上執筆．イギリスのロンドンの会社で仮想通貨の英語の記事を日本語に翻訳する業務委託の経験あり．
UEFNで10本以上のゲームを開発し，フォートナイト上で公開（Fortnite，Fortnite.GG）．

こういった私から学べます．

AIのプログラミング言語「C++/Python言語」を学べるおすすめのWebサイトを知りたいあなたはこちらからどうぞ．

: 【C++/Python言語】AIのプログラミング言語を学べるおすすめのWebサイト【初心者，中級者，上級者】【Triton/Mojo言語】【データサイエンス】

こういった悩みにお答えします．こういった私から学べます．【C++/Python言語】AIのプログラミング言語を学べるおすすめのWebサイト AIのプログラミング言語「C++/Python言語」を学 ...

続きを見る

独学が難しいあなたは，AIを学べるオンラインプログラミングスクール3社で自分に合うスクールを見つけましょう．後悔はさせません！

: AI（人工知能）を学べるおすすめのオンラインプログラミングスクール3社【AIチャットボットやAIバスケロボが作れます】

こういった悩みにお答えします．こういった私から学べます．今すぐ学びたいあなたは，AIを学べるおすすめのオンラインプログラミングスクール3社は下表になります． AI（人工知能）とは AI（人工知能） ...

続きを見る

国内・海外のAIエンジニアのおすすめ求人サイトを知りたいあなたはこちらからどうぞ．

: 国内・海外のAIエンジニアのおすすめ求人サイト【転職エージェント】【C++/Python言語】

こういった悩みにお答えします．こういった私が解説していきます．国内・海外のAIエンジニアのおすすめ求人サイト（転職エージェント）を紹介します． AIエンジニアになるためには，主にC++/Pytho ...

続きを見る

国内・海外のプロンプトエンジニアのおすすめ求人サイトを知りたいあなたはこちらからどうぞ．

: 国内・海外のプロンプトエンジニアのおすすめ求人サイト【転職エージェント】【AIチャットボット，ChatGPT，Auto-GPT，Gemini（旧Bard）】

こういった悩みにお答えします．こういった私が解説していきます．国内・海外のプロンプトエンジニアのおすすめ求人サイト（転職エージェント）を紹介します． ※プロンプトエンジニアのことを，AIトレーナー ...

続きを見る

画像生成AIとは

画像生成AIとは，テキストから画像（text-to-image）を生成するAIのことです．

つまり，テキストでどのような画像を作ってほしいのか命令を出すことで，それにマッチした画像をAIが作成します．

画像生成AIはGenerative AIの1つです．

Generative AIを知りたいあなたはこちらからどうぞ．

: Generative AI（生成AI）とは【ChatGPT，Gemini（旧Bard），NFTで利用】

こういった悩みにお答えします．こういった私から学べます． Generative AI（生成AI） Generative AI（生成AI）は，教師なし学習アルゴリズムを使って新しいデジタル画像，ビデオ ...

続きを見る

Generative AIにおける文章作成AIとしてAIチャットボットが挙げられます．

AIチャットボットを知りたいあなたはこちらからどうぞ．

: AIチャットボット（人工無能）とは【注意点も解説】【ChatGPT，Gemini（旧Bard），AI搭載Bing，LLaMA，DeepSeek】【大規模言語モデル，文章生成AI】

こういった悩みにお答えします．こういった私から学べます． AIチャットボット（人工無能） AIチャットボット（人工無能）とは，生身の人間のエージェントと直接やり取りする代わりに，テキストまたは音声合 ...

続きを見る

画像生成AIで利用される主な技術

画像生成AIで利用される主な技術を紹介します．

※他にも変分オートエンコーダー（VAE：Variational Autoencoder）や自己回帰モデル（Autoregressive Model）など，画像生成AIに使われるモデルがあります．

敵対的生成ネットワーク（GANs：Generative Adversarial Networks）

敵対的生成ネットワーク（GANs：Generative Adversarial Networks）は，2つのニューラルネットワークのGenerator（生成器）とDiscriminator（識別器）を利用して新しい画像を生成する手法です．

Generatorはランダムノイズから始まり，画像を生成しようとします．

Discriminatorは，Generatorが生成した画像と本物の画像を区別するために訓練されます．

Generatorは，Discriminatorが生成した画像を偽物として判定しないように，訓練を繰り返します．

この訓練では，Generatorが本物の画像に近い画像を生成できるようになるまで繰り返されます．

GANsの応用としては，画像生成だけでなく，画像修復，超解像度，画像変換などがあります．

GANsの解説記事です．

GANsの解説動画です．

こちらのGANsの解説動画は英語ですが，GANsの提案者「イアン・グッドフェロー」の動画ですので，是非観ましょう！（スライドはこちら）

拡散モデル（Diffusion Model）

拡散モデル（Diffusion Model）とは，画像生成AIで利用される拡散確率モデルです．

拡散モデルの論文は「Denoising Diffusion Probabilistic Model」になります．

拡散モデルの解説記事は以下になります．

拡散モデルの解説動画は以下になります．

画像生成AIの代表的なソフトウェア

画像生成AIの代表的なソフトウェアを紹介します．

これらのソフトウェアは，主に拡散モデルを利用しています．

DALL-E

DALL-Eは，OpenAIが開発した画像生成AIです．

DALL-Eのバージョンは以下になります．

2021年：DALL-Eをリリース
2022年：DALL-E 2をリリース
2023年：DALL-E 3をリリース

DALL-Eの解説動画です．

Midjourney

Midjourneyは，2022年にMidjourney, Inc.が開発した画像生成AIです．

2023年3月にドナルド・トランプのディープフェイクにMidjourneyが利用されたことで話題になりました．

Midjourneyの解説動画です．

Stable Diffusion

Stable Diffusionは，2022年にルートヴィヒ・マクシミリアン大学ミュンヘンのRobin RombachとAndreas Blattmannが開発した画像生成AIです．

Stable Diffusionを利用することで，独自画像を簡単に作成できます．

Stable Diffusionの解説や使い方は以下がわかりやすいです．

Stable Diffusionは以下のサイトで簡単に利用できます．

Adobe Firefly

Adobe Fireflyは，Adobeが提供する画像生成AIです．

Adobe Fireflyの解説動画です．

Bing Image Creator

Bing Image Creatorは，Bingの画像生成AIです．

Bing Image Creatorの解説動画はこちらです．

Leonardo.Ai

Leonardo.Aiは，無料で1日150枚まで画像生成できる画像生成AIです．

また，Leonardo.Aiは商用利用が可能です．

Leonardo.Aiの解説動画はこちらです．

FLUX.1

FLUX.1は，Stable Diffusionの開発チームであるBlack Forest Labsによって開発されたオープンソースの画像生成AIです．

FLUX.1の紹介動画はこちらです．

まとめ

画像生成AIと代表的なソフトウェアを紹介しました．

多くの画像生成AIがあることがわかりました．

AIのプログラミング言語「C++/Python言語」を学べるおすすめのWebサイトを知りたいあなたはこちらからどうぞ．

: 【C++/Python言語】AIのプログラミング言語を学べるおすすめのWebサイト【初心者，中級者，上級者】【Triton/Mojo言語】【データサイエンス】

こういった悩みにお答えします．こういった私から学べます．【C++/Python言語】AIのプログラミング言語を学べるおすすめのWebサイト AIのプログラミング言語「C++/Python言語」を学 ...

続きを見る

独学が難しいあなたは，AIを学べるオンラインプログラミングスクール3社で自分に合うスクールを見つけましょう．後悔はさせません！

: AI（人工知能）を学べるおすすめのオンラインプログラミングスクール3社【AIチャットボットやAIバスケロボが作れます】

こういった悩みにお答えします．こういった私から学べます．今すぐ学びたいあなたは，AIを学べるおすすめのオンラインプログラミングスクール3社は下表になります． AI（人工知能）とは AI（人工知能） ...

続きを見る

国内・海外のAIエンジニアのおすすめ求人サイトを知りたいあなたはこちらからどうぞ．

: 国内・海外のAIエンジニアのおすすめ求人サイト【転職エージェント】【C++/Python言語】

こういった悩みにお答えします．こういった私が解説していきます．国内・海外のAIエンジニアのおすすめ求人サイト（転職エージェント）を紹介します． AIエンジニアになるためには，主にC++/Pytho ...

続きを見る

国内・海外のプロンプトエンジニアのおすすめ求人サイトを知りたいあなたはこちらからどうぞ．

: 国内・海外のプロンプトエンジニアのおすすめ求人サイト【転職エージェント】【AIチャットボット，ChatGPT，Auto-GPT，Gemini（旧Bard）】

こういった悩みにお答えします．こういった私が解説していきます．国内・海外のプロンプトエンジニアのおすすめ求人サイト（転職エージェント）を紹介します． ※プロンプトエンジニアのことを，AIトレーナー ...

続きを見る

-TECHNOLOGY, NLP AI
-紹介, ソフトウェア, 画像生成AI

comment コメントをキャンセル

国内・海外のプロンプトエンジニアのおすすめ求人サイト【転職エージェント】【AIチャットボット，ChatGPT，Auto-GPT，Gemini（旧Bard）】

ChatGPTの始め方【ChatGPTで命令する（ジピる）とグーグルで検索する（ググる）の違いを解説】

千代浩之（ちしろひろゆき）

2019年12月まで東京大学教員．
2020年1月から現在までアメリカのノースカロライナ州チャペルヒルにあるGuarantee Happiness LLC CTO．
2022年6月から現在までアメリカのノースカロライナ州チャペルヒルにあるJapanese Tar Heel, Inc. CEO兼CTO．

2012年9月～2013年8月にマイケル・ジョーダンの母校「ノースカロライナ大学チャペルヒル校（UNC）」で客員研究員として勤務（留学）．

私の考えを語ります．

大好き：マイケル・ジョーダン，ノースカロライナ，バスケ，東京観光

専門：C言語，リアルタイムシステム，Linuxカーネル，自然言語処理AI，イーサリアム

ブログのカテゴリー紹介

夢はマイケル・ジョーダンと一緒にバスケ&ビジネス！

Go Heels!

私の商品

お問い合わせ