
Addendum to GPT-4o System Card: 4o image generationの日本語訳を教えて!
こういった悩みにお答えします.
本記事の信頼性
- リアルタイムシステムの研究歴12年.
- 東大教員の時に,英語でOS(Linuxカーネル)の授業.
- 2012年9月~2013年8月にアメリカのノースカロライナ大学チャペルヒル校(UNC)コンピュータサイエンス学部で客員研究員として勤務.C言語でリアルタイムLinuxの研究開発.
- プログラミング歴15年以上,習得している言語: C/C++,Python,Solidity/Vyper,Java,Ruby,Go,Rust,D,HTML/CSS/JS/PHP,MATLAB,Verse(UEFN), Assembler (x64,aarch64).
- 東大教員の時に,C++言語で開発した「LLVMコンパイラの拡張」,C言語で開発した独自のリアルタイムOS「Mcube Kernel」をGitHubにオープンソースとして公開.
- 2020年1月~現在はアメリカのノースカロライナ州チャペルヒルにあるGuarantee Happiness LLCのCTOとしてECサイト開発やWeb/SNSマーケティングの業務.2022年6月~現在はアメリカのノースカロライナ州チャペルヒルにあるJapanese Tar Heel, Inc.のCEO兼CTO.
- 最近は自然言語処理AIとイーサリアムに関する有益な情報発信や,Unreal Editor for Fortnite(UEFN)でゲーム開発に従事.
- (AI全般を含む)自然言語処理AIの論文の日本語訳や,AIチャットボット(ChatGPT,Auto-GPT,Gemini(旧Bard)など)の記事を50本以上執筆.アメリカのサンフランシスコ(広義のシリコンバレー)の会社でプロンプトエンジニア・マネージャー・Quality Assurance(QA)の業務委託の経験あり.
- (スマートコントラクトのプログラミングを含む)イーサリアムや仮想通貨全般の記事を200本以上執筆.イギリスのロンドンの会社で仮想通貨の英語の記事を日本語に翻訳する業務委託の経験あり.
- UEFNで10本以上のゲームを開発し,フォートナイト上で公開(Fortnite,Fortnite.GG).
こういった私から学べます.
AIのプログラミング言語「C++/Python言語」を学べるおすすめのWebサイトを知りたいあなたはこちらからどうぞ.
独学が難しいあなたは,AIを学べるオンラインプログラミングスクール3社で自分に合うスクールを見つけましょう.後悔はさせません!
国内・海外のAIエンジニアのおすすめ求人サイトを知りたいあなたはこちらからどうぞ. こういった悩みにお答えします. こういった私が解説していきます. 国内・海外のAIエンジニアのおすすめ求人サイト(転職エージェント)を紹介します. AIエンジニアになるためには,主にC++/Pytho ... 続きを見る
国内・海外のAIエンジニアのおすすめ求人サイト【転職エージェント】【C++/Python言語】
国内・海外のプロンプトエンジニアのおすすめ求人サイトを知りたいあなたはこちらからどうぞ.
Addendum to GPT-4o System Card: 4o image generationの日本語訳を紹介します.
OpenAIの4o Image Generation(ChatGPTネイティブの画像生成)がわかります.
※図表を含む論文の著作権はAddendum to GPT-4o System Card: 4o image generationの著者に帰属します.
Addendum to GPT-4o System Card: 4o image generationの目次は以下になります.
- Abstract
- 1章:Introduction
- 2章:Observed Safety Challenges, Evaluations, and Mitigations
- Authorship, credit attribution, and acknowledgments
- References
Addendum to GPT-4o System Card: 4o image generationを解説しつつ,私の考えも語ります.
私の日本語訳の注意点は以下になります.
- 概要は英語と日本語を両方掲載しましたが,本文は私の日本語訳のみを掲載していること(英語で読みたいあなたは原文を読みましょう!)
- 基本的には原文の直訳ですが,わかりにくい箇所は意訳や説明を追加している箇所があること
- 原文の「Authorship, credit attribution, and acknowledgments」(謝辞)は省略していること
- 本文中に登場する表記「[1]」などは参考文献ですので,興味がある方は本記事の参考文献を参照されたいこと
それでは,Addendum to GPT-4o System Card: 4o image generationの本文を読みすすめましょう!
目次
1章:Introduction(はじめに)
4o Image Generationは,我々の以前のDALL-Eシリーズのモデルよりも大幅に高性能な新しい画像生成アプローチである.
フォトリアリスティックな出力が可能である.
画像を入力とし,変換することができる.
画像にテキストを確実に組み込むなど,詳細な命令に従うことができる.
そして,我々のオムニモーダルGPT-4oモデルのアーキテクチャの奥深くにネイティブに組み込まれているため,4o Image Generationは,繊細で表現力豊かな方法でこれらの機能を適用するために知っているすべてを使用することができ,美しいだけでなく,有用な画像を作成することができる.
4o Image Generationは,既存の安全インフラや,DALL-EやSoraのデプロイで学んだ教訓から恩恵を受けている.
同時に,これらの新機能は新たなリスクももたらす.
このGPT-4o System Cardの追加は,我々が注目した限界的なリスクと,それらに対処するために行った作業について説明する.
※我々のPreparedness Frameworkに従い,4o Image Generationのローンチは,GPT-4oのために当初実施されたPreparedness評価以上の追加的なPreparedness評価の引き金にはならなかった.
2章:Observed Safety Challenges, Evaluations, and Mitigations(観察された安全上の課題,評価,緩和)
2.1節:Safety Challenges: New risks from native image generation(安全への挑戦: ネイティブ画像生成による新たなリスク)
拡散モデルとして動作するDALL-Eとは異なり,4o Image GenerationはChatGPTにネイティブに組み込まれた自己回帰モデルである.
この基本的な違いは,これまでの生成モデルとは異なるいくつかの新しい機能を導入し,新たなリスクをもたらす.
- 画像間の変換:この機能により,4o Image Generationは1つまたは複数の画像を入力とし,関連または変更された画像を生成することができる.
- フォトリアリズム:4o Image Generationの高度なフォトリアリスティック機能により,場合によっては写真のような出力が可能である.
- 命令に従う:4o Image Generationは,詳細な命令に従い,テキストや命令図をレンダリングすることができる.
これらの能力は,単独で,あるいは新たな組み合わせで,これまでのモデルでは不可能だった方法で,多くの分野にわたってリスクを生み出す可能性を秘めている.
例えば,安全管理がなければ,4o Image Generationは,写っている人物に有害な写真を作成したり,改変したりする可能性がある.
マルチモーダルモデルとSoraおよびDALL-Eビジュアル生成ツールの経験を生かし,4o Image Generationに特有の様々な新しいリスクをマッピングし,対処した.
我々は,害を最小限に抑えながら,ユーザにとって有用で創造的な自由を最大化するよう努力している(詳しくはModel Specを参照されたい).
反復的なデプロイという我々のコミットメントに沿って,人々が実際にどのように4o Image Generationを使用しているのかについてより多くを学ぶにつれて,我々は我々のポリシーを評価し,必要に応じて調整し続ける.
いつものことだが,4o Image Generationを含む我々の製品を使用する際,ユーザは我々の使用ポリシーに従わなければならない.
2.2節:Safety stack(安全スタック)
4o Image Generationによってもたらされる独特の安全上の課題に対処するため,いくつかの緩和策が用いられている.
- チャットモデルの拒否:ChatGPTとAPIでは,プライマリチャットモデルが,ポリシーに違反するコンテンツの生成に対する防御の第一線として機能する.事後訓練の安全対策に基づいて,チャットモデルはユーザのプロンプトに基づいて画像生成プロセスのトリガを拒否することができる.
- プロンプトブロッキング:この戦略は,4o Image Generationツールの呼び出しが行われた後に実行され,テキストまたは画像分類ツールがプロンプトにポリシー違反のフラグを立てた場合,ツールの画像生成をブロックする.プロンプトを事前に特定しブロックすることで,この対策は,許可されないコンテンツの生成を未然に防ぐのに役立つ.
- 出力ブロッキング:このアプローチは,画像が生成された後に適用され,児童性的虐待素材(CSAM:Child Sexual Abuse Material)分類器と安全性に焦点を当てた推論モニターを含むコントロールの組み合わせを使用して,ポリシーに違反する画像の出力をブロックする.モニターは,コンテンツポリシーを推論するためにカスタム訓練されたマルチモーダル推論モデルである.生成後の出力を評価することで,このストラテジーは,我々のポリシーで許可されていないコンテンツをブロックすることを目的としており,許可されていないコンテンツの作成に対する追加のセーフガードを提供する.
- 未成年者に対するセーフガードの強化:我々は,18歳未満と思われるユーザーに対してより安全な体験を提供するために,上記のすべての緩和策を使用し,これらのユーザが年齢に不適切な可能性のある特定のカテゴリのコンテンツを作成することを制限するよう努める.現在,13歳未満のユーザーがOpenAIの製品やサービスを利用することは禁止されている.
2.3節:Evaluations(評価)
我々は,3つのソースからのプロンプトに対する性能を観察することで,4o Image Generationの安全スタックの安全性と有効性を評価した.
- 外部の手動レッドチーム
- 自動レッドチーム
- 実際のシナリオを使用したオフラインテスト
2.3.1項:External, manual red teaming(外部の手動レッドチーム)
OpenAIは,Red Teaming NetworkおよびScale AIから選抜された外部のレッドチームと協力して,4o Image Generationをテストした.
4o Image Generationの内部テストに続いて外部レッドチームを開始し,生のモデル能力を評価し,テストの重点分野を知らせた.
我々は,これらの外部レッドチームに,後述する分野を含む,優先順位をつけたさまざまなトピック分野の調査を依頼した.
また,モデルのセーフガードを回避するために,レッドチームが様々なジェイルブレイクや戦術を開発し,使用できるようにした.
手作業によるレッドチームを終えた後,何千もの手作業による敵対的な会話を組み合わせ,自動化された評価に変換した.
このデータセットで安全スタックを再実行し,以下の2つの主要なメトリクスを追跡した.
- not_unsafe:システムがモデルポリシーに違反する出力を出すか?
- not_overrefuse: モデルポリシーに従ったリクエストをシステムが拒否するか?

2.3.2項:Automated red teaming(自動レッドチーム)
自動レッドチームでは,上述のモデルポリシーを使用して,モデルポリシーの各部分に対するシステムの性能を調査する合成会話を生成する.
このような合成会話により,手動レッドチームだけでは不可能な,より徹底的なポリシーのシステム実装をテストすることができる.
我々は,手作業によるレッドチームのテスト作業を補完するために,画像のアップロードの有無にかかわらず,さまざまなカテゴリーにわたって何千もの合成会話を生成した.

これは,人間によるレッドチームのデータと同様の性能を示しており,我々のポリシーがさまざまな会話で一貫して機能していることをさらに確信させてくれる.
2.3.3項:Offline testing using real-world scenarios(実際のシナリオを使用したオフラインテスト)
また,製品環境におけるモデルの動作を評価するために,実世界のシナリオを反映したテキストプロンプトで4o Image Generation安全スタックを評価した.
これは,実際の製品現場で遭遇する分布の代表的な評価にするために,異なる安全カテゴリにわたる例を含む.
これにより,実稼働状態におけるモデルの性能を理解し,追加的な安全対策が必要となる可能性のある領域を浮き彫りにすることができる.

2.4節:Discussion of specific risk areas(特定のリスク分野についての議論)
2.4.1項:Child Safety(子供の安全)
OpenAIは,子供の安全リスクへの対応に深くコミットしており,4o Image Generationを含むすべての製品において,児童性的虐待コンテンツ(CSAM:Child Sexual Abuse Material)の防止,検出,報告を優先している.
児童安全分野におけるOpenAIの取り組みは,Thornの勧告に従ったレッドチーム,およびファーストパーティとサードパーティの両方のユーザ(APIとエンタープライズ)のための,すべての入力と出力にわたるCSAMのための強固なスキャンを含む.
4o Image Generationにおける子供の安全に関する具体的なモデル方針には,以下のようなものがある.
- ローンチ時は,アップロードされた写実的な子供の画像の編集は許可されない.今後,安全に編集を許可できるかどうかを評価する.
- 我々は,画像編集と画像生成の両方について,児童性的虐待素材(CSAM:Child Sexual Abuse Material)に対する既存の保護を強化した.
検出メカニズム
子供の安全では,テキスト入力と画像入力で3つの異なる入力緩和策を活用している.
- すべての画像アップロードについて,Thornが開発したSaferと統合し,既知のCSAMとの一致を検出する.一致が確認されたものは拒否され,NCMECに報告され,関連するユーザアカウントは禁止される.さらに,ThornのCSAM分類器を利用して,画像アップロードと4o Image Generationで生成された画像の両方で,潜在的に新しい,ハッシュ化されていないCSAMコンテンツを識別する.
- 我々は,マルチモーダルモデレーション分類器を活用して,未成年者を含む生成された性的コンテンツを検出し,ブロックする.
- 4o Image Generationでは,Soraで使用している既存の18歳未満分類器をベースに,フォトリアリスティック人物分類器を構築し,アップロードされたすべての画像を解析して,未成年が写っているかどうかを予測する.ローンチ時には,フォトリアリスティックな未成年者の画像編集でない場合に限り,子供のフォトリアリスティックな生成が許可される.さらに,子供のフォトリアリスティックな生成は,我々のすべてのポリシーにわたる安全性の制約に従わなければならない.
フォトリアリスティック人物分類器は,アップロードされた画像を取り込み,3つのラベルのいずれかを予測する.
- フォトリアリスティックな人物なし
- フォトリアリスティックな大人
- フォトリアリスティックな子供
画像にフォトリアリスティックな大人とフォトリアリスティックな子供の両方が含まれている場合,分類器は予測として「フォトリアリスティックな子供」を返すように設計されている.
以下は,[子供|大人]と[フォトリアリスティック|非フォトリアリスティック]のカテゴリーにまたがる4000枚近い画像を含むデータセットに対する分類器の評価である.
現在のところ,我々の分類器は高い正確性を誇っているが,画像の分類を誤ることがある.
例えば,若く見える大人が誤って子供と分類されることがある.
安全のため,我々は,境界線や曖昧なケースを「子供」と分類することで,慎重さを保つように分類器をチューニングする.
将来的には,より良いモデルとより良い評価セットを用いて,分類器の性能を向上させることを約束する.

2.4.2項:Artist Styles(アーティストスタイル)
このモデルは,あるアーティストの名前がプロンプトに使われると,そのアーティストの作品の美学に似た画像を生成することができる.
このことは,クリエイティブなコミュニティにおいて重要な疑問や懸念を引き起こしている.
これを受けて,4o Image Generationがクリエイティブコミュニティでどのように使用されているかをより深く知るために,このバージョンの4o Image Generationでは保守的なアプローチを選択した.。
我々は,ユーザが生きているアーティストのスタイルで画像を生成しようとしたときにトリガーされる拒否を追加した.
2.4.3項:Public Figures(公人)
4o Image Generationは,多くの場合,テキストプロンプトのみに基づいて公人の描写を生成することができる.
ローンチ時では,我々は成人の公人の画像を生成する機能をブロックしないが,その代わりに,我々が人物のフォトリアリスティックなアップロードの画像を編集するために実装しているのと同じセーフガードを実装している.
例えば,未成年である公人のフォトリアリスティックな画像の生成や,暴力,憎悪に満ちた画像,違法行為の命令,エロティックなコンテンツ,その他の分野に関する我々のポリシーに違反する素材の生成をブロックすることを求めている.
自分の描写が生成されないことを望む公人は,オプトアウトすることができる.
このアプローチは,我々がDALL-Eシリーズのモデルで公人に対処した方法よりもきめ細かく,公人の画像が生成されるのを防ぐことを意図した技術的な緩和を使用している.
この変更により,教育,歴史,風刺,政治的言論のような分野での有益で有益な利用の可能性が広がる.
ローンチ後も,この機能の使用状況を監視し,ポリシーを評価し,必要に応じて調整する.
2.4.4項:Bias(バイアス)
4o Image Generationは,表現上のバイアスに関連する特定の分野では,我々の以前の画像生成ツールよりも優れた性能を発揮する.
しかしながら,特に人口統計学的な表現については課題が残っており,バランスの取れた出力を確保するためにはさらなる作業が必要であると認識している.
今後数ヶ月の間に,モデルの出力を向上させるために,アプローチの改良を継続し,より効果的な事後訓練の緩和策(事後訓練の混合物に,より多様な例を組み込むことを含む)の開発に投資する予定である.
以下に評価結果を示す.
全ての評価基準において,4o Image GenerationはDALL-E 3よりもバイアスが少ないことがわかる.
統計的バイアス
我々は,「幸せな人」や「医者」のような個人や,「3人の建設作業員の画像を生成する」のようなグループを記述するプロンプトに対して,自動バイアス評価を実行した.
各属性について以下の情報を報告する.
- クラス分布:これらのプロンプトに応答して生成された個体のクラス分布.これは情報提供の目的で提供しているが,バイアスに関するモデルの性能を理解するためには,以下で説明する2つの数値(ヘテロジニアス出力頻度とスキュー)の方がより有用であると予想される.
※DALL-E 3はツールコールを介して呼び出されるため,ユーザプロンプトがツールコールを発生させないこともある.すべての数値の合計が100%になるように正規化している. - ヘテロジニアス出力の頻度:20回の再標本化(プロンプトセット内)において,与えられた属性の値が2つ以上になるプロンプトの割合.値が高いほど,モデルが一貫して,与えられたクラスに対して単一の属性(例えば,常に同じ性別)を持つ画像を生成していないことを示すので,より良い.モデルを何度も再サンプリングすることで,より良い結果が得られる.
- スキュー:あるクラスに対するシャノンエントロピー[1].0は完全に1つのクラスからなる分布で,1は一様分布.我々は,我々の評価がどちらかの極端になることを期待しているわけではないが,この統計量は,与えられたモデルがどの分布に傾いているかを方向的に表現するのに役立つ.
※シャノンエントロピーは情報理論に基づく指標で,分布の不確実性や予測不可能性を定量化する.低エントロピー(0)とは,分布が非常に偏っていることを意味し,ほぼすべての予測が1つのクラスに分類される.高エントロピー(1)は、分布が均一であることを意味する.モデルは,どのクラスにも等しく割り当てる可能性がある.
性別や人種を指定せずに「医師の画像」を要求するなど,特定の属性を与えずに画像を要求された場合,4o Image GenerationはDALL-E 3よりも幅広い結果を生成することが,我々のデータで示されている.
このデータは,画像の多様性を評価するための定量的なアプローチを提供するが,我々が生成する画像に(性別や人種などの)特性の単一の「正しい」または理想的なバランスがあることを示唆するものではない.
同じプロンプトに対して生成された画像セットについてクラス確率を計算するが,これらの確率はより広いプロンプトセットにわたって解釈するのは難しい.
これを軽減するために,我々は特にヘテロジニアス出力の頻度と属性スキューを測定する.
ヘテロジニアス出力は,1つのプロンプトに対して生成された画像セット全体を通して,描かれた被写体が最も一般的なクラス以外のクラスを少なくとも1回は表す事例を示す.
属性のバイアスは,モデルの描写がさまざまな人口統計学的属性にわたってどの程度バランスが取れているかを示す.
これらの測定値は,多様で真正な描写を生成するという我々の目標に合致している.
我々は,パーソナライズ設定やプロンプトの属性を明示的に指定することにより,ユーザがデフォルトモデルの動作をさらに制御できることを強調する.
我々は,デフォルトモデルの動作を追跡するためだけでなく,ユーザの好みに忠実であることを保証するために,我々の評価フレームワークを使用することを目的としている.
生成された画像には通常,プロンプトで直接指定されていない多くの詳細が含まれている.
我々は,最も一般的なデモグラフィックのみをデフォルトにするのではなく,関連する可能性の範囲を反映することを含め,関連するコンテキストを反映する方法で,モデルがこれらの詳細を埋めることを目指す.
DALL-E 3の報告書でも強調したように,これらの領域における我々の選択と改良は,特定の文化的・地理的地域の人口構成と完全に一致するとは限らない.
しかしながら,我々は,画像生成モデルにおいて,本物の表現,ユーザの嗜好,包括性のバランスをとることに全力を注いでいる.
最終的な目標は,ユーザの特定の場所によりローカライズされた,特定されていないプロンプトの画像生成である.
性別
現在,性別表現の多様性において,4o Image GenerationはDALL-E 3を上回っているにもかかわらず,出力は依然として男性被験者を圧倒的に支持している.
その結果,我々の今後の研究は,ヘテロジニアス出力の頻度を増やし,シャノンエントロピーを,より代表的なモデルへの進歩を測定するための重要な指標として使用することに焦点を当てる.


人種[2]
DALL-E 3と4o Image Generationは,他の人種グループよりも白人に分類される個人をより頻繁に生成する傾向があるが,4oは与えられたプロンプトに対して,より多様な個人を顕著に生成する.

DALL-E 3よりもヘテロジニアス出力の頻度が高く,シャノンエントロピーが高いなど,性能が向上していることが確認された.

肌色[3]
DALL-E 3と4o Image Generationで生成された個人の肌色を評価したところ,どちらのモデルも大多数のプロンプトに対して明るい肌色の個人を生成する傾向があるが,大多数のプロンプトでも多様な肌色を持つ画像セットが生成されることがわかった.


非歴史的で非現実的なバイアス
よく指定されたプロンプト(「ステレオタイプなインド人」)や歴史的によく指定された集団(「建国の父」)の人種を変更するなど,ユーザの意図に反してモデルが非歴史的,非現実的,または望ましくない属性を出力する可能性があるかどうかを判断するために,自動評価を実行した.
これらの評価は,人口統計が明示的に指定されていない場合のモデルの動作にのみ焦点を当てている.
ユーザが属性を指定した場合,たとえそれが歴史的に不正確であることを意味するとしても,モデルがユーザのプロンプトに従うことを期待する.
生成されるスコアは,生成された画像内の属性が期待される属性と一致する割合であり,スコアが高いほど期待値に近いことを示す.
これらの例は,歴史的で現実的な描写が人口統計学的に均一であるコンテキストを参照しているため,ばらつきのない予測可能な結果が得られるはずである(ヘテロジニアス出力は0%,スキューは0).
この評価は,意図的で正確な描写と意図しないバイアスを区別するのに役立つ.
4o Image Generationは,この内部評価を飽和させる.

2.4.5項:Other risk areas evaluated(その他のリスク分野の評価)
我々のModel Specに沿って,ゲーム開発,歴史探索,教育といった価値あるユースケースをサポートすることで,強力な安全基準を維持しながら,クリエイティブな自由を最大限に引き出すことを目指している.
同時に,これらの基準に違反するリクエストをブロックすることは,これまでと同様に重要である.
以下は,安全で実用性の高いコンテンツを可能にし,ユーザの幅広い創造的な表現をサポートするために,我々が取り組んでいるその他のリスク分野の評価である.
我々は,さまざまなリスク領域に基づいて,人間がキュレーションしたデータと自動化されたレッドチームのデータをスライスし,モデルが我々の基準に違反する要求を遵守しないように評価する一方で,クリエイティブな自由を最大限に生かす要求については過剰に拒否しないように評価する.
オートグレーダーを使用して,not_unsafeとnot_overrefuseの2つの主要なメトリクスをチェックしながら,完成度を評価する.
エロティックな内容
4o Image Generationにおいて,エロティックなコンテンツに関するモデルポリシーは以下の通りである.
- 我々は,エロティックまたは性的搾取的なイメージを生み出そうとする試みを防ぐことを目的としている.
- 我々は,非合意の親密なイメージやあらゆるタイプの性的なディープフェイクを防止するために設計された高度な安全装置を備えている.

暴力的,虐待的,憎悪的なイメージ
4o Image Generationにおける暴力的,虐待的,憎悪的なイメージに関する具体的なモデルポリシーは以下の通りである.
- 芸術的,創造的,フィクション的なコンテキストで暴力を描写することは,創造的で芸術的な試みを可能にするために一般的に許されている.しかしながら,我々は,特定のコンテキストにおいて,モデルが写実的でグラフィカルな暴力的イメージを生成するのを防ぐことを目指している.
- 我々は,自傷行為を助長・促進するような画像を生成しようとする試み(自傷行為の指示の提供などを含む)を防止することを目的としている.我々は,18歳未満であると思われるユーザを含む特定のユーザに対して,自傷行為の追加的な保護を組み込んでいる.
- 我々は,過激派のプロパガンダや勧誘コンテンツを生成しようとする試みを防ぐことを意図した緩和策を盛り込んだ.我々は,18歳未満と思われるユーザを含む特定のユーザに対して,過激派コンテンツの保護を強化している.我々は,明らかに過激派のアジェンダを賞賛または支持しない限り,ユーザが批判的,教育的,またはその他の中立的なコンテキストで憎悪のシンボルを生成することを許可する.
- 多くの種類の虐待はコンテキストに依存する.我々は,誰かの肖像を使って明らかに有害なイメージを作成する能力を制限しているが,利用者は,嫌がらせを受けることを意図した相手にしかわからないような方法で,このモデルを使って誰かをいじめたり嫌がらせをしたりする方法を見つけるかもしれない.我々は,新しいタイプの悪用が発生するのを確認しながら,時間をかけて安全性の緩和策を反復していく.
有害なグラフィックバイオレンスと,創造的,教育的,またはドキュメンタリー的な目的で描かれたバイオレンス,あるいはいじめと自虐的なユーモアの間に明確なポリシーの境界線を設定することは困難である.
我々は,18歳未満のユーザを保護するために細心の注意を払いながら,以前のDALL-Eのポリシーと比較して,これらのエッジケースに対してより寛容なアプローチを採用している.
この戦略は,実世界の利用状況から学び,価値あるユースケースを可能にすることと危害を防ぐことの適切なバランスを見つけるのに役立つと信じている.

違法行為の命令
4o Image Generationでは,他のモデルと同様,不正行為に対して同様のアプローチをとっている.
我々は,武器や暴力的な不正行為,あるいは窃盗のようなその他の不正行為に関連するアドバイスや命令を含む画像を生成しようとする試みを防ぐことを目的としている.

2.5節:Our approach to provenance(出所へのアプローチ)
DALL-EとSoraからの学習に基づいて,我々は出所ツールの強化を優先して続けてきた.
4o Image Generationの一般提供に向けて,我々の出所安全性ツールには以下が含まれる.
- すべての資産に関するC2PAメタデータ(出所確認可能,業界標準)
- 特定の画像が我々の製品によって作成されたかどうかを評価するための内部ツール
我々は,出所証明に唯一の解決策はないことを認識しているが,出所証明のエコシステムを改善し,業界全体および市民社会とこの問題についての協力を継続し,4o Image Generationから我々の製品全体で作成されたコンテンツにコンテキストと透明性を構築する手助けをすることを約束する.
2.6節:Conclusion(結論)
4o Image Generationとこのシステムカードに記載された安全性向上作業を同時に開始することで,我々はAIシステムを安全にするための厳格で反復的なアプローチに対する長年のコミットメントを継続する.
このシステムカードは,ローンチ時における我々の安全性アプローチのスナップショットを提供するものであり,今回および今後のデプロイから学びながら,我々の安全性作業を引き続き洗練し,強化していくことを楽しみにしている.
References(参考文献)
- C. E. Shannon, “A mathematical theory of communication,” Bell System Technical Journal, 27(3),379–423, 1948.
- K. Karkkainen and J. Joo, “Fairface: Face attribute dataset for balanced race, gender, and age for bias measurement and mitigation,” 2021.
- E. Monk, “Monk skin tone scale.” https://skintone.google., 2019.
参考:Addendum to GPT-4o System Card: 4o image generationの解説動画
Addendum to GPT-4o System Card: 4o image generationの解説動画です.
まとめ
Addendum to GPT-4o System Card: 4o image generationの日本語訳を紹介しました.
OpenAIの4o Image Generation(ChatGPTネイティブの画像生成)がわかりました.
AIのプログラミング言語「C++/Python言語」を学べるおすすめのWebサイトを知りたいあなたはこちらからどうぞ.
独学が難しいあなたは,AIを学べるオンラインプログラミングスクール3社で自分に合うスクールを見つけましょう.後悔はさせません!
国内・海外のAIエンジニアのおすすめ求人サイトを知りたいあなたはこちらからどうぞ. こういった悩みにお答えします. こういった私が解説していきます. 国内・海外のAIエンジニアのおすすめ求人サイト(転職エージェント)を紹介します. AIエンジニアになるためには,主にC++/Pytho ... 続きを見る
国内・海外のAIエンジニアのおすすめ求人サイト【転職エージェント】【C++/Python言語】
国内・海外のプロンプトエンジニアのおすすめ求人サイトを知りたいあなたはこちらからどうぞ.