OpenAIが提供するCHAT-GPTに最新のアップデートで画像生成機能が追加されました。
この機能追加により、ChatGPTをさらに多彩な用途で活用できるようになりました。
早速使ってみたので、感想を書いてみたいと思います。
目次
画像生成のDALL-Eとは?
DALL·E-3はOpenAIによって開発されたニューラルネットワークモデルで、
テキストの説明から静止画像を生成することができます。
このモデルは、大量の画像とテキストのデータセットを使用してトレーニングされていて、
ユーザーが提供するテキストのプロンプトに基づいてさまざまな画像を生成することが可能です。画像生成のDALL-Eとは?
生成を試してみた結果
黒猫が街を歩いているイラスト風の絵
よくありそうなイラストのテーマを設定し、生成してみました。結果は以下の通りです。
なかなかクリエイティブなものになりましたが、かなり指示に対して飛躍的なアイデアになっています。
そこで次は少し指示を細かくしてみました。
ハンドメイドをテーマにした実写の画像。女性がレザークラフトをしている
というちょっと複雑なテーマで生成してみました。
以下が結果です。
一体どういうことでしょう。どれもこれも要素を含んでいないように感じます。
この後もAIと対話をするも、全くゴールに近づきませんでした。
そこで今度はシンプルに1ワードだけに絞りました。
アメジスト
アメジストは紫色の水晶の一種で、その鮮やかな色彩と美しい結晶構造で知られる天然石です。
こちらが実際のアメジストの画像です。
それに対して生成された画像が以下です。
このあとも何度か生成指示を出しましたが、答えに辿り着くことはありませんでした。
解決策
じつはここまでのAIとのやりとりの前に、まずDALL-Eとはなんなのか? といった説明をさせていました。
もしかしたらそういったやり取りがごっちゃになって生成に影響を与えていたかもしれません。
一度やり取りを削除して、改めて
”アメジスト”
というテーマを与えて生成させたら
私のよく知るアメジストの画像を生成してくれました。
原因としてやはり、前段階で通常の会話をしたりすると、それに引っ張られているようです。
ChatGPTの画像生成の利用方法について
生成された画像は、非商業的な目的での使用が許可されています。
商業的な目的での使用は、特定の許可やライセンスを取得する必要があります。 画像の著作権はOpenAIに帰属します。
しかし具体的にはどういった場面なのでしょうか。それもAIに尋ねたところ、線引きが曖昧らしく、結局は問い合わせという形になるようですが、
以下がAIが教えてくれた主な例です。
- 非商業利用
- 個人が自分のブログで、DALLーEで生成した画像を記事の挿絵として使用する
- 学生がDALLーEで生成した画像を、研究論文の図表として使用する
- 個人がDALLーEで生成した画像を、SNSのプロフィール写真やアイコンとして使用する
- 商業利用
- 企業がDALLーEで生成した画像を、商品のパッケージや広告に使用する
- 広告代理店がDALLーEで生成した画像を、クライアントの商品やサービスのプロモーションに使用する
まとめ
画像を生成するときは初めからテーマをきちんと伝えていくことが重要ですね。
余計な文章を噛ませると生成に影響を出してしまいました。
ようやくchatGPTでも画像生成が行えるようになり、面白くなってきました。
有料会員になって半年くらい経ちますが、ますます利用用途が広がって嬉しい限りです。
コメント