2022年は、画像生成モデルを中心とした生成AIモデルの飛躍の年でした。年末には、大規模言語モデルであるGPTを実装したチャットアプリChatGPTがリリースされ、このムーブメントは一過性ではなく、ビジネスや私たちの生活を一変させる勢いです。

本稿は、マーケターを含む非専門家の方に向けて、AI、特に生成AIモデルを中心にその概要やトレンド、そして応用の可能性をまとめました。まずは、生成AIの概要について述べ、関連するツールやその応用を、簡単な例を挙げながら説明します

1. 生成AIモデル概要

1.1 一般論

生成モデルとは、既知のデータからその生成構造を学習し、それに従って新たなデータを生成するモデルです。

wikipediaには以下のように記述されています。

生成的モデルとは、目的値 y が与えられたときの、観測可能変数 X の条件付き確率を表すモデルであり、記号的にはP(X,Y)と表される。

https://ja.wikipedia.org/wiki/生成的モデル

生成モデルと対になる言葉には、識別モデルがあります。識別モデルは、与えられた入力に対して正しい出力を予測するモデル(つまりP(Y|X=x))であり、与えられたデータを分類するために使用されます。実務的には、識別モデルの方がなじみが深いかもしれません。

その生成構造は一般的に確率分布で表現されます。例えば、1~6までの数字をそれぞれ1/6の等しい確率で出現させるモデルは、サイコロを振った結果を生成するモデルと言えます。

1.2 AIと機械学習年表

AIという言葉が誕生してから約70年が経ちました。AIブームとその終焉が繰り返され、現在に至っています。

  1. 1956年 ダートマス会議が開催され、Artifical Inteligence(AI)という言葉が初めて使用される。
  2. 1958年 パーセプトロンが発表される。[Rosenblatt, F. (1958)]
  3. 1960年~ 第1次AIブーム

  4. 1974年 MYCIN(エキスパートシステム)が開発される。if then ルールベースの推論エンジン
  5. 1980年~ 第2次AIブーム
  6. 1990年~ 統計的機械学習の台頭
  7. 2006年頃 Geoffrey HintonらがDeep brief netを発表ネットワークの多層化→深層学習の萌芽
  8. 2012年 画像認識コンペでhinton率いるトロント大学のチームが注目を浴びる。深層学習時代の始まり。現在まで続く第3次AIブームを引き起こす。
  9. 2014年 敵対的生成ネットワーク(GAN)の発表 [Ian Goodfellow et al (2014)]
  10. 2016年 AlphaGoが囲碁の世界チャンピオンに勝利
  11. 2019年 Open AIが大規模言語モデルGPT2をリリース
  12. 2022年 拡散モデル (diffusion model)を用いた画像生成AIモデルstable diffuisonの登場
    OpenAIがGPT-3.5及びChatGPTをリリース

[各種文献1Wikipedia. (2021年5月25日). “MyCIN.” 参照元: https://ja.wikipedia.org/wiki/Mycin2AI白書 2023 ASCII3総務省. (2016年). “情報通信白書 H28年.” 参照元: https://www.soumu.go.jp/johotsusintokei/whitepaper/ja/h28/html/nc142120.html4松尾豊『人工知能は人間を超えるか』(2015) 角川5岡野原 大輔 「拡散モデル データ生成技術の数理」(2023) 岩波書店6岡谷貴之. (2022年9月2日). 『深層学習 改訂第2版 (機械学習プロフェッショナルシリーズ)』. 株式会社 講談社.を元に作成]

1.3 有名な生成モデル

比較的有名な、生成モデル及び、それらを用いたサービスの一覧を以下に整理しました(2023年6月執筆時点)。

モデル種別モデル提供元代表的なサービス
大規模言語モデルGPTOpenAIChatGPT / Bing AI / github copilot など多数
LaMDA / PaLM2GoogleBARD
画像生成モデルStable diffusionstability AIDream studio https://dreamstudio.ai/
MidjourneyMidjourneyMidjourney
https://www.midjourney.com/ Discodeへの登録が必要
DALL-E2OpenAIDALL-E2 https://openai.com/product/dall-e-2 
imagenGooglehttps://imagen.research.google/

2. 代表的なサービス(言語系)

2.1 chatGPT

2.1.1 概要

大規模言語モデル GPT をバックエンドに持つチャットアプリ。高精度な回答を生成します。

提供元
OpenAI
2015年に設立。設立メンバーの一人にイーロン・マスク氏がいる。MS社と資本提携。
GPTだけではなく、画像生成モデルDALL-E2も開発。
言語モデル
GPT
GPT7GPTの初出は[Improving Language Understanding by Generative Pre-Training (2018)]とのこと(Generative Pre-trained Transformer)はTransformerという構造を組合わせたモデルで、2022年11月にはGPT-3.5がリリースされ、現在(2023年5月)GPT-4が最新である。学習データは非公開。

2.1.2 使い方

https://openai.com/blog/chatgpt でアカウント登録をすれば無料ですぐ使えます。Gmailでもログインも可能です。

エンジンはGPT-3.5を使用しており、2021年9月までのデータで学習しています。そのため、最新の情報については回答できません。

2.1.3 ChatGPT-Plus

ChatGPT-PLUSという有料版もあります。これは2023年2月にリリースされました。

月額$20で以下の内容が利用可能です:

  • ピークタイムでも利用可能
  • 応答時間が高速化
  • 新機能への優先アクセス

さらに、GPT4エンジンを使用可能ですが、インタラクションは3時間で25件に限られます。

2.1.4 GPT4

GPT48https://openai.com/product/gpt-4は最新(2023年6月時点)の言語モデルで、GPT-3.5と比較して回答の精度が向上しています。

上記の図では、「シンデレラの物語を各単語の頭文字が先頭から順番にa,b,c,とアルファベット順になるように、記述してください」とインプットしています。上図「output」では確かにそれを満たすテキストが生成されています。

また、画像を入力として受け付け、その画像の描写を返すことが可能です。

引用 https://arxiv.org/pdf/2303.08774.pdf

2.1.5 API

開発者向けにはAPIも公開されています。ChatGPTのAPIではなく、OpenAIのAPIという位置づけで、以下の種類があります。

言語モデルGPT4 prompt / completion
gpt-3.5-turbo chat
InstructGPT
Fine-tuning models
Embedding models
その他モデルImage models
Audio models

一番実験的に使いやすいのは、gpt-3.5-turbo。1,000tokenで$0.002(約0.28円)、トークンの定義は英単語の音節1つが1トークンで、概算する場合0.75単語で1トークンとのことです。ただし、日本語の計算方法は複雑らしく、ひらがな1文字で1トークン、漢字1文字で2-3トークンのようです。9(https://auto-worker.com/blog/?p=7459 要確認)

ChatGPT-PLUSのサブスクリションとは別会計であることに注意してください。

2.2 Bing AI

2.2.1 概要

GPT-4と検索エンジンBingを統合した新しい検索ツールです。ChatGPTがチャットツールであることに対して、検索ツールであることを意識して作られています。

edge上で動くのが特徴です。使い方はedgeの上部にある「チャット」をクリックすればよいです。

提供元
Microsoft
2019年よりOpenAIと資本提携を開始。
2023年に当該社にさらなる出資を行い、約49%の株式を保有する10https://gigazine.net/news/20230124-openai-microsoft-partnership-extension/
モデル
GPT
DALL-E
GPT4を言語エンジンとして採用しているため、なんと無料で使用可能。
またimage creatorというサービスからDALL-Eを利用可能。

2.2.2 Bing image Creator

また、画像生成機能として「Bing Image Creator」があります。このエンジンはDALL-Eです。

https://www.bing.com/create

Microsoftアカウントが必要です。最初の25回は優先的に画像を生成してくれます。また、日本語のテキストも受け付けます。

商用利用は原則許可していないため、許可を得るには問い合わせが必要です。

2.3 Bard

2.3.1 概要

提供元
Google社
BARTという言語モデルでリードしていたが、大規模言語モデルではOpenAIのChatGPTの後塵を拝す。
言語モデル
PaLM2
もともとBardはLaMDAという言語モデルを採用していたが、2023年5月にPaLM2という言語モデルが新たに発表された(Google I/O event in Mountain View)。
GPTと同様にTransformer構造を持っている。さらにpathwaysという独自技術を使用している。(Pathways Language Modelから命名)
GPT-3.5と比較してパラメータ数が多いといわれている。(GPT4は未公開)
各種公表情報などから作成11Googleの生成AI「Bard」が日本語に対応、大規模言語モデル「PaLM 2」搭載 2023/5/11  https://internet.watch.impress.co.jp/docs/news/1499720.html12https://ja.wikipedia.org/wiki/PaLM13https://arstechnica.com/information-technology/2023/05/googles-top-ai-model-palm-2-hopes-to-upstage-gpt-4-

2.3.2 使い方

https://bard.google.com/ から利用可能です。

2.4 その他の言語モデルを活用したサービス

他の言語モデルを活用したサービスの中で、特にマーケターに役立ちそうなものをピックアップしました。

サービス名概要価格
Notion AI
(Notion Labs Inc)
•個人やチーム向けwebドキュメント作成サービス。
•Notion AIは、文章の自動生成、タスクの自動化、文書の自動整理などを可能にする。
•大規模言語モデルとしてはGPTを利用しているとのこと。
•Notion自体は無料。
$10/month
Jasper (Jasper AI)•Jasper AIは、マーケターやブロガー向けのコンテンツ作成支援AIツール。
•50以上のテンプレートを提供し、SEOに対応したブログ投稿、ソーシャルメディアのコピーライティングなどの作成支援。
•生成されるコンテンツは99.99%がオリジナルとのことだが、商用利用は自社のAI作成方針に沿った運用が無難。
Creator: $29/month
Teams: $99/month
Business: ASK/month
Writesonic (Writesonic)•バックエンドはGPT-3.5 / GPT-4 サブスクリプションのオプションによって異なる(価格は同じであるが、GPT-3.5の方が生成文字数の上限が大きい)。
•Jasperと類似した機能。広告のコピー作成機能など、代理店向け機能あり。
•またFacebook Ads Creatorなど、特定プラットフォームに特化した広告を作成可能。
•chatsonc / botsonicというオリジナルのチャットボット作成機能あり。
Free Trial: $0/month
Pro: $12.67/month (12ヵ月一括契約の場合)
– Enterprise: AKS/month
Hyper Writer (OthersideAI)•日本語対応確認できず。
•まあ大体上記2つと同じようなツール。
•chromeの拡張機能あり。
Starter: $0/month
Premium: $19.99/month
Ultra: 44.99/month
Hyper Writer (OthersideAI)•SEO記事を書く機能、残念ながら日本語対応をしていない。NA

3. 国内広告会社の利用動向 (2023年6月時点)

主要代理店:電通、博報堂、ADK、サイバーエージェント、デジタルホールディングスに関する、2023年以降の生成AI及びChatGPTに関するリリースをネットなどで、リサーチしました。

電通グループ電通
•ChatGPTを活用した「キャラクターとの自動対話サービス」のプロトタイプを開発し、人気のアニメキャラクターや企業の有名キャラクターなどのインターフェースを加えることで、AIチャットサービスにより豊かな顧客体験を提供することを目指す。2023.05.17 14https://www.dentsu.co.jp/news/business/2023/0517-010611.html
電通デジタル
•2022年12月に発表した広告クリエイティブ制作のプロセスをAIによって革新する「∞AI(ムゲンエーアイ)」にGPT-4を実装し。2023.03.23 15https://www.dentsudigital.co.jp/news/release/services/2023-0423-000078
•データアーティストを統合 2023.04.01 16https://xtrend.nikkei.com/atcl/contents/casestudy/00012/01166/ 
•OpenAI社が開発したAIチャットボット「ChatGPT」を含むAIツールのAPIアカウントを全社員に付与。2023.05.29 17https://www.dentsudigital.co.jp/news/release/services/2023-0529-000093
博報堂DYHD博報堂DYHD
•広告成果支援プロダクト「H-AI TD GENERATOR」を提供開始し。このプロダクトは、web広告の広告文をキーワードごとに大量に生成することで、高品質な広告を顧客に素早く納品することができる。2023.01.25 18https://www.hakuhodo.co.jp/news/info/101833/
•博報堂DYHD、社員300人にチャットGPT教育 2023.05.1119 https://www.nikkei.com/article/DGXZQOUC109K10Q3A510C2000000/
博報堂DYMP
•生成AI技術を用いた画像から動画に変換するAI映像サービス「H-AI NARRATIVE」を、イスラエルのD-ID社と共同開発して提供を開始した。2023.05.25 20https://www.hakuhodo.co.jp/news/info/104290/
•博報堂DYHD、社員300人にチャットGPT教育 2023.05.11 21https://www.nikkei.com/article/DGXZQOUC109K10Q3A510C2000000/
博報堂テクノロジーズ
•Azure OpenAI ServiceやOpen-AI社のChatGPTを活用して、業務効率化やDX課題解決に取り組むための「ChatGPTソリューション開発推進室」を発足した。2023.05.11 22https://www.hakuhodody-holdings.co.jp/news/corporate/2023/05/4209.html
サイバーエージェント•OpenAI社の「ChatGPT」を活用し、デジタル広告のオペレーション作業時間を削減する「ChatGPTオペレーション変革室」を設立した。2023.04.04 https://www.cyberagent.co.jp/news/detail/id=28668
•サイバーエージェントは、日本語の大規模言語モデルを開発し、広告クリエイティブ制作領域のAIサービスで活用していることを発表した。2023.05.12 https://www.watch.impress.co.jp/docs/news/1499904.html
デジタルHD•オプトは、ChatGPTと効果予測AIを活用した「CRAIS for Text」を開発し、多数の広告テキストから効果的な広告クリエイティブを実現すると発表しました。2023.03.20 https://digital-holdings.co.jp/news/20230320/1921
各社プレスリリース及び報道記事などから作成

無料相談大歓迎です。ご興味ございましたら、お問い合わせはこちらから宜しくお願い致します。