生成AIブームを牽引するOpenAIとchatGPTについて解説
2022年にChatGPTを世に送り出し、生成AIブームを巻き起こしたのがサンフランシスコに本拠を置くOpenAIという法人です。2023年末の共同設立者兼CEOサム・アルトマン氏の解任・復活劇、2024年に入ると、米大手新聞社The NewYorkTimesから著作権侵害で提訴されるなど、報道やSNSでOpenAIという名前を見たことがある方も多いのではないでしょうか。
注目度の高いOpenAIのなりたちや提供しているサービス、生成AIとはどういったものなのかについて解説します。
OpenAIとは
OpenAIはChatGPTを提供している法人と述べましたが、OpenAIそのものは非営利組織として設立されました。OpenAI GP LLC(管理会社)とOpenAI Global, LLC(営利部門・利益上限付き)の2社を傘下に置く、営利と非営利の両面のガバナンススキームを持つ法人です。
OpenAIが設立されたのは2015年のこと。設立には、テスラやスペースXの創業者であるイーロン・マスク、スタートアップへの投資を行うYコンビネーターの元CEOサム・アルトマンのほか、IT業界・スタートアップ業界の名だたる起業家や投資家、研究者が関わっています。
当初は、AIの将来的な技術的インパクトの大きさと実用化までの不確実性の高さから、研究成果を広く共有することや、株主よりも公益を優先することを目指す非営利法人として設立されました。
2019年に資金調達と優秀な人材の獲得に向けて、営利部門となるOpenAI Global,LLCを設立し、マイクロソフトからの出資を獲得しています。
非営利法人のOpenAIの取締役会によるサム・アルトマンの解任は、このような複雑な組織の成り立ちが一つの要因であるといわれています。
AIブームと生成AI
ChatGPTが登場する以前に、AI分野で注目を集めたキーワードがディープラーニング(深層学習)です。ディープラーニング(深層学習)技術は、自然言語処理や画像認識におけるブレークスルーとされ、自動車の運転支援や医療向け画像診断、音声認識によるチャットボットなどの技術が実用化されています。
2000年代にはじまるディープラーニングによるAIブームを第3次AIブーム、ChatGPTに代表される生成AIがもたらした今回のAIブームを第4次AIブームとする見方が多いようです。
生成AI(Genarative AI)とLLM(Large Language Models:大規模言語モデル)
生成AIが従来のAIと異なるのは、学習したデータから文章や画像、音楽などの新たな情報やコンテンツを生み出すことができるという点です。
ディープラーニングによる従来のAIが、判断や予測といった決められた行為の自動化を主要な目的としていたのに対し、ChatGPTは対話から新たな文章を生成することができるという点で大きく異なります。
また、生成AIに用いられる要素技術の一つとして重要な役割を果たしているのがLLM(Large Language Model:大規模言語モデル)です。
ハードウェア技術の進歩に合わせて、大規模な計算が必要なLLM(大規模言語モデル)の構築とディープラーニングを含む機械学習技術により、言語の理解、文章の生成、汎用的なタスクへの応用などが格段に進歩したといわれています。
ChatGPTの特徴
生成AIであるChatGPTは、人間と対話するのと同様な回答をしたり、小説や手紙など創造的な文章を作成できることが大きな話題となっています。しかし、出力されるテキストは、確率的に“もっともらしい”テキストデータの組み合わせを出力しているものに過ぎません。
ChatGPTが学習しているのはネット上に公開された文書であり、出力される回答は学習した文章に依存しています。ChatGPTが出力できる知識は学習データの範囲に限られること、また、学習データの間違いを認識することができないなどの点に留意する必要があります。
注目されている理由である「人間らしい回答をする」という点は、質問に対する回答パターンを学習しているということに過ぎません。人間のような思考プロセスを経ているわけではない、という点が現段階のAIの限界とされています。
一方、これらの限界を前提とした上で、ChatGPTによる知識の組み合わせが創発的なアイディアやコンセプトを生み出す可能性があることが指摘されており、人間の創造性を助ける一つのツールとしての活用が期待できます。
OpenAIのプロダクト
OpenAIは対話型生成AIであるChatGPTのほかにも、いくつかのプロダクトを提供しています。
ChatGPT
OpenAIが提供しているChatGPTは、無料で利用できる「GPT-3.5」と有料版の「GPT-4」があります。
無料版と有料版では、要件の理解力、文章の精度、誤回答の割合といった性能面での差があります。また、無料版はテキストベースの入出力に限定されるのに対し、有料版では画像認識、画像生成、外部サービスとの連携が可能となります。
DALL-E
DALL-Eは、画像生成に特化したモデルであり、指示したテキストの内容を理解して画像を生成することができます。ChatGPT-4とDALL-EはMicrosoft 365に実装されたAIサービスである「Microsoft Copilot」に搭載されています。
単にキーワードに該当する画像を生成するだけでなく、画像のコンセプトやスタイルなどを指定したり、画像の拡張、要素の追加・削除、バリエーションの追加といった操作を行うことが可能です。
CLIP
CLIPは、画像とテキストの関連性を学習したモデルであり、画像の検索と分類ができるAIです。
たとえば、キーワードを指定するとキーワードに関連する画像を出力します。従来のAIと異なるのは、学習されていない画像やテキストも適切に分類することができる「ゼロショット」という特性を持っている点です。
Whisper
Whisperは音声認識モデルを使い、音声ファイルからテキスト情報を生成することができるAIです。音声の文字起こしのほか、多言語の翻訳にも対応しています。ソフトウェア開発のプラットフォームであるGitHubとAPIから利用することができます。
GPT Store
GPT Storeは、ChatGPTを使って特定のタスクに特化したGPTを開発・公開することができる、OpenAIが提供するプラットフォームです。
一般のユーザーは、論文の下書きの作成、Webサイトの制作、履歴書、プレゼンテーションなどの作成といった特定の用途に専門化したGPTを利用でき、開発者は利用状況に応じて収益を得る機会を得ることができます。
参考:ChatGPTは業務に使えるか?特徴やメリット・デメリットを解説
生成AIのリスク
人間のような受け答えを出力するという点のインパクトに注目が集まるChatGPTですが、人間と同レベルの知的作業を行うことができるAGI(Artificial General Intelligence:汎用人工知能)の水準には到達していません。
AGIが「強いAI」と呼ばれるのに対し、生成AIは「弱いAI」として位置づけられています。
この、一見するとAGIらしく見える点が生成AIのリスクの一つでもあり、冒頭に挙げた著作権の問題なども含め、開発する側、利用する側の双方のリスクの存在に留意する必要があります。
一橋大学イノベーション研究センターによるワーキングペーパーでは、生成AIに係る社会的リスクを以下のように整理しています。
分類 | 課題・論点 | |
出力にかかわる社会的リスク | 正確性・信頼性 |
・学習データ上の限界 |
公平性・社会的妥当性 |
・学習データ上のバイアス |
|
入力関連のリスク | オーサーシップ・著作権・盗作 |
・著作権上の扱い |
個人情報、企業秘密 |
・個人情報保護法上の扱い |
引用:一橋大学イノベーション研究センター「第四次AIブーム(ChatGPT)による世界のAIガバナンス制度の進化 」
正確性・信頼性
「ChatGPTの特徴」で挙げた通り、ChatGPTから出力される回答が、学習データの範囲に限られ、学習データの間違いを間違いとして認識できない点から、完全な正確性と信頼性を期待することはできません。
また、画像や映像・音声を出力する生成系AIは悪用に結びつきやすく、使う人間の側に倫理感が求められます。
公平性・社会的妥当性
正確性・信頼性と同様に、学習データにバイアスや不適当な情報が含まれていた場合、出力結果にもそれが反映されてしまいます。表現にかかわる常識や社会通念を生成AIは理解できないため、使う側のリテラシーに加えて、技術面での改善も期待されます。
著作権・盗作
記事の冒頭で著作権の問題に触れましたが、The NewYorkTimes傘下のレビューサイトに掲載された内容が、ChatGPTが組み込まれているBing Chatの回答結果からほぼそのまま出力されていることなどが著作権問題の一例として挙げられます。
生成AIは、インターネット上で公開されている文書を学習データの対象としていることから、特定のメディアが閲覧に課金しているコンテンツの情報をChatGPTから出力してしまうおそれがあります。また、誤った情報が出力結果に混入することでデータソースの信頼性を毀損するといったことも懸念されています。
個人情報、企業秘密
学習データに個人情報が混入してしまう可能性も懸念されている課題のひとつです。
学習の対象となるインターネット上のデータに個人情報が含まれている場合のほか、個人情報を扱うChatGPTを活用した企業システムなどからも個人情報が漏洩してしまうことなどが考えられます。
また、ユーザーがプロンプトに個人情報や営業秘密に関連する情報を入力した場合に、これらの情報が学習データに利用されて情報漏洩につながることなど、セキュリティへの配慮も求められます。
参考:最新版 営業効率化ツールおすすめ16選 顧客を増やすAI時代の最先端ツール
生成AIの限界を知りDXにつなげる
ChatGPTは2022年11月30日に公開されてから1週間で100万ダウンロードを達成し、既に1億人以上のユーザーを獲得しているといわれています。
個人ユーザーだけでなく企業や行政がChatGPTを導入している事例も多く、生成AIのメリットは着実に認識されつつあるといっていいでしょう。
生成AIの限界を知り、求められるリテラシーに留意した上で活用することができれば、生成AIはDXを推進する強力なツールになると考えられます。