概要
- オープンAIがGPT-リアルタイム-2、GPT-リアルタイム-トランスレート、GPT-リアルタイム-ウィスパーなど次世代の音声AIモデルを公開したと明らかにした。
- オープンAIはChatGPT広告パイロットを日本や韓国、英国などに拡大し、無料プランとChatGPT Go利用者を対象に広告を表示する予定だと発表した。
- 業界では、オープンAIが音声ベースのAIインターフェースと広告プラットフォームを強化して事業を多角化しており、AI機器事業とつながる可能性が大きいと分析している。
期間別予測トレンドレポート


オープンAI(OpenAI)は、人の話し言葉をリアルタイムで理解し、推論までこなす次世代の音声AIモデルを公開した。あわせて、ChatGPTの広告サービスを日本や韓国にも導入する。

オープンAIは5月7日、GPT-5級の推論能力を備え、実際の人間同士の自然な会話の流れを反映した音声モデル「GPT-リアルタイム-2」を公開した。従来のAIモデルは利用者とAIが交互に話すことを前提としていたが、新モデルは利用者がAIの応答を途中で遮ったり、話した内容を言い直したりしても即座に反応する。状況に応じて話し方も調整できる。開発者は、迅速な応答が必要な業務と慎重な応答が求められる業務に応じて、推論の水準を選べるようにした。
オープンAIはこのほか、音声をリアルタイムで翻訳する「GPT-リアルタイム-トランスレート」と、リアルタイムの文字起こしモデル「GPT-リアルタイム-ウィスパー」も披露した。
「GPT-リアルタイム-トランスレート」は70超の言語を認識し、13言語でリアルタイム翻訳に対応する。「GPT-リアルタイム-ウィスパー」は、人が話すのと同時にテキストを生成し、議事録の作成や字幕生成などでの活用が見込まれる。オープンAIは、音声インターフェースが単なる命令入力の手段を超え、「リアルタイムの協業相手」へ進化していると説明した。
オープンAIは5月8日、米国、カナダ、オーストラリアで運営してきた「ChatGPT広告パイロット」を近く日本や韓国、英国などにも広げる予定だと明らかにした。
広告は無料プランと、月8ドルの低価格プラン「ChatGPT Go」の利用者に表示する。回答内容とは明確に区別したスポンサーコンテンツの形で提供し、利用者は広告の非表示やフィードバック機能も使える。オープンAIは、広告がChatGPTの回答に影響しないよう設計しており、利用者の会話内容や個人情報を広告主と共有しないとしている。
業界では、オープンAIが音声ベースのAIインターフェースと広告プラットフォームを同時に強化し、事業の多角化を進めているとみる。特に音声AI技術は、同社が準備中のAI機器事業と結びつく可能性が大きい。
ラ・ヒョンジン記者 raraland@hankyung.com

Korea Economic Daily
hankyung@bloomingbit.ioThe Korea Economic Daily Global is a digital media where latest news on Korean companies, industries, and financial markets.





