ストーリー基盤のAIデータレイヤー 'ポセイドン', 訓練データ収集アプリをリリース
概要
- ポセイドンは分散型の AIデータインフラ を構築し、誰でもデータ収集に参加して 報酬 を得られるアプリを公開したと発表した。
- ポセイドンは a16z Crypto から1500万ドルのシード投資を獲得し、高品質データセット の確保とラベリング、ライセンス化インフラを整備したと伝えた。
- 収集されたデータはブロックチェーンに IPとして登録され透明に管理 され、AI企業は正当な使用料で著作権問題なくデータを活用できると述べた。

知的財産権(IP)のためのブロックチェーンインフラ、ストーリー(STORY)は自社インキュベーティングプロジェクトである分散型人工知能(AI)データインフラ 'ポセイドン(Poseidon)' のフィジカルAI運用のための訓練データ収集アプリを正式に公開したと3日に発表した。
これはポセイドンが開発した最初のアプリで、世界中の誰もがAI訓練データの収集に参加して報酬を受け取れる新しいデータ経済モデルを提示する。
ポセイドンは7月、グローバル最大級のベンチャーキャピタルであるアンドリーセン・ホロウィッツ(a16z Crypto)の主導により、総1500万ドル(韓国ウォンで約208億ウォン)のシード投資を獲得し業界の注目を集めた。
ポセイドンはロボット訓練用の一人称視点(POV)映像、多言語音声など、既存のインターネットクローリング方式では確保が難しい高品質なデータセットを収集し、これをラベリング・ライセンス化するインフラを構築した。収集されたデータセットは前処理を経てストーリーブロックチェーンにIPとして登録され、透明に追跡・流通され、自動的にロイヤリティが分配される。AI企業はこれを利用して正当な使用料を支払い、著作権問題なくデータを活用できる。
ポセイドンは多数の分散型物理インフラネットワーク(DePIN)パートナーが開発したアプリと連携してセンサーデータを確保し、ソフトウェア開発キット(SDK)、統合ライセンスツールなどのインフラスタックを順次公開する予定だ。今回披露したアプリは韓国語、ヒンディー語、日本語などの非英語圏言語ごとに1000件以上の音声データセット確保を目標とし、ユーザーが容易にデータ収集に参加できるよう設計されている。
利用者はアプリが提供するスクリプトを該当言語で読み、音声を録音するクエストを実行してポイントを獲得できる。こうして蓄積された音声データはAIモデルがより多様で正確に人間の言語を理解するのに役立つ。
ポセイドンはこれを皮切りに外部開発社が参加するアプリも追加し、テキストや映像など多様な高品質データを収集していく計画だ。
ポセイドンのチームは、ストーリー最高AI責任者(CAIO)かつポセイドンプロジェクト主任科学者のサンディープ・チンチャリ(Sandeep Chinchali)を中心にAIインフラ分野での深い専門性を有している。サンディープは米国スタンフォード大学でAIおよび分散システムの博士号を取得し、現在テキサス大学オースティン校(UT Austin)の教授としてAI・ロボティクス・分散システムを研究している。プロダクト統括兼共同創業者のサリック・シャ(Sarick Shah)は、金融、通信、ヘルスケアなど大企業を対象にAI製品を展開した経験を持つ機械学習エンジニアで、10年以上の経歴を有している。
ポセイドン議長を務めるストーリー代表のイ・スンユン氏は「AI企業はもはや公開データセットにのみ依存することはできず、新たな形のデータインフラの必要性はさらに高まっている。ポセイドンは誰もが参加できるブロックチェーンネットワークを通じて分散型の方式でデータを収集し、貢献者には公正な報酬配分が行われる。これによりAI企業はインターネット上で容易に確保できない高品質なデータセットを著作権問題なく活用できる」と述べた。

Bloomingbit Newsroom
news@bloomingbit.ioFor news reports, news@bloomingbit.io



