KGeN、5,300万人のユーザーベースを活用したAI学習データ構造を提示
Doohyun Hwang
概要
- KGeNは、5,300万人超のユーザーネットワークを活用したAI学習データ収集構造を公開したと明らかにした。
- 自社開発のPOGE(Proof of Gamified Engagement)構造により、架空データを除外した高度化データセットを構築していると述べた。
- 家庭内の日常を一人称視点で捉えた映像データ約2万時間を確保しており、グローバルネットワークに基づく精緻なデータ構造を拡大する計画だと明らかにした。
期間別予測トレンドレポート



分散型データインフラ企業のKGeN(ケイジェン)は2日、5,300万人超のユーザーネットワークを活用した人工知能(AI)学習データの収集構造を公開した。
KGeNは、インド、東南アジア、ブラジル、中東など世界各地に分散するユーザー層を通じて、実環境で生成されるデータを確保している。単なるクリックデータではなく、ユーザーの実際の意図と行動が反映されたデータを収集することが中核だ。
データ検証には、自社開発の「POGE(Proof of Gamified Engagement・ゲーミフィケーション参加証明)」構造を適用した。これによりユーザーの身元と活動履歴を確認し、架空データを除外した高度化データセットを構築するという。
具体的なデータ構築事例も示された。KGeNは、家庭内の日常活動を収めた一人称視点の映像データを約2万時間規模で確保した。
KGeN側は「当該データは演出なしで実生活の中から収集されたため、環境と行動の多様性がそのまま反映された」とし、「収集過程では個人情報および機微情報を徹底的に除外する方式で運用している」と強調した。
さらに「AI学習データの質と多様性がモデル性能を左右する核心要素になっている」と述べ、「グローバルネットワークを基盤に、実環境で生成された精緻なデータ構造を継続的に拡大していく計画だ」と付け加えた。

Doohyun Hwang
cow5361@bloomingbit.ioKEEP CALM AND HODL🍀





