中国本土で初のデジタルヒューマン国家標準 顧客サービスAIが一段進化
中国本土で、顧客サービス向けバーチャルデジタルヒューマンの国家標準が初めて策定されました。金融や行政、教育などで広がるデジタルヒューマン活用に対し、統一された技術基準を示すことで、安全で安定したサービス提供をめざします。
中国本土で初のデジタルヒューマン国家標準とは
今年10月5日に公表されたこの標準は、英語名でInformation technology – General technical requirements for customer service virtual digital humanとされ、顧客サービス用バーチャルデジタルヒューマンの一般的な技術要件を体系的に定めています。
対象となるのは、問い合わせ対応や窓口業務などを担うデジタルヒューマンです。すでに金融、政府関連業務、教育など複数の分野で導入が進んでおり、今回の国家標準は、研究開発から運用までの共通のものさしを提供する位置づけです。
標準では、顧客サービス用デジタルヒューマンシステムの参照フレームワークを定義し、以下のようなモジュールごとに要件を整理しています。
- アバター生成
- 視覚インタラクション
- 音声インタラクション
- 感情インタラクション
- 運用・保守(キーワードやコーパスの更新など)
アバター生成:2Dと3Dに明確な基準
まず、見た目となるアバター生成について、具体的な技術条件が定められました。
- 2Dデジタルヒューマンのアバターは、顔の特徴が完全かつ明瞭に表現されていること。
- 3Dのハイパーリアルなデジタルヒューマンモデルは、少なくとも20万ポリゴン以上を用いて細かな形状を再現すること。
このように、2Dと3Dそれぞれに必要な表現精度を数値で示すことで、開発側は目指すべき品質レベルをより明確に把握できるようになります。
マルチモーダルな対話機能と応答性能
インタラクション機能についても、複数のモードにわたって要件が定められています。デジタルヒューマンは、音声、ジェスチャー、全身動作といったマルチモーダル対話をサポートすることが求められます。
主な性能目標は次のとおりです。
- 音声と口の動きの同期精度:90%以上
- ジェスチャーインタラクションの成功率:平均90%以上
- 全身動作インタラクションの成功率:平均90%以上
- 音声対話の応答時間:2秒以内
- 意味理解(セマンティック理解)の正確さ:85%以上
口の動きと音声の同期や、ジェスチャー・身体動作の成功率にまで数値基準が置かれたことで、デジタルヒューマンの話し方や身ぶりの自然さを客観的に評価しやすくなります。応答時間と意味理解の要件は、ストレスの少ない対話体験と、文脈を踏まえた回答に直結します。
感情インタラクション:共感に近づくための80%
今回の標準では、人間らしさに直結する感情インタラクションについても具体的な数値が示されています。
- 感情インタラクションの成功率:80%以上
ここでいう成功率とは、利用者の喜び、悲しみ、不安といった感情を正確に認識し、それに応じた表情生成や感情音声合成などで適切に応答できたかどうかを指します。80%という基準は、完全な人間同士の共感には及ばないものの、顧客サービスとして一定の安心感を提供する水準を目指したものといえます。
既存システムの高度化と新技術への対応
この国家標準は、新規のデジタルヒューマンだけでなく、すでに運用されている2D・3Dのデジタルヒューマン製品のアップグレードや改修にも適用されます。既存システムが、どの項目で基準を満たし、どこに改善余地があるかを把握する指標として機能します。
一方で、標準はAI生成コンテンツなど新しい技術の統合的な活用にも余地を残しています。企業は、自社の業務シナリオに応じて技術を柔軟に組み合わせることができ、イノベーションの芽を残しつつ、最低限の品質や安全性を確保しやすくなります。
現在、標準に対応した試験方法も開発が進められており、完成すれば企業は共通のテストベンチマークに基づいて自社のデジタルヒューマンを評価できるようになります。これにより、問題点の早期発見や改善の効率化が期待されます。
広がる活用シーンと静かな競争
顧客サービス向けバーチャルデジタルヒューマンは、金融機関のオンライン窓口、行政サービスの案内役、教育現場での学習サポートなど、多様な場面で使われ始めています。今回のように、具体的な技術要件が国家標準として示されることで、利用者にとってはサービス品質への信頼感が増し、企業側には開発投資の判断材料が増えることになります。
数値目標が細かく設定されることは、開発現場にとってはハードルでもあり、指針でもあります。どこまで表情を作り込むのか、感情認識をどのレベルまで高めるのかといった判断が、これまで以上に規格という形で可視化されていきます。
バーチャルデジタルヒューマンは、単なるチャットボットから、人の声や動き、感情に寄り添う存在へと進化しつつあります。中国本土で始まったこうした標準化の動きが、今後、他の国や地域のルールづくりや企業戦略にもどのように影響していくのか、静かな注目が集まりそうです。
Reference(s):
China issues first national standard for virtual digital humans
cgtn.com








