音声インタフェースとwebアクセシビリティ
TRANSCRIPT
1
音声インタフェースとWebアクセシビリティ
西本卓也(東京大学)
2008年11月15日
2
インタフェースの原則
• 目標:音声インタフェース設計の体系化– 既存のHMIに関する提案の再構成
• 基本原則(1996)– 労力最少:移動量、回数、操作容易性
– 透過性:状態理解、手順連想、フィードバック
– 頑健性:誤入力防止、修復容易性
• 構成原則(1996)– 初心者、熟練者、上級利用移行
• 導入原則(2008)– 有用性、適合性、妥当性
3
ワープロによる文書作成
• 目標– あるパラグラフをもう少し短くしたい(曖昧)
• 意図形成– ある文末で段落を変える(具体的決定)
• 行為系列の特定– カーソル移動、改行コード挿入、空白挿入、、
• 行為実行、状態知覚、状態解釈、評価
• 海保 他:認知的インタフェース,新曜社,1991
4
実行の淵と評価の淵
Norman, Draper (ed.) : User Centered System Design,1986.
5
電話音声応答システム
• プロンプトの例:– 1:各イベントの時間・内容についてお知らせします。***から音声でお答えください。
– 2:***から音声でお答えください。各イベントの時間・内容についてお知らせします。
• ユーザは少しずつプロンプトを聞く– 任意のタイミングでバージインできる
– プロンプトを聞きながら何度も評価と実行を行う
• 言語情報の効果:命令表現、文末表現
• 非言語/パラ言語情報(Raman: Auditory UI)– 効果音が鳴ったらプロンプトの最後
– 声の種類に意味を持たせる高山 他: SP2001-132, 2002.
6
ミクロな実行・評価モデル
• 「一次元の揮発性メディア」としての音声
• AJAXも同型の問題?
7
実行と評価の不自然な対応
• 問題発見の切り口として– キー操作に対するフィードバックの遅れ
• 「音切れ」の重要性• 音声対話システムにも同様の課題
– システム状況の知覚• 不自然な因果関係から
– 超早口化されて聞き取り困難な合成音声• 聞こえているのが「奇跡」• 心的辞書が活用できないと聞こえないはず
• 「バッドノウハウ」の温床– 「次のリンク」を使って「斜め読みする」– コンテンツを後ろからさかのぼって読む
8
対策の例
• 音声インタフェース固有の快適性の追求– 専用TTSが必要:応答速度、情報伝達速度– 妥当な評価尺度、評価手法の確立
• タスクの本質的な構造に基づく設計– 画面ではなくアプリの情報を音声化
• 対面朗読→模擬対話→読み上げ用HTMLアプリ• 「ショッピングカート」/アンドゥの重要性
– 開発が大変、効率化したい• Ruby on Rails + {VoiceXML or HTML}• モダリティ階層モデル
– REST : Representational State Transfer– Galatea Dialog Studio としての実装
9
対面朗読者と視覚障害者の対話の分析とその応用, 情処研報, 2007-SLP-11, pp.55-60, Feb 2007.
カツカレーステーキカレー天むす松花堂
特選御膳・・・
松花堂弁当スタンダード1
・・・・
階層化メニュー
「お気に入り」リスト
10
MVCモデルとマルチモーダル
• MVC = Model / View / Controller • View => Modality Component
11
マルチモーダルIFの6階層モデル
12
まとめ
• 音声IFとしてのWebアクセシビリティ
• マルチモーダルIFの原則– 問題点の抽出
– 「実行」と「評価」の対応という観点から
– 個別の問題に関する評価と改良
• 課題– もっと体系的な方法論
– HTMLの現実に即した問題解決
– Voice Webの可能性• 音声認識の有用性と適合性??