音声インタフェースとwebアクセシビリティ

1

音声インタフェースとWebアクセシビリティ

西本卓也（東京大学）

2008年11月15日

2

インタフェースの原則

• 目標：音声インタフェース設計の体系化– 既存のHMIに関する提案の再構成

• 基本原則(1996)– 労力最少：移動量、回数、操作容易性

– 透過性：状態理解、手順連想、フィードバック

– 頑健性：誤入力防止、修復容易性

• 構成原則(1996)– 初心者、熟練者、上級利用移行

• 導入原則(2008)– 有用性、適合性、妥当性

3

ワープロによる文書作成

• 目標– あるパラグラフをもう少し短くしたい（曖昧）

• 意図形成– ある文末で段落を変える（具体的決定）

• 行為系列の特定– カーソル移動、改行コード挿入、空白挿入、、

• 行為実行、状態知覚、状態解釈、評価

• 海保他：認知的インタフェース,新曜社,1991

4

実行の淵と評価の淵

Norman, Draper (ed.) : User Centered System Design,1986.

5

電話音声応答システム

• プロンプトの例：– １：各イベントの時間・内容についてお知らせします。＊＊＊から音声でお答えください。

– ２：＊＊＊から音声でお答えください。各イベントの時間・内容についてお知らせします。

• ユーザは少しずつプロンプトを聞く– 任意のタイミングでバージインできる

– プロンプトを聞きながら何度も評価と実行を行う

• 言語情報の効果：命令表現、文末表現

• 非言語／パラ言語情報（Raman: Auditory UI）– 効果音が鳴ったらプロンプトの最後

– 声の種類に意味を持たせる高山他: SP2001-132, 2002.

6

ミクロな実行・評価モデル

• 「一次元の揮発性メディア」としての音声

• AJAXも同型の問題？

7

実行と評価の不自然な対応

• 問題発見の切り口として– キー操作に対するフィードバックの遅れ

• 「音切れ」の重要性• 音声対話システムにも同様の課題

– システム状況の知覚• 不自然な因果関係から

– 超早口化されて聞き取り困難な合成音声• 聞こえているのが「奇跡」• 心的辞書が活用できないと聞こえないはず

• 「バッドノウハウ」の温床– 「次のリンク」を使って「斜め読みする」– コンテンツを後ろからさかのぼって読む

8

対策の例

• 音声インタフェース固有の快適性の追求– 専用TTSが必要：応答速度、情報伝達速度– 妥当な評価尺度、評価手法の確立

• タスクの本質的な構造に基づく設計– 画面ではなくアプリの情報を音声化

• 対面朗読→模擬対話→読み上げ用HTMLアプリ• 「ショッピングカート」／アンドゥの重要性

– 開発が大変、効率化したい• Ruby on Rails + {VoiceXML or HTML}• モダリティ階層モデル

– REST : Representational State Transfer– Galatea Dialog Studio としての実装

9

対面朗読者と視覚障害者の対話の分析とその応用, 情処研報, 2007-SLP-11, pp.55-60, Feb 2007.

カツカレーステーキカレー天むす松花堂

特選御膳・・・

松花堂弁当スタンダード1

・・・・

階層化メニュー

「お気に入り」リスト

プレゼンター

プレゼンテーションのノート

しかし、私たちはマニュアルに基づいて判断の最小単位ごとにフォームで送信してもらい、ページを遷移させました。それが、まずこの図です。左上から右下にページを遷移します。まず、お弁当の種類を選ぶページがあり、次にさらに条件を絞り込むか聞くページを出します。ユーザの選択が「はい」であれば、

10

MVCモデルとマルチモーダル

• MVC = Model / View / Controller • View => Modality Component

11

マルチモーダルIFの6階層モデル

12

まとめ

• 音声IFとしてのWebアクセシビリティ

• マルチモーダルIFの原則– 問題点の抽出

– 「実行」と「評価」の対応という観点から

– 個別の問題に関する評価と改良

• 課題– もっと体系的な方法論

– HTMLの現実に即した問題解決

– Voice Webの可能性• 音声認識の有用性と適合性？？

音声インタフェースとwebアクセシビリティ

Technology