internationalization for local government information on crowd sourcing
Post on 06-Aug-2015
42 Views
Preview:
TRANSCRIPT
行政情報の多言語化を目指して
オープンな行政分野向け翻訳メモリの構築を通して実現するグローバル対応都市へ
Code for IbarakiUrban Data challenge 2014 Idea部門
行政情報発信の多言語化はまだまだ
必要な情報(災害・医療・福祉など)については多言語化が望まれており、総務省策定の「地域における多文化共生プラン」 (2006年 )が自治体に通知されて国際化を推進することになっている。
http://www.soumu.go.jp/kokusai/
しかしながら、人材・予算の不足や需要と供給のミスマッチ(必要な情報が翻訳されていない、機械翻訳等の多用で理解しずらい)などの課題が引き続き指摘されている。
チャレンジ
観光情報の多言語化も必要
世界中からお客様を迎えることが出来る観光業。日本には各地に魅力的なリソースがあるにもかかわらず、外国語での情報発信が不足しているところも多く、十分に知られているとは言えない。
(例)英語圏で有名な観光サイト、ロンリープラネットにおける水戸市の紹介http://www.lonelyplanet.com/japan/mito
観光スポットとしてわずかに 2箇所、偕楽園と好文亭(実際は偕楽園内施設)のみ紹介
チャレンジ
オープンデータも多言語で提供したい
水戸市提供の土砂災害ハザードマップ(UDCT公開データ )
チャレンジ
一つの方法としては機械翻訳解決案?
機械翻訳は品質が不十分
しかしながら行政でプロの翻訳者による翻訳を提供することについては
・全ての言語に対して翻訳を提供するのはコスト的に無理・ニーズにあったリソースを行政側で判断するのが難しい・情報に変更があったときに翻訳もあわせて変更するのが難しい
シビックテックの出番!
みんなで考え、みんなで作るニーズの多い言語(中国、韓国、フィリピン、ブラジル、ベトナム、アメリカ ...)は外国人居住者の方も多い。
1. コミュニティ内に協力できる人も多いかも ニーズが多いとリソースも多いはず
解決案
シビックテックの出番!
みんなで考え、みんなで作るニーズの多い言語(中国、韓国、フィリピン、ブラジル、ベトナム、アメリカ ...)は外国人居住者の方も多い。
1.コミュニティ内に協力できる人も多いかも2.本当に必要なドキュメントを把握しやすい 翻訳者は利用者でもある
解決案
シビックテックの出番!
みんなで考え、みんなで作るニーズの多い言語(中国、韓国、フィリピン、ブラジル、ベトナム、アメリカ ...)は外国人居住者の方も多い。
1.コミュニティ内に協力できる人も多いかも2.本当に必要なドキュメントを把握しやすい3.翻訳プロジェクトをとおしてコミュニケーションをとることができる 相互理解をつうじて地域にとけこんでもらえる
解決案
シビックテックの出番!
みんなで考え、みんなで作るニーズの多い言語(中国、韓国、フィリピン、ブラジル、ベトナム、アメリカ ...)は外国人居住者の方も多い。
1.コミュニティ内に協力できる人も多いかも2.本当に必要なドキュメントを把握しやすい3.翻訳をとおしてコミュニケーションをとることができる
HOWWeb翻訳ツールを使い分散してコミュニティで翻訳を進める
解決案
Web翻訳ツール
プロ翻訳者が使っているWebサービス翻訳補助ツール
機能・翻訳メモリ(原文と訳文を対称にしたデータベース)・用語集(同じ訳語を使い、翻訳のブレをなくす)・スタイルガイド(翻訳者によって語調が変わることを防ぐ)・バージョン管理(原文が変更されたときに、容易に変更点を確認できる)これらの機能がWebブラウザから容易に利用できるのがWeb翻訳ツール
解決案
オープンソースの世界で利用
オープンソースの世界でも、ローカライズにはいろいろなツールが使われてきた。そのノウハウを行政情報の翻訳にも生かしたい
代表的なツール Pootle (要サーバ) Transifex Zanata ...
Transifexの例
左に選択された原文、右側に原文と翻訳の対が表示される。
ボランティア協力者が出来る範囲で翻訳をする
翻訳が行われると自動的に翻訳メモリも生成され、後に利用が可能とな
る(翻訳メモリの例)
<原文 > <訳文 > それが申込書です。 It is an application form.窓口に提出して Please submit it to customer desk.翻訳ごとに翻訳の対がどんどん蓄積されていく。似たような原文が来た場合にプログラムがそれを表示する。
それが許可書です。という原文の場合、(提案 適合率 75%) It is an application form.のように表示されるので、これを利用してIt is a license. のように容易に翻訳できる。
翻訳メモリの再利用
翻訳メモリ(言語ごとの翻訳対データベース)には標準規格 TMXがあり、これをファイルとして保存し再利用することが可能。
行政情報や観光情報など特定範囲の翻訳については繰り返し表現も多く、かつ、どの自治体でも似たようなサービスを提供しているため、翻訳が進めば進むほど、再利用の価値が高くなる。翻訳メモリこそが翻訳コミュニティの財産といえる。
(参考)公開翻訳メモリ・リソース
EU欧州委員会の翻訳プロジェクト( 23ヶ国語対応、ただし日本語なし)http://ipsc.jrc.ec.europa.eu/index.php?id=197
(一財)自治体国際化協会の翻訳成果物http://www.clair.or.jp/j/multiculture/sesaku/page-10.html
日本財団図書館 和英対象自治用語集http://nippon.zaidan.info/seikabutsu/2000/00086/mokuji.htm
Google Global Translation memoryGoogle Translation toolkitのみ利用可能で TMX提供なし
翻訳ソンの開催 Web翻訳ツールの利用方法のトレーニング、翻訳ボランティアコミュニティを形成するために国際交流センターなどの拠点を利用して、翻訳ワークショップを定期的に開催する。水戸市国際交流センターhttp://www.mitoic.or.jp/jp/center/
対象としては、コミュニティで必要とされている情報(災害・医療・福祉・手続き 施設等)を優先的に行政情報の多言語化に・取り組む
観光情報については水戸検定取得者など地元で観光情報に興味を持っている人たちとコラボレーションしながら、外国人居住者が水戸を再発見するという意味をあわせたワークショップだと良い
解決案
オープンデータとしての翻訳メモリ公開
オープンデータとしての行政情報、観光情報の翻訳作業を基にした翻訳メモリが充実してきた後、翻訳メモリ自体をオープンデータとして公開する
翻訳メモリをオープンデータとして公開することにより、これを利用した翻訳ツールの開発や他オープンデータへの適応など幅広い応用が考えられる
行政情報は先述のとおり、他自治体でも似た部分、重なる部分が多いと思われるため、翻訳メモリの公開が日本の自治体の多文化共生に資すると考える
解決案
まとめ
行政情報の多言語化はコミュニティの力でサポートできると良い
Web翻訳ツールを使うとコラボレーションが楽
翻訳メモリをオープンデータ化することで応用がぐんと広がる
Code for Ibaraki
みんなで考え、みんなで作る
top related