internationalization for local government information on crowd sourcing

21
行行行行行行行行行行行行行行 行行行行行行行行行行行行行行行行行行行行行行行行行行行行行行行行行行行行行 Code for Ibaraki Urban Data challenge 2014 Idea 行行

Upload: shigeomi-shibata

Post on 06-Aug-2015

42 views

Category:

Engineering


1 download

TRANSCRIPT

Page 1: Internationalization for local government information on crowd sourcing

行政情報の多言語化を目指して

オープンな行政分野向け翻訳メモリの構築を通して実現するグローバル対応都市へ

Code for IbarakiUrban Data challenge 2014 Idea部門

Page 2: Internationalization for local government information on crowd sourcing

行政情報発信の多言語化はまだまだ

必要な情報(災害・医療・福祉など)については多言語化が望まれており、総務省策定の「地域における多文化共生プラン」 (2006年 )が自治体に通知されて国際化を推進することになっている。

http://www.soumu.go.jp/kokusai/

しかしながら、人材・予算の不足や需要と供給のミスマッチ(必要な情報が翻訳されていない、機械翻訳等の多用で理解しずらい)などの課題が引き続き指摘されている。

チャレンジ

Page 3: Internationalization for local government information on crowd sourcing

観光情報の多言語化も必要

世界中からお客様を迎えることが出来る観光業。日本には各地に魅力的なリソースがあるにもかかわらず、外国語での情報発信が不足しているところも多く、十分に知られているとは言えない。

(例)英語圏で有名な観光サイト、ロンリープラネットにおける水戸市の紹介http://www.lonelyplanet.com/japan/mito

観光スポットとしてわずかに 2箇所、偕楽園と好文亭(実際は偕楽園内施設)のみ紹介

チャレンジ

Page 4: Internationalization for local government information on crowd sourcing

オープンデータも多言語で提供したい

水戸市提供の土砂災害ハザードマップ(UDCT公開データ )

チャレンジ

Page 5: Internationalization for local government information on crowd sourcing

一つの方法としては機械翻訳解決案?

Page 6: Internationalization for local government information on crowd sourcing

機械翻訳は品質が不十分

しかしながら行政でプロの翻訳者による翻訳を提供することについては

・全ての言語に対して翻訳を提供するのはコスト的に無理・ニーズにあったリソースを行政側で判断するのが難しい・情報に変更があったときに翻訳もあわせて変更するのが難しい

Page 7: Internationalization for local government information on crowd sourcing

シビックテックの出番!

       みんなで考え、みんなで作るニーズの多い言語(中国、韓国、フィリピン、ブラジル、ベトナム、アメリカ ...)は外国人居住者の方も多い。

1. コミュニティ内に協力できる人も多いかも   ニーズが多いとリソースも多いはず

解決案

Page 8: Internationalization for local government information on crowd sourcing

シビックテックの出番!

       みんなで考え、みんなで作るニーズの多い言語(中国、韓国、フィリピン、ブラジル、ベトナム、アメリカ ...)は外国人居住者の方も多い。

1.コミュニティ内に協力できる人も多いかも2.本当に必要なドキュメントを把握しやすい  翻訳者は利用者でもある

解決案

Page 9: Internationalization for local government information on crowd sourcing

シビックテックの出番!

       みんなで考え、みんなで作るニーズの多い言語(中国、韓国、フィリピン、ブラジル、ベトナム、アメリカ ...)は外国人居住者の方も多い。

1.コミュニティ内に協力できる人も多いかも2.本当に必要なドキュメントを把握しやすい3.翻訳プロジェクトをとおしてコミュニケーションをとることができる  相互理解をつうじて地域にとけこんでもらえる

解決案

Page 10: Internationalization for local government information on crowd sourcing

シビックテックの出番!

       みんなで考え、みんなで作るニーズの多い言語(中国、韓国、フィリピン、ブラジル、ベトナム、アメリカ ...)は外国人居住者の方も多い。

1.コミュニティ内に協力できる人も多いかも2.本当に必要なドキュメントを把握しやすい3.翻訳をとおしてコミュニケーションをとることができる

HOWWeb翻訳ツールを使い分散してコミュニティで翻訳を進める

解決案

Page 11: Internationalization for local government information on crowd sourcing

Web翻訳ツール

プロ翻訳者が使っているWebサービス翻訳補助ツール

機能・翻訳メモリ(原文と訳文を対称にしたデータベース)・用語集(同じ訳語を使い、翻訳のブレをなくす)・スタイルガイド(翻訳者によって語調が変わることを防ぐ)・バージョン管理(原文が変更されたときに、容易に変更点を確認できる)これらの機能がWebブラウザから容易に利用できるのがWeb翻訳ツール

解決案

Page 12: Internationalization for local government information on crowd sourcing

オープンソースの世界で利用

オープンソースの世界でも、ローカライズにはいろいろなツールが使われてきた。そのノウハウを行政情報の翻訳にも生かしたい

 代表的なツール        Pootle (要サーバ)        Transifex        Zanata   ...

Page 13: Internationalization for local government information on crowd sourcing

Transifexの例

左に選択された原文、右側に原文と翻訳の対が表示される。

Page 14: Internationalization for local government information on crowd sourcing

ボランティア協力者が出来る範囲で翻訳をする

Page 15: Internationalization for local government information on crowd sourcing

翻訳が行われると自動的に翻訳メモリも生成され、後に利用が可能とな

る(翻訳メモリの例)

<原文 >          <訳文 >  それが申込書です。  It is an application form.窓口に提出して     Please submit it to customer desk.翻訳ごとに翻訳の対がどんどん蓄積されていく。似たような原文が来た場合にプログラムがそれを表示する。

それが許可書です。という原文の場合、(提案 適合率 75%) It is an application form.のように表示されるので、これを利用してIt is a license. のように容易に翻訳できる。

Page 16: Internationalization for local government information on crowd sourcing

翻訳メモリの再利用

翻訳メモリ(言語ごとの翻訳対データベース)には標準規格 TMXがあり、これをファイルとして保存し再利用することが可能。

行政情報や観光情報など特定範囲の翻訳については繰り返し表現も多く、かつ、どの自治体でも似たようなサービスを提供しているため、翻訳が進めば進むほど、再利用の価値が高くなる。翻訳メモリこそが翻訳コミュニティの財産といえる。

Page 17: Internationalization for local government information on crowd sourcing

(参考)公開翻訳メモリ・リソース

EU欧州委員会の翻訳プロジェクト( 23ヶ国語対応、ただし日本語なし)http://ipsc.jrc.ec.europa.eu/index.php?id=197

(一財)自治体国際化協会の翻訳成果物http://www.clair.or.jp/j/multiculture/sesaku/page-10.html

日本財団図書館 和英対象自治用語集http://nippon.zaidan.info/seikabutsu/2000/00086/mokuji.htm

Google Global Translation memoryGoogle Translation toolkitのみ利用可能で TMX提供なし

Page 18: Internationalization for local government information on crowd sourcing

翻訳ソンの開催 Web翻訳ツールの利用方法のトレーニング、翻訳ボランティアコミュニティを形成するために国際交流センターなどの拠点を利用して、翻訳ワークショップを定期的に開催する。水戸市国際交流センターhttp://www.mitoic.or.jp/jp/center/

対象としては、コミュニティで必要とされている情報(災害・医療・福祉・手続き 施設等)を優先的に行政情報の多言語化に・取り組む

観光情報については水戸検定取得者など地元で観光情報に興味を持っている人たちとコラボレーションしながら、外国人居住者が水戸を再発見するという意味をあわせたワークショップだと良い

解決案

Page 19: Internationalization for local government information on crowd sourcing

オープンデータとしての翻訳メモリ公開

オープンデータとしての行政情報、観光情報の翻訳作業を基にした翻訳メモリが充実してきた後、翻訳メモリ自体をオープンデータとして公開する

翻訳メモリをオープンデータとして公開することにより、これを利用した翻訳ツールの開発や他オープンデータへの適応など幅広い応用が考えられる

行政情報は先述のとおり、他自治体でも似た部分、重なる部分が多いと思われるため、翻訳メモリの公開が日本の自治体の多文化共生に資すると考える

解決案

Page 20: Internationalization for local government information on crowd sourcing

まとめ

行政情報の多言語化はコミュニティの力でサポートできると良い

Web翻訳ツールを使うとコラボレーションが楽

翻訳メモリをオープンデータ化することで応用がぐんと広がる

Page 21: Internationalization for local government information on crowd sourcing

Code for Ibaraki

みんなで考え、みんなで作る