京都発祥日本語入力「freewnn」は(今度こそ)どこまで賢くなれるか?

17
京都発祥日本語入力FreeWnn(今度こそ)どこまで賢くなれるか!? はしもとまさ@おーぷん万葉 2015/8/8 オープンソースカンファレンス 2015 Kansai/Kyoto

Upload: masahiko-hashimoto

Post on 18-Aug-2015

398 views

Category:

Technology


0 download

TRANSCRIPT

京都発祥日本語入力「FreeWnn」は(今度こそ)どこまで賢くなれるか!?

はしもとまさ@おーぷん万葉2015/8/8

オープンソースカンファレンス 2015 Kansai/Kyoto

簡単に自己紹介。

● 東海道らぐ元名古屋案内人です– 東海道らぐ = Tokaido Linux User Group– ちなみに現在は神奈川県民

● ちびぎーこ保護者会の人

– ちびぎーこ保護者会 = 別名:日本openSUSEユーザ会

– 夏コミ、書きました。 「3日目 東P15b」

● 最近はおーぷん万葉を始めてます– 日本語入力についていろいろ研究中。。。

東海道らぐといえば「あひる焼き」

このはちゃんも御用達!

おーぷん万葉とは

● 目的「自由な日本語入力環境を手に入れよう!」– 現在: かな漢字変換ソフト「Izumo」を開発中。

● 現状の問題点:– ビックデータと叫ばれる時代に、開発がアクティブで

自由にコミットメントできる日本語入力システムがない???– インプットメソッド(UI側)も残念な状況orz

→ そんな現状を打破したい!てのが目的です。

今日はFreeWnnのお話

● 京都大・オムロン等が開発したWnnのオープンソース版

– Wnn はここ京都発祥のかな漢字変換ソフトです!

http://www.freewnn.org/

● 名称の由来は「わたしの(W)なまえは(N)なかのです(N)」

ところで、「なかのさん」って誰???

なかのさんは度々話題になるそうで…

開発日誌なるものがネット上で見つかりました…

~ Wnn 開発の思い出 ~ より。

● 会議の席上、京大側は、かな漢字変換は単文節変換で十分ではないかという意見を出してきた。しかし、当時パソコンのワープロソフトは文章一括変換が主流。「いくらワークステーションだからといって、今から聞発するのだから、せめて『私の名前は中野です。』という文を一発で変換して欲しい。」と主張したのだった。

● 何回目かの設計会議の冒頭で、京大のY助手が黒板にWnnと書いた。 「これが、我々が今聞発している日本語処理ンステムの名前で、[ ウーンヌ ] と発首します。」と説明があった。 「Wnn」の意味を聞いて一同大笑いし、そしてその後、誰も反対しなかったので、自然に名前が決まっていった。

http://www.masuda.org/wnn-kaihatu.htm

今回OSC京都の展示

IBus-fwnnを作成して展示していました

IBus FreeWnn

Ibus-fwnn

これを作りました

キー入力を受け付ける かな漢字変換を行うサーバー

実は昨年のOSC京都の頃に作成。

…だったのだけど、ソースコードがイケてないorz

→ 今回は少しだけ改良!一番イケていなかったローマ字かな変換をライブラリ化

● 「watasi」って打つと「わたし」に変換するアレ● Trieというアルゴリズム(実装方法)で実装したい● ライブラリ化すればIBus以外でも使える! ←これ超重要!

Ibus や Fcitx といったインプットメソッド

ローマ字かな変換

FreeWnnライブラリかな漢字変換ライブラリ

ここを作ってライブラリ化する

Trieとは?

● 通常の木構造に対し、枝にラベルがついたもの– メリット:共通接頭検索が可能になる

12 3

5 6

すび

これがいわゆるラベルこれがついてるとTrieと呼ぶらしい

ラベルをたどることで辞書検索が可能になります→データ圧縮にもつながる

最近のかな漢字変換で非常によく使われる技術ですテストに出るよ!!!(どんなテスト?)

…で、できた!

先週 (8/1) に東京で開かれた小江戸らぐのオフでは実演もちゃんとできた!

…が!??

ライブラリ作成の基本であるI/Fの設計に失敗して見事にIBusと結合できなかった!!!

Ibus や Fcitx といったインプットメソッド

ローマ字かな変換

FreeWnnライブラリかな漢字変換ライブラリ

ここがくっつかないんですけど~!!!

大馬鹿者っ!!!

ん?

というわけで今回は…

それとは別の機能「リアルタイム?変換」を展示

お試しいただいた方、ありがとうございました!

ソースコードはこちら: https://github.com/hashimom/ibus-fwnn

「リアルタイム?変換」とは:– キーの入力に反応して漢字変換を行います

言い方変えると、キー入力に反応してFreeWnnで変換を行う

– …が、まだまだ未実装な箇所がある。。。スペースキーが反応しません!(なにっ!??

せっかくなので、実演タイム!

まだまだ課題の多いおーぷん万葉…

協力者、大募集中です!!!

※特に僕の苦手なUI部を作成してくださる方…

ご清聴、ありがとうございましたm(_ _)m