英語論文執筆のための 統合ライティング支援環境 - github …概要:...

1
概要: 論文執筆用の自然言語エディタを作る 背景 ライティング支援のためのプロトコルTEASPN用いて,英語論文執筆支援環境を実現 機能 : ライティング支援に応用可能な要素技術 言語モデルによる補完 文法誤り検出・訂正 アカデミックライティング に適した単語・フレーズの提示 アカデミックライティングに適した 言い換え提案/ 訂正 エンジン 論文で表れにくいフレーズから 表れやすいフレーズへの言い換え Language server protocolを自然言語用に拡張 20Mの擬似パラレルデータと クラウドソーシングで集めた日本人が書いた 草文・リファレンスペア20Kを利用 [伊藤ら, 2019] 文脈を考慮した引用推薦 辞書 PoEC [高松ら, 2012] の検索 GPT-2NLPドメインでチューニグ 論文執筆に役立つ様々なモジュールを実装 研究成果を世界に向けて発信するためには英語による 論文執筆が必須 執筆支援に応用できる要素技術・リソースは多く存在 するにも関わらず,執筆者 (ユーザ) が使いやすい形で 提供されていない The global modeling using the reinforcement learning in all documents is our work in the future. Global modeling using reinforcement learning for all documents is our future work. We plan to extend our work to global modeling using reinforcement learning for all documents. In future work, we plan to apply global modeling using reinforcement learning to all documents. A more global model that uses reinforcement learning for all documents is our future work. The global modeling using reinforcement learning for all documents is our future works. 入力 出力 適切な単語,フレーズによる穴埋め 多様な言い換えを提案 Our parser (*) accuracy 82.5%, 14.7% improvement (*) state-of- the-art. 入力 出力 Our parser achieves an accuracy of 82.5%, a 14.7% improvement over the state-of-the-art. Our parser achieves a 82.5% accuracy, 14.7% improvement over the state-of-the-art. We propose | a method for identifying … a new translation system that … 補完 We extend the LSTM-minus model _cite_ (Wang and Chang, 2016) Graph-based Dependency Parsing with Bidirectional LSTM We suggest the … 用例・KWIC検索 They proposes the … 今後の展望と課題 propose demonstrate point out TEASPN: PoEC search 一般的な英語の例文検索* PoECって何? [adj] idea 保守的 TEASPN: Tatoeba search OK 推薦 論文検索 TEASPN: Citation search NLI alignment OK * https://tatoeba.org/jpn/ のデータを使用 ハイライト カーソルを当てて辞書検索 構文解析器を用いた, シンタックスハイライト等 共参照解析 他人が書いた文章を読むときなど (リーダーとして) 役立つ可能性 執筆支援環境の提供 : 様々な要素技術を使い慣れたエディタで 自然言語執筆に特化した エディタの開発 英語論文執筆のための 統合ライティング支援環境 伊藤拓海 1,2 栗林 樹生 1,2 萩原 正人 3 鈴木 潤 1,4 乾 健太郎 1,4 1 東北大学 2 Langsmith株式会社 3 Octanove Labs. 4 理化学研究所 Backend Research Models Writing Software Writing Software Research Models Editor Word Processor Web frontend OSS Spell Checker Commercial Products Commercial API BEFORE AFTER TEASPN OSS Spell Checker Editor Editor Editor Word Processor Web frontend Suggestion Model Search GEC Model Suggestion Model Search GEC Model Document, SDK, デモ動画を公開済み (EMNLP2019 system demo track accepted) TEASPN: 要素 技術と執筆ソフトウェア間の効率的な橋渡し Visual Studio Code Atom Sublime Text Fix: propose コマンドメニューから (F1 or ⇧P) OK “main idea”を含む用例:274 The main idea behind this heuristic is to find... 要素技術の精度向上・高速化 システムの公開

Upload: others

Post on 20-Feb-2021

0 views

Category:

Documents


0 download

TRANSCRIPT

  • 概要: 論文執筆用の自然言語エディタを作る 背景

    ライティング支援のためのプロトコルTEASPNを用いて,英語論文執筆支援環境を実現

    機能: ライティング支援に応用可能な要素技術

    言語モデルによる補完

    文法誤り検出・訂正

    アカデミックライティングに適した単語・フレーズの提示

    アカデミックライティングに適した言い換え提案/ 訂正エンジン

    論文で表れにくいフレーズから表れやすいフレーズへの言い換え

    Language server protocolを自然言語用に拡張

    約20Mの擬似パラレルデータとクラウドソーシングで集めた日本人が書いた草文・リファレンスペア20Kを利用 [伊藤ら, 2019]

    文脈を考慮した引用推薦

    辞書

    PoEC [高松ら, 2012] の検索

    GPT-2をNLPドメインでチューニグ

    論文執筆に役立つ様々なモジュールを実装研究成果を世界に向けて発信するためには英語による論文執筆が必須

    執筆支援に応用できる要素技術・リソースは多く存在するにも関わらず,執筆者 (ユーザ) が使いやすい形で提供されていない

    The global modeling using the reinforcement learning in all documents is our work in the future.

    Global modeling using reinforcement learning for all documents is our future work.We plan to extend our work to global modeling using reinforcement learning for all documents. In future work, we plan to apply global modeling using reinforcement learning to all documents.A more global model that uses reinforcement learning for all documents is our future work.The global modeling using reinforcement learning for all documents is our future works.

    入力

    出力

    適切な単語,フレーズによる穴埋め

    多様な言い換えを提案

    Our parser (*) accuracy 82.5%, 14.7% improvement (*) state-of-the-art.

    入力

    出力

    Our parser achieves an accuracy of 82.5%, a 14.7% improvement over the state-of-the-art.Our parser achieves a 82.5% accuracy, 14.7% improvement over the state-of-the-art.

    We propose | a method for identifying …a new translation system that …

    補完

    We extend the LSTM-minus model _cite_

    (Wang and Chang, 2016) Graph-based Dependency Parsing with Bidirectional LSTM

    We suggest the …

    用例・KWIC検索

    They proposes the …

    今後の展望と課題

    proposedemonstratepoint out

    TEASPN: PoEC search

    一般的な英語の例文検索*

    PoECって何?

    [adj] idea

    保守的

    TEASPN: Tatoeba search

    OK

    推薦

    論文検索

    TEASPN: Citation search NLI alignment OK

    * https://tatoeba.org/jpn/のデータを使用

    ハイライト

    カーソルを当てて辞書検索

    構文解析器を用いた,シンタックスハイライト等

    共参照解析他人が書いた文章を読むときなど(リーダーとして) 役立つ可能性

    執筆支援環境の提供: 様々な要素技術を使い慣れたエディタで

    自然言語執筆に特化したエディタの開発

    英語論文執筆のための統合ライティング支援環境

    伊藤拓海1,2 栗林樹生1,2 萩原正人3 鈴木潤1,4 乾 健太郎1,4

    1東北大学 2Langsmith株式会社 3Octanove Labs. 4理化学研究所

    Backend

    Research Models

    Writing Software Writing Software

    Research Models

    Editor Word ProcessorWeb frontend

    OSS

    Spell

    Checker

    Commercial

    Products

    Commercial

    API

    BEFORE AFTER

    TEASPN

    OSS Spell

    Checker

    Editor Editor EditorWord

    ProcessorWeb frontend

    Suggestion

    ModelSearchGEC Model

    Suggestion

    Model

    SearchGEC Model

    Document, SDK, デモ動画を公開済み(EMNLP2019 system demo track accepted)

    TEASPN: 要素技術と執筆ソフトウェア間の効率的な橋渡し

    Visual Studio Code

    Atom

    Sublime Text

    Fix: propose

    コマンドメニューから (F1 or ⌘⇧P)

    OK

    “main idea”を含む用例:274 件• The main idea behind this heuristic is to find...

    要素技術の精度向上・高速化

    システムの公開