한국어 학습자 구어 담화의 말뭉치언어학적 - aatk · 2020-05-30 · 한국어...

26
한국어 학습자 구어 담화의 말뭉치언어학적 논의 - 대화행위 주석을 중심으로- American Association of Teachers of Korean 21th Annual Conference & Workshop June 16~18, 2016 Emory University Atlanta, GA 이동은(국제한국어교육학회, 국민대학교) [email protected]

Upload: others

Post on 31-Jul-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 한국어 학습자 구어 담화의 말뭉치언어학적 - AATK · 2020-05-30 · 한국어 학습자 구어 담화의 말뭉치언어학적 논의 - 대화행위 주석을 중심으로-

한국어 학습자 구어 담화의

말뭉치언어학적 논의

- 대화행위 주석을 중심으로-

American Association of Teachers of Korean 21th Annual Conference & Workshop

June 16~18, 2016 Emory University

Atlanta, GA

이동은(국제한국어교육학회, 국민대학교) [email protected]

Page 2: 한국어 학습자 구어 담화의 말뭉치언어학적 - AATK · 2020-05-30 · 한국어 학습자 구어 담화의 말뭉치언어학적 논의 - 대화행위 주석을 중심으로-

들어가기

1

◎ 출발점 2000년대 이후 한국어 학습자 구어 말뭉치의 기초 연구와 구축이 활발히 진행되고 있음.

<한국어 학습자 말뭉치 기초 연구 및 구축(2015)> 구어 말뭉치의 경우, 전사와 주석에 따라 그 말뭉치의 신뢰도가 좌우됨.

본 연구에서는 국제표준기구(ISO)에서 연구,

개발 중인 성과물을 참고하여 한국어 학습자 말뭉치를 위한 대화행위 주석 체계를 모색하고자 함.

Page 3: 한국어 학습자 구어 담화의 말뭉치언어학적 - AATK · 2020-05-30 · 한국어 학습자 구어 담화의 말뭉치언어학적 논의 - 대화행위 주석을 중심으로-

선행연구 ◎ 담화∙화용 연구의 흐름

- 북미, 유럽 학계에서는 1970년대부터 영어 중심의 현실 언어 연구 - 한국어학계에서는 1990년대 중반, <담화와 인지>를 중심으로 담화 분석 연구 시작. 대량의 말뭉치보다는 개인 연구 차원의 질적 연구가 주를 이룸. - 한국어교육학계, 2000년 이후, <한국어교육>을 중심으로 한국

어 모어화자와 학습자의 구어 담화분석 연구 본격화. - 2016년 현재, 한국어 학습자 구어 말뭉치 구축 사업 2차년도

과제 수행 중.

담화 화용 분야의 주석 연구는 1990년대 중후반 이후 북미와 유럽에서 이루어짐.

2

Page 4: 한국어 학습자 구어 담화의 말뭉치언어학적 - AATK · 2020-05-30 · 한국어 학습자 구어 담화의 말뭉치언어학적 논의 - 대화행위 주석을 중심으로-

국제 학계의 경향

◎ 북미와 유럽을 중심으로 담화, 화용 주석에 대한 논의

• Carletta 외(1995): 특정 과제나 영역으로 화행 범주를 나누려는 시도 • Allen&Core (1997): DAMSL(Dialogue Act Mark-up in Several Layers) • Alexandersson 외(1997): VERBMOBILE • Weisser (2003): 대화 분석 및 처리 도구인 SPAACy 개발 DAMSL과 VERBMOBILE을 참고하여 화행 주석 체계 41개의 세트를 마련. • Leech & Weisser(2013): SPAADIA 주석 체계

대규모 말뭉치에 실험적으로 주석을 반영하려는 시도가 계속되고 있음. taxonomy ≪≫ annotation (정확도, 실행)

3

Page 5: 한국어 학습자 구어 담화의 말뭉치언어학적 - AATK · 2020-05-30 · 한국어 학습자 구어 담화의 말뭉치언어학적 논의 - 대화행위 주석을 중심으로-

연구 절차

- 학습자 말뭉치 검토 : 담화 기능상의 특징 중심

- 학습자 담화분석, 학습자 담화의 구조화 : 기존의 Learner corpus 검토, 분석 방법 탐구 - 담화분석의 엄밀성을 담보로 하는 형식화에 대한 고민: 대화행위 1차, 2차 모의 주석 - 주석체계 결정과 주석하기(glossing) - 학습자 수준별 담화·화용능력의 구명

4

Page 6: 한국어 학습자 구어 담화의 말뭉치언어학적 - AATK · 2020-05-30 · 한국어 학습자 구어 담화의 말뭉치언어학적 논의 - 대화행위 주석을 중심으로-

연구 절차 대화행위 기본 단위 : 화행

화행: 의사소통적 관점에서 발화 의미, 화자의 의도와 청자의 이해 * 의문문 • 구조적 의미 : 의문에 대한 적정 수준의 응답 요구 • 전달된 의미 : - 의문 : 언제 출발하세요? - 제안 : 심사를 좀 미룰까요? - 비난 : 이게 최선입니까? (*뮛이 중헌디?) - 경고/협박 : 한 번 굶어 볼래? - 명령 : 이제 공부 좀 하지 그래? - 요청 : 잠깐 얘기 좀 할 수 있을까요? - 인사 : 오늘은 좀 어떠세요? - 단언 : 저 선생님 너무 이쁘지 않아요? - 문제 제기: 무엇을 위해서 우리가 이렇게까지 해야 하죠? 5

Page 7: 한국어 학습자 구어 담화의 말뭉치언어학적 - AATK · 2020-05-30 · 한국어 학습자 구어 담화의 말뭉치언어학적 논의 - 대화행위 주석을 중심으로-

ISO의 대화행위 규약에서 의사소통 기능

◎ ISO(국제표준기구)에서는 언어자원 주석 방식의 표준화 작업

을 진행 중(2008년 5월~) <Semantic Annotation Framework>

• 대화행위 규약을 체계화하기 위해 노력

*대화행위(Dialogue act)란?

6

특정 의사소통 기능과 의미 내용을 지닌 것으로 해석되는

대화 참여자의 의사소통 행위의 견본

의미 내용 ☞ 대화적 행위에 관한 대상, 관계, 행위, 명제의 명세를 통해 파악 가능

의사소통 기능 ☞ 대화상대자의 정보 상태를 변화시키고자 어떻게 의도하는지에 대한 명세

Page 8: 한국어 학습자 구어 담화의 말뭉치언어학적 - AATK · 2020-05-30 · 한국어 학습자 구어 담화의 말뭉치언어학적 논의 - 대화행위 주석을 중심으로-

- 일반적 목적의 의사소통 기능 - 차원-특수적 의사소통 기능

ISO의 대화행위 규약에서 의사소통 기능

*대화행위(Dialogue act)란?

7

특정 의사소통 기능과 의미 내용을 지닌 것으로 해석되는

대화 참여자의 의사소통 행위의 견본

의미 내용 ☞ 대화적 행위에 관한 대상, 관계, 행위, 명제의 명세를 통해 파악 가능

의사소통 기능 ☞ 대화상대자의 정보 상태를 변화시키고자 어떻게 의도하는지에 대한 명세

화행과 관련된 부분

Page 9: 한국어 학습자 구어 담화의 말뭉치언어학적 - AATK · 2020-05-30 · 한국어 학습자 구어 담화의 말뭉치언어학적 논의 - 대화행위 주석을 중심으로-

일반적 목적의 의사소통 기능: Bunt (2011)

8

Page 10: 한국어 학습자 구어 담화의 말뭉치언어학적 - AATK · 2020-05-30 · 한국어 학습자 구어 담화의 말뭉치언어학적 논의 - 대화행위 주석을 중심으로-

차원-특수적 의사소통 기능: Bunt (2011)

9

Page 11: 한국어 학습자 구어 담화의 말뭉치언어학적 - AATK · 2020-05-30 · 한국어 학습자 구어 담화의 말뭉치언어학적 논의 - 대화행위 주석을 중심으로-

ISO의 대화행위 규약에서 의사소통 기능

Bunt (2011)을 통해서 본 ISO의 의사소통 기능 분류는…

- 일반적인 화행을 넓은 범위로 담아내고 있음.

- 하지만 영어 기준의 화행 분류가 한국어의 경우에도 부합할

지는 검증된 바 없음.

이를 한국어 학습자의 구어 말뭉치 담화 주석에 활용하기 위해서는…

- 한국어 화행으로의 적용 가능성을 확인해 보는 작업이 우선적.

- 내국인의 구어 말뭉치에 실험적 주석 작업 실시해 본 후, 한

국어의 특수성에 맞게 수정, 보완하여 학습자 말뭉치에도 적용

가능할 것. 10

Page 12: 한국어 학습자 구어 담화의 말뭉치언어학적 - AATK · 2020-05-30 · 한국어 학습자 구어 담화의 말뭉치언어학적 논의 - 대화행위 주석을 중심으로-

한국어 학습자의 대화행위 주석을 위한 단계적 모색

11

구어 말뭉치에 어떻게 담화와 화용 정보 주석을

달 것인가?

현재 한국어 학습자의 말뭉치 주석은

형태, 통사적 수준

Page 13: 한국어 학습자 구어 담화의 말뭉치언어학적 - AATK · 2020-05-30 · 한국어 학습자 구어 담화의 말뭉치언어학적 논의 - 대화행위 주석을 중심으로-

한국어 학습자의 대화행위 주석을 위한 단계적 모색

12

구어 말뭉치에 어떻게 담화와 화용 정보 주석을 달 것인가?

국내에서도 1990년대 후반, 21세기 세종 계획의 개선 방향에 대해 논의하며 담화 화용 분석에 대한 필요성을 제기 최재웅(1999) : 21세기 세종계획 이후, 세종 코퍼스에 대 한 화행 범주화의 문제와 화행 분석의 필요성에 대해 언급 서상규,구현정(2002) : 정밀 전사의 필요성 제기. 담화 정보 를 포함하는 주석 체계 수립을 위한 방향 논의

Page 14: 한국어 학습자 구어 담화의 말뭉치언어학적 - AATK · 2020-05-30 · 한국어 학습자 구어 담화의 말뭉치언어학적 논의 - 대화행위 주석을 중심으로-

한국어 학습자의 대화행위 주석을 위한 단계적 모색

13

구어 말뭉치에 어떻게 담화와 화용 정보 주석을 달 것인가?

본고의 논의…

전제 : 학습자 말뭉치에 담화 화용 정보 주석이 포함된다면 학습자의 의사소통 문제를 파악하고 한국어 말하기 교육 연구〮개발에 기여할 것.

목표 : 한국어 학습자 말뭉치에 적용할 만한 한국어 대화행위 주석 체계를 실험적으로 만들어 보는 것

방법 : 선행연구를 기반으로 실험적 주석 체계를 설정하고 한국어에 적용 가능한지 내국인 구어 말뭉치 자료에 적용하여 확인, 함의 도출

Page 15: 한국어 학습자 구어 담화의 말뭉치언어학적 - AATK · 2020-05-30 · 한국어 학습자 구어 담화의 말뭉치언어학적 논의 - 대화행위 주석을 중심으로-

한국어 학습자의 대화행위 주석을 위한 단계적 모색

14

그런데, 한국어 연구에서 활용 가능한 담화 화용 기능 분류는 없을까?

국제 통용 한국어 표준 교육과정 개발 연구(2010-2011)에서 한국어교육용 담화 기능 명세 및 등급화한 자료

: 한국어 교재 6종에 나타난 의사소통 기능 항목을 목록 화하고 7등급의 교육과정에 맞춰 기술하였음. : 현재 2차 개발 연구 과제 수행 중 → 표준 국어 문법 개발(2013~ , 국립국어원) : 표준화된 문법 체계와 용어의 통일을 목표로 참조 문법, 기반 문법 지향

Page 16: 한국어 학습자 구어 담화의 말뭉치언어학적 - AATK · 2020-05-30 · 한국어 학습자 구어 담화의 말뭉치언어학적 논의 - 대화행위 주석을 중심으로-

15

Page 17: 한국어 학습자 구어 담화의 말뭉치언어학적 - AATK · 2020-05-30 · 한국어 학습자 구어 담화의 말뭉치언어학적 논의 - 대화행위 주석을 중심으로-

한국어 학습자의 대화행위 주석을 위한 단계적 모색

16

그런데, 한국어 연구에서 활용 가능한 담화∙화용 기능 분류는 없을까?

국제 통용 표준 모형(2010-2011)

전체 담화 단위가 가지는 기능을 중심으로 의사소통 기능 설정 미시 화행 수준의 기능부터 거시 담화 차원의 기능까지 혼재되어 있음. (인사하기, 감사하기 등) (발표하기, 토론하기, 재구성하기 등) 본고에서는 발화 단위 하나하나에 부기할 미시 화행 수준의 기능 명세가 필요하므로 이 연구를 현 단계에서 활용하기는 어려움.

Page 18: 한국어 학습자 구어 담화의 말뭉치언어학적 - AATK · 2020-05-30 · 한국어 학습자 구어 담화의 말뭉치언어학적 논의 - 대화행위 주석을 중심으로-

한국어 학습자의 대화행위 주석을 위한 단계적 모색

17

이후의 연구 방법 및 절차

한국어 대화행위 주석 실험적 체계 연구 1) ISO 체계에서 가장 기본적인 기능들 위주로 모의 주석

체계 설정 실용성 확보 차원

2) 21세기 세종 구어 말뭉치 중 원시 구어 말뭉치 파일 하나 선택 일반적인 한국어 대화 상황에 적용 3) 한국어 교육 분야 초보 연구자 두 명이 수기로 주석 작업 시행 주석 체계의 문제 및 작업의 효율성 검토

Page 19: 한국어 학습자 구어 담화의 말뭉치언어학적 - AATK · 2020-05-30 · 한국어 학습자 구어 담화의 말뭉치언어학적 논의 - 대화행위 주석을 중심으로-

한국어 학습자의 대화행위 주석

18

◎ 모의 주석 체계

대화행위 모의 주석 체계 정보 요청 <QWH> - 명제 질문 <QYN> - 판정 질문 <QCHE> - 확인 질문 <QCHO> - 선택 질문

정보 제공 <INFO> - 정보 주기 <ANS> - 응답하기 <AGR> - 동의하기 <DISAGR> - 반대하기

행위 토론 <OFF> - 행위 제공하기, 약속하기 <SUG> - 제안하기 <REQ> - 요청하기 <IMP> - 명령, 지시하기

피드백 <FBPOS> - 주의집중, 이해, 인지 등을 보여주는 적극적 반응 <FBNEG> - 주의집중, 이해, 인지 실패를 보여주는 소극적 반응

Page 20: 한국어 학습자 구어 담화의 말뭉치언어학적 - AATK · 2020-05-30 · 한국어 학습자 구어 담화의 말뭉치언어학적 논의 - 대화행위 주석을 중심으로-

19

• 대화행위 주석 작업 시행 - 대상 : 21세기 세종 구어 말뭉치 중 일상 대화 원시 말뭉치 파일(7214어절)

참여자 A 참여자 B

말뭉치 주석 작업 경험 有 말뭉치 주석 작업 경험 無

작업시간 : 4시간 작업시간 : 4시간 48분

Page 21: 한국어 학습자 구어 담화의 말뭉치언어학적 - AATK · 2020-05-30 · 한국어 학습자 구어 담화의 말뭉치언어학적 논의 - 대화행위 주석을 중심으로-

모의 주석 체계의 문제점

20

1) 하나의 발화 단위 내에 두 가지 기능이 나타날 때 어떻게 표기할 것인가? 예1 <u who=P1><s n=00014>언제까지 하냐 대학원 졸업할 때까지?</s></u> A: <QYN> B: <QWH> 예2 <s n=00063>어~ 오빠 잠깐만 나 전화 왔거든 잠깐만::.</s></u> A: <REQ> B: <INFO>

A는 “대학원 졸업할 때까지”에 초점을 두어 판정 질문으로 분석, B는 “언제까지 하냐”에 초점을 두어 명제 질문으로 분석

A는 “잠깐만”에 초점을 두어 요청으로 분석, B는 “나 전화 왔거든”에 초점을 두어 정보 주기로 분석

Page 22: 한국어 학습자 구어 담화의 말뭉치언어학적 - AATK · 2020-05-30 · 한국어 학습자 구어 담화의 말뭉치언어학적 논의 - 대화행위 주석을 중심으로-

모의 주석 체계의 문제점

21

2) 하나의 의미를 이루는 발화 단위가 끊어져 전사되었을 때, 앞 뒤 발화의 기능을 어떻게 표기할 것인가? <u who=P1><s n=00014>언제까지 하냐 대학원 졸업할 때까지?</s></u> A: <QYN> B: <QWH> <s n=00015><pause dur=1.5></s> <u who=P2><s n=00016>어:: 대학원 졸업할 때까지 해도 되고::,</s></u> A, B: <ANS> <u who=P1><s n=00017>응.</s></u> A: <FBPOS> B: <ANS> <u who=P2><s n=00018>안 해도 되고.</s> A: <ANS> B: <INFO> <s n=00019>중간에 그만 둬도 되고,</s></u> A: <ANS> B: <INFO>

P1의 질문에 대해 P2의 대답이 연속적으로 나타나는 부분에서 A는 모두 대답으로 분석, B는 처음은 대답, 나머지는 정보 주기로 분석

Page 23: 한국어 학습자 구어 담화의 말뭉치언어학적 - AATK · 2020-05-30 · 한국어 학습자 구어 담화의 말뭉치언어학적 논의 - 대화행위 주석을 중심으로-

모의 주석 체계의 문제점

22

3) 현재의 체계로는 인사나 감사, 전화 응답 관용구, 느낌이나 의견 표현, 감탄사 등에 대한 주석 불가능 예4 <u who=P2><s n=00062>네 국문괍니다::.</s> A: <INFO> B: 판정 불가 예5 <u who=P2><s n=00060><anchor synch=T1>옵::스,<anchor synch=T2> </s></u> A, B: 판정 불가 예6 <u who=P2><s n=00053>우리 답사 갔을 때 이런 거 하나 있었으면 진짜 좋았을 텐데,</s></u> A: <INFO> B: <FBPOS>

Page 24: 한국어 학습자 구어 담화의 말뭉치언어학적 - AATK · 2020-05-30 · 한국어 학습자 구어 담화의 말뭉치언어학적 논의 - 대화행위 주석을 중심으로-

모의 주석 체계의 문제점

23

4) 정보주기의 범위가 너무 넓음 5) 응답과 정보주기, 응답과 적극적 피드백 구분 예7 <u who=P1><s n=00047>그러냐?</s></u> A, B: <QCHE> <u who=P2><s n=00048>어.</s> A, B: <ANS> <s n=00049>와 이거 뭐라고 쓰여 있는 거야?</s></u> A, B: <QWH> <u who=P1><s n=00050>응?</s></u> A: <ANS> B: <QCHE> <u who=P2><s n=00051>언어::,</s></u> A: <INFO> B: <ANS> <u who=P1><s n=00052>언어 정보 개발 연구원.</s></u> A, B: <INFO>

6) 참여자 사전 교육 및 모의 연습 필요 – 판정자(Judge) 피드백

Page 25: 한국어 학습자 구어 담화의 말뭉치언어학적 - AATK · 2020-05-30 · 한국어 학습자 구어 담화의 말뭉치언어학적 논의 - 대화행위 주석을 중심으로-

24

나오기

연구 목표 ☞ 담화 주석 논의에 있어 바람직한 대화

행위 주석 체계 방향 제안

남은 문제 ☞ 억양에 대한 정보가 표기되지 않은

상태에서 어떻게 화행 의미를 판단할 것인가?

전망 ☞ 합리적인 차원의 대화행위 주석 체제에 대

한 고민을 통해 한국어 학습자 담화분석 연구에 기여

Page 26: 한국어 학습자 구어 담화의 말뭉치언어학적 - AATK · 2020-05-30 · 한국어 학습자 구어 담화의 말뭉치언어학적 논의 - 대화행위 주석을 중심으로-

25

감사합니다.