dslab.konkuk.ac.krdslab.konkuk.ac.kr/class/2020/20gp2/projects/proposal/[t1]propos… ·...

11

Upload: others

Post on 08-Aug-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: dslab.konkuk.ac.krdslab.konkuk.ac.kr/Class/2020/20GP2/Projects/proposal/[T1]propos… · 한국어개체명인식을위하여입력으로사용되는단어표상을확장하기위해
Page 2: dslab.konkuk.ac.krdslab.konkuk.ac.kr/Class/2020/20GP2/Projects/proposal/[T1]propos… · 한국어개체명인식을위하여입력으로사용되는단어표상을확장하기위해
Page 3: dslab.konkuk.ac.krdslab.konkuk.ac.kr/Class/2020/20GP2/Projects/proposal/[T1]propos… · 한국어개체명인식을위하여입력으로사용되는단어표상을확장하기위해
Page 4: dslab.konkuk.ac.krdslab.konkuk.ac.kr/Class/2020/20GP2/Projects/proposal/[T1]propos… · 한국어개체명인식을위하여입력으로사용되는단어표상을확장하기위해
Page 5: dslab.konkuk.ac.krdslab.konkuk.ac.kr/Class/2020/20GP2/Projects/proposal/[T1]propos… · 한국어개체명인식을위하여입력으로사용되는단어표상을확장하기위해

TensorFlow

- https://www.tensorflow.org/

- Machine�Learning�Framework

- 딥러닝모델구현에사용

KoNLPy

- https://konlpy-ko.readthedocs.io/ko/v0.5.2/

- 한국어자연어처리 Python�Library

- 한글형태소분석에사용

React.js- https://reactjs.org/

- Web�Frontend�Library

- 결과물을표시할 Application�제작에사용

Django

- https://www.djangoproject.com/

- Python�Web�Framework

- 딥러닝모델을올려 API화 하는데사용

Page 6: dslab.konkuk.ac.krdslab.konkuk.ac.kr/Class/2020/20GP2/Projects/proposal/[T1]propos… · 한국어개체명인식을위하여입력으로사용되는단어표상을확장하기위해

“문단을 입력하세요”

리버풀 FC는 잉글리시프리미어리그우승을목전에뒀지만코로나19 바이러스의영향으로리그가잠시중단된상태다.

“문단을 입력하세요”

리버풀 FC는 잉글리시프리미어리그우승을목전에뒀지만코로나19 바이러스의영향으로리그가잠시중단된상태다.

Topic : 축구리버풀, FC, 프리미어리그, 우승, 중단

Page 7: dslab.konkuk.ac.krdslab.konkuk.ac.kr/Class/2020/20GP2/Projects/proposal/[T1]propos… · 한국어개체명인식을위하여입력으로사용되는단어표상을확장하기위해

한국어개체명인식을위하여입력으로사용되는단어표상을확장하기위해사전 학습된 단어 임베딩 벡터, 품사 임베딩 벡터, 음절 기반에서 확장된 단어 임베딩 벡터, 개체명 사전자질벡터를사용했을때사전학습된단어임베딩벡터만사용한것보다 8.05%의성능향상을보인다.

- 유홍연,�고영중

효율적인 대화 정보 예측을 위해 전처리 단계에서 사용자 정의 사전을 이용하고, 단어 임베딩 단계에서최적의파라미터를발견한다. 설계한 개체명인식모델을실험하기위해생활화학제품분야를선택하고관련도메인내목적지향대화시스템에서적용할수있는개체명인식모델을구축한다.

- 고명현,�김학동,�임헌영,�이유림,�지민규,�김원일

“자체구축한대량의말뭉치를이용해단어임베딩벡터학습으로단어집합을확장시켜

기존의 NER보다성능을높이도록한다.”

Page 8: dslab.konkuk.ac.krdslab.konkuk.ac.kr/Class/2020/20GP2/Projects/proposal/[T1]propos… · 한국어개체명인식을위하여입력으로사용되는단어표상을확장하기위해

단어벡터를이용해시멘틱연산이가능한사이트로,

고양이+애교=강아지 / 사랑+우정=애교등의결과산출.

“word2vec,�형태소분석기이용해,

개체명인식으로해당텍스트범주를표시하는웹사이트구축”

EX.�Input�:�손흥민은대한민국출신의축구선수이다.�

Hidden�:�손흥민(사람/스포츠),�대한민국(지역/나라),�

축구(문명, 문화/스포츠),�선수(문명,�문화/스포츠)

Output�:�“스포츠”에 관한문장이다.

Page 9: dslab.konkuk.ac.krdslab.konkuk.ac.kr/Class/2020/20GP2/Projects/proposal/[T1]propos… · 한국어개체명인식을위하여입력으로사용되는단어표상을확장하기위해
Page 10: dslab.konkuk.ac.krdslab.konkuk.ac.kr/Class/2020/20GP2/Projects/proposal/[T1]propos… · 한국어개체명인식을위하여입력으로사용되는단어표상을확장하기위해
Page 11: dslab.konkuk.ac.krdslab.konkuk.ac.kr/Class/2020/20GP2/Projects/proposal/[T1]propos… · 한국어개체명인식을위하여입력으로사용되는단어표상을확장하기위해

감 사 합 니 다