Search | Korea Science

Word Segmentation and POS tagging using Seq2seq Attention Model (seq2seq 주의집중 모델을 이용한 형태소 분석 및 품사 태깅)

Chung, Euisok;Park, Jeon-Gue
- 한국어정보학회:학술대회논문집
- /
- 2016.10a
- /
- pp.217-219
- /
- 2016
본 논문은 형태소 분석 및 품사 태깅을 위해 seq2seq 주의집중 모델을 이용하는 접근 방법에 대하여 기술한다. seq2seq 모델은 인코더와 디코더로 분할되어 있고, 일반적으로 RNN(recurrent neural network)를 기반으로 한다. 형태소 분석 및 품사 태깅을 위해 seq2seq 모델의 학습 단계에서 음절 시퀀스는 인코더의 입력으로, 각 음절에 해당하는 품사 태깅 시퀀스는 디코더의 출력으로 사용된다. 여기서 음절 시퀀스와 품사 태깅 시퀀스의 대응관계는 주의집중(attention) 모델을 통해 접근하게 된다. 본 연구는 사전 정보나 자질 정보와 같은 추가적 리소스를 배제한 end-to-end 접근 방법의 실험 결과를 제시한다. 또한, 디코딩 단계에서 빔(beam) 서치와 같은 추가적 프로세스를 배제하는 접근 방법을 취한다.
PDF

A Joint Learning Model for Speech-act Analysis and Slot Filling Using Bidirectional GRU-CRF Based on Attention Mechanism (주의집중 메커니즘 기반의 양방향 GRU-CRF를 이용한 화행 분석과 슬롯 필링 공동 학습 모델)

Yoon, Jeongmin;Ko, Youngjoong
- Annual Conference on Human and Language Technology
- /
- 2018.10a
- /
- pp.252-255
- /
- 2018
화행 분석이란 자연어 발화를 통해 나타나는 화자의 의도를 파악하는 것을 말하며, 슬롯 필링이란 자연어 발화에서 도메인에 맞는 정보를 추출하기 위해 미리 정의되어진 슬롯에 대한 값을 찾는 것을 말한다. 최근 화행 분석과 슬롯 필링 연구는 딥 러닝 기반의 공동 학습을 이용하는 연구가 많이 이루어지고 있고 본 논문에서는 한국어 특허상담 도메인 대화 말뭉치를 이용하여 공동 학습 모델을 구축하고 개별적인 모델과 성능을 비교한다. 또한 추가적으로 공동 학습 모델에 주의집중 메커니즘을 적용하여 성능이 향상됨을 보인다. 최종적으로 주의집중 메커니즘 기반의 공동 학습 모델이 기준 모델과 비교하여 화행 분류와 슬롯 필링 성능이 각각 3.35%p, 0.54%p 향상되어 85.41%, 80.94%의 성능을 얻었다.
PDF

Performance Evaluation of Interworking IP over ATM Models in power telecommunication network (전력정보통신망에서의 ATM과 IP 연동모델 성능분석)

김선익;박명해;오도온;이진기;우희곤
- Proceedings of the Korean Information Science Society Conference
- /
- 1999.10c
- /
- pp.384-386
- /
- 1999
ATM 통신망의 성공 및 확산을 위해서는 신규서비스의 창출과 함께 기존 서비스의 가격 경쟁력 있는 수용이 요구되는데, 인터넷 (IP)은 그 사용자 및 서비스의 수요를 고려할 때 ATM 망에서 가장 먼저 수용해야 할 서비스로서 현재 ATM 통신망에서의 인터넷 수용방안이 다양하게 논의되고 있다. 본 논문에서는 전력정보통신망을 전제로 하여 ATM WAN 통신망에서의 IP 서비스 수용에 관심을 두고 이를 위한 두 가지 방안으로 LAN Emulation 모델과 간단한 형태의 IP Internetworking 모델을 설정하고, LAN 과 WAN 접속구간의 서비스 카테고리가 ABR(Available Bit Rate)과 UBR(Unspecified Bit Rate)인 경우에 대해서 각 모델별로 적용하여 시뮬레이션을 수행하였다. 성능 비교를 위해 TCP 계층과 ATM 계층에서의 end-to-end delay를 분석한 결과, LAN-Emulation 모델을 적용하는 경우 간단한 형태의 IP Internetworking 모델에서 보다 성능효율이 우수하고, LAN과 WAN 접속구간의 서비스 카테고리는 백본 ATM 교환기와 Edge 단말에서의 버퍼크기가 동일한 경우 ABR이 UBR보다 성능효율이 우수함을 알 수 있었다.
PDF

Stochastic Time Duration Model with Gamma-Dirichlet Distribution for Global and Local Duration of HMM (Gamma-Dirichlet 분포에 의한 HMM의 전역 및 지역 시간지속 모델)

Sin, Bong-Kee
- Proceedings of the Korean Information Science Society Conference
- /
- 2008.06c
- /
- pp.517-521
- /
- 2008
HMM의 약점인 상태 지속 분포를 개선하는 새로운 개념의 확률적 전역+지역 시간 지속 분포 segment 모델(GL-STDM)을 제안한다. 즉, 시계열 신호의 전역적 시간 정보를 표현하고, 각 상태 별 duration 모델과 각 상태의 duration 정보 사이의 상관관계를 표현하는 global pattern (shape 또는 long-term dependency)을 제안한다. 그러나 제안 모델은, Markov 가정을 깨뜨리기 때문에 dynamic programming이 자랑하는 단순함, 효율성을 유지하지는 못한다. 하지만 최근 부각되는 방법인 Monte Carlo 표본 기법을 이용하여 효과적으로 문제를 해결하는 방법을 제시하였다. 본 논문에서는 제안 모델 GL-STDM의 개념과 정의, 그리고 추론 방법과 모델 평가 방법을 기술하였다.
PDF

A P2P Network Design with Dynamic Topology Cloning (동적 위상 복제를 이용한 P2P 네트워크 설계)

구태완;김은규;이성룡;정연진;이광모
- Proceedings of the Korean Information Science Society Conference
- /
- 2003.10c
- /
- pp.433-435
- /
- 2003
PeerToPeer(P2P) 네트워크 모델은 기존의 클라이언트/서버(Client/Server:C/S) 네트워크 모델에 비해 중앙 네트워크상의 트래픽 회피라는 측면에서 현재 활발히 연구되고 있는 분야이다. 그러나 P2P 네트워크 모델은 확장성, 네트워크에 참여하는 노드들의 수에 대한 제약, 구성된 네트워크 모델 기반에서 정보 및 공유 가능한 자원들의 검색에 대한 어려움 등의 많은 문제점들이 있다. 본 논문에서는 효과적인 정보 및 자원의 검색을 위해 정형화된 P2P 네트워크 모델을 기반으로 하여 P2P 네트워크 모델이 가지고 있는 특성들을 고려하여 동적으로 구성 가능한 위상 구조를 제시한다.
PDF

A Study on Quality Assurance for BIM Model (BIM 모델 품질 검증 방안에 관한 연구)

Seong, Jun-Ho;Hwang, Kyu-Bin;Hahn, Seon-Ho;Kim, Khil-Chae
- Proceedings of the Computational Structural Engineering Institute Conference
- /
- 2010.04a
- /
- pp.81-84
- /
- 2010
본 연구는 Building Information Modeling(이하 BIM)의 본연의 목표인 정보의 통합 관리 및 재활용 측면에서 모델의 정보를 정확하고 체계적으로 구축될 수 있는 품질검증의 필요성을 인지하고 이를 위해 BIM 모델의 품질검증 방안에 관하여 논의하고자 한다. 이를 위해 국내외 BIM 관련 품질관리 현황을 파악하고 국내 정보시스템 구축에 관한 지침으로 한국데이터베이스 진흥 센터의 데이터 품질관리 지침을 분석하여 BIM 품질검증 방안을 도출하고자 하였다. 그 결과 BIM 모델의 품질검증 방안을 구축하기 위해 첫쩨 사전적 의미로부터 품질관리의 개념을 수립하고, 그 대상을 설정 하였으며, 둘째로 품질관리의 최종 목표인 정보의 재활용 관점에서 단계적 접근방안으로 5단계의 전략적 방향을 제시 하였다. 마지막으로 BIM 모델의 품질검증 방안을 구축하기 위해 사례 분석을 토대로 BIM 모델 관점에서 품질 검증 시기, 기준, 방법을 제시하였다.
PDF

3D mesh compression using model segmentation and de-duplications (모델 분할 및 중복성 제거 기법을 이용한 3차원 메쉬 압축 기술)

Kim, Sungjei;Jeong, Jinwoo;Yoon, Ju Hong
- Proceedings of the Korean Society of Broadcast Engineers Conference
- /
- 2020.11a
- /
- pp.190-191
- /
- 2020
본 논문은 모델 분할 기법과 중복성 제거 기법을 통한 대용량 3차원 메쉬 모델의 고속 압축 기술에 관한 내용이다. 대용량 3차원 메쉬 모델의 비실시간 압축은 실시간 스트리밍 응용 시나리오에서 제약점으로 작용하고 있고, 본 논문에서는 인코딩 시간을 줄이기 위해 경량 메쉬 분할 방법을 통해 대용량 메쉬를 여러 개의 작은 메쉬로 분할하고, 각각의 분할된 메쉬를 병렬적으로 인코딩하여 처리 속도를 개선하였다. 또한, 메쉬 모델 내의 같은 기하학적 정보를 가진 중복된 정점들이 존재할 수 있으며, 중복된 정보를 제거하고 제거된 정점과 삼각형 표면 간의 연결 정보를 갱신하는 과정을 통해 메쉬 모델의 기하학적 정보를 유지하면서 압축 성능을 확보하였다.
PDF

Korean-English Non-Autoregressive Neural Machine Translation using Word Alignment (단어 정렬을 이용한 한국어-영어 비자기회귀 신경망 기계 번역)

Jung, Young-Jun;Lee, Chang-Ki
- Annual Conference on Human and Language Technology
- /
- 2021.10a
- /
- pp.629-632
- /
- 2021
기계 번역(machine translation)은 자연 언어로 된 텍스트를 다른 언어로 자동 번역 하는 기술로, 최근에는 주로 신경망 기계 번역(Neural Machine Translation) 모델에 대한 연구가 진행되었다. 신경망 기계 번역은 일반적으로 자기회귀(autoregressive) 모델을 이용하며 기계 번역에서 좋은 성능을 보이지만, 병렬화할 수 없어 디코딩 속도가 느린 문제가 있다. 비자기회귀(non-autoregressive) 모델은 단어를 독립적으로 생성하며 병렬 계산이 가능해 자기회귀 모델에 비해 디코딩 속도가 상당히 빠른 장점이 있지만, 멀티모달리티(multimodality) 문제가 발생할 수 있다. 본 논문에서는 단어 정렬(word alignment)을 이용한 비자기회귀 신경망 기계 번역 모델을 제안하고, 제안한 모델을 한국어-영어 기계 번역에 적용하여 단어 정렬 정보가 어순이 다른 언어 간의 번역 성능 개선과 멀티모달리티 문제를 완화하는 데 도움이 됨을 보인다.
PDF

Pre-trained Language Model for Table Question and Answering (표 질의응답을 위한 언어 모델 학습 및 데이터 구축)

Sim, Myoseop;Jun, Changwook;Choi, Jooyoung;Kim, Hyun;Jang, Hansol;Min, Kyungkoo
- Annual Conference on Human and Language Technology
- /
- 2021.10a
- /
- pp.335-339
- /
- 2021
기계독해(MRC)는 인공지능 알고리즘이 문서를 이해하고 질문에 대한 정답을 찾는 기술이다. MRC는 사전 학습 모델을 사용하여 높은 성능을 내고 있고, 일반 텍스트문서 뿐만 아니라 문서 내의 테이블(표)에서도 정답을 찾고자 하는 연구에 활발히 적용되고 있다. 본 연구에서는 기존의 사전학습 모델을 테이블 데이터에 활용하여 질의응답을 할 수 있는 방법을 제안한다. 더불어 테이블 데이터를 효율적으로 학습하기 위한 데이터 구성 방법을 소개한다. 사전학습 모델은 BERT[1]를 사용하여 테이블 정보를 인코딩하고 Masked Entity Recovery(MER) 방식을 사용한다. 테이블 질의응답 모델 학습을 위해 한국어 위키 문서에서 표와 연관 텍스트를 추출하여 사전학습을 진행하였고, 미세 조정은 샘플링한 테이블에 대한 질문-답변 데이터 약 7만건을 구성하여 진행하였다. 결과로 KorQuAD2.0 데이터셋의 테이블 관련 질문 데이터에서 EM 69.07, F1 78.34로 기존 연구보다 우수한 성능을 보였다.
PDF

Extracting multiple sentiment expression areas using BERT+CRF (BERT+CRF를 이용한 다중 감성 표현 영역 추출)

Park, Ji-Eun;Lee, Ju-Sang;Ock, Cheol-Young
- Annual Conference on Human and Language Technology
- /
- 2021.10a
- /
- pp.571-575
- /
- 2021
감성분석이란 텍스트에 들어있는 의견이나 감성, 평가, 태도 등의 주관적인 정보를 컴퓨터를 통해 분석하는 과정이다. 본 논문은 다양한 감성분석 실험 중 감성이 드러나는 부분을 파악하여 서술어 중심의 구 혹은 절 단위로 감성 표현 영역을 추출하는 모델을 개발하고자 한다. 제안하는 모델은 BERT에 classification layer와 CRF layer를 결합한 것이고 baseline은 일반 BERT 모델이다. 실험 결과는 기존의 baseline 모델의 f1-score이 33.44%이고 제안한 BERT+CRF 모델의 f1-score이 40.99%이다. BERT+CRF 모델이 7.55% 더 좋은 성능을 보인다.
PDF

Search Result 23,503, Processing Time 0.042 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)