• 제목/요약/키워드: Contextual sequence

검색결과 10건 처리시간 0.018초

Multi-task learning with contextual hierarchical attention for Korean coreference resolution

  • Cheoneum Park
    • ETRI Journal
    • /
    • 제45권1호
    • /
    • pp.93-104
    • /
    • 2023
  • Coreference resolution is a task in discourse analysis that links several headwords used in any document object. We suggest pointer networks-based coreference resolution for Korean using multi-task learning (MTL) with an attention mechanism for a hierarchical structure. As Korean is a head-final language, the head can easily be found. Our model learns the distribution by referring to the same entity position and utilizes a pointer network to conduct coreference resolution depending on the input headword. As the input is a document, the input sequence is very long. Thus, the core idea is to learn the word- and sentence-level distributions in parallel with MTL, while using a shared representation to address the long sequence problem. The suggested technique is used to generate word representations for Korean based on contextual information using pre-trained language models for Korean. In the same experimental conditions, our model performed roughly 1.8% better on CoNLL F1 than previous research without hierarchical structure.

전시공간의 표현요소 연구 (A Study on the Expressive Factors of Exhibition Space)

  • 김준호
    • 한국디자인학회:학술대회논문집
    • /
    • 한국디자인학회 2000년도 추계 학술발표대회 논문집
    • /
    • pp.46-47
    • /
    • 2000
  • 전시공간에는 공간성과 시간성이 교차한다. 구조화된 공간은 시간적 인식 매커니즘으로 개별 시퀀스의 맥락적 합으로 인식된다. 그것은 마치 한편의 영화를 감상할 때나 전통 중국음식을 음미할 때에 잔상, 잔미의 연속적 롤 플레잉의 과정과 유사하다. (중략)

  • PDF

ViStoryNet: 비디오 스토리 재현을 위한 연속 이벤트 임베딩 및 BiLSTM 기반 신경망 (ViStoryNet: Neural Networks with Successive Event Order Embedding and BiLSTMs for Video Story Regeneration)

  • 허민오;김경민;장병탁
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제24권3호
    • /
    • pp.138-144
    • /
    • 2018
  • 본 고에서는 비디오로부터 coherent story를 학습하여 비디오 스토리를 재현할 수 있는 스토리 학습/재현 프레임워크를 제안한다. 이를 위해 연속 이벤트 순서를 감독학습 정보로 사용함으로써 각 에피소드들이 은닉 공간 상에서 궤적 형태를 가지도록 유도하여, 순서정보와 의미정보를 함께 다룰 수 있는 복합된 표현 공간을 구축하고자 한다. 이를 위해 유아용 비디오 시리즈를 학습데이터로 활용하였다. 이는 이야기 구성의 특성, 내러티브 순서, 복잡도 면에서 여러 장점이 있다. 여기에 연속 이벤트 임베딩을 반영한 인코더-디코더 구조를 구축하고, 은닉 공간 상의 시퀀스의 모델링에 양방향 LSTM을 학습시키되 여러 스텝의 서열 데이터 생성을 고려하였다. '뽀롱뽀롱 뽀로로' 시리즈 비디오로부터 추출된 약 200 개의 에피소드를 이용하여 실험결과를 보였다. 실험을 통해 에피소드들이 은닉공간에서 궤적 형태를 갖는 것과 일부 큐가 주어졌을 때 스토리를 재현하는 문제에 적용할 수 있음을 보였다.

Zero-anaphora resolution in Korean based on deep language representation model: BERT

  • Kim, Youngtae;Ra, Dongyul;Lim, Soojong
    • ETRI Journal
    • /
    • 제43권2호
    • /
    • pp.299-312
    • /
    • 2021
  • It is necessary to achieve high performance in the task of zero anaphora resolution (ZAR) for completely understanding the texts in Korean, Japanese, Chinese, and various other languages. Deep-learning-based models are being employed for building ZAR systems, owing to the success of deep learning in the recent years. However, the objective of building a high-quality ZAR system is far from being achieved even using these models. To enhance the current ZAR techniques, we fine-tuned a pretrained bidirectional encoder representations from transformers (BERT). Notably, BERT is a general language representation model that enables systems to utilize deep bidirectional contextual information in a natural language text. It extensively exploits the attention mechanism based upon the sequence-transduction model Transformer. In our model, classification is simultaneously performed for all the words in the input word sequence to decide whether each word can be an antecedent. We seek end-to-end learning by disallowing any use of hand-crafted or dependency-parsing features. Experimental results show that compared with other models, our approach can significantly improve the performance of ZAR.

학습, 기업 활동 통합 지원 모델 및 템플릿의 연구 - uEFL (Universal Engine For Learning)의 활용을 중심으로 - (Study on Templates and Models for Learning & Business Activity Integration using uEFL(Universal Engine for Learning))

  • 이호건;허원;장진영
    • 통상정보연구
    • /
    • 제10권4호
    • /
    • pp.81-96
    • /
    • 2008
  • uEFL is an open source solution to integrate general business/learning activities and processes. uEFL is originally developed to adopt LD (Learning Design) specification, which represents learning as various combination of learning activities with learning conditions and outcomes. Learning activities are described with participant's role, learning environment, and contextual sequence. This viewpoint resembles BPM (Business Process Modeling). uEFL can convert LD to BPM description. uEFL engine can run converted LD activity with other business activities. This paper presents 4 templates and 2 sample models for uEFL. The templates and models will show how learning activities can be integrated with business activities efficiently.

  • PDF

활동기반 접근법에 의한 활동패턴의 맥락적 정보분석과 프로파일 (An Activity-Based Analysis of Contextual Information of Activity Patterns and Profiles)

  • 조창현
    • 대한교통학회지
    • /
    • 제25권6호
    • /
    • pp.171-183
    • /
    • 2007
  • 도시교통 수요는 활동 수행으로부터 유발된다. 개인의 활동 의사결정에 의한 일상활동의 개인 간 총합은 집합적 공간행동으로 관찰되며, 활동간 서로 다른 공간의 극복을 위해 유발된 통행은 활동 간의 구조적인 상호연쇄관계에 의해 그 구체적 형태를 부여받는다. 개인의 하루 일상을 통한 시공간적 의사결정 및 사회적 실행과 사회 공간적 환경간의 상호작용을 탐구하는 활동기반접근법은 도시민의 일상과 통행을 분석하는데 중요한 이론 틀을 제공한다. 이 연구는 도시민의 일상활동을 활동기반접근법에 근거하여 대표적인 유형으로 분류하고, 분류된 유형의 프로파일과 관련 있는 활동 주체 특성과 활동 당시의 상황 특성을 분석하였다. 분석 결과 도시민의 일상활동은 소수의 대표적 활동패턴 집단으로 분류 가능하며, 각 집단의 특성은 다차원 프로파일에 의해 유의하게 요약되었다. 또한 각각의 프로파일은 서로 다른 사회경제적, 상황적 특성과 상관되어 있음을 확인하였다. 연구는 도시민의 일상활동 원리를 밝힘으로써, 도시교통 정책수단에 대한 도시민의 개별 반응 양식과 그 집합적 행동을 예측하기 위한 이론적 기초를 제공한다.

순환 신경망 모델을 이용한 한국어 음소의 음성인식에 대한 연구 (A Study on the Speech Recognition of Korean Phonemes Using Recurrent Neural Network Models)

  • 김기석;황희영
    • 대한전기학회논문지
    • /
    • 제40권8호
    • /
    • pp.782-791
    • /
    • 1991
  • In the fields of pattern recognition such as speech recognition, several new techniques using Artifical Neural network Models have been proposed and implemented. In particular, the Multilayer Perception Model has been shown to be effective in static speech pattern recognition. But speech has dynamic or temporal characteristics and the most important point in implementing speech recognition systems using Artificial Neural Network Models for continuous speech is the learning of dynamic characteristics and the distributed cues and contextual effects that result from temporal characteristics. But Recurrent Multilayer Perceptron Model is known to be able to learn sequence of pattern. In this paper, the results of applying the Recurrent Model which has possibilities of learning tedmporal characteristics of speech to phoneme recognition is presented. The test data consist of 144 Vowel+ Consonant + Vowel speech chains made up of 4 Korean monothongs and 9 Korean plosive consonants. The input parameters of Artificial Neural Network model used are the FFT coefficients, residual error and zero crossing rates. The Baseline model showed a recognition rate of 91% for volwels and 71% for plosive consonants of one male speaker. We obtained better recognition rates from various other experiments compared to the existing multilayer perceptron model, thus showed the recurrent model to be better suited to speech recognition. And the possibility of using Recurrent Models for speech recognition was experimented by changing the configuration of this baseline model.

사실적 행동 활성화를 위한 컨텍스트 인식 증강현실 에이전트의 행동생성 시스템 (Behavior Generation System of Context-aware Augmented Reality Agent for Realistic Activation of agent's behavior)

  • 신헌용;우운택
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.579-582
    • /
    • 2009
  • 최근에 증강현실 에이전트에 대한 관심의 증가로 인하여, 유비쿼터스 컴퓨팅 환경이나 사용자의 입력에 자율적으로 반응하거나 새로운 형태의 인터페이스로서 이에 대한 다양한 연구가 진행되고 있다. 하지만, 기존의 연구들은 에이전트의 반응생성을 위한 유비쿼터스 컴퓨팅 환경내의 컨텍스트와 실제 및 가상 공간에 존재하는 정보들의 활용 방안에 대한 연구가 부족하였다. 따라서 본 논문에서는 환경 정보와 사용자의 프로파일 정보, 그리고 사용자 중심의 컨텍스트의 활용해서 행동을 선택하고 계획하는 증강현실 에이전트의 행동생성 시스템을 제안하고자 한다. 에이전트의 내부는 Belief-Desire-Intention (BDI) 모델과 계층적 업무 네트워크 (HTN)내 검색을 통해서, 반응적 행동의 시퀀스를 선택한다. 행동의 시퀀스가 기본 행동들만으로 구성이 된 후, 에이전트는 이전 행동 및 입력의 종류에 따라서 행동의 적합성을 판단 및 적응을 수행한 후, 행동을 활성화 시킨다. 제안된 행동 생성 시스템은 행동을 통한 에이전트의 정보 전달이 요구되는 교육, 게임, 도우미 에이전트 등에서 응용이 가능할 것이다. 이렇게 계획된 행동을 통해서 증강현실 에이전트는 효과적인 정보 전달과 의사소통 능력을 사용자에게 보여줄 수 있을 것으로 기대된다.

  • PDF

트윗의 타임 시퀀스를 활용한 DTM 분석 : 2019 남북미정상회동 이벤트를 중심으로 (Tweets analysis using a Dynamic Topic Modeling : Focusing on the 2019 Koreas-US DMZ Summit)

  • 고은지;최선영
    • 한국정보통신학회논문지
    • /
    • 제25권2호
    • /
    • pp.308-313
    • /
    • 2021
  • 이 연구는 2019년 판문점 남북미 정상 회동 트윗을 타임 시퀀스와 함께 수집하여 시퀀셜 토픽모델링인 DTM으로 분석하였다. 트위터와 같은 마이크로 블로깅 서비스는 단일 이벤트에 뉴스와 오피니언이 혼재된 비정형 데이터가 대규모로 동시에 발생하고, 정보와 반응이 동일 메시지 형식으로 생산된다. 때문에 토픽 트렌드를 파악하려면 시퀀셜 데이터의 특성을 반영하여 패턴 분석을 해야 맥락적 의미를 알 수 있다. 토픽 일관성 점수를 구해 LDA를 평가한 후 DTM을 계산한 결과, 뉴스 보도와 오피니언 관련 토픽 30개가 도출되었고, 각 토픽과 키워드는 시간에 따라 발생 확률이 역동적으로 진화하고 있었다. 결론적으로 DTM은 특정 이벤트에 대한 사회 전반에 나타난 통합적 토픽 추이를 시간에 따라 분석하는데 적합한 모델임을 밝혔다.

온톨로지 지식 기반 특성치를 활용한 Bidirectional LSTM-CRF 모델의 시퀀스 태깅 성능 향상에 관한 연구 (Improving Bidirectional LSTM-CRF model Of Sequence Tagging by using Ontology knowledge based feature)

  • 진승희;장희원;김우주
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.253-266
    • /
    • 2018
  • 본 연구는 질의 응답(QA) 시스템에서 사용하는 개체명 인식(NER)의 성능을 향상시키기 위하여 시퀀스 태깅 방법론을 적용한 새로운 방법론을 제안한다. 사용자의 질의를 입력 받아 데이터베이스에 저장된 정답을 추출하기 위해서는 사람의 언어를 컴퓨터가 알아들을 수 있도록 구조화 질의어(SQL)와 같은 데이터베이스의 언어로 전환하는 과정이 필요한데, 개체명 인식은 사용자의 질의에서 데이터베이스에 포함된 클래스나 데이터 명을 식별하는 과정이다. 기존의 데이터베이스에서 질의에 포함된 단어를 검색하여 개체명을 인식하는 방식은 동음이의어와 문장성분 구를 문맥을 고려하여 식별하지 못한다. 다수의 검색 결과가 존재하면 그들 모두를 결과로 반환하기 때문에 질의에 대한 해석이 여러 가지가 나올 수 있고, 계산을 위한 시간복잡도가 커진다. 본 연구에서는 이러한 단점을 극복하기 위해 신경망 기반의 방법론을 사용하여 질의가 가지는 문맥적 의미를 반영함으로써 이러한 문제를 해결하고자 했고 신경망 기반의 방법론의 문제점인 학습되지 않은 단어에 대해서도 문맥을 통해 식별을 하고자 하였다. Sequence Tagging 분야에서 최신 기술인 Bidirectional LSTM-CRF 모델을 도입함으로써 신경망 모델이 가진 단점을 해결하였고, 학습되지 않은 단어에 대해서는 온톨로지 기반 특성치를 활용하여 문맥을 반영한 추론을 사용하였다. 음악 도메인의 온톨로지(Ontology) 지식베이스를 대상으로 실험을 진행하고 그 성능을 평가하였다. 본 연구에서 제안한 방법론인 L-Bidirectional LSTM-CRF의 성능을 정확하게 평가하기 위하여 학습에 포함된 단어들뿐만 아니라 학습에 포함되지 않은 단어들도 포함한 질의를 평가에 사용하였다. 그 결과 L-Bidirectional LSTM-CRF 모형을 재학습 시키지 않아도 학습에 포함되지 않은 단어를 포함한 질의에 대한 개체명 인식이 가능함을 확인하였고, 전체적으로 개체명 인식의 성능이 향상됨을 확인할 수 있었다.