• 제목/요약/키워드: sequence-to-sequence 모델

검색결과 695건 처리시간 0.03초

온톨로지 지식 기반 특성치를 활용한 Bidirectional LSTM-CRF 모델의 시퀀스 태깅 성능 향상에 관한 연구 (Improving Bidirectional LSTM-CRF model Of Sequence Tagging by using Ontology knowledge based feature)

  • 진승희;장희원;김우주
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.253-266
    • /
    • 2018
  • 본 연구는 질의 응답(QA) 시스템에서 사용하는 개체명 인식(NER)의 성능을 향상시키기 위하여 시퀀스 태깅 방법론을 적용한 새로운 방법론을 제안한다. 사용자의 질의를 입력 받아 데이터베이스에 저장된 정답을 추출하기 위해서는 사람의 언어를 컴퓨터가 알아들을 수 있도록 구조화 질의어(SQL)와 같은 데이터베이스의 언어로 전환하는 과정이 필요한데, 개체명 인식은 사용자의 질의에서 데이터베이스에 포함된 클래스나 데이터 명을 식별하는 과정이다. 기존의 데이터베이스에서 질의에 포함된 단어를 검색하여 개체명을 인식하는 방식은 동음이의어와 문장성분 구를 문맥을 고려하여 식별하지 못한다. 다수의 검색 결과가 존재하면 그들 모두를 결과로 반환하기 때문에 질의에 대한 해석이 여러 가지가 나올 수 있고, 계산을 위한 시간복잡도가 커진다. 본 연구에서는 이러한 단점을 극복하기 위해 신경망 기반의 방법론을 사용하여 질의가 가지는 문맥적 의미를 반영함으로써 이러한 문제를 해결하고자 했고 신경망 기반의 방법론의 문제점인 학습되지 않은 단어에 대해서도 문맥을 통해 식별을 하고자 하였다. Sequence Tagging 분야에서 최신 기술인 Bidirectional LSTM-CRF 모델을 도입함으로써 신경망 모델이 가진 단점을 해결하였고, 학습되지 않은 단어에 대해서는 온톨로지 기반 특성치를 활용하여 문맥을 반영한 추론을 사용하였다. 음악 도메인의 온톨로지(Ontology) 지식베이스를 대상으로 실험을 진행하고 그 성능을 평가하였다. 본 연구에서 제안한 방법론인 L-Bidirectional LSTM-CRF의 성능을 정확하게 평가하기 위하여 학습에 포함된 단어들뿐만 아니라 학습에 포함되지 않은 단어들도 포함한 질의를 평가에 사용하였다. 그 결과 L-Bidirectional LSTM-CRF 모형을 재학습 시키지 않아도 학습에 포함되지 않은 단어를 포함한 질의에 대한 개체명 인식이 가능함을 확인하였고, 전체적으로 개체명 인식의 성능이 향상됨을 확인할 수 있었다.

단백질 기능 예측을 위한 그래프 기반 모델링 (Graph-based modeling for protein function prediction)

  • 황두성;정재영
    • 정보처리학회논문지B
    • /
    • 제12B권2호
    • /
    • pp.209-214
    • /
    • 2005
  • 단백질 상호작용 데이터는 현 생물정보학에서 기능이 알려져 있지 않은 단백질의 기능 예측에 높은 신뢰성이 있는 프로티오믹스의 계산 모델에 이용되고 있다. 단백질 기능 예측 관련 연구로는 guilt-by-association 개념을 바탕으로 대규모의 단순 2차원 단백질-단백질 상호작용 맵을 이용하고 있다. 본 논문에서는 단백질-단백질 상호작용 데이터를 이용한 그래프 기반 기능 예측 방법인 neighbor-counting, $\chi^2$-통계치 예측 모델을 살펴보고 대량의 상호작용 데이터로부터 빠른 기능예측에 효과적인 알고리즘을 제안한다. 제안하는 알고리즘은 단백질 상호작용 맵, 서열 유사성 및 경험적 전문가 지식을 이용하는 그래프 기반 모델이다. 제안된 알고리즘은 Yeast 단백질의 기능 예측을 수행하였으며, neighbor-counting, $\chi^2$-통계치 모델의 실험 결과와 비교되었다.

컨테이너의 최적 적하계획을 위한 PPGA (PPGA for the Optimal Load Planning of Containers)

  • 김길태;조석제;진강규;김시화
    • 한국항해항만학회지
    • /
    • 제28권6호
    • /
    • pp.517-523
    • /
    • 2004
  • 컨테이너 적하계획은 항만 장비운용의 효율성을 결정짖는 주요 요인 중 하나이다. 적하계획 문제에 유전알고리즘을 응용할 때 처리 작업 수가 많게 되면, 기존의 방법으로 많은 시간이 걸린다. 이 문제를 해결하기 위하여 본 논문에서는 이주모델과 링구조 기반의 의사병렬 유전알고리즘을 개발하고 컨테이너의 최적 적하순서를 결정하는 문제에 적용하여 그 유효성을 밝힌다.

Co/Si 다층박막에서의 고상반응에 의한 비정질상과 결정상의 생성 및 상전이 (Formation of amorphous and crystalline phase, phase sequence by solid state reaction in Co/Si multilayer thin films)

  • 심재엽;박상욱;지응준;곽준섭;최정동;백홍구
    • 한국재료학회지
    • /
    • 제4권3호
    • /
    • pp.301-311
    • /
    • 1994
  • Co/Si계에서 고상확산에 의하여 비정질상이 생성되는지의 여부를 유효구동력 개념을 이용하여 예측하였으며 유효생성열 개념 및 PDF모델로부터 결정상의 생성과 상전이를 예측하였다. 한편, DSC와 XRD를 이용하여 Co/Si다층박막에서의 비정질상의 생성여부와 결정상의 생성 및 상전이를 확인하여 모델로부터 예측한 결과와 비교하였다. Co/si계에서는 비정질상이 성장하지 않았으며 이는 유효구동력 개념으로부터 예측된 결과와 일치하였다. Co/Si계에서 생성되는 최초의 결정상은 CoSi였으며 유효생성열과 PDF모델로부터 예측된 최초의 결정상은 각각 $CO_2Si$와 CoSi였다. 따라서 Co/Si계에서 생성되는 최초의 결정상은 구조적인 요소를 고려해 PDF모델의 예측결과와 잘 일치하였다. 증착당시 Co와 Si의 조성비가 2대 1일경우와 1대 2일 경우의 상전이는 각각 $CoSi \to Co_2Si$$CoSi \to Co_2Si \to CoSi \to CoSi_2$의 초기단계의 생성기구는 각각 핵생성이 율속이었으며, 이들의 생성에 필요한 활성화에너지는 각각 1.71, 2.34, 2.79eV이었다.

  • PDF

의존성 반영 분해모델에 의한 유전자의 핵심 프로모터 영역 예측 (Prediction of Core Promoter Region with Dependency - Reflecting Decomposition Model)

  • 김기봉;박기정;공은배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권3_4호
    • /
    • pp.379-387
    • /
    • 2003
  • 다수의 미생물 유전체 프로젝트들이 완료되면서 엄청난 양의 유전체 핵산 염기서열 데이터들이 양산되고 있다. 이러한 상황에서 전산 기법을 이용하여 유전체 DNA 염기서열 상에서 유전자의 프로모터 영역을 규명하는 문제는 최근에 상당한 연구의 관심대상으로 떠오르고 있다. 본 논문에서는 전사조절의 핵심 역할을 하는 -10 영역과 전사개시 부위를 포함한 원핵생물의 핵심 프로모터 영역에 대한 의존성 반영 분해모델 (Dependency-Reflecting Decomposition Model)을 제안한다. 이 모델은 인접한 위치에 존재하는 핵산 염기들 사이의 의존성뿐만 아니라 인접하지 않은 위치의 핵산 염기들간의 의존성까지 고려함으로써 핵산 염기서열 상에 내포되어있는 중요한 생물학적 의존성들을 함축하고 있다. DRDM 모델은 우수한 성능평가 결과를 보였으며. 미생물 유전체 Contig들 상에서 임의의 유전자 프로모터를 예측하는데 효과적으로 이용될 수 있다.

천해에 적용가능한 태풍 해일-조석-파랑 수치모델 개발 1. 해수유동 모델의 정확성 검토 (Development of the Combined Typhoon Surge-Tide-Wave Numerical Model Applicable to Shallow Water 1. Validation of the Hydrodynamic Part of the Model)

  • 천제호;안경모;윤종태
    • 한국해안·해양공학회논문집
    • /
    • 제21권1호
    • /
    • pp.63-78
    • /
    • 2009
  • 본 논문에서는 천해에 적용 가능한 동적결합형 태풍 해일-조석-파랑 수치모델의 개발과 개발된 모델의 정확성을 검증하였다. 태풍 해일과 조석 수치모델은 POM (Princeton Ocean Model)을 기반으로 하였으며, 풍파 파랑 수치모델은 WAM (Wave Model)을 기반으로 천해에 적용할 수 있도록 수정하여 두 모델을 동적으로 결합하였다. 연속된 두 개의 논문 중에 첫 번째 논문인 본 논문에서는 해일과 조석을 수치 모의하는 해수유동 부분의 수치모의의 안정성과 정확성을 검증하였다. 수치모의의 안정성과 정확성 향상을 위하여 기존의 POM 모델의 난류 수치모델 부분과 연직속도 계산 알고리즘을 수정 보완하였다. 수정된 POM 모델의 정확성과 수치적 안정성 검증을 위하여 해석해와 실 해역에서 측정된 관측결과와 비교하였으며, 수정된 POM 모델이 기존의 POM 모델보다 수치계산의 안정성과 정확성이 개선되었음을 확인할 수 있었다.

활률적 클러스터링에 의한 움직임 파라미터 추정과 세그맨테이션 (Motion Parameter Estimation and Segmentation with Probabilistic Clustering)

  • 정차근
    • 방송공학회논문지
    • /
    • 제3권1호
    • /
    • pp.50-60
    • /
    • 1998
  • 본 논문에서는 콤팩트한 동영상 표현과 객체기반의 generic한 동영상압축을 위한 파라미터릭 움직임 모델의 파라미터 추정과 세그맨테이션 기법에 관해서 기술한다. 동영상의 optical flow와 같은 국소적 움직임 정보와 파라미터 움직임 모델의 특징을 이용해서 영상의 콤팩트한 구조적 표현을 추출하기 위해, 본 논문에서는 2 스템의 과정 즉, 초기영역을 추출하는 과정과, 파라미터릭 움직임 파라미터의 추정과 세그맨테이션을 동시에 수행하는 과정으로 구성된 새로운 알고리즘을 제안한다. 혼합 모델이 ML 추정에 의거한 확률적 클러스터링에 의해 움직임 물체의 움직임과 형상을 반영한 초기영역을 추출하고, 파라미터릭 움직임 모델을 사용해서 각각의 초기 영역마다 움직임 파라미터를 추정하고 세그맨테이션을 수행한다. 또한, CIF 표준 동영상을 사용한 모의 실험을 통해 본 제안 알고리즘의 유효성을 평가한다.

  • PDF

이산 도트 자극에서 시각적 착시를 인식하는 시각 모델 (A Visual Model for the Perception of the Optical illusions from Discrete Dot Stimuli)

  • 정은화;홍경호
    • 정보처리학회논문지B
    • /
    • 제10B권6호
    • /
    • pp.639-646
    • /
    • 2003
  • 본 논문은 일련의 불연속적인 도트 자극으로부터 시각적 착시현상을 추출하는 신경회로망 모델을 제시한다. 제안된 모델은 시각 정보처리 경로에서 발견되는 시각 세포들의 특성을 근거로 한다. 본 연구는 일련의 이산 도트 자극들이 개별적인 도트들로 인식하지 않고 연속적인 가상의 윤곽으로 인식하는 시각적 착시 현상을 나타내는 생리심리학 실험을 기초로 하여 도트 자극의 시각적 착시를 구현한 것으로서 실험에서는 가상 다각형 형태로 배치된 6에서 10개의 도트자극들을 사용한다. 이 실험 데이터는 Smith & Vos가 생리심리학적 실험에서 다룬 데이터와 유사하다. 제안된 모델은 이산 도트자극으로부터 연속적인 착시 윤곽을 성공적으로 추출한다.

설명 가능한 개인화 영화 추천 서비스를 위한 딥러닝 기반 텍스트 요약 모델 (Deep Learning-based Text Summarization Model for Explainable Personalized Movie Recommendation Service)

  • 진요요;강경모;김재경
    • 한국IT서비스학회지
    • /
    • 제21권2호
    • /
    • pp.109-126
    • /
    • 2022
  • The number and variety of products and services offered by companies have increased dramatically, providing customers with more choices to meet their needs. As a solution to this information overload problem, the provision of tailored services to individuals has become increasingly important, and the personalized recommender systems have been widely studied and used in both academia and industry. Existing recommender systems face important problems in practical applications. The most important problem is that it cannot clearly explain why it recommends these products. In recent years, some researchers have found that the explanation of recommender systems may be very useful. As a result, users are generally increasing conversion rates, satisfaction, and trust in the recommender system if it is explained why those particular items are recommended. Therefore, this study presents a methodology of providing an explanatory function of a recommender system using a review text left by a user. The basic idea is not to use all of the user's reviews, but to provide them in a summarized form using only reviews left by similar users or neighbors involved in recommending the item as an explanation when providing the recommended item to the user. To achieve this research goal, this study aims to provide a product recommendation list using user-based collaborative filtering techniques, combine reviews left by neighboring users with each product to build a model that combines text summary methods among deep learning-based natural language processing methods. Using the IMDb movie database, text reviews of all target user neighbors' movies are collected and summarized to present descriptions of recommended movies. There are several text summary methods, but this study aims to evaluate whether the review summary is well performed by training the Sequence-to-sequence+attention model, which is a representative generation summary method, and the BertSum model, which is an extraction summary model.

GPGPU에 기반하는 위치 정보 집합에서 집단 이동성 모델의 도출 기법과 그 표현 기법 (A Method for Group Mobility Model Construction and Model Representation from Positioning Data Set Using GPGPU)

  • 송하윤;김동엽
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권3호
    • /
    • pp.141-148
    • /
    • 2017
  • 인간의 위치 이동 데이터를 모바일 기기에서 수집한 위치 정보를 이용해 얻을 수 있게 되면서, 위치 정보를 어떻게 이용할 수 있는지 그 활용 방안이 중요시 되고 있다. 이 연구에 앞서 위치 정보에 포함된 위치 정보와 시간 정보를 이용한 개인 이동성 모델 도출 연구가 선행되었다. 이동성 모델의 개념을 집단으로 확장하여 특정 집단에 속한 사람들의 개인 이동성 모델을 이용한 집단 이동성 모델을 도출하는 방법에 대해서 연구했고, 두 명의 개인 이동성 모델을 이용한 집단 이동성 모델과 그 모델을 표현하는 Markov 모델을 생성할 수 있었다. 본 논문에서는 세명 이상의 개별 이동 모델을 포함하는 사람의 이동성 모델을 생성하고 집단 모델 내 군집간의 확률 기반 Markov 모델을 도출하는 방법에 대해 소개한다. 또한 GPGPU 기법을 통해 생성 시간을 줄이는 기법을 이용하여 실용화를 고려하였다.