• 제목/요약/키워드: sequence-to-sequence 모델

검색결과 695건 처리시간 0.025초

회분식 공정의 HAZOP 분석 자동화를 위한 이탈전파 모델 (Deviation - Propagation Models for Automating HAZOP Analysis of Batch Processes)

  • 옥유영;허보경;황규석
    • 한국가스학회지
    • /
    • 제3권2호
    • /
    • pp.34-42
    • /
    • 1999
  • 회분식 공정의 HAZOP 분석 기법은 연속 공정의 HAZOP 분석 기법과는 달리 time과 sequence라는 이산적인 변수들을 고려해야 한다. 회분식 공정의 time과 sequence 해석은 연속 공정의 HAZOP 분석 기법으로는 설명될 수 없으므로, 이산 변수들과 연속 변수들의 관계를 이용하여 회분식 공정의 HAZOP 분석을 수행하는 방법을 개발하였다 본 연구에서는 이 방법을 Latex 제조 공정에 적용하여 그 실효성을 검토하였다.

  • PDF

제한된 언어 자원 환경에서의 다국어 개체명 인식 (Multilingual Named Entity Recognition with Limited Language Resources)

  • 천민아;김창현;박호민;노경목;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.143-146
    • /
    • 2017
  • 심층학습 모델 중 LSTM-CRF는 개체명 인식, 품사 태깅과 같은 sequence labeling에서 우수한 성능을 보이고 있다. 한국어 개체명 인식에 대해서도 LSTM-CRF 모델을 기본 골격으로 단어, 형태소, 자모음, 품사, 기구축 사전 정보 등 다양한 정보와 외부 자원을 활용하여 성능을 높이는 연구가 진행되고 있다. 그러나 이런 방법은 언어 자원과 성능이 좋은 자연어 처리 모듈(형태소 세그먼트, 품사 태거 등)이 없으면 사용할 수 없다. 본 논문에서는 LSTM-CRF와 최소한의 언어 자원을 사용하여 다국어에 대한 개체명 인식에 대한 성능을 평가한다. LSTM-CRF의 입력은 문자 기반의 n-gram 표상으로, 성능 평가에는 unigram 표상과 bigram 표상을 사용했다. 한국어, 일본어, 중국어에 대해 개체명 인식 성능 평가를 한 결과 한국어의 경우 bigram을 사용했을 때 78.54%의 성능을, 일본어와 중국어는 unigram을 사용했을 때 각 63.2%, 26.65%의 성능을 보였다.

  • PDF

제한된 언어 자원 환경에서의 다국어 개체명 인식 (Multilingual Named Entity Recognition with Limited Language Resources)

  • 천민아;김창현;박호민;노경목;김재훈
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.143-146
    • /
    • 2017
  • 심층학습 모델 중 LSTM-CRF는 개체명 인식, 품사 태깅과 같은 sequence labeling에서 우수한 성능을 보이고 있다. 한국어 개체명 인식에 대해서도 LSTM-CRF 모델을 기본 골격으로 단어, 형태소, 자모음, 품사, 기구축 사전 정보 등 다양한 정보와 외부 자원을 활용하여 성능을 높이는 연구가 진행되고 있다. 그러나 이런 방법은 언어 자원과 성능이 좋은 자연어 처리 모듈(형태소 세그먼트, 품사 태거 등)이 없으면 사용할 수 없다. 본 논문에서는 LSTM-CRF와 최소한의 언어 자원을 사용하여 다국어에 대한 개체명 인식에 대한 성능을 평가한다. LSTM-CRF의 입력은 문자 기반의 n-gram 표상으로, 성능 평가에는 unigram 표상과 bigram 표상을 사용했다. 한국어, 일본어, 중국어에 대해 개체명 인식 성능 평가를 한 결과 한국어의 경우 bigram을 사용했을 때 78.54%의 성능을, 일본어와 중국어는 unigram을 사용했을 때 각 63.2%, 26.65%의 성능을 보였다.

  • PDF

UML 사용 사례 다이어그램과 순서 다이어그램을 이용한 SMIL 문서 동기화 (Synchronization of SMIL Documents using UML Use Case Diagrams and Sequence Diagrams)

  • 채원석;하얀;김용성
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권4호
    • /
    • pp.357-369
    • /
    • 2000
  • SMIL(Synchronized Multimedia Integration Language)는 멀티미디어 객체의 집합으로 시간적인 동기화를 표현할 수 있는 마크업 언어이다. 본 연구에서는 SMIL 문서를 시간에 따라 동기화 표현을 명확히 할 수 있도록 객체 지향 기반의 시각화 도구인 UML의 사용 사례(Use case), 순서(Sequence), 다이어그램을 이용한 객체 모델링 방법을 제안한다. 이를 위해 SMIL 문서에서 UML 사용사례와 순서 다이어그램으로의 사상 규칙과 알고리즘, 형식 모델, 그리고, 모델링 함수를 제안한다. 본 연구의 의의는 SMIL 문서 개발자들이 손쉽게 문서 구조 파악 및 개발을 할 수 있으며, 형식 모델과 다이어그램 모델링 함수는 객체지향 데이타베이스 문서 관리의 기반이 된다는 것이다.

  • PDF

점용접의 해석 모델 개발 및 용접조건에 대한 영향도 분석 (Development of Computational Model for Spot Welding and Effect Analysis on Welding Conditions)

  • 방혜진;주용현;최정훈;신현식;정병성;박규종;이상교;조종두
    • 한국자동차공학회논문집
    • /
    • 제23권6호
    • /
    • pp.642-649
    • /
    • 2015
  • Resistance Spot Welding (RSW) is the method for joining two overlapped base materials when high pressure and current is applied from electrodes. Due to the safety problem such high pressure and voltage, automation should be early adopted. In this paper, the spot welding is developed as a computational model of wheel house from GM Korea and the welding condition such as weld sequence is considered. The computational analysis is preceded as a static and elasto-plastic procedure and used thermal expansion coefficient represents a dependency of spot volume between two panels. In case of welding sequence, the efficiency which depends on the distance between current spot point and the other is calculated in several cases.

영상 시퀀스의 밝기변화 보정 (Luminance Stabilization of Image Sequence)

  • 이임건;한수환
    • 한국정보통신학회논문지
    • /
    • 제14권7호
    • /
    • pp.1661-1666
    • /
    • 2010
  • 영상 시퀀스는 획득과정에서 주변부의 밝기 변화와 그림자 등으로 인해 원치 않는 밝기 변화가 포함될 수 있다. 시각적으로 성가신 훼손 형태로 표현되는 이러한 플리커(flicker)는 움직임 벡터의 계산이나 물체의 추출과 같은 후 처리에 많은 영향을 미치므로 미리 제거하는 것이 바람직하다. 본 논문은 플리커를 발생시키는 모델을 분석하고 이를 제거하는 새로운 알고리즘을 제안한다. 제안하는 알고리즘은 플리커를 유발하는 게인과 오프셋 파라미터를 분리하여 추정하고 이를 훼손된 영상에 보정하여 영상 시퀀스를 안정화 시킨다. 제안하는 방법을 장면에서 움직임이 없는 인위적인 테스트 영상 시퀀스와 움직임이 있는 실제 영상 시퀀스에 적용하여 알고리즘의 성능을 보였다.

비지도 학습 기반의 임베딩과 오토인코더를 사용한 침입 탐지 방법 (Intrusion Detection Method Using Unsupervised Learning-Based Embedding and Autoencoder)

  • 이준우;김강석
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권8호
    • /
    • pp.355-364
    • /
    • 2023
  • 최근 지능화된 사이버 위협이 지속적으로 증가함에 따라 기존의 패턴 혹은 시그니처 기반의 침입 탐지 방식은 새로운 유형의 사이버 공격을 탐지하는데 어려움이 있다. 따라서 데이터 학습 기반 인공지능 기술을 적용한 이상 징후 탐지 방법에 관한 연구가 증가하고 있다. 또한 지도학습 기반 이상 탐지 방식은 학습을 위해 레이블 된 이용 가능한 충분한 데이터를 필요로 하기 때문에 실제 환경에서 사용하기에는 어려움이 있다. 최근에는 정상 데이터로 학습하고 데이터 자체에서 패턴을 찾아 이상 징후를 탐지하는 비지도 학습 기반의 방법에 대한 연구가 활발히 진행되고 있다. 그러므로 본 연구는 시퀀스 로그 데이터로부터 유용한 시퀀스 정보를 보존하는 잠재 벡터(Latent Vector)를 추출하고, 추출된 잠재 벡터를 사용하여 이상 탐지 학습 모델을 개발하는데 있다. 각 시퀀스의 특성들에 대응하는 밀집 벡터 표현을 생성하기 위하여 Word2Vec을 사용하였으며, 밀집 벡터로 표현된 시퀀스 데이터로부터 잠재 벡터를 추출하기 위하여 비지도 방식의 오토인코더(Autoencoder)를 사용하였다. 개발된 오토인코더 모델은 시퀀스 데이터에 적합한 순환신경망 GRU(Gated Recurrent Unit) 기반의 잡음 제거 오토인코더, GRU 네트워크의 제한적인 단기 기억문제를 해결하기 위한 1차원 합성곱 신경망 기반의 오토인코더 및 GRU와 1차원 합성곱을 결합한 오토인코더를 사용하였다. 실험에 사용된 데이터는 시계열 기반의 NGIDS(Next Generation IDS Dataset) 데이터이며, 실험 결과 GRU 기반의 오토인코더나, 1차원 합성곱 기반의 오토인코더를 사용한 모델보다 GRU와 1차원 합성곱을 결합한 오토인코더가 훈련 데이터로부터 유용한 잠재 패턴을 추출하기 위한 학습 시간적 측면에서 효율적이었고 이상 탐지 성능 변동의 폭이 더 작은 안정된 성능을 보였다.

단어 생성 이력을 이용한 시퀀스-투-시퀀스 요약의 어휘 반복 문제 해결 (Reduce Redundant Repetition Using Decoding History for Sequence-to-Sequence Summarization)

  • 류재현;노윤석;최수정;박세영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.120-125
    • /
    • 2018
  • 문서 요약 문제는 최근 심층 신경망을 활용하여 활발히 연구되고 있는 문제 중 하나이다. 많은 기존 연구들이 주로 시퀀스-투-시퀀스 모델을 활용하여 요약을 수행하고 있으나, 아직 양질의 요약을 생성하기에는 많은 문제점이 있다. 시퀀스-투-시퀀스 모델을 활용한 요약에서 가장 빈번히 나타나는 문제 중 하나는 요약문의 생성과정에서 단어나 구, 문장이 불필요하게 반복적으로 생성되는 것이다. 이를 해결하기 위해 다양한 연구가 이루어지고 있으며, 이들 대부분은 요약문의 생성 과정에서 정확한 정보를 주기 위해 모델에 여러 모듈을 추가하였다. 하지만 기존 연구들은 생성 단어가 정답 단어로 나올 확률을 최대화 하도록 학습되기 때문에, 생성하지 말아야 하는 단어에 대한 학습이 부족하여 반복 생성 문제를 해결하는 것에는 한계가 있다. 따라서 본 논문에서는 기존 요약 모델의 복잡도를 높이지 않고, 단어 생성 이력을 직접적으로 이용하여 반복 생성을 제어하는 모델을 제안한다. 제안한 모델은 학습할 때 생성 단계에서 이전에 생성한 단어가 이후에 다시 생성될 확률을 최소화하여 실제 모델이 생성한 단어가 반복 생성될 확률을 직접적으로 제어한다. 한국어 데이터를 이용하여 제안한 방법을 통해 요약문을 생성한 결과, 비교모델보다 단어 반복이 크게 줄어들어 양질의 요약을 생성하는 것을 확인할 수 있었다.

  • PDF

비선형 줌-렌즈 왜곡 모델을 이용한 비디오 영상에서의 줌-렌즈 왜곡 보정 (Zoom Lens Distortion Correction Of Video Sequence Using Nonlinear Zoom Lens Distortion Model)

  • 김대현;신형철;오주현;남승진;손광훈
    • 방송공학회논문지
    • /
    • 제14권3호
    • /
    • pp.299-310
    • /
    • 2009
  • 본 논문은 줌-렌즈로 취득한 비디오 영상에 대해서 줌-렌즈의 왜곡을 자동으로 보상할 수 있는 새로운 방법을 제안하였다. 먼저, 초점거리의 증가에 따라 렌즈의 왜곡 계수가 비선형적으로 단조 감소하는 특징으로부터 초점거리와 렌즈 왜곡 계수로 표현되는 비선형 줌-렌즈 왜곡 모델을 정의하였다. 그리고 취득한 비디오 영상으로부터 몇 장의 샘플 영상을 선정하고, 이 샘플영상에 대한 초점거리와 렌즈 왜곡 계수는 기존의 방법들을 이용하여 측정하였다. 이렇게 측정한 초점거리와 렌즈 왜곡 계수들로 부터 줌-렌즈 왜곡 모델을 최적화 시켰다. 최적화된 줌-렌즈 왜곡 모델은 각 비디오 영상의 초점거리를 입력으로 하여 렌즈 왜곡계수를 자동으로 계산할 수 있다. 본 논문에서 제안한 방법은 다양한 실사 영상과 비디오 영상에 적용하여 그 성능을 검증하였으며, 화질의 열화 없이 영상의 왜곡을 보상할 수 있었다.

단백질 구조 예측을 위한 서열 연관 규칙 탐사 (Discovering Sequence Association Rules for Protein Structure Prediction)

  • 김정자;이도헌;백윤주
    • 정보처리학회논문지D
    • /
    • 제8D권5호
    • /
    • pp.553-560
    • /
    • 2001
  • 바이오정보학(bioinformatic)은 생물학 분야 특히 분자 수준의 유전체 연구에서 발생하는 데이터를 저장, 관리, 분석하여 실험 프로젝트를 지원함은 물론, 기능 예측 및 조절에 대한 실험 설계를 가능하게 하는 제반 컴퓨터 기술을 의미한다. 유전체 연구의 다양한 접근 방식 중 단백체학(proteomics)는 유전체의 최종 산물인 단백질을 직접적으로 다룬다는 측면에서 그 효용성에 대해 많은 기대를 모으고 있다. 본 논문에서는 단백질의 기능을 결정하는 가장 중요한 요소 중 하나인 단백질의 구조를 예측하기 위한 데이터 마이닝 기법을 제안한다. 단백질의 일차 구조인 아미노산 서열에 타나나는 부서열간의 연관성이 해당 단백질의 이차 혹은 삼차 구조를 결정하는 중요한 단서임을 설명하고, 아미노산 부서열간의 연관성을 표현하기 위한 모델로서 서열 연관 규직을 정의한다. 서열 연관 규칙의 유용성을 평가하기 위한 지지도와 신뢰도를 새롭게 정의하고, 주어진 단백질 집단으로부터 유용한 서열 연관 규칙을 발견하기 위한 기법을 제안한다. 아울러, SWISS-PROT 단백질 데이터베이스로부터 입수한 단백질 서열 데이터를 이용하여 제안한 기법의 성능을 평가한다.

  • PDF