• 제목/요약/키워드: 모델 접근 방법

검색결과 1,688건 처리시간 0.033초

뉴스 클러스터링을 위한 문장 간 상호 작용 기반 문서 쌍 유사도 측정 모델들 (Sentence Interaction-based Document Similarity Models for News Clustering)

  • 최성환;손동현;이호창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.401-407
    • /
    • 2020
  • 뉴스 클러스터링에서 두 문서 간의 유사도는 클러스터의 특성을 결정하는 중요한 부분 중 하나이다. 전통적인 단어 기반 접근 방법인 TF-IDF 벡터 유사도는 문서 간의 의미적인 유사도를 반영하지 못하고, 기존 딥러닝 기반 접근 방법인 시퀀스 유사도 측정 모델은 문서 단위에서 나타나는 긴 문맥을 반영하지 못하는 문제점을 가지고 있다. 이 논문에서 우리는 뉴스 클러스터링에 적합한 문서 쌍 유사도 모델을 구성하기 위하여 문서 쌍에서 생성되는 다수의 문장 표현들 간의 유사도 정보를 종합하여 전체 문서 쌍의 유사도를 측정하는 네 가지 유사도 모델을 제안하였다. 이 접근 방법들은 하나의 벡터로 전체 문서 표현을 압축하는 HAN (hierarchical attention network)와 같은 접근 방법에 비해 두 문서에서 나타나는 문장들 간의 직접적인 유사도를 통해서 전체 문서 쌍의 유사도를 추정한다. 그리고 기존 접근 방법들인 SVM과 HAN과 제안하는 네 가지 유사도 모델을 통해서 두 문서 쌍 간의 유사도 측정 실험을 하였고, 두 가지 접근 방법에서 기존 접근 방법들보다 높은 성능이 나타나는 것을 확인할 수 있었고, 그래프 기반 접근 방법과 유사한 성능을 보이지만 더 효율적으로 문서 유사도를 측정하는 것을 확인하였다.

  • PDF

음성인식 리스코링을 위한 의존관계분석과 상호정보량 접근방법의 비교 (Dependency relation analysis and mutual information technique for ASR rescoring)

  • 정의석;전형배;박전규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.164-166
    • /
    • 2014
  • 음성인식 결과는 다수의 후보를 생성할 수 있다. 해당 후보들은 각각 음향모델 값과 언어모델 값을 결합한 형태의 통합 정보를 갖고 있다. 여기서 언어모델 값을 다시 계산하여 성능을 향상하는 접근 방법이 일반적인 음성인식 성능개선 방법 중 하나이며 n-gram 기반 리스코링 접근 방법이 사용되어 왔다. 본 논문은 적절한 성능 개선을 위하여, 대용량 n-gram 모델의 활용 문제점을 고려한 문장 구성 어휘의 의존 관계 분석 접근 방법 및 일정 거리 어휘쌍들의 상호정보량 값을 이용한 접근 방법을 검토한다.

  • PDF

동적 조직을 위한 접근제어 모델 (An Access Control Model for the Dynamic Organization )

  • 심완보
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.1401-1404
    • /
    • 2008
  • 본 논문에서는 기존의 관료제 조직과 다른 동적조직의 특성을 살펴보고 이러한 특성으로 인해 기존의 접근제어 모델들을 동적조직의 접근제어 모델로 사용할 때 문제가 되는 점들을 살펴본다. 이를 바탕으로 동적조직을 위한 개선된 역할기반 접근제어 모델을 제안한다. 제안된 모델은 기존 접근제어 모델들의 문제점을 해결하기 위한 방법들을 제시한다.

신경망 규칙 추출에서 규칙 결합의 bottom-up 접근 방법 (Bottom-up Approach of Rule Rewriting in Neural Network Rule Extraction)

  • 이은헌;김현철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 추계학술발표대회
    • /
    • pp.916-919
    • /
    • 2018
  • 심층신경망 모델은 우수한 성능을 갖고 있음에도 불구하고 모델이 어떤 판단 과정을 통해 결론을 내렸는지 파악하기 어렵다. 그에 따라 판단에 대한 근거가 중요한 분야에서는 심층신경망 모델을 적용한 실제 사례를 찾기 어렵다. 인공신경망 모델을 해석하기 어렵다는 문제를 해결하기 위해 내부 구조를 이용하여 규칙을 추출하는 decompositional 접근법이 제안되었으나 기존의 연구는 대부분 은닉층이 1개인 다층 퍼셉트론 모델에서 규칙을 생성하는 것을 가정하고 있다. 오늘날 사용하는 심층신경망 모델은 일반적으로 여러 은닉층을 가지고 있기 때문에 기존의 접근법을 그대로 적용할 경우 규칙 불확실성에 따라 잘못된 규칙을 추출하는 문제가 발생한다. 본 논문은 decompositional 접근법에 존재하는 규칙 불확실성 문제를 완화하고 깊이가 깊은 심층신경망 모델에 규칙을 추출하는 방법을 제안한다. 제안한 접근법은 실제 활성화 값을 통해 지식을 추출하며, 이를 통해 규칙 불확실성 문제를 완화할 수 있었다.

seq2seq 주의집중 모델을 이용한 형태소 분석 및 품사 태깅 (Word Segmentation and POS tagging using Seq2seq Attention Model)

  • 정의석;박전규
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.217-219
    • /
    • 2016
  • 본 논문은 형태소 분석 및 품사 태깅을 위해 seq2seq 주의집중 모델을 이용하는 접근 방법에 대하여 기술한다. seq2seq 모델은 인코더와 디코더로 분할되어 있고, 일반적으로 RNN(recurrent neural network)를 기반으로 한다. 형태소 분석 및 품사 태깅을 위해 seq2seq 모델의 학습 단계에서 음절 시퀀스는 인코더의 입력으로, 각 음절에 해당하는 품사 태깅 시퀀스는 디코더의 출력으로 사용된다. 여기서 음절 시퀀스와 품사 태깅 시퀀스의 대응관계는 주의집중(attention) 모델을 통해 접근하게 된다. 본 연구는 사전 정보나 자질 정보와 같은 추가적 리소스를 배제한 end-to-end 접근 방법의 실험 결과를 제시한다. 또한, 디코딩 단계에서 빔(beam) 서치와 같은 추가적 프로세스를 배제하는 접근 방법을 취한다.

  • PDF

seq2seq 주의집중 모델을 이용한 형태소 분석 및 품사 태깅 (Word Segmentation and POS tagging using Seq2seq Attention Model)

  • 정의석;박전규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.217-219
    • /
    • 2016
  • 본 논문은 형태소 분석 및 품사 태깅을 위해 seq2seq 주의집중 모델을 이용하는 접근 방법에 대하여 기술한다. seq2seq 모델은 인코더와 디코더로 분할되어 있고, 일반적으로 RNN(recurrent neural network)를 기반으로 한다. 형태소 분석 및 품사 태깅을 위해 seq2seq 모델의 학습 단계에서 음절 시퀀스는 인코더의 입력으로, 각 음절에 해당하는 품사 태깅 시퀀스는 디코더의 출력으로 사용된다. 여기서 음절 시퀀스와 품사 태깅 시퀀스의 대응관계는 주의집중(attention) 모델을 통해 접근하게 된다. 본 연구는 사전 정보나 자질 정보와 같은 추가적 리소스를 배제한 end-to-end 접근 방법의 실험 결과를 제시한다. 또한, 디코딩 단계에서 빔(beam) 서치와 같은 추가적 프로세스를 배제하는 접근 방법을 취한다.

  • PDF

Local Thermal Equilibrium 모델에 의한 이차이온 질량분석의 정량화 방법

  • 곽병화;권오준
    • ETRI Journal
    • /
    • 제10권2호
    • /
    • pp.63-69
    • /
    • 1988
  • SIMS(Secondary Ion Mass Spectrometry) 분석 데이터의 정량화 방법으로 이온주입에 의한 실험적 접근법과 LTE(Local Thermal Equilibrium) 모델을 사용한 준이론적 접근법 2가지가 주로 논의되고 있다. 본 고에서는 LTE 모델을 사용, SIMS data를 정량화하는 방법에 대하여 기술하였으며 아울러 BASIC language로 된 간단한 LTE 프로그램을 제시하였다.

  • PDF

NVP 신뢰도 분석을 위한 새로운 접근방법에 관한 연구 (A Study on Method a New Approach for The Analsis of NVP Reliablity)

  • 신경애
    • 한국컴퓨터정보학회지
    • /
    • 제8권2호
    • /
    • pp.43-50
    • /
    • 2001
  • 소프트웨어 신뢰성을 향상시키는 방법에는 소프트웨어 결함 허용기법 중에서 가장 객관적이고 정량적으로 평가받는 것이 NVP(N-Version Programming)기법이다. 이 기법에서 신뢰도를 추정하는 모델로 이항분포를 사용하는데 이 모델은 각 컴포넌트 신뢰도의 값들이 동일하다는 한계점이 있었다. 본 연구에서는 기존 모델의 한계점을 해결하기 위하여 NVP 신뢰도 분석을 위한 새로운 접근 방법으로 유전자 알고리즘(Genetic Algorithms)을 적용하였고. 또한 적용 모델과 기존 모델을 서로 비교 검토하였다. 그 결과 전체시스템 신뢰도를 일정 수준이상 유지하면서 각 컴포넌트 신뢰도의 값들을 최적화 할 수 있었고. 또한 비용을 최소로 하는 최적의 수를 추정할 수 있었다. 그리고 적용 모델과 기존 모델을 비교 및 평가하여 타당성을 증명하였다.

  • PDF

동시공학적 전문가시스템 개발방법론 (A Concurrent Engineering A, pp.oach to Expert System Development)

  • 박광호
    • 지능정보연구
    • /
    • 제1권1호
    • /
    • pp.73-89
    • /
    • 1995
  • 전문가시스템이 등장한지도 근 20년이 흘렀고 다양한 분야에서 기업의 중추적 시스템으로 운영되고 있다. 이렇게 전문가시스템이 연구단계에서 벗어나 실용화됨에 따라 전문가시스템의 개발방법에 대한 연구가 학계가 산업계가 새로운 연구과제로 인식되고 있다. 지금까지 개발에 대한 연구는 주로 지식획득 기술의 개발에 치중되어있다. 본 논문에서는 전문가시스템의 개발에 대한 방법론적 접근방법이 제시된다. 이 접근벙법은 시간과 인력 등 자원의 제약을 받는 전문가시스템 개발프로젝트에 적합한 것으로 동시공학(Concurrent Engineering)개념을 채택하고 있으며 개발 라이프사이클 모델, 프로젝트팀 구성방법등을 다루고 있다. 또한, 동시공학적 접근방법을 지원하기 위한 분석과 설계방법으로는 객체지향기술을 사용하며 개발단계별로 해당 모델이 산출물로 구축된다.

  • PDF

워드 임베딩과 품사 태깅을 이용한 클래스 언어모델 연구 (Class Language Model based on Word Embedding and POS Tagging)

  • 정의석;박전규
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권7호
    • /
    • pp.315-319
    • /
    • 2016
  • 음성인식 성능 개선을 위한 언어모델의 기술적 진보는 최근 심층 신경망을 기반으로 한 접근방법으로 한 단계 더 진보한 모양새다. 그러나 연구되고 있는 심층 신경망 기반 언어모델은 대부분 음성인식 이후 리스코링 단계에서 적용할 수 있는 한계를 지닌다. 또한 대규모 어휘에 대한 심층 신경망 접근방법은 아직 시간이 필요하다고 본다. 따라서 본 논문은 심층 신경망 언어 모델의 단순화된 형태인 워드 임베딩 기술을 음성인식 후처리가 아닌 기반 N-gram모델에 바로 적용할 수 있는 접근 방법을 찾는다. 클래스 언어모델이 한 접근 방법이 될 수 있는데, 본 연구에서는 워드 임베딩을 우선 구축하고, 해당 어휘별 벡터 정보를 클러스터링하여 클래스 언어모델을 구축 방법을 제시한다. 이를 기존 어휘기반 N-gram 모델에 통합한 후, 언어모델의 성능 개선 여부를 확인한다. 클래스 언어모델의 타당성 검증을 위해 다양한 클래스 개수의 언어모델 실험과 RNN LM과의 비교 결과를 검토한 후, 모든 언어모델의 성능 개선을 보장하는 품사 부착 언어모델 생성 방법을 제안한다.