• 제목/요약/키워드: 유사성 질의

검색결과 947건 처리시간 0.037초

키워드 확장을 통한 효율적인 유의어 검출 방법 (Efficient Synonym Detection Method through Keyword Extension)

  • 지기용;박지수;손진곤
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 추계학술발표대회
    • /
    • pp.767-770
    • /
    • 2018
  • 인공지능의 발달로 사람이 사용하는 자연어 형태의 문장을 통해 정보를 주고받는 질의응답 시스템이 주목받고 있다. 이러한 질의응답 시스템은 자연어로 구성된 사용자의 질의문에서 의도를 정확하게 파악해야 한다. 단순히 질의어의 키워드에 의존한 검색은 단어의 중의성을 고려하지 않아 질의문의 의도를 정확히 파악하는 데 문제가 있다. 이런 문제점을 해결하기 위해 질의문의 의미와 맥락에 따른 연관성을 이용하여 유의어를 확장하는 방법이 연구되고 있다. 본 논문에서는 워드 임베딩을 통해 생성된 단어 유사도를 이용하여 질의문에서 추출된 키워드를 확장하는 방법을 제안한다.

질의응답 시스템에서 형태소임베딩 모델과 GRU 인코더를 이용한 문장유사도 측정 (Measuring Sentence Similarity using Morpheme Embedding Model and GRU Encoder for Question and Answering System)

  • 이동건;오교중;최호진;허정
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.128-133
    • /
    • 2016
  • 문장유사도 분석은 문서 평가 자동화에 활용될 수 있는 중요한 기술이다. 최근 순환신경망을 이용한 인코더-디코더 언어 모델이 기계학습 분야에서 괄목할만한 성과를 거두고 있다. 본 논문에서는 한국어 형태소임베딩 모델과 GRU(Gated Recurrent Unit)기반의 인코더를 제시하고, 이를 이용하여 언어모델을 한국어 위키피디아 말뭉치로부터 학습하고, 한국어 질의응답 시스템에서 질문에 대한 정답을 유추 할 수 있는 증거문장을 찾을 수 있도록 문장유사도를 측정하는 방법을 제시한다. 본 논문에 제시된 형태소임베딩 모델과 GRU 기반의 인코딩 모델을 이용하여 문장유사도 측정에 있어서, 기존 글자임베딩 방법에 비해 개선된 결과를 얻을 수 있었으며, 질의응답 시스템에서도 유용하게 활용될 수 있음을 알 수 있었다.

  • PDF

질의응답 시스템에서 형태소임베딩 모델과 GRU 인코더를 이용한 문장유사도 측정 (Measuring Sentence Similarity using Morpheme Embedding Model and GRU Encoder for Question and Answering System)

  • 이동건;오교중;최호진;허정
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.128-133
    • /
    • 2016
  • 문장유사도 분석은 문서 평가 자동화에 활용될 수 있는 중요한 기술이다. 최근 순환신경망을 이용한 인코더-디코더 언어 모델이 기계학습 분야에서 괄목할만한 성과를 거두고 있다. 본 논문에서는 한국어 형태 소임베딩 모델과 GRU(Gated Recurrent Unit)기반의 인코더를 제시하고, 이를 이용하여 언어모델을 한국어 위키피디아 말뭉치로부터 학습하고, 한국어 질의응답 시스템에서 질문에 대한 정답을 유추 할 수 있는 증거문장을 찾을 수 있도록 문장유사도를 측정하는 방법을 제시한다. 본 논문에 제시된 형태소임베딩 모델과 GRU 기반의 인코딩 모델을 이용하여 문장유사도 측정에 있어서, 기존 글자임베딩 방법에 비해 개선된 결과를 얻을 수 있었으며, 질의응답 시스템에서도 유용하게 활용될 수 있음을 알 수 있었다.

  • PDF

음소 질의어 집합 생성 알고리즘 (Phonetic Question Set Generation Algorithm)

  • 김성아;육동석;권오일
    • 한국음향학회지
    • /
    • 제23권2호
    • /
    • pp.173-179
    • /
    • 2004
  • 음소 질의어 집합은 문맥 속에서 비슷한 조음 효과를 보이는 음소들을 분류해 놓은 것으로서, 음성 인식 시스템 학습 시 결정트리를 기반으로 HMM (hidden Markov model)의 상태들을 클러스터링할 때 사용된다. 현재까지의 음소 질의어 집합은 대부분 음성학자나 언어학자들에 의해 수작업으로 제시되어 왔는데, 이러한 지식 기반음소 질의어들은 언어 또는 유사음소 단위 (PLU: phone like unit)에 종속될 뿐 아니라 생성된 클러스터 내의 동질성을 저하시킬 수 있다는 단점이 있다. 본 논문에서는 이와 같은 문제점들을 해결하기 위해 음성 데이터를 사용하여 측정한 음소들 사이의 유사도를 기반으로 언어나 유사음소단위에 상관없이 자동으로 음소 질의어 집합을 생성하는 알고리즘을 제안한다. 실험결과, 제안한 방법으로 생성된 음소 질의어들을 사용한 인식기의 에러율이 약 14.3%감소하여 데이터 기반의 음소 질의어 집합이 상태 클러스터링에 효율적임을 관측하였다.

희석액의 삼투질농도에 따른 감성돔 (Acanthopagrus schlegeli) 정자의 운동성 변화 (Changes of Sperm Motility in Black Seabream (Acanthopagrus schlegeli) by Osmolality of Diluents)

  • 장영진;임한규;장윤정
    • 한국양식학회지
    • /
    • 제13권3호
    • /
    • pp.187-191
    • /
    • 2000
  • 삼투질농도가 감성돔(Acanthopagrus schlegeli) 정자의 운동성에 미치는 영향을 연구하였다. 감성돔 정자는 정장과 등장인 삼투질농도에서 운동성이 억제되었으나, 전해질(NaCl, KCl, $CaCl_2$, $MgCl_2$) 및 비전해질(mannitol, glucose, fructose, sucrose) 희석액의 삼투질농도가 증가할 때, 운동성을 획득하였다. 희석액의 삼투질농도에 의한 정자운동지수(SMI)의 변화는 포물선을 그렸다 모든 희석액에서 SMI는 해수의 삼투질농도와 유사한 약 1,000 mOsm/kg에서 가장 높았고 그 이상에서는 다시 낮아졌다. 비록 정자의 운동성이 희석액의 삼투질농도에 의해 유발되고 해수와 비슷한 농도의 고장인 희석 액에서 SMI가 가장 높았지만, 고장이나 저장의 희석액에 정자를 노출시키는 것은 정자의 운동성 감소를 유발하였고 생존에 유해하였다.

  • PDF

내용 기반 영상 검색을 위한 개선된 질의 방법 (Improved Query Method for Contents-Based Image Retrieval)

  • 임미영;김형준;김경수;김희정;하명환;정병희;김회율
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅲ
    • /
    • pp.1665-1668
    • /
    • 2003
  • 디지털 컨텐츠의 증가에 따라 이들의 효율적인 검색과 관리를 위하여 내용 기반 영상 검색에 관한 많은 연구가 이루어지고 있다. 이러한 내용기반 영상 검색의 질의 방법으로는 유사한 영상을 질의로 사용하는 QBE와 영상을 사용자가 직접 스케치하여 질의에 사용하는 QBS 가 대표적이다. 본 논문에서는 질의로 사용할 정확한 영상을 가지고 있어야 하는 QBE 방법의 제약과 질의할 영상의 전체를 스케치해야 하는 QBS 의 문제점을 보완하는 개선된 질의 방법을 제안한다 제안하는 방법은 입력 영상의 단순화를 통해 스케치에 사용할 밑그림을 제공하고 사용자가 간단한 수정을 거쳐 질의 영상을 얻을 수 있도록 하는 방법으로 기존의 질의 방법을 개선하여 사용자의 편리성을 향상시킨다.

  • PDF

시퀀스 데이터베이스를 위한 서브시퀀스 탐색 : 세그먼트 기반 접근 방안 (Efficient Subsequence Searching in Sequence Databases : A Segment-based Approach)

  • 박상현;김상욱;노웅기
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권3호
    • /
    • pp.344-356
    • /
    • 2001
  • 본 논문에서는 시퀀스 데이터베이스에서 시간왜곡 변환(time warping)을 지원하는 서브시퀀스 탐색 문제를 다룬다. 서브시퀀스 탐색은 데이터 시퀀스의 평균 길이의 이차 함수로 성능이 저하된다. 이러한 문제를 해결하기 위하여 본 논문에서는 세그먼트 기반 서브시퀀스 탐색 기법(Segment-Based Approach for Subsequence Searches : SBASS)을 제안한다. SBASS는 데이터와 질의 시퀀스를 연속된 세그먼트들로 분할하여 다음의 두가지 조건을 만족하는 모든 데이터 시퀀스를 검색한다. (1) 세그먼트의 개수가 질의 시퀀스의 세그먼트 개수와 같다. (2) 모든 세그먼트 쌍 간의 거리가 주어진 오차 한도 이내이다. 제안된 세그먼트 분할 기법에서는 세그먼트가 서로 다른 길이를 갖도록 허용하며, 세그먼트 쌀간의 유사성의 척도로서 시간왜곡 변환 거리를 이용한다. 효율적인 유사 서브시퀀스 탐색을 위하여, 각 데이터 세그먼트로부터 요서 값들이 단조적으로 변화하는 특성을 이용하여 특성 벡터를 추출하고, 추출된 특성 벡터를 이용하여 공간 인덱스를 생성한다. 질의는 이 인덱스를 이용하여 (1) R-트리 여과, (2) 특성 여과, (3) 순서 여과, (4) 후처리의 네 단계로 처리된다. 다양한 실험을 통하여 제안된 기법의 효율성을 입증한다.

  • PDF

통계적 단어 대조를 이용한 음식점 추천 챗봇 애플리케이션 구현 (Implementation of a Chatbot Application for Restaurant recommendation using Statistical Word Comparison Method)

  • 민동희;이우범
    • 융합신호처리학회논문지
    • /
    • 제20권1호
    • /
    • pp.31-36
    • /
    • 2019
  • 사용자로부터 입력되는 비정형 데이터를 대화 형태로 이해하여 사용자가 원하는 정보에 대한 맞춤 서비스를 제공하는 챗봇은 모바일 서비스의 중요한 분야로서 주목받고 있다. 그러나 사용자의 자연 언어 형태의 질의 대화를 완전하게 이해하여 서비스할 수 있는 방법은 아직 미흡한 실정이다. 따라서 본 논문에서는 사용자가 음식점 추천을 위하여 입력하는 대화 문장으로부터 지역, 음식분류, 음식점명 등의 의미 단어를 추출하고, 추출된 단어를 SNS의 음식점 추천 관련 해시태그를 기반으로 구축된 지식 데이터베이스의 내용과 대조하여 통계적으로 단어 유사성이 가장 큰 사용자 목적 정보를 제공한다. 본 논문에서 구현한 음식점 추천 챗봇 시스템의 성능 평가를 위해서 웹 기반의 모바일 환경을 구축하여 다양한 사용자 질의 정보에 대한 접근 편의성을 측정한 결과, 기존 유사 서비스와 비교하여 터치 횟수와 화면 전환 횟수에서 각각 37.2%와 73.3%의 감소함을 보였다.

질의의 위치와 문맥을 반영한 클러스터 기반 재순위화 (Reranking Clusters based on Query Term Position and Context)

  • 조승현;장계훈;이경순
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 춘계학술발표대회
    • /
    • pp.471-474
    • /
    • 2010
  • 질의와 질의 주변에 나오는 어휘는 의미적으로 연관되어있다는 가정하에 질의뿐만 아니라 질의 주변에 나오는 문맥 어휘들도 가중치를 높여준다면 검색에 효율을 높일 수 있을 것이다. 본 논문에서는 질의와 질의 주변에 나오는 문맥 어휘들에게 가중치를 주어 질의 어휘의 위치 가중치를 반영한 문서를 표현하고, 위치 가중치가 반영된 문서 벡터들 사이의 유사도를 계산하여 클러스터 기반 재순위화를 하여 성능을 향상시키는 방법을 제안한다. 뉴스 집합인 TREC AP 문서를 이용하여 언어모델, 위치 가중치를 이용한 언어모델, 클러스터 기반 재순위화 모델의 비교실험을 통해 유효성을 검증한다.

WebDBs: 사용자 중심의 웹 검색 엔진 (WebDBs : A User oriented Web Search Engine)

  • 김홍일;임해철
    • 한국통신학회논문지
    • /
    • 제24권7B호
    • /
    • pp.1331-1341
    • /
    • 1999
  • 본 연구에서는 SQL과 유사한 질의어를 사용하여 웹에 등록된 정보를 검색하는 시스템인 WebDBs(Web DataBase system)를 제안한다. 제안된 시스템에서는 웹에 산재되어 있는 HTML 문서로부터 검색에 필요한 정보들을 자동으로 추출한다. 추출된 자료에 대하여 SQL 기반의 질의 처리가 가능하도록 하였다. 웹 데이터베이스 시스템에서는 대부분의 질의 수행 시간이 통신 회선을 통한 문서 획득에 소요된다. 따라서, 웹 검색의 경우 웹 지역성에 많이 의존한다는 점에 착안하여, 사용자 검색 결과를 캐쉬에 저장하고 유사한 응용에서 이를 재사용 하고자 한다. 이때 캐쉬에 저장된 정보들을 검색된 질의와 연관하여 저장함으로써 좀더 사용자 응용을 고려한 캐쉬 관리기법을 제안하였다. 또한 위와 같은 개념에 입각한 웹 검색엔진을 구하였다.

  • PDF