• Title/Summary/Keyword: 유사도 질의

Search Result 1,858, Processing Time 0.041 seconds

Construction of a Bidirectional Transformer Model for Paraphrasing Detection (패러프레이즈 문장 검출을 위한 양방향 트랜스포머 모델 구축)

  • Ko, Bowon;Choi, Ho-Jin
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.465-469
    • /
    • 2019
  • 자연어 처리를 위해서 두 문장의 의미 유사성을 분석하는 것은 아주 중요하다. 이 논문은 패러프레이즈 검출 태스크를 수행하기 위한 Paraphrase-BERT를 제안한다. 우선 구글이 제안한 사전 학습된 BERT를 그대로 이용해서 패러프레이즈 데이터 (MRPC)를 가지고 파인 튜닝하였고 추가적으로 최근에 구글에서 새로 발표한 Whole Word Masking 기술을 사용하여 사전 학습된 BERT 모델을 새롭게 파인 튜닝하였다. 그리고 마지막으로 다중 작업 학습을 수행하여 성능을 향상시켰다. 구체적으로 질의 응답 태스크와 패러프레이즈 검출 태스크를 동시에 학습하여 후자가 더 잘 수행될 수 있도록 하였다. 결과적으로 점점 더 성능이 개선되었고 (11.11%의 정확도 향상, 7.88%의 F1 점수 향상), 향후 작업으로 파인 튜닝하는 방법에 대해서 추가적으로 연구할 계획이다.

  • PDF

Performance Analysis of High-Dimensional Index Structure for Vector Data in Content-Based Video Retrieval (동영상 내용기반 검색을 위한 고차원 벡터 데이터 색인 구조의 성능 분석)

  • Lee, Hyun-jo;Chang, Jae-woo;Park, Soon-Young
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2007.11a
    • /
    • pp.211-214
    • /
    • 2007
  • 최근 멀티미디어 데이터, 특히 UCC를 중심으로 동영상 데이터가 급증하고 있다. 그러나 현재 대부분의 검색 시스템은 키워드 기반의 동영상 데이터 검색만을 지원하고 있으며, 따라서 사용자가 원하는 동영상 데이터를 효율적으로 검색하지 못하는 실정이다. 동영상 데이터에 대한 효율적인 검색을 지원하기 위해서는, 동영상의 내용(이미지, 색, 모양 등)을 고차원의 특징 벡터 데이터로 표현하여 유사한 동영상을 검색하는 내용-기반 검색이 요구된다. 본 논문에서는 내용-기반 검색을 위해 제안된 기존의 고차원 벡터 데이터 색인 구조를 실험을 통하여 성능을 비교하며, 이를 통해 동영상 내용-기반 검색에 가장 효율적인 색인 기법을 제시한다. 아울러 보다 효율적인 내용-기반 검색을 위한, 근사 k-NN 질의 탐색 기법의 유용성을 검증한다.

Material Characteristics and Making Techniques of Pottery by Type from the Oryang-dong Kiln Site in Naju, Korea (나주 오량동 요지 출토 토기의 기종별 재료 특성과 제작기법 연구)

  • Jin, Hong Ju;Jang, Sungyoon;Kim, Su Kyoung;Lee, Myeong Seong
    • Journal of Conservation Science
    • /
    • v.36 no.6
    • /
    • pp.440-455
    • /
    • 2020
  • This study aims to examine the material characteristics of bowls and compare the making techniques of flat cup with cover and jar coffin from the Oryang-dong kiln site, Naju. Bowls, the most frequently excavated small pottery have similar material characteristics, including gray surface, fine-grained texture, and small-sized tempers such as quartz and feldspar, regardless of the excavation slopes. However, the firing temperature of the bowls mostly ranges from 950 to 1,100 ℃. It is estimated that the bowls had formalized making techniques, owing to the similar material composition and firing technique regardless of the excavation slope. The flat cups with cover have similar texture and mineral phases, except their poorly sorted inclusions. However, the jar coffins contain not only fine-grained minerals but also medium-grained quartz, feldspar, and biotite, showing a relatively wide range of firing temperatures. According to the geochemical results of pottery by type, it is assumed that chemical compositions are classified into two groups: small pottery(bowl and falt cup with cover) and jar coffins. In conclusion, small potteries such as bowls and flat cups with cover were made by removing the heavy minerals from raw materials, whereas jar coffins were made by adding medium-grained minerals to raw materials to maintain and support their structures, despite the same source materials. In addition, it is presumed that pottery making proceeded by selecting the source materials, preparing according to their use and controlling the firing temperature and environment.

Trace metals in sediments of the Keum River (금강퇴적물 중 미량금속의 분포특성)

  • 이석훈
    • The Korean Journal of Quaternary Research
    • /
    • v.10 no.1
    • /
    • pp.27-52
    • /
    • 1996
  • 금강 퇴적물의 지화학적 특성을 파악하기 위하여 상류에서 하류까지 21개의 표층 퇴적물을 채취하고 총금속(Al, Fe, Mn, Cr, Co, Ni, Cu, Zn, Pb) 입도별 금속 및 존재형태별 금속을 분석하였다. 또한 하천에서 연안역까지 미량금속의 공간적 변화를 보기 위해 부유물 을 일정 간격으로 채취하여 미량금속을 분석하였다. 퇴적물 중 미량 금속 함량을 평균 입도 와 밀접히 관계하여 변화하며 세립질실트 이하 부분에서 가장높은 함량을 보였고 이 높은 함량은 하천 부유물 중 금속 함량과 Mn을 제외하고 거의 유사한 수준이었다. Pb은 조립질 모래에서도 높은 함량을 보이는데 이는 조립질 모래에 많이 포함된 정장석에 의한 영향이 되고 세립질 실트에서의 높은 금속 함량은 세립한 중광물에 의한 영향이다. Mn과 Pb을 제 안한 금속들은 퇴적물 중 주로(70% 이상) 결정 격자와 관계하여 존재하는데 이는 퇴적물의 주구성 입도가 조립하여 금속이 풍부하고 세립한 중광 물에 의한 영향이 크기 때문이다. 하 천에서 염하구로 금속 함량이 급격히 감소하는데 이는 용존 $Mn^{+2}$이온이 $MnO_2$로 변화하는 산화반응과 하천구역에서의 퇴적 그리고 염하구에서 금속이 적어 진 입자(염하구 내에서 유기물 분해/용해로 만들어지거나 재부유 작요에 의한 조립질 물질) 와 하천 부유물과의 혼합작용에 의해 이루어진다.

  • PDF

Film grain extraction and synthesis for improved coding efficiency (Film grain의 추출 및 합성을 통한 압축 효율 향상에 대한 연구)

  • Yoo, HyoungJin;Jin, Bora;Cho, Nam-Ik
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2013.11a
    • /
    • pp.169-171
    • /
    • 2013
  • 최근 Full-HD TV, UHDTV의 보급에 따라 고화질 영상에 대한 수요가 증가하고 있으며 N-Screen 서비스의 확장으로 고화질 영상을 빠르게 전송하는 문제의 중요성은 더욱 커지고 있다. 고화질 영상을 빠르게 전송하기 위해서는 압축 효율의 향상이 필요한데, 일반적으로 영상에 잡음이 많을 때에는 압축 효율이 떨어진다. 본 논문에서는 다양한 원인의 잡음들 중에 film grain noise에 초점을 맞추어 이를 조절하여 영상압축의 효율을 높이는 방법을 연구한다. film grain은 영화촬영 방법 및 환경 등에 따라 강도가 달라지기도 하지만 필름으로 촬영한 모든 영화에서 쉽게 관찰할 수 있으며 앞으로도 계속 포함이 될 것으로 예상되고, 디지털 영화의 경우에도 저조도에서는 이와 비슷한 특성의 잡음이 발생한다. 재안하는 방법에서는 film grain이 포함된 영상에서 grain을 추출/제거한 영상을 압축하며 추출한 film grain에서 작은 영역을 선택하여 sample grain을 만든 후 별도로 압축한다. 디코더에서 grain을 없앤 영상만을 보여줄 수 있지만, 경우에 따라 grain이 없으면 심미적으로 오히려 좋지 않은 결과가 보이기도 한다. 따라서 압축을 푼 후에는 sample grain에서 원본 영상 크기의 grain을 합성한 후 grain을 제거한 영상과 더하여 grain이 포함된 영상을 재 생성한다. 실험한 결과 원본과 유사한 grain이 생성되면서 압축효율이 향상됨을 확인할 수 있다.

  • PDF

Statistical Phrase Indexing Based on Positional Relation for Korean Information Retrieval (한국어 정보검색에서 위치관계에 기반한 통계적 구 색인)

  • Hong, Gum-Won;Kim, Sang-Bum;Lee, Sang-Zoo;Rim, Hae-Chang
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.76-82
    • /
    • 2001
  • 최근 웹 문서의 규모가 커짐에 따라 높은 정확도를 필요로하는 정보검색시스템이 요구되고 있다. 구 색인은 정확도를 향상시킬 수 있는 방법으로 전통적으로 많이 사용되어 왔으며, 정보검색에서 사용하는 구는 크게 통계적인 구와 구문적인 구로 나눌 수 있다. 한국에서는 주최 복합명사를 처리하거나, 구문적인 구를 이용한 방법들만이 사용되어 왔고, 통계적인 구를 이용한 검색은 연구되지 않았다. 질의에 존재하는 구의 위치관계와 문서에 존재하는 구의 위치관계가 서로 동일하다면 그 문서는 그 질의와 더욱 유사할 것이라 판단하고, 본 논문에서는 통계적인 구에서 구 구성요소간의 위치관계를 고려한 정보검색 시스템을 제안한다. 명사구 이치의 유용한 구를 생성하기 위하여 내용어를 색인했으며 색인어간의 거리와 순서를 고려하여 가중치를 부여하였다. 명사구와 내용어에 기반한 구를 사용한 각각의 실험에서 거리에 따른 가중치를 부여하는 방법이 거리를 무시한 방법에 비해서 효과적이었고 구 구성요소간의 위치관계를 고려하는 것이 성능향상의 주요한 요인임을 알 수 있었다. 또한 명사위주의 질의에서는 내용어보다는 명사만을 색인하는 것이 효과적임을 알 수 있었다.

  • PDF

A Multi-Query Optimizing Method for Data Stream Similar Queries on Sliding Window (슬라이딩 윈도에서의 데이터 스팀데이터 유사 질의 처리를 위한 다중질의 최적화 기법)

  • Liangbo Li;Yan Li;Song-Sun Shin;Dong-Wook Lee;Weon-Il Chung;Hae-Young Bae
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2008.11a
    • /
    • pp.413-416
    • /
    • 2008
  • In the presence of multiple continuous queries, multi-query optimizing is a new challenge to process multiple stream data in real-time. So, in this paper, we proposed an approach to optimize multi-query of sliding window on network traffic data streams and do some comparisons to traditional queries without optimizing. We also detail some method of scheduling on different data streams, while different scheduling made different results. We test the results on variety of multi-query processing schedule, and proofed the proposed method is effectively optimized the data stream similar multi-queries.

Answering User Queries on Online Learning Platforms through Natural Language Processing and Keyword Visualization Using Word Cloud (자연어처리를 통한 온라인 학습 플랫폼 사용자 질의 답변 및 Word cloud를 활용한 키워드 시각화)

  • Kyong Rok Yoo;Young-Seob Jeong
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2024.01a
    • /
    • pp.351-354
    • /
    • 2024
  • 최근 온라인 학습의 비중이 증가함에 따라 온라인 학습 서비스의 일부인 온라인 상담 부분도 비례하여 증가하고 있으며, 많은 상담량으로 인해 상담 서비스의 품질이 저하되고 답변의 속도, 효율성도 감소하는 문제가 발생한다. 국내 교육기관에서는 서비스 개선과 사용자 맞춤형서비스를 제공하기 위해 다양한 연구를 진행하고 있으며 민원을 처리하는 챗봇 등 자동 답변 서비스 도입을 추진하고 있다. 챗봇 및 자동 답변 서비스는 서비스 제공자 입장에서 저예산으로 단순한 질문에 대하여 신속하고 효율적인 서비스를 제공할 수 있으며 서비스 이용자는 즉각적인 답변과 유사한 답변 예시를 확인함으로 질문을 빠르게 해결할 수 있는 장점이 있다. 국가 공공기관에서 제공하는 학습 서비스는 단순하고 반복적인 문의가 많고 정형적인 질의응답이 주로 등록이 되고 있다. 자동 답변 서비스는 이런 문제점을 해결할 수 있는 대안이 된다. 서비스 이용자가 등록한 문의를 기반으로 학습한 답변 서비스는 담당자의 반복된 업무처리 경감과 사용자의 답변감소, 일관된 답변처리로 서비스 품질개선에 큰 영향을 줄 수 있다. 본 연구에서는 사용자의 질문에 효율적인 답변 및 민원 처리 서비스를 제공할 수 있는 방법을 제시하며, 관리자의 업무능력 향상과 효율성을 위해 기간별 키워드 빈도수를 계산하여 Word cloud를 생성하여 제공함으로써 사용자들에게 일정 기간 내 빈도수가 높은 키워드 관련 공지 및 안내를 할 수 있도록 한다.

  • PDF

Partial Image Retrieval Using an Efficient Pruning Method (효율적인 Pruning 기법을 이용한 부분 영상 검색)

  • 오석진;오상욱;김정림;문영식;설상훈
    • Journal of Broadcast Engineering
    • /
    • v.7 no.2
    • /
    • pp.145-152
    • /
    • 2002
  • As the number of digital images available to users is exponentially growing due to the rapid development of digital technology, content-based image retrieval (CBIR) has been one of the most active research areas. A variety of image retrieval methods have been proposed, where, given an input query image, the images that are similar to the input are retrieved from an image database based on low-level features such as colors and textures. However, most of the existing retrieval methods did not consider the case when an input query image is a part of a whole image in the database due to the high complexity involved in partial matching. In this paper, we present an efficient method for partial image matching by using the histogram distribution relationships between query image and whole image. The proposed approach consists of two steps: the first step prunes the search space and the second step performs block-based retrieval using partial image matching to rank images in candidate set. The experimental results demonstrate the feasibility of the proposed algorithm after assuming that the response tune of the system is very high while retrieving only by using partial image matching without Pruning the search space.

A Retrieval System of Environment Education Contents using Method of Automatic Annotation and Histogram (자동 주석 및 히스토그램 기법을 이용한 환경 교육 컨텐츠 검색 시스템)

  • Lee, Keun-Wang;Kim, Jin-Hyung
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.9 no.1
    • /
    • pp.114-121
    • /
    • 2008
  • In order to process video data effectively, it is required that the content information of video data is loaded in database and semantic- based retrieval method can be available for various query of users. In this paper, we propose semantic-based video retrieval system for Environment Education Contents which support semantic retrieval of various users by feature-based retrieval and annotation-based retrieval of massive video data. By user's fundamental query and selection of image for key frame that extracted form query, the agent gives the detail shape for annotation of extracted key frame. Also, key frame selected by user become query image and searches the most similar key frame through feature based retrieval method that propose. From experiment, the designed and implemented system showed high precision ratio in performance assessment more than 90 percents.