• Title/Summary/Keyword: 검색키워드

Search Result 1,017, Processing Time 0.023 seconds

A Study on Next-Generation Information Service of KISTI (KISTI의 차세대 정보 서비스 연구)

  • Lee, Mi-Kyoung;Jung, Han-Min;Sung, Won-Kyung
    • 한국IT서비스학회:학술대회논문집
    • /
    • 2008.05a
    • /
    • pp.12-17
    • /
    • 2008
  • 시맨틱 웹 기반의 차세대 정보 서비스인 OntoFrame2007은 시맨틱 웹과 웹 2.0 기술을 상호 보완하여 개발한 플랫폼으로 URI기반의 개체 중심적 통합 검색을 통해 Topic, Person, Event 기반의 개체 페이지를 구성한다. 각 페이지에는 Add-on 서비스를 통해 연구자 그룹, 연구자 네트워크, 통계 정보를 제공하며, 매쉬업 기술을 이용하여 매핑 서비스, 도서 서비스를 제공한다. OntoFrame2007은 서비스 설계 과정에서 Google, Google Scholar, CiteSeer, yesKisti 사이트와 비교하여 사용자의 요구사항 및 각 서비스의 장점을 최대한 반영시켰으며, 개발 단계마다 반복적 사용성 평가를 통해 사용자 중심의 서비스를 제공하도록 개선시켰다. 본 시스템에서는 URI를 통해 개체의 모호성을 제거하여 키워드 기반의 통합 검색의 한계를 극복하였으며, 사용자 질의어를 식별하여 단위 서비스로 구성된 최적 개체 페이지를 통해 정교한 검색 서비스를 제공해준다. 개체 페이지들은 키워드 검색 결과, 연구 동향 정보 및 연구자 그룹, 전문가 네트워크 및 지역별 연구 동향 등을 제공해준다.

  • PDF

A Study on The Patent Information Retrieval Algorithm (특허정보검색 알고리즘에 관한 연구)

  • Go, Gwang-Su;Jung, Won-Gyo;Shin, Young-Geun;Park, Sang-Sung;Jang, Dong-Sik
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2011.06a
    • /
    • pp.369-371
    • /
    • 2011
  • 본 연구에서는 특허문서에 사용된 핵심키워드 찾아내고 추출된 핵심키워드에 가중치를 부여하여 특허데이터DB에서 질의문서와 유사한 특허기술문서를 찾고 유사도 순으로 우선 배치하여 검색에 효율을 높일 수 있는 알고리즘을 제안한다. 본 연구는 제안한 알고리즘은 검색결과에 대하여 질의한 문서와 유사한 문서 순으로 랭크가 가능하기 때문에 검색의 효율을 높이는 효과를 가지고 온다.

  • PDF

REALM for Open-domain Question Answering of Korean (REALM을 이용한 한국어 오픈도메인 질의 응답)

  • Kan, Dong-Chan;Na, Seung-Hoon;Choi, Yun-Su;Lee, Hye-Woo;Chang, Du-Seong
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.192-196
    • /
    • 2020
  • 최근 딥러닝 기술의 발전에 힘입어 오픈 도메인 QA 시스템의 발전은 가속화되고 있다. 특히 IR 시스템(Information Retrieval)과 추출 기반의 기계 독해 모델을 결합한 접근 방식(IRQA)의 경우, 문서와 질문 각각을 연속 벡터로 인코딩하는 IR 시스템(Dense Retrieval)의 연구가 진행되면서 검색 성능이 전통적인 키워드 기반 IR 시스템에 비해 큰 폭으로 상승하였고, 이를 기반으로 오픈 도메인 질의응답의 성능 또한 개선 되었다. 본 논문에서는 경량화 된 BERT 모델을 기반으로 하여 Dense Retrieval 모델 ORQA와 REALM을 사전 학습하고, 한국어 오픈 도메인 QA에서 QA 성능과 검색 성능을 도출한다. 실험 결과, 키워드 기반 IR 시스템 BM25를 기반으로 했던 이전 IRQA 실험결과와 비교하여 더 적은 문서로 더 나은 QA 성능을 보였으며, 검색 결과의 경우, BM25의 성능을 뛰어넘는 결과를 보였다.

  • PDF

Implementation of the Inverted File for Indexing Large-volume Data (대용량 데이터 색인에 적합한 역파일의 구현)

  • Sung Chae Lim
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2008.11a
    • /
    • pp.909-912
    • /
    • 2008
  • 대용량 문서에 대한 키워드 검색을 위해 역파일(inverted-file) 색인 기법이 널리 쓰이고 있다. 역파일 색인 기법을 구현함에 있어 고려되어야 할 점은 키워드 검색 처리 시에 디스크 사용을 최소로 할 수 있는 방법이다. 크기가 작은 역파일이라면 디스크 I/O 사용도 작고 필요시 역파일을 메모리에 적재하여 둠으로써 디스크 사용을 크게 줄일 수 있다. 하지만, 웹 검색이나 규모가 큰 도서관 시스템에서와 같이 색인 데이터 크기가 매우 큰 경우 역파일을 읽는 디스크 비용이 급격히 증가할 수 있다. 본 논문에서는 매우 큰 크기의 역파일을 사용하는 검색 환경에서 디스크 사용을 최소로 할 수 있는 역파일 구조를 제안한다. 제안된 구조는 질의 처리 과정을 고려해 계층 구조로 설계되며 실제 상용 시스템에 적용되어 안정성 및 성능을 입증했다.

Query Expansion System for Semantic Contents Retrieval (시맨틱 콘텐츠 검색을 위한 질의 확장 시스템)

  • Lee, Moo-Hun;Choi, Eui-In
    • Journal of Digital Convergence
    • /
    • v.10 no.10
    • /
    • pp.307-312
    • /
    • 2012
  • For semantic search methods to provide more accurate results than keyword-based search in a logical representation that uses a knowledge base are being studied. Than most of the user to use formal query language and schema used to interpret the meaning of a user keyword. In this paper, we propose to expand the user query for semantic search. In the proposed system, user query expansion component and a component to adjust the results to interpret user queries to take advantage of the knowledge base associated with a search term. Finally, a user query semantic interpretation, the proposed scheme to verify the experimental results of the prototype system is described.

Question Retrieval using Deep Semantic Matching for Community Question Answering (심층적 의미 매칭을 이용한 cQA 시스템 질문 검색)

  • Kim, Seon-Hoon;Jang, Heon-Seok;Kang, In-Ho
    • Annual Conference on Human and Language Technology
    • /
    • 2017.10a
    • /
    • pp.116-121
    • /
    • 2017
  • cQA(Community-based Question Answering) 시스템은 온라인 커뮤니티를 통해 사용자들이 질문을 남기고 답변을 작성할 수 있도록 만들어진 시스템이다. 신규 질문이 인입되면, 기존에 축적된 cQA 저장소에서 해당 질문과 가장 유사한 질문을 검색하고, 그 질문에 대한 답변을 신규 질문에 대한 답변으로 대체할 수 있다. 하지만, 키워드 매칭을 사용하는 전통적인 검색 방식으로는 문장에 내재된 의미들을 이용할 수 없다는 한계가 있다. 이를 극복하기 위해서는 의미적으로 동일한 문장들로 학습이 되어야 하지만, 이러한 데이터를 대량으로 확보하기에는 어려움이 있다. 본 논문에서는 질문이 제목과 내용으로 분리되어 있는 대량의 cQA 셋에서, 질문 제목과 내용을 의미 벡터 공간으로 사상하고 두 벡터의 상대적 거리가 가깝게 되도록 학습함으로써 의사(pseudo) 유사 의미의 성질을 내재화 하였다. 또한, 질문 제목과 내용의 의미 벡터 표현(representation)을 위하여, semi-training word embedding과 CNN(Convolutional Neural Network)을 이용한 딥러닝 기법을 제안하였다. 유사 질문 검색 실험 결과, 제안 모델을 이용한 검색이 키워드 매칭 기반 검색보다 좋은 성능을 보였다.

  • PDF

A Study on Retrieval System of Course Materials (강의자원 검색시스템에 관한 연구)

  • Nam, Young-Joon;Yim, Young-Sun
    • Journal of the Korean BIBLIA Society for library and Information Science
    • /
    • v.21 no.4
    • /
    • pp.205-215
    • /
    • 2010
  • This study has extracted the basic component of the Library Course Pages through case studies of the Library Course Pages Service, and examined the staus quo of the Open Course Ware(OCW) for the sharing of the course materials. The study has also designed and established a ontology-based retrieval system model that is capable of semantic-based retrieval of the course materials in colleges. A comparison between and analysis of the past keyword search results was conducted to evaluate the model. Through evaluation, the study concluded that the ontology-based system was more effective than the keyword search method in both retrieval result and material sharing between the institutions.

Ontology Knowledge based Information Retrieval for User Query Interpretation (사용자 질의 의미 해석을 위한 온톨로지 지식 기반 검색)

  • Kim, Nanju;Pyo, Hyejin;Jeong, Hoon;Choi, Euiin
    • Journal of Digital Convergence
    • /
    • v.12 no.6
    • /
    • pp.245-252
    • /
    • 2014
  • Semantic search promises to provide more accurate result than present-day keyword matching-based search by using the knowledge base represented logically. But, the ordinary users don't know well the complex formal query language and schema of the knowledge base. So, the system should interpret the meaning of user's keywords. In this paper, we describe a user query interpretation system for the semantic retrieval of multimedia contents. Our system is ontological knowledge base-driven in the sense that the interpretation process is integrated into a unified structure around a knowledge base, which is built on domain ontologies.

Design and Evaluation of an Individual Instance-based Ontology Retrieval System for Archival Records of the "Saemaul Movement" (새마을운동 기록물의 개체기반 온톨로지 검색시스템 설계 및 평가)

  • Lee, Byung Gil;Kim, Heesop
    • Journal of Korean Society of Archives and Records Management
    • /
    • v.13 no.3
    • /
    • pp.67-97
    • /
    • 2013
  • The purpose of this study is to design and evaluate an individual instance-based ontology retrieval system for archival records of the "Saemaul Movement". We used Protege editor 4.1 to design an individual instance-based ontology. To evaluate the proposed ontology retrieval system, five short queries and ten narrative queries were used and compared their precision and recall against the NARA keyword-based retrieval system. The performance results showed that the individual-based ontology retrieval system outperformed the keyword-based retrieval system in terms of the measurement of precision and recall.

User Profile based Personalized Web Agent (사용자 프로파일 기반 개인 웹 에이전트)

  • So, Young-Jun;Park, Young-Tack
    • Journal of KIISE:Software and Applications
    • /
    • v.27 no.3
    • /
    • pp.248-256
    • /
    • 2000
  • This paper presents a personalized web agent that constructs user profile which consists of user preferences on the web and recommends his/her relevant information to the user. The personalized web agent consists of monitor agent, user profile construction agent, and user profile refinement agent. The monitor agent makes a user describe his/her preferences directly and it creates the database of preference document, finally performs several keyword extraction to increase the accuracy of the DB. The user profile construction agent transforms the extracted keywords into user profile that could be confirmed and edited by the user. and the refinement agent refines user profile by recursively learning and processing user feedback. In this paper, we describe the several keyword weighting and inductive learning techniques in detail. Finally, we describe the adaptive web retrieval and push agent that perform adaptive services to the user.

  • PDF