• Title/Summary/Keyword: 관계기반 검색

Search Result 748, Processing Time 0.039 seconds

Effect of Word Sense Ambiguation on Internet-Based Information Retrieval (어휘의미중의성이 인터넷기반 정보검색에 미치는 영향)

  • 황상규;오경묵;변영태;천윤심
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1999.08a
    • /
    • pp.151-155
    • /
    • 1999
  • 기존의 문헌정보검색에 있어 어휘의미중의성은 검색 효율 저하의 주요 원인 중 하나로 생각되어져 왔다. 어휘 의미중의성에 의한 검색 효율 저하란 검색어로 입력한 어휘가 문서에서 서로 다른 의미로 사용됨에 따라 의도하지 않은 다른 문서가 검색될 수 있음을 의미한다. 본 논문에서는 새로운 정보 검색 환경인 인터넷기반 정보검색에 인어 어휘의미중의성이 검색 정확율에 미치는 영향을 살펴보고, 기존에 문헌정보검색에 있어 어휘 의미중의성에 관한 연구가 인터넷기반 정보검색에 있어서도 제대로 적용되는지를 확인해 보았다. 또한 실험을 통해 검색어 수와 어휘의미중의성 간의 상관관계를 조사하였으며, 일반 이용자가 인터넷기반 정보검색 수행시 어휘의미중의성에 의한 검색 효율 저하를 최대한 방지할 수는 방법에 대해 모색해 보았다.

  • PDF

Designing XML Repository System based on EJB Components (EJB 컴포넌트 기반으로 한 XML Repository시스템 설계)

  • 정상혁;이정수;주경수
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.97-99
    • /
    • 2002
  • 웹 정보의 교환과 공유를 위해 XML 문서의 필요성이 증가함에 따라 XML 문서의 저장과 검색에 대한 많은 연구들이 현재 진행되고 있다 본 논문에서는 XML 문서를 효과적으로 저장, 검색하는 XML Repository 시스템을 설계한다. XML Repository 시스템은 XML 문서를 관계형 데이터베이스에 저장하고, 관계형 데이터베이스에서 검색하여 XML 문서로 생성할 수 있다. 또한 XML 응용 시스템과 관계형 데이터베이스 시스템 사이에 원활한 연계를 위해서, XML DTD를 관계형 데이터베이스 스키마로의 변환이 가능하다. 본 논문에서는 EJB 컴포넌트를 이용하여 XML 문서를 저장, 검색, 변환 할 수 있는 XML Repository 시스템을 설계하고자 한다.

  • PDF

Relation Analysis of Disease and Biomarker based on Google Scholar (구글 학술 검색 기반의 질병과 바이오마커 관계 분석)

  • Oh, Byoung-Doo;Kim, Yu-Seop
    • Annual Conference on Human and Language Technology
    • /
    • 2017.10a
    • /
    • pp.238-241
    • /
    • 2017
  • 본 논문에서는 구글 학술 검색 기반의 데이터를 이용하여 질병과 폐질환과 관련된 바이오마커 단어의 유사도를 계산하는 방법을 제안한다. 질병과 바이오마커의 유사도를 계산할 때, 각 단어의 구글 학술 검색의 검색 결과를 이용하였다. 이를 통해 폐질환 관련 바이오마커와 다른 질병간의 관계를 파악하고자 하며, 의료 전문가에게 폐질환 관련 바이오마커와 다른 질병간의 새로운 관계를 제시하고자 한다. 이러한 데이터를 이용하여 계산한 결과, Wor2Vec의 결과를 이용한 코사인 유사도의 결과와 상관 계수가 약 0.64로 상당히 높은 상관 관계를 확인할 수 있었다. 따라서 이 방법을 통해 질병과 바이오마커의 관계를 파악하고자 하였다. 또한 Word2Vec을 이용한 질병과 바이오마커 단어의 벡터 값과 단어 유사도 계산 방법의 결과를 이용한 Deep Neural Networks (DNNs) 모델을 구축하고자 하며, 이를 통해 자동적으로 유사도를 분석하고자 하였다.

  • PDF

Relation Analysis of Disease and Biomarker based on Google Scholar (구글 학술 검색 기반의 질병과 바이오마커 관계 분석)

  • Oh, Byoung-Doo;Kim, Yu-Seop
    • 한국어정보학회:학술대회논문집
    • /
    • 2017.10a
    • /
    • pp.238-241
    • /
    • 2017
  • 본 논문에서는 구글 학술 검색 기반의 데이터를 이용하여 질병과 폐질환과 관련된 바이오마커 단어의 유사도를 계산하는 방법을 제안한다. 질병과 바이오마커의 유사도를 계산할 때, 각 단어의 구글 학술 검색의 검색 결과를 이용하였다. 이를 통해 폐질환 관련 바이오마커와 다른 질병간의 관계를 파악하고자 히며, 의료 전문가에게 폐질환 관련 바이오마커와 다른 질병간의 새로운 관계를 제시하고자 한다. 이러한 데이터를 이용하여 계산한 결과, Wor2Vec의 결과를 이용한 코사인 유사도의 결과와 상관 계수가 약 0.64로 상당히 높은 상관 관계를 확인할 수 있었다. 따라서 이 방법을 통해 질병과 바이오마커의 관계를 파악하고자 하였다. 또한 Word2Vec을 이용한 질병과 바이오마커 단어의 벡터 값과 단어 유사도 계산 방법의 결과를 이용한 Deep Neural Networks (DNNs) 모델을 구축하고자 하며, 이를 통해 자동적으로 유사도를 분석하고자 하였다.

  • PDF

A Methodology Using Frequency and Precision of Terms for Improving the Searching Performance in Keyword Search (어휘의 사용 빈도와 프리시젼을 이용한 키워드 검색 성능의 향상 방안)

  • Lee Sanghee;Lee Dongjoo;Yang Jongwon;Lee Taehee;Lee Sang-goo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.208-210
    • /
    • 2005
  • 웹에서의 검색을 수행하기 위해 다양한 연구가 수행되었으나, 일반적으로 키워드 검색 방식이 주를 이루고 있다. 이는 검색 대상에 대한 정보가 충분한 경우에는 원하는 검색 결과를 찾아내기 친우나, 그렇지 않은 경우에는 사용자로 하여금 원하는 검색 결과를 추출하기 위친 여러 번의 검색을 추가로 수행하는 수고로움을 요구하곤 한다. 이러한 문제를 해결하기 위하여 어휘 간의 관계에 기반을 둔 확장 검색 방식을 제안한다. 시소러스를 바탕으로 유의어 그룹을 정의하고, 사용자의 검색 키워드 정보를 이용하여 어휘 간의 관계 및 그룹 간의 관계를 정의한다. 정의된 관계를 바탕으로 키워드를 확장하고, 확장된 키워드의 사용 빈도와 프리시젼을 이용하여 사용할 어휘를 선별하여 검색을 수행한다.

  • PDF

A Study on File Search Engine Based on DBMS (DBMS을 활용한 파일 검색엔진 연구)

  • Kim, HyoungSeuk;Yu, Heonchang
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2016.10a
    • /
    • pp.548-551
    • /
    • 2016
  • 기존 그리드 기반의 전통적인 RDBMS는 비구조적 데이터에 대한 색인이 지원되지 않았다. 이러한 제약 조건들로 인해 파일 문서 및 비 구조화된 데이터의 검색 엔진으로는 부적합하였다. 최근에 다양한 검색 오픈소스(Solr, Lucene)등으로 검색 엔진이 개발되어 활용되고 있지만, 검색한 결과와 기존 데이터의 연동이 쉽지 않고 구조 변경이 어려우며, 사용자의 다양한 요구 사항 수용이 쉽지 않은 단점을 가지고 있다. 따라서 본 연구에서는 빠른 검색을 위한 색인 (index) 최적화와 대용량 데이터 처리를 위한 파티션 기반 데이터의 분할 및 정복 (divide and conquer) 처리, 이중화된 검색어 색인 기능을 구현하였다. 또한 동의어 사전을 구축하여 연관 관계 분석이 가능하도록 DB를 구축하여 검색어와 동의어의 상호 관계성을 유지하였으며 오픈 소스보다 발전한 형태의 검색 엔진을 개발하는 것을 목표로 하였다. 본 연구를 위해 약 400만건 이상의 다양한 포맷 (Ms-office, Hwp, Pdf, Text)등의 파일 문서를 샘플로 실험을 진행하였다.

A Study on the Countermeasures to Book Search Services of Web Portals: Focusing on Google Book Search (포털 도서검색서비스 대응방안에 대한 연구 - 구글도서검색을 중심으로 -)

  • Kim, Sung-Won
    • Journal of Korean Library and Information Science Society
    • /
    • v.42 no.1
    • /
    • pp.397-415
    • /
    • 2011
  • Google, an internet search service with extensive user base, has provided Book Search service. Google has pursued collaboration with publishers and libraries to obtain content for Book Search service; publisher community for the purpose of sourcing the books with copyrights, and the libraries for the purpose of digitizing their collections and also utilizing already digitized resources. Google Book Search Service has evoked significant controversy because of the potential monopoly problems and its risk, accompanied by Google's huge influence and broad user spectrum. This study, thus, suggests the countermeasures that library community should prepare in order to cope with the Google Book Search.

Content-Based Image Retrieval using RBF Neural Network (RBF 신경망을 이용한 내용 기반 영상 검색)

  • Lee, Hyoung-K;Yoo, Suk-I
    • Journal of KIISE:Software and Applications
    • /
    • v.29 no.3
    • /
    • pp.145-155
    • /
    • 2002
  • In content-based image retrieval (CBIR), most conventional approaches assume a linear relationship between different features and require users themselves to assign the appropriate weights to each feature. However, the linear relationship assumed between the features is too restricted to accurately represent high-level concepts and the intricacies of human perception. In this paper, a neural network-based image retrieval (NNIR) model is proposed. It has been developed based on a human-computer interaction approach to CBIR using a radial basis function network (RBFN). By using the RBFN, this approach determines the nonlinear relationship between features and it allows the user to select an initial query image and search incrementally the target images via relevance feedback so that more accurate similarity comparison between images can be supported. The experiment was performed to calculate the level of recall and precision based on a database that contains 1,015 images and consists of 145 classes. The experimental results showed that the recall and level of the proposed approach were 93.45% and 80.61% respectively, which is superior than precision the existing approaches such as the linearly combining approach, the rank-based method, and the backpropagation algorithm-based method.

A Representation and Storage of Image Information using A Dual Graph Data Model (이중 그래프 데이터 모델을 이용한 이미지 정보 표현과 저장)

  • 박미화;엄기현
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 1998.10a
    • /
    • pp.124-129
    • /
    • 1998
  • 이미지 데이터베이스를 구성하여 사용자가 원하는 정보를 추출하는 의미 기반 검색을 지원하기 위해서는 이미지 내용에 관한 의미 정보들이 데이터 모델로 구조화되어야 한다. 본 논문에서는 다양한 정적 이미지 내용 정보들에 대한 내용 기반 검색과 의미 기반 검색을 제공하는 이미지 데이터 모델을 소개하고 이를 이용하여 이미지가 담고 있는 의미 정보를 표현하고 데이터베이스 스키마로 변환하여 저장하는 구조와 검색하는 방법을 소개한다. 본 이미지 데이터 모델은 이미지내에 포함된 시각 객체들의 내용 정보를 그래프 구조로 표현하고 객체들간의 의미 관계를 정의한다. 이는 이미지 내용에 대한 정확한 정보 표현과 질의와 검색을 가능하게 한다.

  • PDF

A Texture-Dependent Color Feature for CBIR (질감의존 색 특징을 이용한 내용기반 영상검색)

  • 정재웅;권태완;박섭형
    • Proceedings of the IEEK Conference
    • /
    • 2003.07e
    • /
    • pp.1819-1822
    • /
    • 2003
  • 내용 기반 영상검색에서 다중 특징을 사용하여 영상을 검색하는 기존의 방법들은 영상에서 특징간의 상관관계를 고려하지 않고 각 특징을 개별적으로 추출하여 검색에 사용한다. 따라서 특징간의 최적의 가중치를 찾아야 하는 문제가 있다. 이 논문에서는 내용기반 영상검색을 위해 색과 질감 특징을 효과적으로 표현할 수 있는 새로운 특징 벡터인 CCE (channel color energy)를 제안한다. 실험을 통하여 제안하는 방법이 정규 가중거리 비교 방법에 비해 우수한 성능을 보이는 것을 확인하였다.

  • PDF