• Title/Summary/Keyword: search word

검색결과 378건 처리시간 0.02초

어휘의미 중의성이 인터넷 정보검색 효율에 미치는 영향에 관한 연구 (A Study of Word Sense Ambiguation which Affects Efficiency of the Internet-based Information Retrieval)

  • 황상규;오경묵;변영태
    • 정보관리학회지
    • /
    • 제16권3호
    • /
    • pp.65-82
    • /
    • 1999
  • 부적절한 검색어의 선정 및 검색식의 작성은 인터넷 정보검색 수행 시 검색 효율 저하의 주요 원인으로 작용하게 된다. 또한 정보검색 수행 시 발생하는 어휘의미중의성(Word Sense Ambiguation) 역시 검색 효율 저하의 주요 원인으로 작용하는데, 어휘의미중의성에 의한 효율 저하 정도를 실험을 통해 확인하였다. 어휘의미중의성에 의한 검색 효율 저하란 검색어로 입력한 어휘가 문서에서 서로 다른 의미로 사용됨에 따라 의도하지 않은 다른 문서가 검색될 수 있음을 의미한다. 본 논문에서는 새로운 정보검색 환경인 인터넷기반정보검색에 있어 어휘의미중의성이 검색 정확률에 미치는 영향을 살펴보고, 기존의 정보검색에 있어 어휘의미중의성에 관한 연구가 인터넷기반 정보검색에 있어서도 제대로 적용되는지를 조사 분석하였다.

  • PDF

Word2Vec 학습을 통한 의미 기반 해외 유사 특허 검색 방안 (Identifying Similar Overseas Patent Using Word2Vec-Based Semantic Text Analytics)

  • 백민지;김남규
    • 한국IT서비스학회지
    • /
    • 제17권2호
    • /
    • pp.129-142
    • /
    • 2018
  • Recently, the number of patent applications have been increasing rapidly every year as the importance of protecting intellectual property rights becomes more important. Patents must be inventive and have novelty. Especially, the novelty implies that the corresponding invention is not the same as the previous invention. To confirm the novelty, prior art search must be conducted before and after the application. The target of prior art search should include not only Korean patents but also foreign patents. Search of foreign patents should be supported by multilingual search techniques. However, a dictionary-based naive approach shows a limitation because some technical concepts are represented in different terms according to each nation. For example, a Korean term and a Japanese term may not be synonym even though they represent the same technical concept. In this paper, we propose a new method to map semantic similarity between technical terms in Korean patents and Japanese patents. To investigate different representations in each nation for the same technical concept, we identified and analyzed pairs of patents those are mutually connected with priority claim relationship. By performing an experiment with real-world data, we showed that our approach can reveal semantically similar technical terms in other language successfully.

OpenAPI를 이용하여 간결함과 즉시성을 가진 검색 매쉬업 (Mashup for Instant and Simple Search using OpenAPIs)

  • 황기태
    • 한국인터넷방송통신학회논문지
    • /
    • 제11권2호
    • /
    • pp.41-49
    • /
    • 2011
  • 본 논문은 사용자가 작업하는 문서에서 검색하고자 하는 검색어를 빠르고 단순하게, 그리고 다양한 검색의 범위를 조절할 수 있는 검색 방법을 제안하고 구현한 사례를 소개한다. 기존 웹 사이트 검색 방식은 하던 작업을 멈추고 웹 브라우저를 실행하고 사이트에 접속하며 키워드를 입력하는 지루한 과정이 필요하다. 또한 검색의 결과도 장황하며, 사전, 이미지, 동영상 등 동시 검색이 필요한 경우 여러 사이트에서 여러 번 검색하는 불편함이 있다. 본 논문은 사용자가 작업하는 어떤 문서에서도 간단히 검색어를 선택하고 CTRL키와 마우스 왼쪽 버튼을 동시에 누르는 것으로 검색이 이루어지도록 한다. 이를 위해 웹 서비스를 이용할 수 있는 Open API를 이용하여 여러 검색 웹 사이트의 검색 기능을 동시에 통합적으로 활용하는 매쉬업 검색 소프트웨어를 구현한다. 본 논문에서 개발한 검색 소프트웨어는 검색의 단순 즉시성, 결과의 간결성, 검색 범위의 다양성, 기능의 확장성뿐만 아니라 작업하는 어떤 문서에도 검색이 가능한 매쉬업의 좋은 사례로 평가된다.

검색엔진의 정확률 향상을 위한 질의어 의미와 사용자 반응 정보의 이용 (Using Query Word Senses and User Feedback to Improve Precision of Search Engine)

  • 윤성희
    • 정보관리학회지
    • /
    • 제26권4호
    • /
    • pp.81-92
    • /
    • 2009
  • 본 논문은 정보검색 시스템의 사용자 질의어와 색인에 기반한 검색 과정에서 나타나는 중의성 해소를 위해 질의어 의미정보와 사용자 피드백을 사용하여 검색 성능을 향상시키는 방법을 소개한다. 의미 정보를 이용하여 질의어의 중의성을 해소하는 검색 과정은 검색 결과로서 의미적으로 무관한 많은 문서들 을 배제할 수 있다. 이를 위해 검색의 색인이 되는 명사 중심의 의미범주를 기반으로 의미정보 지식베이스를 구축하고, 검색 문서들을 색인어와 해당 의미범주로 분류한다. 검색 과정에서는 사용자의 질의 의미 선택과 정답 문서에 대한 참조 행위를 웹 페이지의 순위 결정에 반영하여 검색 성능을 향상시킬 수 있다.

인터넷 패션 소비자의 쇼핑동기, 정보탐색 및 행동의도에 관한 연구 (Shopping Motives, Information Search and Behavioral Intentions of Internet Fashion Consumers)

  • 석효정;박성희;이은진
    • 한국의류학회지
    • /
    • 제35권8호
    • /
    • pp.918-932
    • /
    • 2011
  • This research examines shopping motives, information search of e-fashion consumers and their behavioral intentions (word of mouth, repurchase and site switching intentions). The survey was conducted from December $17^{th}$ 2010 to January $5^{th}$ 2011 and all respondents had previous experiences with on-line purchase of fashion items. The study finds that an information search has three dimensions, recreational search, informative search, and rational search. The effects of both hedonic and utilitarian shopping motives on information search and behavioral intentions are significant. In addition, recreational and informative search have a positive impact on word of mouth and site switching intentions, while repurchase intention is influenced by an informative search. Rational search has a positive effect on switching intention only. Finally, there are significant differences by gender in shopping motives, information search and behavioral intentions.

논문 검색 결과의 효과적인 브라우징을 위한 단어 군집화 기반의 결과 내 군집화 기법 (A Search-Result Clustering Method based on Word Clustering for Effective Browsing of the Paper Retrieval Results)

  • 배경만;황재원;고영중;김종훈
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권3호
    • /
    • pp.214-221
    • /
    • 2010
  • 검색 결과 내 군집화(search-result clustering)는 검색 엔진으로부터 검색된 결과 내에서 비슷한 문서를 자동으로 군집화하는 기법이다. 본 논문에서는 논문 검색 서비스에 전문화된 새로운 결과 내 군집화 기법을 제안한다. 제안하는 시스템은 '범주체계생성기(Category Hierarchy Generation System)'와 '논문군집기(Paper Clustering System)'로 구성되어있다. '범주체계생생기'는 KOSEF의 연구 범주 체계를 이용하여 분야 시소러스라 불리는 범주 체계를 생성하고, K-means 알고리즘을 이용한 단어 군집화 알고리즘을 사용하여 분야 시소러스의 키워드 집합을 확장한다. '논문군집기'는 top-down 방식과 bottom-up 방식을 이용하여 각 논문의 범주를 결정한다. 제안하는 시스템은 논문 검색 서비스와 같은 전문 분야에 대한 검색 서비스에 유용하게 사용될 수 있을 것이다.

워드넷 기반 협동적 평가와 하이퍼링크를 이용한 검색엔진의 성능 향상 (Improving Performance of Search Engine By Using WordNet-based Collaborative Evaluation and Hyperlink)

  • 김형일;김준태
    • 정보처리학회논문지B
    • /
    • 제11B권3호
    • /
    • pp.369-380
    • /
    • 2004
  • 본 논문에서는 정색엔진의 성능 향상을 위하여 질의어의 모호성 해결과 새로운 가중치 부여 방식을 제안한다. 일반적인 검색엔진은 질의어의 형태와 같은 것들이 포함되어 있는 웹 페이지를 결과로 보여주는 내용기만 방식을 사용하고 있다. 검색 결과로 나타난 웹 페이지들의 순위를 결정하는데 있어서도 주어진 질의어와 웹 페이지 사이의 키워드 매칭에 의한 내용기반 방식을 사용한다. 이와 같이 질의어의 형태만으로 웹페이지들과 유사도를 비교한다는 것은 정확한 검색에 많은 장애를 준다. 또한 질의어의 의미에 모호성이 존재할 경우에는 사용자의 의도와 관련 없는 것들이 결과로 나타나기도 한다. 이러한 원인의 발생은 일반적인 검색엔진들이 내용기반 방법을 기반으로 웹 검색에 이용되기 때문이다. 본 논문에서는 질의어에 모호성이 있는 경우 워드넷을 이용하여 모호성을 해결하도록 하는 사용자 인터페이스를 구현했다. 그리고 사용자의 클릭 수를 각 웹 페이지의 가중치에 누적함으로써 다수 사용자의 협동적 평가에 따른 웹 페이지의 중요도가 검색 순위에 반영되도록 하였다. 클릭수의 누적에 있어서 질의어의 의미 카테고리별로 가중치를 구분하여 저장함으로써 보다 세분화된 웹 페이지 가중치 부여 방식을 사용하였다 그리고 점 페이지의 하이퍼링크를 웹 페이지의 가중치에 적용하였다. 웹 페이지의 가중치에 하이퍼링크를 적용함으로써 웹 페이지의 대표성을 가중치에 부여하여 가중치에 신뢰도를 증가시켰다. 실험용 정색엔진이 일반 검색엔진에 비해 높은 검색 정확도를 나타내는 것을 실험을 통해 확인하였다.

언어기반 게임그래픽 디자인 발상의 창의적 인지에 관한 연구 (A Study on Creative Cognition of Language based concept Generation of Game Graphics)

  • 허윤정
    • 인터넷정보학회논문지
    • /
    • 제12권5호
    • /
    • pp.171-179
    • /
    • 2011
  • 본 연구는 디자인발상 과정에서 구글의 연관 검색어를 언어 자극으로 제공했을 경우 디자인 결과에 어떠한 결과를 주는지 그리고 그러한 과정에서 창의적 인지 과정이 어떻게 사용되는 지를 분석하였다. 디자인 발상 과정에 구글의 연관 검색어를 자극제로 5단계에 걸쳐 제공하였다. 구글 검색어는 다수의 사용자의 참여와 공헌에 의해 새롭게 재창조된 지식과 정보를 제공하는 집단지성에 기반을 두고 있다. 실험을 위해 두 가지 과제를 연관 검색어들과 함께 제공하였다. 디자인 발상실험 후 연관검색어의 사용여부와 빈도수 그리고 핀케의 12가지 제네플로어 모델이라는 3가지 기준에 의해 분석하였다. 본 연구의 결과를 요약하면 다음과 같다. 여러 단계의 연관 검색어들을 사용했으나, 초기 연관 검색어와 연관성이 높은 상위 단계의 검색어가 하위 단계의 검색어보다 더 많이 사용되었다. 또한 상위 단계와 하위 단계의 검색어들을 함께 사용했을 때 더 창의적의 결과가 나타났다. 핀케의 제네플로어 모델의 12가지 인지 과정에 따라 실험결과물을 분석한 결과 창의적 결과물은 단순히 연관 검색어를 사용하기 보다는 여러 단어들을 연합하고 변형하였으며 또한 창의적인 결과에는 12가지 인지 과정 중 개념적 해석, 기능적 추론과 맥락적 전이와 같은 인지 과정이 사용되었다.

INFORMATION SEARCH BASED ON CONCEPT GRAPH IN WEB

  • Lee, Mal-Rey;Kim, Sang-Geun
    • Journal of applied mathematics & informatics
    • /
    • 제10권1_2호
    • /
    • pp.333-351
    • /
    • 2002
  • This paper introduces a search method based on conceptual graph. A hyperlink information is essential to construct conceptual graph in web. The information is very useful as it provides summary and further linkage to construct conceptual graph that has been provided by human. It also has a property which shows review, relation, hierarchy, generality, and visibility. Using this property, we extracted the keywords of web documents and made up of the conceptual graph among the keywords sampled from web pages. This paper extracts the keywords of web pages using anchor text one out of hyperlink information and makes hyperlink of web pages abstract as the link relation between keywords of each web page. 1 suggest this useful search method providing querying word extension or domain knowledge by conceptual graph of keywords. Domain knowledge was conceptualized knowledged as the conceptual graph. Then it is not listing web documents which is the defect of previous search system. And it gives the index of concept associating with querying word.

웹 검색을 활용한 워드넷에서의 IT 전문 용어 확장 (Wordnet Extension for IT terminology Using Web Search)

  • 박경국;이광모;김유섭
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2007년도 제19회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.189-193
    • /
    • 2007
  • 본 연구에서는 기존 워드넷에 등록되지 않은 IT 전문 용어와 같은 신규 용어들을 웹 검색을 사용하여 워드넷에 추가 시켜 확장시키는 설계를 하였다. 워드넷은 단어 간의 관계를 표현하는 어휘 사전이지만 일반적인 단어들로 구성되어 있고 새로이 등장하는 전문 용어는 포함하지 않는 경우가 많아 이러한 용어들을 새로이 워드넷에 등록함으로써 워드넷을 확장해야 한다. 이 작업은 웹 검색 결과를 분석하여 이 용어와 관련 깊은 용어들을 찾아서 워드넷에 없는 용어들을 워드넷에 추가시킴으로써 이루어 진다. 웹 검색 결과 문서를 형태소 분석기를 사용하여 가중치가 높은 순으로 관련 단어들을 찾고 이들 중 워드넷에 등록되어 있는 단어를 찾아 해당 단어의 하의어로 신규 단어의 위치를 배치시킨다.

  • PDF