• 제목/요약/키워드: Search Query

검색결과 690건 처리시간 0.026초

시맨틱 검색에서 키워드 질의 변환을 위한 탐색 공간 축소 모델 (Search Space Reduction Model for Keyword Query Transformation on Semantic Search)

  • 염정남;조준면;유정주
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1390-1393
    • /
    • 2013
  • 인터페이스가 제한된 단말에서 정보 검색 서비스를 제공하는 경우, 검색 재현율보다는 정확도가 중요하다. 데이터를 쉽게 구조화할 수 있고 검색 정확도가 중요한 한정된 도메인에서는 시맨틱 검색 기술을 통해 강력한 정보 검색 서비스를 제공할 수 있지만, 사용자 키워드 질의를 시스템 질의로 변환하는 과정에서 다양한 해석들이 존재할 수 있기에 개선의 여지도 많다. 본 논문에서는 해석 정확도와 확장성을 동시에 향상시키기 위한 새로운 모델을 제안한다. 제안 모델은 공간의 구조와 요소들의 해석을 제한함으로써 중간 탐색 공간의 크기를 점진적으로 줄이면서 사용자의 검색 의도는 가능한 보존할 수 있다. 실제 데이터로 이루어진 대용량 지식을 이용해 다른 최신 기술과 비교하여 실험적 평가를 제시하였다.

Using Ontology to Represent Cultural Aspects of Local Products for Supporting Local Community Enterprise in Thailand

  • Plirdpring, Phakharach;Ruangrajitpakorn, Taneth
    • Journal of Information Science Theory and Practice
    • /
    • 제10권1호
    • /
    • pp.45-58
    • /
    • 2022
  • Community enterprise plays an important role for developing local business. Products from local communities apply local specialties such as high-quality materials and inherited wisdom. This work aims to support merchandises from local community enterprises by bringing out their specialties related to local wisdom and intangible cultural aspects. An ontology is applied to demonstrate the innate information regarding the implicit values of the products and is used as a core for a semantic search system. Details of the products are gathered from their respective community using an interview method and are extracted to align with the developed ontological schema. The semantic search system thus is implemented with a recommendation process for online accessibility for providing the organised information. From evaluation, the developed ontology and its instances are rated highly for their consistency, conciseness, and completeness. In usage, accuracy of the query and recommendation results are evaluated at 97.38% searching accuracy and 85.03% for recommending interesting products.

A linked data system framework for sharing construction defect information

  • Lee, Doyeop;Park, Chansik
    • 국제학술발표논문집
    • /
    • The 6th International Conference on Construction Engineering and Project Management
    • /
    • pp.232-235
    • /
    • 2015
  • Defect data contains experiential knowledge about specific work conditions. And the number of projects performed by a company is too limited for an individual to experience the various defects under the current complex construction environment. Therefore, in order to manage and prevent a reoccurrence of defects, a proper data feedback mechanism is required. However, most defect data are stored in unstructured ways, resulting in the fundamental problem of data utilization. In this paper, a new framework is proposed by using linked data technologies to improve defect data utilization. The target of this framework is to convert defect data to the ontology-based linked data format for sharing defect data from different data sources. To demonstrate it, some technical solutions are implemented by using real cases. The proposed approach can reduce data search time and improve the accuracy of search results as well. Moreover, the proposed approach can be applied to other domains that need to refer to external sources such as safety, specification, product, and regulation.

  • PDF

허밍 질의 처리 시스템의 성능 향상을 위한 효율적인 빈번 멜로디 인덱싱 방법 (An Efficient Frequent Melody Indexing Method to Improve Performance of Query-By-Humming System)

  • 유진희;박상현
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권4호
    • /
    • pp.283-303
    • /
    • 2007
  • 최근 방대한 양의 음악데이타를 효율적으로 저장하고 검색하기 위한 방법의 필요성이 증대되고 있다. 현재 음악 데이타 검색에서 가장 일반적으로 쓰이는 방법은 텍스트 기반의 검색 방법이다. 그러나 이러한 방법은 사용자가 키워드를 기억하지 못할 경우 검색이 어려울 뿐만 아니라 키워드와 정확하게 일치하는 정보만 검색해 주기 때문에 유사한 내용을 가진 정보를 검색하기에 부적절하다. 이러한 문제점을 해결하기 위해 본 논문에서는 내용 기반 인덱싱 방법(Content-Based Indexing Method)을 사용하여 사용자가 부정확한 멜로디(Humming)로 질의하였을 경우라도 원하는 음악을 효율적으로 찾아주는 허밍 질의처리 시스템(Query-By-Humming System)을 설계한다. 이를 위해 방대한 음악 데이타베이스에서 한 음악을 대표하는 의미 있는 멜로디를 추출하여 인덱싱하는 방법을 제안한다. 본 논문에서는 이러한 의미 있는 멜로디를 사용자가 자주 질의할 가능성이 높은 멜로디로서 하나의 음악에서 여러 번 나타나는 반면 멜로디와 긴 쉼표 후에 시작되는 쉼표 단위 멜로디로 정의한다. 실험을 통해 사용자들이 이들 멜로디를 자주 질의한다는 가정을 증명하였다. 본 논문은 성능 향상을 위한 3가지 방법을 제안한다. 첫 번째는 검색속도를 높이기 위해 인덱스에 저장할 멜로디를 문자열 형태로 변환한다. 이때 사용되는 문자 변환 방법은 허밍에 포함된 에러를 허용한 방법으로써 검색 결과의 정확도를 높일 수 있다. 두 번째는 사용자가 자주 질의할 가능성이 높은 의미 있는 멜로디를 인덱싱 하여 검색 속도를 높이고자 한다. 이를 위해 신뢰도가 높은 의미 있는 멜로디를 생성하는 빈번 멜로디 추출 알고리즘과 쉼표 단위 멜로디 추출 방법을 제안한다. 세 번째로는 정확도를 향상시키기 위한 3단계 검색 방법을 제안한다. 이는 데이타베이스 접근을 최소화하여 정확한 검색 결과를 얻기 위하여 제안되었다. 또한 기존 허밍 질의 처리 시스템의 대표적인 인덱싱 방법으로 제안되었던 N-gram 방법과의 성능 비교를 통해 본 논문이 제안하는 방법의 성능이 보다 더 향상되었음을 검증하였다.

지역 질의 생성기반 전역 XQuery 질의 처리 기법 (A Global XQuery Query Processing based on Local XQuery Query Generation)

  • 박종현;박원익;김영국;강지훈
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권11호
    • /
    • pp.11-20
    • /
    • 2010
  • XML 뷰는 분산 환경에서 이종 데이터들을 XML 데이터처럼 바라보며 XML로 통합하기 위한 방법으로 제안되었으며, 전역 XML 뷰는 분산되어 있는 다양한 형태의 이종 데이터들을 단일의 XML 데이터처럼 바라보며 질의할 수 있도록한다. 이때사용자가 사용하는표준질의어는 XQuery이며, 전역XML 뷰를대상으로 작성된 질의가 바로 전역XQuery 질의이다. 그러므로이를효과적으로 처리하기위한방법은분산 환경에서이종데이터들사이의 통합 및 검색을 위한 연구의 주제이다. 기존 SQL 질의 처리에서 알 수 있는 것처럼, 분산 질의 처리를 위한 방법들 가운데 가장 범용적으로 사용되는 방법 중 하나는 전역 질의를 지역 질의로 분할하여 분할된 지역 질의들을 처리하고, 그 결과를 취하여 전역 질의의 결과로 재구성하는 것이다. 그러나 XQuery는 FOR 절과 같은 SQL 질의어에서는 찾아볼 수 없는 복잡한 구조적 특성을 갖는다. 그러므로 전역 XQuery 질의의 처리를 위해 지역 질의를 생성하기 위해서는 고려해야 할 사항들이 존재한다. 본 논문에서는 전역 SQL 질의 처리를 위한 지역 질의 생성 기법을 전역 XQuery 질의의 처리를 위해 적용할 때 발생하는 문제점을 정의하고 이를 해결하기 위한 방법을 제안한다. 또한, 제안한 방법을 기반으로 하는 전역 XQuery 질의 처리기를 구현하여 그 효율성을 보인다.

Efficient Peer-to-Peer Lookup in Multi-hop Wireless Networks

  • Shin, Min-Ho;Arbaugh, William A.
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제3권1호
    • /
    • pp.5-25
    • /
    • 2009
  • In recent years the popularity of multi-hop wireless networks has been growing. Its flexible topology and abundant routing path enables many types of applications. However, the lack of a centralized controller often makes it difficult to design a reliable service in multi-hop wireless networks. While packet routing has been the center of attention for decades, recent research focuses on data discovery such as file sharing in multi-hop wireless networks. Although there are many peer-to-peer lookup (P2P-lookup) schemes for wired networks, they have inherent limitations for multi-hop wireless networks. First, a wired P2P-lookup builds a search structure on the overlay network and disregards the underlying topology. Second, the performance guarantee often relies on specific topology models such as random graphs, which do not apply to multi-hop wireless networks. Past studies on wireless P2P-lookup either combined existing solutions with known routing algorithms or proposed tree-based routing, which is prone to traffic congestion. In this paper, we present two wireless P2P-lookup schemes that strictly build a topology-dependent structure. We first propose the Ring Interval Graph Search (RIGS) that constructs a DHT only through direct connections between the nodes. We then propose the ValleyWalk, a loosely-structured scheme that requires simple local hints for query routing. Packet-level simulations showed that RIGS can find the target with near-shortest search length and ValleyWalk can find the target with near-shortest search length when there is at least 5% object replication. We also provide an analytic bound on the search length of ValleyWalk.

개인화 웹 검색 시스템 기반의 문서 요약 시스템 (A Document Summary System based on Personalized Web Search Systems)

  • 김동욱;강수용;김한준;이병정;장재영
    • 디지털콘텐츠학회 논문지
    • /
    • 제11권3호
    • /
    • pp.357-365
    • /
    • 2010
  • 개인화 웹 검색 시스템은 사용자의 검색의도에 따라 질의어 확장, 검색 결과의 재순위화 등의 방법을 통하여 사용자에게 개인화된 검색 결과를 제공한다. 이를 위해 검색 시스템은 질의어와 사용자의 프로파일 정보를 활용하여 사용자의 검색 의도를 파악하고 분석하여, 검색 결과 페이지에 반영하여 보여주게 된다. 이때 검색 결과 페이지는 문서의 URL과 문서의 제목, 작은 텍스트 조각을 표시한다. 여기서 작은 텍스트 조각은 검색 질의어가 포함된 문서의 요약이며, 스니펫이라고 알려져 있다. 사용자는 이러한 문서의 요약을 통하여 웹 문서가 자신이 원하는 정보를 가진 문서인지를 판단하거나, 해당 URL에 직접 접속하지 않고도 원하는 정보를 얻을 수 있게 된다. 따라서 문서 요약은 사용자가 문서를 볼 것인지 아닌지에 대한 중요한 판단 기준이 되며, 만약 문서 요약 시스템이 개인화된 요약 결과를 제공한다면 사용자의 만족도는 더욱 증가할 것이다. 본 논문은 전체 웹 검색 시스템에서 검색 속도의 큰 하락없이 사용자의 만족도를 증가시킬 수 있는 개인화 문서 요약 시스템을 제안한다.

계층적 검색 의도와 웹 자원을 활용한 2계층 구조의 서브토픽 마이닝 (Subtopic Mining of Two-level Hierarchy Based on Hierarchical Search Intentions and Web Resources)

  • 김세종;이종혁
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권2호
    • /
    • pp.83-88
    • /
    • 2016
  • 서브토픽 마이닝은 입력 질의에서 나타날 수 있는 검색 의도들의 중의성 해소 및 보다 명확한 의도 전달을 위해 관련 서브토픽들을 연관성, 선호도, 다양성을 고려하여 추출 및 순위화하는 것을 말한다. 본 논문은 웹 자원의 활용에 대한 기존 연구의 한계점을 명시하고, 이를 극복하기 위해 계층적 검색 의도와 웹 자원을 기반으로 한 2계층 구조의 서브토픽 마이닝 방법론을 제안한다. 우리는 서브토픽 마이닝 평가 대회에서 제공한 웹 문서 및 각 자원의 특성을 고려하여 제 2계층 서브토픽들을 추출, 확장 및 재순위화하고, 넓은 검색 의도를 가진 서브토픽 내의 단어들은 제 1계층 서브토픽들을 구성하는데 활용하였다. 본 방법론은 관련 평가 대회에서 최고 성능을 보인 기존 연구들의 결과들과 비교했을 때, 대부분의 평가 척도에서 높은 성능을 보였다.

온톨로지를 이용한 웹문서의 시맨틱 검색 (Semantic search of web documents using ontology)

  • 오성균;김병곤
    • 디지털콘텐츠학회 논문지
    • /
    • 제15권5호
    • /
    • pp.603-612
    • /
    • 2014
  • 사용자들에게 좀 더 정확하고 편리한 검색결과를 제공하기 위하여 정보의 구조적인 특징 등을 사용하는 시맨틱 검색의 개념이 널리 연구되고 있다. 이를 위하여, 최근의 정보검색분야와 데이터구축 분야의 연구에서는 데이터의 구조적인 표현과 검색 메카니즘을 구현하기 위하여 온톨로지를 강조하고 있다. 본 연구에서는 웹 환경에서의 검색 정확도와 만족도를 향상시키기 위하여 온톨로지를 이용한 시맨틱 검색 방법을 제안한다. 온톨로지와 KB(KnowledgeBase)를 이용하여 검색 대상을 키워드간의 관계를 유추한 사실(fact)과 관계키워드들을 지니는 웹문서들로 크게 나누고 이들을 서로 유기적으로 검색을 진행하는 시맨틱 검색 질의 처리기법을 제안하였다. 또한 결과에 대한 사용자의 검색 만족도를 높이기 위하여 결과 문서와 사실에 대한 랭킹 방법을 제안하였다. 실험을 통하여 주어진 식의 값을 달리하여 랭킹을 올바로 구현하는 요소로 키워드의 빈도와 온톨로지상의 클래스 레벨이 영향을 미치는 것을 확인 할 수 있었고, 이를 통하여 적합한 형태의 계수 값을 제시하였다.

개선된 노드 분산율을 위한 적응적 P2P 검색 알고리즘 (An Adaptive Peer-to-Peer Search Algorithm for Reformed Node Distribution Rate)

  • 김분희;이준연
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권4호
    • /
    • pp.93-102
    • /
    • 2005
  • 제한된 통신 환경 상에서 P2P 어플리케이션에 의해 발생되는 과도한 트래픽은 네트워크 대역폭 문제와 연관된다. 또한 P2P시스템은 피어들의 P2P 오버레이 네트워크에의 연결성이 매우 약한 약결합 시스템으로 검색 단계에서 원하는 자원을 찾는다 하여도 다운로드 단계에서 반드시 그 피어에서 자원을 다운받을 수 있다는 보장이 없다. 이전 검색 알고리즘(1)에서는 이러한 문제를 해결하기 위해 Random Walks 기반의 휴리스틱 피어 선택 기법을 적용하였다. 본 논문에서는 각 피어의 컴퓨팅 파워에 영향 받는 노드 분산율을 개선하기 위해 이전 알고리즘(1) 기반의 적응적 P2P 검색 알고리즘을 제안하였다. 또한 트래픽 양을 줄이기 위해 부가적으로 질의율 기반의 차별적 리플리케이션 기법을 채택했다. 제안한 시스템의 성능 평가 결과 검색의 방향성과 통신 발생의 분포 측면에서 적절한 타협점에서 동작함을 확인하였다.

  • PDF