• 제목/요약/키워드: Semantic search system

검색결과 250건 처리시간 0.024초

클라우드 환경에서 효율적인 SaaS를 위한 온톨로지를 이용한 서비스 검색 시스템 (The Service Discovery System based on ontology for efficient SaaS in the cloud)

  • 황치곤;윤창표;정계동
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2013년도 추계학술대회
    • /
    • pp.678-680
    • /
    • 2013
  • 최근 컴퓨팅 환경은 클라우드 환경을 기반으로 서비스를 쉽게 이용할 수 있도록 제공되고 있다. 그중에서 SaaS(SoftWare as a Service)는 소프트웨어를 인터넷상의 클라우드 시스템에 올려놓고 클라우드 사용자가 사용할 수 있도록 제공하는 것이다. 그러나 이것의 문제점은 사용자가 클라우드 시스템에 등록된 서비스를 찾지 못해 서비스를 이용하지 못한다는 것이다. 이러한 문제를 해결하기 위해 온톨로지를 이용하여 서비스 간의 관계와 의미를 밝힘으로써 사용자가 원하는 서비스를 정확히 찾아 사용할 수 있도록 지원해야 한다. 서비스 검색을 위한 온톨로지는 사용자가 입력한 서비스 이름이나 기능을 이용하여 연관관계를 추론하여 서비스를 검색하는데 도움을 줄 수 있다. 이를 위한 서비스 온톨로지 구성방법과 온톨로지를 이용한 서비스 검색 시스템을 제안한다.

  • PDF

의미적 연결 관계에 기반한 전자 카탈로그에서의 확장된 어휘 인덱스 구축 및 이를 이용한 검색 성능 향상 기법 (Construct ion of Keyword Index and Improved Search Methods for e-Catalogs Eased on Semantic Relationship)

  • 이동주;이태희;이상구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.67-69
    • /
    • 2005
  • 본 논문에서는 기 구축된 전자 카탈로그를 의미적 연결 관계에 기초한 확장된 전자 카탈로그로 변환하는 방법을 제안한다. 이를 통해 구축된 확장된 전자 카탈로그에서 의미적 태깅에 의한 확장된 어휘 인덱스 구축 방안과, 이를 이용한 검색 성능 향상 기법을 제안한다. 기존의 전자 카탈로그는 상품 정보가 분류별로 생성된 테이블에 저장되고 저장된 테이블로부터 생성된 키워드 인덱스로부터 검색이 이루어 졌다. 이러한 검색은 상품이 가지는 정보를 데이터베이스에 구축된 테이블에만 한정하게 되어 전자 카탈로그에 포함된 상품이나 분류간의 의미적 연결 관계들을 충분히 이용하지 못하였다 전자 카탈로그에 내재된 의미적 요소를 충분히 활용하기 위해서는 전자 카탈로그를 의미적 연결 관계에 기초한 모델로 구성할 필요가 있다. 본 논문에서는 의미적 모델 기반 전자 카탈로그 시스템으로의 전환 과정을 XML형태의 명세를 이용해 반자동적으로 전환할 수 있는 툴을 구현하며, 단순 키워드 어휘 인덱스 구축이 아닌, 어휘 인덱스의 의미적 확장을 제안하고, 이를 위한 태그 요소로써 어휘에 대한 형태소 분석 결과, 수치 환산 및 확장 요소, 속성간의 도메인 정보 등을 제시하였다. 이를 기반으로 최적의 검색 결과를 얻어 내도록 하는 인접도 평가 함수에 적용하는 방법을 제시한다.

  • PDF

다양한 Open API 타입들을 지원하는 시맨틱 기반 매쉬업 개발 툴 (A Semantic-Based Mashup Development Tool Supporting Various Open API Types)

  • 이용주
    • 인터넷정보학회논문지
    • /
    • 제13권3호
    • /
    • pp.115-126
    • /
    • 2012
  • 최근에 매쉬업은 미래 IT 융합 서비스의 효과적인 구현 방법으로써 그 관심도가 점점 높아지고 있으며 그들의 활용도 매우 다양하다. 그렇지만 이러한 높은 관심에도 불구하고 Open API들을 매쉬업 속으로 결합할 때 여러 가지 이슈들이 있을 수 있다. 첫째, 포털사이트들은 매쉬업에서 사용 가능한 수많은 API들을 제공하고 있는데, 이들에 대한 적합한 API들을 수동으로 탐색하고 발견하는 것은 매우 힘들고 많은 시간이 소비되는 작업이다. 둘째, 현존하는 어떠한 매쉬업 포털 사이트들도 전통적인 SOAP 기반 웹 서비스 분야에서 보였던 것처럼 API들을 찾고 통합하는데 시맨틱 기법을 활용하는 사이트는 없다. 세째, 적합한 API들을 발견하였더라도 특별한 기술적 훈련 없이 값어치 있는 매쉬업을 생성하기란 현실적으로 어려운 일이다. 본 논문에서는 위와 같은 이슈들을 해결하기 위해 먼저 기존의 SOAP 기반 웹 서비스 분야에서 사용된 시맨틱 기반 기술 및 알고리즘들을 최소의 수정만으로 재사용할 수 있음을 보인다. 다음으로, 조합 가능한 API들을 발견하기 위해 어떻게 API 특성들이 신택틱하게 정의되고 시맨틱하게 묘사될 수 있는지 보인다. 그러고 이러한 신택틱/시맨틱 정보들이 어떻게 Open API들의 발견과 조합에 도움을 줄 수 있는지 보인다. 마지막으로, 동적 Open API 조합을 위한 대화형 목표 지향 접근 방법을 제안한다. 여기서 최종 매쉬업은 API들의 순차적 접근 방법에 의해 점차적으로 각 단계에서 하나씩 새로운 API가 조합에 첨가된다.

이질적인 쇼핑몰 환경을 위한 온톨로지 기반 상품 매핑 방법론 (An Ontology-Driven Mapping Algorithm between Heterogeneous Product Classification Taxonomies)

  • 김우주;최남혁;최대우
    • 지능정보연구
    • /
    • 제12권2호
    • /
    • pp.33-48
    • /
    • 2006
  • 의미 웹(Semantic Web)과 이에 대한 관련기술들은 웹을 통해 자유롭게 정보를 공유할 수 있는 새로운 지평을 마련해 주었다. 이를 토대로 온톨로지(Ontology)에 대한 연구 역시 활발히 진행되어 왔으며, 결과적으로 온톨로지는 여러 가지 측면에서 가시적인 성과들을 이룩해 낼 수 있었다. 의미 웹에 대한 기대가 고조되면서, 온톨로지는 많은 연구 학자들로부터 각광을 받는 분야로 떠오를 수 있었으며, 오늘날, 이러한 온톨로지에 대한 연구는 지식표현Knowledge-Representation)등과 같은 학술적인 단계에서 벗어나 전자상거래 분야까지 그 영역을 넓혀 나가고 있다. 그러나 일부에서는 이러한 온톨로지의 양산으로 인해 발생할 문제들에 대한 우려의 목소리가 적지 않다. 즉, 현재 온톨로지들은 서로간의 이질성으로 인해 그 효용 가치를 위협받고 있다는 것이다. 예를 들어, 현재 Yahoo나 DMOZ Open Directory(www.(dmoz.org)등으로부터 제공 중인 상품 카테고리의 경우, 시각적으로는 유사해 보일지 모르나 그들이 지닌 카테고리 구조라든지 사용된 용어 등을 살펴보면 상당한 차이점이 존재한다는 사실을 발견해 낼 수 있다. 따라서 현재 온톨로지가 지향하는 본래의 효용 가치를 극대화시키기 위해서는 이러한 이질성을 극복할 수 있는 방법론이 반드시 필요하다고 할 수 있다. 본 연구에서는 현재 온톨로지 분야에서 가장 커다란 이슈로 떠오르고 있는 정보통합에 대한 해결책을 제시해 보고자 한다. 정보통합이란, 서로 이질적인 프로그래밍 언어나 형식으로 이루어진 데이터들을 통합하여 요약한 형태로 제공하는 기술이라 정의 내릴 수 있다. 이러한 정보 통합의 대표적인 분야로 Merging, Alignment, Translation, Articulation을 들 수 있는데, 이 가운데, 본 연구에서는 "Ontology Alignment"에 대해 집중적으로 다루어 보고자 한다. 이와 더불어, 현재 의미 웹이 지향하는 대표적인 특성 중 하나로써 상호운영성을 꼽을 수 있다. 온톨로지 매핑(Ontology mapping)은 이러한 상호운영성을 지원하기 위한 대표적인 기술로써 각광을 받고 있다. 따라서 우리는 이러한 온톨로지 매핑에 대한 방법론을 쇼핑몰 환경에 적용함으로써 서로 이질적인 상품 카테고리로 구성된 두 쇼핑몰간의 상품에 대한 매핑 알고리즘(Mapping Algorithm)을 제안하고자 한다. 또한, 효용성 검증을 위하여 온톨로지 매핑에 있어 이미 효용성을 검증 받은 PROMPT와의 비교 분석도 수행하여 본다.

  • PDF

Structural SVM을 이용한 백과사전 문서 내 생략 문장성분 복원 (Restoring Omitted Sentence Constituents in Encyclopedia Documents Using Structural SVM)

  • 황민국;김영태;나동열;임수종;김현기
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.131-150
    • /
    • 2015
  • 영어와 달리 한국어나 일본어 문장의 경우 용언의 필수격을 채우는 명사구가 생략되는 무형대용어 현상이 빈번하다. 특히 백과사전이나 위키피디아의 문서에서 표제어로 채울 수 있는 격의 경우 그 격이 문장에서 더 쉽게 생략된다. 정보검색, 질의응답 시스템 등 주요 지능형 응용시스템들은 백과사전류의 문서에서 주요한 정보를 추출하여 수집하여야 한다. 그러나 이러한 명사구 생략 현상으로 인해 양질의 정보추출이 어렵다. 본 논문에서는 백과사전 종류 문서에서 생략된 명사구 즉 무형대용어를 복원하는 시스템의 개발을 다루었다. 우리 시스템이 다루는 문제는 자연어처리의 무형대용어 해결 문제와 거의 유사하나, 우리 문제의 경우 문서의 일부가 아닌 표제어도 복원에 이용할 수 있다는 점이 다르다. 무형대용어 복원을 위해서는 먼저 무형대용어의 탐지 즉 문서 내에서 명사구 생략이 일어난 곳을 찾는 작업을 수행한다. 그 다음 무형대용어의 선행어 탐색 즉 무형대용어의 복원에 사용될 명사구를 문서 내에서 찾는 작업을 수행한다. 문서 내에서 선행어를 발견하지 못하면 표제어를 이용한 복원을 시도해 본다. 우리 방법의 특징은 복원에 사용된 문장성분을 찾기 위해 Structural SVM을 사용하는 것이다. 문서 내에서 생략이 일어난 위치보다 앞에 나온 명사구들에 대해 Structural SVM에 의한 시퀀스 레이블링(sequence labeling) 작업을 시행하여 복원에 이용 가능한 명사구인 선행어를 찾아내어 이를 이용하여 복원 작업을 수행한다. 우리 시스템의 성능은 F1 = 68.58로 측정되었으며 이는 의미정보의 이용 없이 달성한 점을 감안하면 높은 수준으로 평가된다.

뇌파측정기술(EEG)에 기초한 멀티미디어 자료의 주제 적합성에 관한 연구 (Understanding Topical Relevance of Multimedia based on EEG Techniques)

  • 김현희;김용호
    • 한국문헌정보학회지
    • /
    • 제50권3호
    • /
    • pp.361-381
    • /
    • 2016
  • 본 연구는 뇌파측정기술(EEG/ERP)을 적용하여 멀티미디어 자료의 주제 적합성의 단순 모형과 복합 모형을 제안하였다. 즉, 단순 탐색을 처리할 때의 주제 적합성 판단 과정은 단순 모형으로 기술하고, 복합 탐색을 처리할 때의 주제 적합성 판단 과정은 복합 모형으로 설명한다. 단순 모형은 이미지의 의미 분석을 기술하는 N300과 작업 분류에 대한 판단을 할 때 발생하는 P3b 요소들을 이용하였다. 한편 복합 모형은 이미지 기반 표현과 개념적 표현을 하나의 문맥으로 통합시킬 때 나타나는 N400과 복잡한 인지 과정을 기술하는 P600 요소들을 이용하였다. 제안된 적합성 모형들은 EEG 측정 정보에 기초한 멀티미디어 정보시스템의 상호 작용 인터페이스 설계의 기초 자료로 활용될 수 있을 것으로 생각한다.

주제분석기법으로서의 자동색인 (Automatic indexing as a subject analysis technique)

  • 이영자
    • 한국도서관정보학회지
    • /
    • 제12권
    • /
    • pp.61-96
    • /
    • 1985
  • The human subject analysis of a document has some critical problems. The method results in the inconsistency in analysis process and the contradiction of two objects of the subject analysis (one is the identification of the content for the retrieval of specific items and the other is to identify the content for the grouping of related materials). Since the subject analysis by mechanized has been recognized to be the possible way to aggregate the problems of manual analysis, various a n.0, pproaches of automatic indexing have been studied and experimented. This study is to examine the automatic indexing as one of the promising subject analysis techniques by statistical, syntactical and semantic a n.0, pproaches. In conclusion, the reasonable a n.0, pplication time of the automatic indexing should be made a decision based on the through investigation on the cost verse effectiveness, and automatic indexing system should be developed in the close relationship with the on-line search which is a good retrieval system for information explosion society. From now on, since the machine-readable document-text will be envisaged to be more and more available due to the rapid development of computer technology, the more substantial research on the automatic indexing will be also possible, which can bring about the increasing of practical automatic indexing systems.

  • PDF

웹 온톨로지 구축을 위한 OWL 저작 시스템 (OWL Authoring System for building Web Ontology)

  • 이무훈;조현규;조현성;조성훈;장창복;최의인
    • 한국전자거래학회지
    • /
    • 제10권3호
    • /
    • pp.21-36
    • /
    • 2005
  • 현재의 웹 검색은 단순히 키워드매칭만을 통해 필요한 정보들을 검색하기 때문에 그 결과가 사용자가 원하는 정보와는 의미적으로 상이한 결과들을 많이 포함하고 있다. 사용자가 원하는 정보와 의미적으로 정확히 일치하는 정보들을 추출하기 위해서는 웹 자원에 대한 정확한 의미 부여와 웹 자원들 사이의 의미적 연관성을 기술할 수 있는 지식 표현 수단인 온톨로지가 필요하다. 웹 기술표준화 단체인 W3C에서는 이와 같은 웹 자원에 대한 의미 표현 기술로 OWL(Web Ontology Language)이라는 웹 온톨로지 언어를 발표하였으나 아직 이를 효과적으로 저작, 편집할 수 있는 전용 도구의 개발은 아직 미비한 실정이다. 따라서 본 논문은 OWL의 생성 및 편집을 효과적으로 제공할 수 있는 저작 시스템을 설계하고 구현하였다.

  • PDF

온톨로지 기반의 주제-객체관계를 이용한 국가 R&D 지식맵 구축 (Development of a National R&D Knowledge Map Using the Subject-Object Relation based on Ontology)

  • 양명석;강남규;김윤정;최광남;김영국
    • 정보관리학회지
    • /
    • 제29권4호
    • /
    • pp.123-142
    • /
    • 2012
  • 최근 효과적인 정보검색을 제공하기 위해 시맨틱 웹을 비롯한 다양한 검색기법들을 사용하고 있다. 이중에서 효과적인 방법은 온톨로지를 이용한 검색기술을 적용하는 것이라 할 수 있다. 본 논문에서는 국가과학기술지식정보서비스(NTIS)에서 구축한 국가R&D정보를 분석하여 온톨로지를 구축하고, 이용자가 관심있어 하는 주제분야(과제, 인물, 성과, 기관)를 중심으로 온톨로지의 객체관계를 표현하고 정보를 탐색하기 위한 국가R&D지식맵(knowledge map)을 구축하였다. 국가R&D지식맵은 사용자가 선택한 객체를 중심노드로 설정하여, 주제분야를 노드로 표현하고, 객체와 주제분야간의 관계를 분석하여 사용자가 관심 있어 하는 질의를 주제분야의 하위노드로 표현하였다. 사용자가 하위노드의 질의를 선택하면 시스템에서는 선택한 질의를 온톨로지로부터 추론할 수 있는 SPAQL 질의어를 생성하고 추론엔진으로부터 검색결과를 받아 사용자에게 제시하였다.

응용환경 적응을 위한 온톨로지 매칭 방법론에 관한 연구 (Adaptive Ontology Matching Methodology for an Application Area)

  • 김우주;안성준;강주영;박상언
    • 지능정보연구
    • /
    • 제13권4호
    • /
    • pp.91-104
    • /
    • 2007
  • 온톨로지 매칭 기술은 시맨틱 웹을 비롯한 여러 분야에서 중요한 기술 중 하나이다. 온톨로지 매칭은 두 개의 온톨로지를 입력으로 받고, 이를 몇 개의 매개변수로 구성된 특정 알고리즘을 이용하여 두 온톨로지 간의 매칭 관계를 알아내는 절차를 말한다. 온톨로지 매칭은 대용량 온톨로지의 통합이나, 지능화된 통합 검색의 구현 및 여러응용프로그램에 의한 도메인의 공유 등 여러 분야에서 유용하게 활용될 수 있다. 일반적으로 온톨로지 매칭의 성능은 온톨로지 매칭이 사용되는 환경과 관계없이 매칭 결과에 대한 측정만으로 평가되어 왔다. 따라서 대부분의 연구는 매칭 결과를 최적화하기 위해 매개변수를 조절하는 것에 집중하였다. 본 연구에서는 기존의 측정방법에 따른 높은 측정결과만을 목표로 하지 않고 온톨로지의 성격과 매칭 결과의 사용 목적에 따라 매개변수를 적절히 변화시켜야 한다는 점에 주목하고, 주어진 환경에 맞게 매개변수를 조정하는 방법론을 제안하고자 한다.

  • PDF