• 제목/요약/키워드: 키워드 매칭

검색결과 95건 처리시간 0.027초

시맨틱 웹에서 온톨로지를 위한 OWL 저작도구 (OWL Authoring Tools for Ontology in Semantic Web)

  • 안병규;이무훈;이민희;김동혁;백주현;고병오;조현규;송병렬;최의인
    • 한국전자거래학회:학술대회논문집
    • /
    • 한국전자거래학회 2003년도 종합학술대회 논문집
    • /
    • pp.204-210
    • /
    • 2003
  • 현재의 웹 검색은 단순히 키워드 매칭만을 수행하기 때문에 검색 결과가 사용자가 원하는 정보와는 의미적으로 상이한 결과들을 많이 포함하고 있다. 사용자가 원하는 정보와 의미적으로 정확히 일치하는 정보들을 추출하기 위해서는 웹 자원에 대한 정확한 의미 부여와 함께, 이를 파악하고 선택적으로 획득, 통합, 가공할 수 있는 온톨로지와 같은 시맨틱 웹 환경요소들이 필요하다 웹 기술 표준화 단체인 W3C에서는 이와 같은 웹 자원에 대한 의미표현 기술로 OWL(Web Ontology Language)이라는 웹 온톨로지 표현 언어를 발표하였으나 아직 이를 효과적으로 저작, 편집할 수 있는 도구는 전무한 실정이다. 따라서 본 논문은 OWL을 기반으로 하여 온톨로지의 생성 및 편집을 효과적으로 제공할 수 있는 통합된 저작도구를 설계 및 구현하였다.

  • PDF

정보검색기반 질의응답 시스템 설계 (Design of a QA System based on Information Retrieval)

  • 김민경;안혁주;김학수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 춘계학술발표대회
    • /
    • pp.816-818
    • /
    • 2015
  • 본 논문에서는 질의유형을 통한 검색기반 질의응답 시스템을 구현하기 위한 설계방법을 제안한다. 이를 위해 위키피디아 문서의 링크 데이터를 이용하여 색인 대상문서와 데이터베이스를 구축하는 색인 모델과 2-포아송 모델을 이용하여 얻은 문서들을 색인 데이터베이스를 통해 필터링하여 정답 후보문장을 추출하는 검색모델, 키워드 패턴 매칭 기반 질의유형 분류 모델을 설계하였다.

감성 색체 이미지 검색을 위한 미술 작품 온톨로지 개발 (An Ontology for the Retrieval of Art Image with Sensitivity Color)

  • 조우상;한상진;이복주
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.385-388
    • /
    • 2004
  • 인공지능분야에서의 온톨로지란 기본적인 개념의 규정과 개념들 사이의 관계를 표현한 용어들의 분류(classification)를 의미한다. 온톨로지를 만들기 위해서는 많은 온톨로지 관련 언어가 있다. 그 중 최근의 연구 방향은 DAML+OIL과 OWL로 작성된 온톨로지를 이용한 추론, 인텔리전트 서비스 분야이다. 본 논문에서는 웹 상의 미술 작품 온톨로지에 대해 기존의 키워드 매칭 검색 대신에 추론엔진을 이용한 시맨틱 기반의 확장된 검색 방법을 소개한다. 향후 연구는 퍼지 개념을 도입하여 기존의 결과 보다 정확한 검색 결과를 얻기 위한 연구를 할 것이다.

  • PDF

성격 유형과 음색에 따른 롱-테일 음악 추천 시스템 설계 (Design of The Long Tail in Music Recommendation System according to a Personality type and Timbre)

  • 조보연;최현준;서동렬
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 춘계학술발표대회
    • /
    • pp.208-211
    • /
    • 2013
  • 인터넷의 발달과 온라인 음악서비스로 인해 많은 사람들이 손쉽게 원하는 곡들을 선택하여 청취할 수 있다. 수많은 곡들 중 자기가 선호하는 음악을 듣고 찾기엔 많은 시간이 필요할 뿐만 아니라 검색하기 위해 곡 제목이나 아티스트 및 연도에 관한 정보도 숙지해야 할 것이다. 또한 질의에 해당하는 키워드가 포함되는 리스트만 제공되는 기존 음악 다운 사이트의 환경을 개선하고자, 영국 헤리엇와트 대학 연구진의 결과를 토대로 한 성격유형을 매칭시켜 해당된 장르를 구하고 컨텐트 기반인 음색유사도를 통해 질의에 해당된 음악을 추천해 주는 시스템을 설계하고자 한다. 4Shared.com과 비교 분석하였고 누구나 아는 유명한 곡들보다 한번도 들어보지 못한 곡들을 추천함으로써 유용성에 대한 기대감을 높이고자 한다.

인용논문 분석을 통한 학술 문서 추천 시스템 (A recommender of academic papers using the citation analysis)

  • 박상진;김윤현;이지현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 춘계학술발표대회
    • /
    • pp.279-282
    • /
    • 2011
  • 인터넷의 급속한 보급으로 사용자가 정보와 지식의 접근이 용이 해진 반면, 방대한 정보의 과 부화로 인하여 데이터의 신뢰성이 문제시 되고 있다. 특히, 기존의 학술 연구와 관련된 논문 데이터 검색에 있어서, 사용자의 요구 사항에 정확히 부합하는 결과물을 제공하는 데는 많은 한계를 가진다. 본 연구는 기존의 단순 키워드 매칭 검색의 한계를 넘어서, 레퍼런스와 인용 논문을 활용한 내용 기반 검색 방법론을 제안 한다.

웹 크롤링 이용한 크레페 검색 시스템 설계 (Crepe Search System Design using Web Crawling)

  • 김효종;한군희;신승수
    • 디지털융복합연구
    • /
    • 제15권11호
    • /
    • pp.261-269
    • /
    • 2017
  • 본 연구의 목적은 광역 네트워크로 연결된 다수의 봇을 활용한 방식이 아닌 단일 네트워크에서 정보의 최신성을 보장하기 위해 데이터베이스 서버를 사용하지 않고 실시간으로 웹에 접속하여 정보를 불러오는 방식을 사용한 검색 시스템을 설계하는 것이다. 연구의 방법은 크레페 시스템에서 신속하고 정확한 인물과 키워드 검색을 할 수 있는 시스템을 설계하고 분석한다. 크레페 서버는 본문 태그 매칭 변환 과정은 사용자가 정보를 등록할 경우 글자체, 글자 크기, 색상등과 같이 사용자마다 여러 스타일이 적용되어 그 자체가 정보가 되기 때문에 모든 정보를 그대로 저장하게 된다. 크레페 서버는 본문 태그 매칭 문제점이 발생되지 않는다. 그러나 크레페 검색 시스템을 실행할 때에는 사용자들의 스타일 및 특성을 정형화할 수 없다. 이러한 문제점을 html_img_parser 함수와 Go언어의 html 파서 패키지를 사용하면 해결할 수 있다. 특정 사이트를 대상으로 하는 웹 크롤러 설계가 아닌 범용 웹 크롤러에 큐와 다중 스레드를 적용하여 다양한 웹 사이트를 빠르고 효율적으로 탐색, 수집한 빅 데이터를 다양한 응용 분야에 활용될 수 있을 것이다.

실시간 이슈 탐지를 위한 일반-급상승 단어사전 생성 및 매칭 기법 (A Generation and Matching Method of Normal-Transient Dictionary for Realtime Topic Detection)

  • 최봉준;이한주;용우석;이원석
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제13권5호
    • /
    • pp.7-18
    • /
    • 2017
  • 트위터는 사용자들에게 정보를 받거나 교환하는 채널로써의 역할이 활발히 이루어지고 있고 새로운 사건이 발생했을 때 빠르게 반응하기 때문에 지진이나 홍수, 자살 등의 새로운 사건을 탐지하는 센서역할로 활용할 수 있다. 그리고 사건을 탐지하기 위해서 우선적으로 관련된 트윗 추출이 필수적이다. 하지만 관련된 트윗을 찾기 위해 관련 키워드를 포함한 트윗을 추출하기 때문에 해당 키워드가 없지만 의미적으로 사건과 관련이 있는 트윗은 찾지 못하는 문제점이 있다. 또한 기존의 연구들은 디스크에 저장된 데이터에 대한 분석이 주를 이루고 있어 원하는 결과를 얻기 위해서는 데이터를 수집하여 저장하고 분석에 이르기까지 오랜 시간이 소모된다. 이러한 문제점을 해결하기 위해 본 연구에서는 실시간 이슈 탐지를 위한 일반-급상승 단어 사전 생성 및 매칭 기법을 제안한다. 데이터 스트림 인메모리 기반으로 일반-급상승 단어 사전을 생성 및 관리하기 때문에 새로운 사건을 빠르게 학습하고 대응할 수 있다. 또한 분석을 원하는 주제의 일반 사전과 급상승 사전을 동시에 관리하기 때문에 기존의 방법으로 찾지 못하는 트윗을 검출해 낼 수 있다. 본 연구를 통해 빠른 정보와 대응이 필요한 분야에 즉시적으로 활용할 수 있다.

사무실 환경 내 다중카메라 영상의 이벤트분석을 통한 자연어 기반 동영상 검색시스템 (Natural Language based Video Retrieval System with Event Analysis of Multi-camera Image Sequence in Office Environment)

  • 임수정;홍진혁;조성배
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 1부
    • /
    • pp.384-389
    • /
    • 2008
  • 최근 동영상을 저장하거나 효과적으로 검색하는 시스템의 필요성이 증가하고 있다. 기존 동영상 검색 시스템은 메뉴나 텍스트 기반의 키워드로 동작하는데, 검색을 위한 정보가 빈약하여 많은 동영상이 동시에 검색되는 경우가 많고, 사용자가 해당 시스템을 사용하기 위한 지식이 필요하다. 본 논문에서는 키워드 기반 질의에 비해 사용자의 의도나 다양한 정보를 포함 할 수 있고 이벤트나 사람 뿐 아니라 인간의 기본적인 행동까지 검색하는 자연어 질의 기반 동영상 검색 시스템을 제안한다. 먼저, 사무실에서 수집된 동영상에 대한 도메인 분석을 통해 메타데이터로 이벤트 데이터베이스를 구축하고, 해당 영역에서의 사용자 질의에 대한 전처리 과정과 분석 작업을 통해 스크립트 데이터베이스를 구축한다. 이렇게 구축된 시스템을 바탕으로 대화형 질의와 답변 쌍 매칭을 통해 동영상을 검색한다. 10명의 사용자를 대상으로 메뉴 기반 검색 시스템과의 성능 평가와 프로세스 평가 비교 검증을 통해, 성능이나 사용자 만족도면에서 제안하는 시스템이 우수함을 보였다.

  • PDF

유사과제파악을 위한 검색 알고리즘의 개발에 관한 연구 (A Study on the Development of Search Algorithm for Identifying the Similar and Redundant Research)

  • 박동진;최기석;이명선;이상태
    • 한국콘텐츠학회논문지
    • /
    • 제9권11호
    • /
    • pp.54-62
    • /
    • 2009
  • 국가적으로 그리고 각 연구기관에서는 투자의 효율성을 기하기 위하여 연구사업 선정과정에서 데이터베이스로부터 중복과제 혹은 유사과제를 검색하는 과정을 거친다. 최근 부얼리언 기반의 키워드 매칭 검색알고리즘의 발전 및 이를 채택한 검색엔진의 개발로 인하여 검색의 정확도가 많이 향상되었지만, 사용자가 입력하는 제한된 수의 키워드들에 의한 검색은 유사과제 파악과 우선순위의 결정에 어려움이 있다. 본 연구에서는 제안된 과제의 문서를 분석하여 다수의 색인어들을 추출하고, 이들에게 가중치를 부여한 후, 기존의 문서들과 비교하여 유사과제를 찾아내는 문서단위의 검색 알고리즘을 제안한다. 구체적으로 벡터공간검색(Vector-Space Retrieval)모델의 한 종류인 TFIDF(Term Frequency Inverse document Frequency)를 기본 구조로 채택한다. 또한 개발되는 알고리즘에는 연구과제 제안문서의 구조에 적합한 속성별 가중치(feature weighting)를 반영하고 검색속도의 향상을 위하여 K-최근접 문서(KNN: K-Nearest Neighbors) 기법도 반영한 알고리즘을 제시한다. 실험을 위하여 실제 연구제안 문서와 구조가 동일한 기존의 보고서를 사용하였는데, KISTI에서 운영하는 과학기술정보포털서비스인 NDSL에서 이미 분류해 놓은 4분야의 1,000 개 연구 보고서 문서를 발췌하여 실험을 하였다.

XML 문서 검색을 위한 경로 역 색인 기법 (The Path Inverted Index Technique for XML Document Retrieval)

  • 문경원;황병연
    • 정보처리학회논문지D
    • /
    • 제17D권2호
    • /
    • pp.103-110
    • /
    • 2010
  • 최근에 관계형 데이터베이스 관리 시스템(RDBMS)의 장점을 이용하여 XML로 표현된 문서를 효과적으로 저장, 관리, 검색하는 XML 문서관리 시스템에 대한 많은 연구들이 활발하게 진행되어 왔다. 그러나 경로 질의 중에서 LIKE 연산과 같은 부분 패턴 매칭 질의의 경우는 비효율적인 비교 연산으로 인해 검색 성능이 현저하게 떨어지기 때문에 RDBMS의 색인의 효과를 볼 수 없다. 본 논문에서는 XML 문서를 RDBMS에 효율적으로 저장하는 계층형 XML 저장 기법과 경로 역 색인 기법을 제안한다. 제안하는 기법은 XML문서의 엘리먼트를 키워드로 보고 해당 키워드가 속한 경로의 식별자와 시퀀스로 포스팅 파일을 구성하여 경로 기반 질의의 검색 속도를 향상하는데 주안점을 둔다. 검색 성능에 관한 실험을 통해서 제안된 기법이 기존의 RDBMS를 이용한 기법보다 약 60% 우수한 성능을 가지고 있음을 입증한다.