• 제목/요약/키워드: 형태 검색

검색결과 1,631건 처리시간 0.024초

구문 분석에 기반한 자연어 질의로부터의 불리언 질의 생성 (Boolean Formulation of Korean Natural Language Queries Using Syntactic Analysis)

  • 박미화;원형석;이원일;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.73-80
    • /
    • 1998
  • 본 연구는 자연어 질의의 형태 및 구문 정보를 바탕으로 불리언 질의를 생성하는데 그 목적을 둔다. 일반적으로 대부분의 상용정보검색시스템은 입력형식을 검색성능이 종은 불리언 형태로 하고 있으나, 일반 사용자는 자신이 원하는 정보를 불리언 형태로 표현하는데 익숙하지 않다. 그러므로 본 정보검색시스템은 자연어 질의를 기본 입력형태로 하여 사용자의 편의성을 높이고, 이 질의를 범주문법에 기반한 구문분석 결과에 의해 복합명사를 고려한 불리언 형태로 변환하여 검색을 수행함으로써 시스템의 검색 성능의 향상을 도모하였다. 정보검색 실험용 데이터 모음인 KTSET2.0으로 실험한 결과 본 논문에서 제안한 자연어 질의로부터 자동 생성된 불리언 질의의 검객성능이 KTSET2.0에서 제공하는 수동으로 추출한 불리언 질의보다 8% 더 우수한 성능을 보였고, 기존 자연어질의 시스템이 수용해온 방법인 형태소 분석을 거쳐 불용어를 제거한 후 Vector 모델을 적용하여 검색을 수행한 경우보다는 23% 더 나은 성능을 보였다.

  • PDF

이진집합기반에서 칼라와 형태정보를 이용한 영상 검색시스템 설계 (Design of Image Retrieval System using Color and Morphological Informations based on Binary Sets)

  • 김성동;최기호
    • 한국멀티미디어학회논문지
    • /
    • 제3권6호
    • /
    • pp.575-584
    • /
    • 2000
  • 본 논문에서는 이진 집합하에서 칼라 공간과 형태 정보를 가지고 새로운 영상검색 방법을 제시한다. 각 영상에 대한 칼라 공간 정보는 칼라 이진세트에 의해 구해지고 형태정보는 영역 세그멘테이션에 의해서 구해진다. 영상 검객 과정에서, 질의 영상과 데이터베이스 영상들의 칼라 및 영상 이진세트들을 비교하여 검색될 후보영상의 집합이 결정된다. 특히, 유사도 측정은 시차적으로 유사한 칼라들의 분포와 객체의 칼라공간 및 형태 특징에 가중치를 고려한 검색이 가능하도록 하였다. 또한 검색 과정의 속도를 향상시키기 위해 후보영상에 대한 복잡한 유사도 측정을 단순히 수행할 수 있도록 새로운 검색 기법을 제안하였다. 위에서 제안한 방법과 3,000개의 화상들로 이루어진 영상 데이터베이스에 대한 구현 실험을 수행하여 제안된 칼라 공간 및 형태특징을 기반으로 한 영상 검색이 비교적 효과적인 결과를 보였다.

  • PDF

World Wide Web에서 검색엔진의 효율성 비교 연구

  • 김종태;김상욱
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 1997년도 춘계학술대회 발표논문집
    • /
    • pp.89-106
    • /
    • 1997
  • 현재 웹(Web)상에서 운용되고 있는 검색엔진의 활용실태에 관한 체게적 검토를통해 각 엔진에 대한 가능을 비교·분석함으로써 각각의 특징과 효율성을 평가해보고자하였다. 효율적인 검색을 위해서는 각 검색엔진의 특성을 파악하여야 하며 얻고자 하는 정보의 특성(정보분류, 사용분야, 정보 형태 등)에 의해서도 검색엔진의 선별이 필요하다. 검색엔진들은 자신만의 독특한 검색방법을 지니고 있으며 사용자 인터페이스, 질의(Query)의 형태와 검색결과에 차이를 보일 수있다. 그러나 이들 검색엔진의 효율성을 비교하기 위한 기준은 아직까지 정립되지 않았으며 학문적으로 검증된 명확한 기준이 없다. 따라서 본 연구에서는 검색엔진의 효율성 비교를 위해 현재 인터넷상에서 통용되고 있는 검색능력평가에 관한 보고서들에서 평가기준으로 삼고있는 기준들을 수집, 분석한후 가장 타당한 것으로 평가기준들을 선정, 체계화하는 작업을 선행하였다. 그리고 각 검색엔진의 검색효율성을 평가하여 그 결과를 분석함으로써 최적의 검색엔진 선택과 정확한 정보의 검색 및 활용에 일조하고자하였다.

타일 정렬을 이용한 이미지 검색 알고리즘 (Image Search Algorithm with Tile Alignment)

  • 박웅;전호윤;신종우;전명재;조환규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.712-714
    • /
    • 2004
  • 인터넷상의 대부분 이미지 검색엔진들은 이미지의 실제 내용보다는 이미지 파일명이나 부가적인 색인과 같은 문자 정보에 의존하여 이미지 검색을 하고 있다. 한편 이미지의 색상 정보를 비교에 사용하는 RGB 히스토그램 방법은 수행시간은 짧지만 형태는 고려하지 않기 때문에 높은 정확도는 기대하기 어렵다. 본 논문에서는 이미지의 실제 내용을 비교하여 비정형의 복잡한 물체를 검색하는 새로운 이미지 검색 알고리즘을 제안한다. 제안하는 알고리즘은 이미지의 색상과 형태 정보를 담은 타일 서열을 local alignment 알고리즘으로 정렬하여 이미지 검색을 한다 비정형 물체인 음식 사진을 사용한 실험에서 기존의 방법 RGB 히스토그램을 이용한 방법보다 월등히 향상된 정확도를 나타내었다.

  • PDF

대용량 이종 XML 데이터 검색을 위한 RDBMS기반 인덱싱 기법 (Technology for Searching Massive XML Data with Different Schema)

  • 이성진;박영순
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.202-204
    • /
    • 2004
  • 최근 XML은 기업간 데이터 교환의 표준으로 자리잡았다. 기업간 데이터 교환은 필연적으로 대량의 XML형태의 데이터가 로그 형태로 보전되게 된다. W3C에서는 XML자료의 검색을 위하여 XQueryl.0을 발표하고 XML 검색문의 표준화를 제시하였다. 검색운과는 별도로 XML데이터의 저장 모델에 대한 연구 또한 활발히 진행되고 있다. 본 논문에서는 대용량 XML데이터를 RDBMS를 이용하여 저장하고 빠른 검색을 지원 할 수 있는 역 인덱싱 방안을 기초로 검색 성능을 향상시킬 수 있는 방안에 대하여 연구하고 기존 방법과의 비교 실험을 통해 그 효과를 검증하였다.

  • PDF

미리내 검색시스템의 명사추출 시스템 (Noun Extraction System in Information retrieval System of "Mirine")

  • 김영관;권혁철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회 및 제1회 형태소 분석기 및 품사태거 평가 워크숍
    • /
    • pp.89-91
    • /
    • 1999
  • 이 논문은 한국어 정보검색 시스템 "미리내"의 내부 모듈인 색인어 추출 시스템의 성능 평가에 관한 내용이다. 성능 평가를 위해서 99년 ETRI에서 실시한 "형태소분석기 및 태거 비교 분석대회(MATEC99)"의 시험어절을 사용하였다. 정보검색 시스템 "미리내"는 한국어 정보검색을 위해 부산대학교에서 개발한 시스템이다. 한국어 형태소분석 및 태거 대회(MATEC99)를 위해 미리내 검색엔진의 색인어 추출 모듈을 일부 수정하여 명사를 추출하였다. 명사추출기이든 형태소분석기이든 응용프로그램의 특성에 맞춰져서 동작한다. 정보검색의 하위 모듈인 색인어 추출 시스템은 정보검색을 위해 변형된 결과를 출력하므로 성능 비교를 위해 일부 모듈의 수정이 불가피하였다. ETRI에서 실시한 MATEC99는 지금까지 객관적인 평가 기준이 없었던 한국어 형태소분석기, 태거, 명사추출기의 표준화에 중요한 역할을 하였다.

  • PDF

두 종류의 임베딩을 이용한 수식 검색 성능 개선 (Performance Improvement of Mathematical Formula Retrieval Using Two Different Kinds of Embedding)

  • 양선;김혜민;고영중
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.616-618
    • /
    • 2018
  • 본 연구에서는 한글 질의어를 이용하여 MathML이라는 마크업 언어 형태로 저장된 수식을 검색하는 수식 검색 시스템을 제안하는데, 마크업 형태 자체에 대한 임베딩과 수식을 한글화 한 후의 임베딩이라는 두 가지 서로 다른 임베딩 결과를 이용하여 검색 성능을 향상시키는 것을 목표로 한다. 최근 자연어 처리의 많은 과제에서 임베딩은 거의 필수적으로 사용되고 있는데, 본 실험을 통해 자연어 문서가 아닌 마크업 형태 수식을 대상으로도 임베딩 사용이 성능 개선에 효과가 있음을 확인할 수 있다. 검색 환경을 실제와 유사하게 설정하기 위하여, 본 실험에서 사용하는 데이터에는 실험을 위해 수기로 작성된 수식들 외에도 실제 웹에서 가져온 여러 분야의 수많은 수식들이 포함된다. Indri 시스템을 이용하여 검색 실험을 수행한 결과, 임베딩을 활용하여 수식을 확장한 경우 수식 확장 이전에 비해 MRR 기준 4.8%p의 성능 향상을 확인할 수 있었다.

  • PDF

시각적 형태 정보에 관한 감성어휘 분류 (Classification of KANSEI Vocabulary according to Visual Shape Information)

  • 백선경;황광수;김판구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.76-78
    • /
    • 2006
  • 인간의 주관적이고 애매한 감성은 차세대 컴퓨팅의 다양한 분야에서 연구되며. 인간의 감성을 이해하고 감성의 변화에 능동적으로 반응하는 사용자 중심의 정보 처리에 대한 요구가 급격히 증가하고 있다. 우리는 감성기반 이미지 검색을 위해 저차원 시각정보에 대한 강성처리를 연구하고 있다. 기존의 저차원 시각정보 특징을 고려한 내용기반 이미지 검색 방법은 사용자의 취향이나 감성 요구에 적합한 결과를 검색하기에는 많은 어려움이 있다. 본 논문에서는 인간의 감성을 이해, 검색, 인식하기 위한 시각정보와 감성간의 관계 연구 중 우리의 기존 연구인 시각적 형태 정보의 감성어휘 공간에서 형태와 어휘간의 감성거리를 이용한 분류방법을 제안한다. 그리고 분류된 각 영역에서의 대표 어휘를 추출하여 시각적 형태에 따른 감성어휘간의 구체적 계층 관계를 정의한다. 이는 감성기반 이미지 검색 분야에 활용 가능한 연구이며, 우리가 사용하는 언어에 내재된 감성정보를 해석하고 그 어휘들의 체계적인 시각적 감성관계를 정의하는 의의를 갖는다.

  • PDF

에지 정보에 의한 형태와 질감 및 칼라 정보를 이용한 영상 검색 (Image Retrieval Using Shape by Edge Feature and Texture and Color)

  • 이정봉;이광호;최철;조성민;박장춘
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 춘계학술발표논문집(상)
    • /
    • pp.234-239
    • /
    • 2002
  • 영상 검색의 수행 방법으로 사람의 시각 시스템의 특성을 기반으로 효과적인 특징 추출 통한 계층적인 내용 기반 검색 시스템을 제안한다. 영상 고유의 특징을 얻기 위해 영상내에 존재하는 형태 정보와 질감 방향성 및 칼라 정보를 이용한다. 본 논문에서는 형태 정보의 추출을 위하여 사용자의 질의 영상에서 에지 특징 정보를 추출하고 부분 영역으로 분할된 영상에서 GLCM(Gray Level Co-occurrence Matrix)의 Contrast를 질감 특징으로 추출한다. 이들 두 특징을 이용하여 1차 분류 과정을 거치고 2차 검사에서는 보다 정확한 검색을 수행하기 위하여 1차로 분류된 후보영상들에 대하여 영상의 세부 정보인 칼라 정보를 기반으로 유사도를 측정함으로써 유사한 칼라와 형태를 가지는 영상뿐만 아니라 칼라가 다른 유사한 영상에도 효율적인 검색 성능을 보였다.

  • PDF

색상과 형태를 이용한 내용 기반 영상 검색 (Content-based Image Retrieval Using Color and Shape)

  • 하정요;최미영;최형일
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권1호
    • /
    • pp.117-124
    • /
    • 2008
  • 본 논문에서는 색상정보와 형태정보를 이용한 내용기반 영상 검색방법을 제안한다. 이미지의 한 가지 특징만을 고려한 내용 기반 이미지 검색은 두 가지 이상의 특징 정보를 이용했을 때와 비교하여 정확도가 떨어져 성능을 저하시킬 수 있다. 따라서 여러 검색 시스템에서는 색상이나 형태, 질감 등과 같은 이미지의 다양한 특징들을 혼합하여 검색에 이용하고 있다. 본 연구는 각 영상의 Hue값에 대한 색상정보와 CSS(Curvature Scale Space)를 이용한 형태정보를 사용한다. 각 영상들의 특징 정보와 데이터베이스에 저장된 영상들의 특징 정보들을 비교하여 유사도 순위에 따라 후보영상들이 검색된다. 실험 결과 색상정보나 형태정보 한가지의 특징만을 사용한 경우 보다 정확도와 재현율면에서 사용자가 원하는 이미지와 보다 유사한 결과를 검출할 수 있었다.

  • PDF