• 제목/요약/키워드: 분류별 검색

검색결과 307건 처리시간 0.03초

잠재적 의미 색인을 이용한 유사 질의어 확장 (Query expansion by Similar words Using LSI)

  • 임태훈;안동언;정성종
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.165-169
    • /
    • 2009
  • 오늘날 인터넷 검색은 하루가 다르게 발전되고 있다. 주로 키워드 매칭에 의존을 둔 지금의 검색 서비스들은 사용자 중심의 아이템들을 개발해 정보검색의 경과시간 및 결과의 분류면에서 우수함을 보여주고 있다. 질의어의 의미에 유사한 검색은 아직은 발전하는 단계로, 내용에 기반을 둔 검색 환경에 초점이 맞춰지고 있다. 이와 관련하여 행렬의 특이치 분해(SVD)를 이용한 잠재적 의미 색인 기법(LSI)을 본 연구에서 다루고자 한다. 구축한 시스템의 성능 평가는 재현도 계산으로 비교되었는데 작은 크기의 특이값(singular value)들 생략에 의한 SVD의 성능과 그것을 재이용, 질의어에 대한 의미 구조상 근접한 용어들을 찾아 질의어를 확장한 후 적합한 문서들의 검색을 사용한 특이값 개수, 유사단어 확장 개수를 달리하여 실험하였다. 실험 결과, 특이값 2개를 사용한 잠재적 의미 색인이 특이값 3개를 사용한 잠재적 의미 색인보다 보다 나은 성능을 보였다. 그리고 조건을 달리한 모든 잠재적 의미 색인의 경우 단어 매칭에 의한 적합문서 검색보다 별 뚜렷한 나은 결과는 보이지 않았다. 하지만 의미적으로 관계가 깊은 유사어들을 찾아냈고, 의미적으로 가장 관계 깊은 문서를 대부분의 경우에서 순위 1위로 찾아내는 부분적 우수함을 보였다.

  • PDF

시간 지연 신경망을 이용한 음악 장르 분류 (Music Genre Classification using Time Delay Neural Network)

  • 이재원;조찬윤;김상균
    • 한국멀티미디어학회논문지
    • /
    • 제4권5호
    • /
    • pp.414-422
    • /
    • 2001
  • 본 논문에서는 오디오 데이터의 효과적인 검색을 위하여, 시간지연신경망을 이용한 음악 장르 분류 시스템을 제안한다. 분류 대상 장르는 Blues, Country, Hard Core, Hard Rock, Jazz, R&B(Soul), Techno, Trash Metal의 8종류이다. 장르를 분류하기 위한 비교단위는 곡 중에서의 한 마디이다. 이러한 마디는 리듬의 특성을 효과적으로 반영하는 스네어 드럼 소리를 기준으로 추출한다. 분류기는 시간 지연 신경망을 이용하여 구성하며 입력은 추출된 마디에 대한 주파수 특징벡터이다. 제안한 시스템의 유효성을 검증하기 위한 실험에서, 장르별 10곡씩 총 80곡의 학습 데이터와 장르별 5곡씩 총 40곡의 테스트 데이터에 대하여 각각 92.5%와 60%의 정인식율을 보였다

  • PDF

분야별로 분류된 콘텐츠를 제공하는 어플리케이션의 설계와 구현 (Design and Implementation of the Application Providing the Content Classified by Sector)

  • 김상형;김형범;순펑;주하정;박은주;임한규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.581-584
    • /
    • 2017
  • 컴퓨터나 모바일 기기 사용자들이 필요한 자료나 정보 등을 검색하거나 콘텐츠가 있는 웹사이트를 찾는 경우, 흔히 사용하는 검색만으로는 어려움을 겪을 때가 존재한다. 이에 본 논문은 이러한 불편함을 최소화하기 위해 스마트폰 이용자가 원하는 콘텐츠를 찾고자 하는 경우, 분야별로 중요한 사이트들을 모아 해당 콘텐츠가 있는 사이트를 리스트로 제공해주는 어플리케이션을 개발하였다. 이는 사용자들에게 원하는 콘텐츠가 있는 사이트를 좀 더 쉽게 찾을 수 있도록 편리성을 줄 것이라 기대한다.

전자상거래에서 비교구매 에이전트를 위한 웹 온토롤지에 대한 연구 (A Study of Automatic Web Ontology for Comparison-Shopping Agent in e-Business)

  • 김수경;;안기홍
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 추계학술발표논문집(상)
    • /
    • pp.547-550
    • /
    • 2004
  • 기존 전자상거래 플랫폼과 컨텐츠는 데이터의 확장 및 통합이 고려되지 않은 HTML을 중심으로 한 표현 기반 기술로 되어 있고, 특히 전자상거래 사이트별로 상품 정보에 대한 분류체계가 상이함으로 인해 구매자에게 상품별 비교와 검색에 있어서 많은 시간이 낭비되고 또한 정보의 공유가 어려운 기술로 인하여 판매자와 구매자 모두의 요구를 만족시키지 못하고 있다. 본 논문에서는 최근 차세대 웹 기술로 각광받고 있는 시맨틱 웹 기반 기술인 RDF/RDFS를 이용하여 기존 이종의 상점에 제시된 상품정보를 RDF 문서로 생성하고, OWL을 사용하여 상품 지식 기반온톨로지를 구축한 뒤, RDF 문서와의 분석과 매칭을 통하여 이종의 상점에 표현된 상품을 실시간으로 비교 검색하는 시스템을 설계 제안하였다.

  • PDF

시멘틱 웹 기반의 비교구매 에이전트를 위한 동적 웹 온톨로지 시스템에 대한 연구

  • 김수경;안기홍
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2005년도 춘계학술대회
    • /
    • pp.306-315
    • /
    • 2005
  • 기존 전자상거래 플랫폼과 컨텐츠는 데이터의 확장 및 통합이 고려되지 않은 HTML을 중심으로 한 표현 기반 기술로 되어 있고, 각 사이트별로 상품 정보에 대한 분류체계가 상이하여 구매자들이 상품별 비교와 검색에 있어서 많은 시간을 낭비하는 등 많은 문제점을 가지고 있다. 따라서 전자상거래 사이트들 간의 효율적인 정보 공유의 필요성이 제기 되고 있다. 또한 정보의 공유가 어려운 기술로 인하여 판매자와 구매자들의 다양한 요구를 만족시키지 못하고 있다. 그러므로 본 논문에서는 최근 차세대 웹기술로 각광받고 있는 시맨틱 웹 기반 기술인 RDF/RDFS를 이용하여 기존의 상점에 제시된 상품정보를 Wrapper 기술을 이용하여 필요한 정보만을 추출한 뒤, 이것을 기반으로 RDF 트리플과 문서로 생성한다. 상품 정보에 대한 온톨로지를 설계한 뒤 이를 Web Ontology Language (OWL)를 사용하여 상품 지식 기반 온톨로지를 구축하고, 이를 RDF 트리플과 문서와의 분석과 매칭을 통하여 이종의 상점에 표현된 상품들을 실시간으로 비교 검색하고 동적으로 상품에 대한 지식 기반 온톨로지를 생성하는 웹 온톨로지 시스템을 설계 제안하였다.

  • PDF

개인화된 학습서비스를 위한 관심분야에 따른 웹 문서 분류기 (Web Document Classifier based on Interesting Field for Personalized Learning Service)

  • 김준일;이영석;조정원;최병욱
    • 한국정보교육학회:학술대회논문집
    • /
    • 한국정보교육학회 2005년도 하계학술대회
    • /
    • pp.304-313
    • /
    • 2005
  • RSS와 같은 신디케이션 기술은 사용자가 스스로 웹사이트에 접근하지 않아도, 새롭게 업데이트 되는 정보가 있을 때마다 RSS Aggregator를 통해 사용자에게 알려줌으로써 편리성을 가져다준다. 이러한 기술을 이용한다면 학습자들은 새로운 웹 문서가 게시될 때마다 해당 사이트를 방문할 필요 없이, 자동으로 신규 정보만 얻어오는 학습 자료의 습득 도구로서 활용이 가능하다. 하지만, 정의가 새롭게 추가되는 여부만을 판단하는 기존의 RSS Aggregator의 경우에 등록된 채널수가 늘어갈수록 사용자는 자신이 원하는 정보를 찾기 위해, 정보를 분류하고 검색하는 작업에 많은 노력을 기울여야한다. 본 논문에서는 이러한 문제점을 해결하고 사용자에게 의다 효율적인 정보 전달을 위해, 사용자 스스로 관심분야를 생성하여, 사용자에게 전달되는 신규자료는 각 분야에 자동적으로 분류되며, 사용자가 지정해 놓은 조건에 적합하도록 콘텐츠를 제공 받을 수 있는 시스템을 설계하였다. 신규자료를 분야에 자동적으로 분류하기 위해 초기 분류된 문서로부터 분야별 색인어 추출 방안을 제안하고자 한다.

  • PDF

정책정보서비스의 활성화 방안 연구 - 교육정책정보전문센터의 모형 제시를 중심으로 - (A Study of Promotion of Public Policy Information Services: Focusing on a Model of a Specialized Educational Policy Information Center)

  • 이명희
    • 한국문헌정보학회지
    • /
    • 제47권3호
    • /
    • pp.139-160
    • /
    • 2013
  • 국내의 교육정책정보서비스를 제공하는 교육정책당국, 전문 연구기관과 전문사이트의 10개 웹사이트를 선정하여 내용분석법의 방법으로 이들이 제공하는 주요 정책정보의 종류, 분류체계, 검색시스템의 정보검색 기능 등을 중심으로 분석하였다. 비교 분석한 결과 제시된 문제점을 검토하여 표준화된 교육정책정보 분류체계 개발, 교육정책정보원의 메타데이터 표준화와 검색시스템의 편의성 제고, 정책당국 밀착형 맞춤서비스 제공, 분야별 정책정보 전문센터 운영, 정책분야 간 협력체제 구축을 개선점으로 제안하였다. 또한, 교육정책정보원, 교육정책정보시스템, 운영체제, 협력체제로 구성된 교육정책정보전문센터 모형을 제시하였다.

부정맥 분류 결과의 축약에 기반한 유사환자 검색기 (A Search for Analogous Patients by Abstracting the Results of Arrhythmia Classification)

  • 박주영;강경태
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권7호
    • /
    • pp.464-469
    • /
    • 2015
  • 모바일 기기를 활용한 홀터 모니터링으로 환자의 개인별 심전도 신호의 장주기 수집이 가능해졌다. 하지만 이에 따른 의사 결정 지원 도구 및 응용에 대한 연구는 미흡한 실정이다. 본 논문에서는 장주기로 수집된 심전도 신호의 대표패턴을 추출하기 위한 축약 알고리즘을 제안한다. 그리고 추출된 대표패턴을 이용하여 유사한 환자의 목록을 제공하는 검색기를 소개한다. 사례분석을 통해 제안한 유사환자 검색기가 대표패턴을 통해 전문가의 임상활동을 간소화 하며, 유사한 환자의 목록을 제공하여 축적 데이터의 높은 활용 가능성을 제고함을 보였다. 또한, MIT-BIH 부정맥 데이터베이스를 이용한 평가에서, 축약 알고리즘이 64%의 레코드에 대해 단순화된 대표패턴을 제공하며, 부정맥 분류 결과를 평균 98% 축소함을 보였다.

개념 망 구조를 기반으로 한 문항 관리 시스템의 설계 및 구현 (Design and Implementation of a Question Management System based on a Concept Lattice)

  • 김미혜
    • 한국콘텐츠학회논문지
    • /
    • 제8권11호
    • /
    • pp.412-425
    • /
    • 2008
  • 이-러닝을 통한 교육에 있어 학습자의 학업 성취도를 향상시킬 수 있는 중요한 요인 중의 하나는 다양한 평가문항을 제공하여 학습자가 원하는 주제의 문제들을 용이하게 검색하여 학습할 수 있도록 지원하는 것이다. 그러나 평가문항을 위한 시스템은 주로 구문해석에 기반 한 키워드 검색과 영역별 단원 중심의 계층적인 분류체계에만 의존하고 있어 영역별 연관 관계에 의한 통합된 유형의 문항 검색에는 어려움을 지닌다. 본 논문에서는 C언어 프로그래밍 학습을 위한 문항을 웹상에서 쉽게 관리하고 유지할 수 있는 더불어 관리된 문항들을 효과적으로 검색하여 활용할 수 있는 문항관리 및 검색 시스템을 설계하고 구현 하였다. 제안된 문항 검색 시스템은 사용자 질의가 가지는 의미로부터 문항간의 개념적 연관 관계에 의한 검색을 가능하게 함으로써 단일 주제의 문항뿐만 아니라 영역별 연관 관계에 의한 통합된 유형의 문항들을 편리하게 검색하여 학습에 활용할 수 있도록 하였다. 따라서 제안된 시스템은 교과의 기본적인 원리, 개념의 이해뿐만 아니라 종합적인 지식 활용 및 문제 해결 능력 향상을 지원하는 시스템으로 기대된다.

한글 위키피디아를 이용한 트위터 문서의 주제별 클러스터링 기법 (Topical Clustering Techniques of Twitter Documents Using Korean Wikipedia)

  • 장재영
    • 한국인터넷방송통신학회논문지
    • /
    • 제14권5호
    • /
    • pp.189-196
    • /
    • 2014
  • 최근 들어 트위터와 같은 SNS 환경에서 검색의 필요성이 증가하고 있다. 트위터 검색을 지원하기 위해서는 다량으로 검색된 문서를 주제별로 분류하는 클러스터링 기법이 필요하다. 하지만 트위터의 특성상 단순한 클러스터링 기술을 그대로 적용하기에는 많은 제약이 따른다. 본 논문에서는 이를 극복하기 위해 트위터 환경에 적합한 클러스터링 기법을 제안한다. 제안된 기법에서는 한글 위키피디아를 이용하여 각 트위터 문서에 대한 특징 벡터를 보강하고 각 특징들의 가중치를 재계산하는 방법을 이용하였다. 또한 한글 트위터 문서를 대상으로 실험을 실시하고 기존 기법과의 성능 비교를 통해서 제안된 기법의 유용성을 증명하였다.