• 제목/요약/키워드: 개념기반 정보검색

검색결과 368건 처리시간 0.037초

신경망을 적용한 온톨로지 기반의 Focused Crawling (Ontology-Based Focused Crawling Combined with Neural Network)

  • ;강보영;남궁현;김홍기
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2007년도 제19회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.128-133
    • /
    • 2007
  • Focused crawling은 검색시스템의 구축을 위한 웹 문서 수집단계에서, 미리 정의된 토픽 집합들과 관련성을 가지는 웹 문서를 수집하기 위하여 제안되었다. 이러한 focused crawling 연구에서 보다 효과적인 웹 문서 수집을 위해 주어진 토픽에 대한 양질의 배경지식을 제공할 수 있도록 온톨로지가 활발히 활용되어왔다. 그러나 기존의 온톨로지 기반 focused crawling 연구는 토픽과 웹 문서 간의 관련성 측정을 위하여, 주어진 토픽과 관련있는 온톨로지 내 각 개념들에 직관에 의존한 가중치를 부여하여 활용하였다. 하지만 이러한 직관에 의존한 가중치부여 기법은 안정된 수집결과를 도출할 수 있는 최적화된 가중치 값을 얻기가 힘든 한계가 있다. 따라서 본 논문에서는 이러한 개념에 대한 가중치가 학습에 의하여 자동으로 결정되도록, 인공신경망을 적용한 온톨로지 기반 focused crawling 기법을 제안한다. 웹 상에서 제안된 시스템의 성능을 실험한 결과 기존의 온톨로지 기반 수집 기법에 비하여 보다 향상된 결과를 보임을 알 수 있었다.

  • PDF

IPTV 환경에서의 콘텐츠 정보 강화 서비스의 설계 및 구현 (Design and Implementation of content information enrichment service in the IPTV environment)

  • 이종설;장세진;이석필
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2011년도 하계학술대회
    • /
    • pp.424-427
    • /
    • 2011
  • 방송 환경과 인터넷 환경이 융합되고 스마트 TV의 등장에 따라, 사용자는 복잡한 미디어 서비스 환경에 노출되었다. 이로 인해 사용자가 접하는 미디어 콘텐츠의 종류와 데이터의 양은 기하급수 적으로 증가 하고 있다. 웹과 인터넷을 기반으로 하는 정보기술은 모바일 전자 기술의 발달에 따라 데스크탑 이라는 공간적인 한계를 벗어나 유기적인 유비쿼터스 환경으로 변화하고 있으며, 정보 및 콘텐츠의 개념은 웹문서와 텍스트를 넘어서 UCC, 음악, 영화 등의 모바일 멀티미디어 콘텐츠들로까지 빠르게 확장되고 있다. 또한, N-스크린과 IPTV 서비스의 등장은 사용자로 하여금 장소와 시간에 관계없이 미디어를 취득할 수 있는 이득을 제공할 수 있으나 사용자가 선택은 더욱 힘들어 졌다. 방송 통신 융합 단말에서 콘텐츠에 대한 정보를 제공 받기 위해서는 TV-Anytime 인터페이스, MPEG Query Format 인터페이스, OPEN API 등이 사용 가능하다. TV-Anytime 인터페이스는 대용량 저장 장치를 갖는 방송 단말기에서 메타데이터를 제공 및 검색하기 위한 인터페이스를 제공하며, MPEG Query Format 인터페이스는 MPEG-7을 기반으로 하는 메타데이터를 검색하기 위한 인터페이스를 제공한다. 또한, OPEN API는 업체들을 중심으로 공개적으로 제공 되어지는 API로 개방과 참여를 목적으로 한다. 이에 본 논문에서는 사용자의 콘텐츠 사용 정보를 바탕으로 선호 정보를 생성하고, 이를 바탕으로 콘텐츠에 대해서 강화된 정보를 생성하기 위한 서비스를 설계 및 개발한다.

  • PDF

메타데이터 기반의 연구성과정보 검색시스템의 개념적 설계 (Conceptual Design of Metadata based Research Results Information Retrieval System)

  • 박동진;이상태;최기석
    • 정보관리연구
    • /
    • 제37권2호
    • /
    • pp.1-20
    • /
    • 2006
  • 최근 연구성과정보의 원활한 교환 및 유통은 연구생산성 향상에 가장 핵심적인 요인으로 인식되고 있다. 그래서 국가적으로 그리고 각 연구기관에서는 연구성과정보 서비스를 위한 시스템을 계획하거나 구축 중에 있다. 그러나 연구정보들은 서로 다른 형태로 분산되어 있으며, 연구정보를 기술하는 방식에 있어서도 기관별 그리고 연구자 개인별로 많은 차이가 있어서 연구성과정보의 통합에 있어서 많은 제약이 있다. 따라서 본 연구는 시맨틱 웹 기술을 도입하여 연구성과정보의 메타데이터에 대한 상호운용성을 제고하는 방안을 제시함으로써 궁극적으로 연구성과정보의 통합을 지원하고자 한다. 특히 과학기술정보표준화위원회에서 제시한 연구성과정보 메타데이터 표준(안)을 기초로 개발되는 온톨로지는 용어들에 대한 구조적인 그리고 의미적인 통합을 가능하게 하며, RDF/RDFS를 이용한 메타데이터 지식표현은 정보 서비스의 검색과 유통에 있어서 지능적인 서비스를 가능하게 한다. 또한 본 연구를 통하여 제시한 시스템의 개념적 구조는 시맨틱 웹 기반의 검색시스템 개발에 있어서 주요 기능, 구성요소, 적용기술 및 상세 설계의 방향을 제시한다. 본 연구에서 제안한 메타데이터를 통한 시스템의 통합방식은 기존의 연구성과정보 시스템의 서비스 영역을 확대할 뿐 아니라, 더욱 정교해진 지능적인 검색 서비스도 가능하게 한다.

시맨틱 웹기반 수산용 의약품 정보시스템 설계 (A Design of semantic web-based fish drug information system)

  • 정희택;김해란;한순희
    • 한국정보통신학회논문지
    • /
    • 제14권1호
    • /
    • pp.145-155
    • /
    • 2010
  • 본 연구는 키워드 기반의 단순 검색이 아닌 개념의 관계와 추론을 통해 연관정보 및 계층 정보를 함께 보여 줄 수 있는 수산용의약품 도메인 온톨로지 구축 방안을 제안한다. 이를 위해 수산분야 종사자들로부터 적합성질문 목록을 조사하여 개념 및 용어를 도출하는 선행과정을 수행한다. 다음으로 온톨로지 언어인 OWL을 지원하는 Protege-OWL 편집기를 이용하여 온톨로지 모델링 과정을 기술한다. 그리고 마지막으로 구축된 온톨로지를 통해 사용자들이 수산용의약품에 대한 관련 정보를 쉽게 찾아갈 수 있는 사용자 인터페이스를 제안한다. 이는 수산용의약품과 연관된 질병, 어종, 약품평가 내역을 다른 위치로 이동하지 않고 한 화면 내에서 확인 할 수 있게 됨으로써 관련 전공학생, 수산질병관리사, 양식어민들에게 필요한 정보에 대한 효과적인 검색 방법을 제공한다.

단백질 상호작용 네트워크을 위한 개념 기반 추상화 (A Concept-Based Approach for Abstracting Protein Interaction Networks)

  • 최재훈;박종민;김기헌;박선희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.232-234
    • /
    • 2005
  • 본 논문은 세포 내에 존재하는 방대한 단백질들 사이의 상호작용 관계 네트워크에서 생물학적인 의미 연관성을 가지는 부분 네트워크를 콤포지트로 추상화할 수 있는 방법을 제안한다. 이 추상화를 위해 네트워크에서 구조적으로 완전한 부분 네트워크, 개념적으로 인접한 부분 네트워크 그리고 두 조건을 모두 만족하는 부분네트워크를 탐색한다. 따라서, 사용자는 방대한 네트워크을 개념적인 관점에서 분석할 수 있으며, 특정한 의미을 가지는 부분 네트워크를 쉽게 검색할 수 있다.

  • PDF

시소러스를 기반으로 한 온톨로지 시스템 구현에 관한 연구 (A Study on the Thesaurus-based Ontology System for the Semantic Web)

  • 정도헌;김태수
    • 정보관리학회지
    • /
    • 제20권3호
    • /
    • pp.155-175
    • /
    • 2003
  • 본 연구는 W3C를 중심으로 시맨틱 웹을 위한 표준 온톨로지 언어로 제안된 OWL(Web Ontology Language)을 바탕으로 패싯형 시소러스인 AAT(Art and Architecture Thesaurus)의 개념 체계를 이용한 온톨로지 스키마를 구현하여 시맨틱 웹 환경의 온톨로지 기반 시스템을 구축하였다. 특히, 개념의 범위를 AAT의 Furniture 패싯 이하의 용어에 한정하였고 이 중 개념관계가 다양하고 많은 어휘를 가진 하위 패싯인 Chair 개념을 중심으로 시스템 구현 및 테스트를 하였다. 이 시스템은 올톨로지로 정의된 개념을 검색하며, 동의어에 대해 항상 우선어(Preferred term)를 제시하여 어휘를 제어한다. 또한 질의어를 중심으로 한 용어간의 관계를 이용자에게 제시하고 관련어 및 개념의 분류기준 속성을 제시한다. 그 밖에 개념에 인스턴스 값을 입력하고 이를 RDF 문서로 재생산하는 시스템을 구축하여 온톨로지 시스템 응용의 일례를 제시하였다. 이 과정에서 여러 온톨로지를 도입하였고, 인스턴스 값을 담기위한 컨테이너 기반으로 메타데이터 요소를 사용하였다.

Intranet을 기반으로하는 조선소 동시공학 지원시스템 Framework

  • 이창호
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회 1996년도 추계학술대회발표논문집; 고려대학교, 서울; 26 Oct. 1996
    • /
    • pp.262-266
    • /
    • 1996
  • 동시공학적 개념을 선박의 설계에 적용하기 위하여 동시공학 지원 시스템을 구축하는 방법을 제시함이 이 연구의 목적이다. Intranet기술의 개방성과 경제성을 이용한 시스템 개발은 조선 산업의 특성에 맞는 지원체계를 구축하는데 합리적인 대안으로 여겨진다. 그간의 동시공학 적용노력인 단위 시스템의 개발을 통한 방식에서 벗어나 정보시스템과 통합을 가능하게 하는 Intranet 방식은 설계와 생산, Life-cycle정보의 통합을 가능하게 해주는 Framework을 제공해 줄 수 있다. 동시공학 지원 시스템의 주요기능의 파악과 필요한 요소기술들의 경향분석을 이 연구의 주내용으로 하고 있다. 가상 설계의 기능, 동시공학 팀의 Workflow, 의사소통 지원, 데이타베이스 검색, 관리, 타시스템 연계, 설계 데이타 view등이 주요 필요 기능으로 여겨진다.

  • PDF

FRAD 개념 모형 기반의 학술논문 전거데이터 구조에 관한 연구 (A Study on the based on FRAD Conceptual Model based Authority Data Scheme for Academic Papers)

  • 이석형;곽승진
    • 한국문헌정보학회지
    • /
    • 제45권3호
    • /
    • pp.235-257
    • /
    • 2011
  • 본 연구의 목적은 국내 학술논문에 나타나는 저자명, 단체명, 학술지명 전거데이터 구조를 FRAD 개념 모형을 적용하여 설계하는데 있다. 학술정보에는 정보의 접근점이 되는 저자, 소속기관, 발행기관, 학술지 및 회의명과 같은 개체를 포함하고 있을 뿐만 아니라 이들 개체들간 여러 관계들이 존재하고 있다. FRAD 개념 모형에 따른 학술정보 전거데이터의 표현을 통해 학술정보의 체계적인 관리 및 정확한 정보 검색, 그리고 다양한 형태의 지식 표현이 가능할 것으로 판단된다. 본 연구에서 설계된 개체-관계형 학술정보 전거데이터는 학술문서와 연계되며, 개체 식별을 위한 여러 속성 정보 및 관계 정보를 포함한다.

전문용어의 처리에 의한 도메인 온톨로지의 구축 (Domain-specific Ontology Construction by Terminology Processing)

  • 임수연;송무희;이상조
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권3호
    • /
    • pp.353-360
    • /
    • 2004
  • 온톨로지는 특정 도메인에 사용되는 용어들과 그 용어들 간의 관계를 정의하고, 이를 계층구조로 표현한 것을 말한다. 본 논문에서는 전문용어의 처리에 기반 한 도메인 특정적인 온톨로지의 반자동 구축방안을 제안하고자 한다. 이를 위하여 도메인 텍스트 내에서 전문용어를 구성하고 있는 명사나 접미사의 패턴을 분류하고, 이에 따라 전문용어를 추출하고 계층구조를 구하는 알고리즘을 제안한다. 실험은 약학 관련 문서를 대상으로 하였으며, 단일어절 전문용어를 인식한 결과 평균 92.57%, 다중어절 전문용어의 경우 평균 66.64%의 정확도를 보였다. 구축된 온톨로지는 의미정보와 함께 전문용어를 구성하는 특정 명사나 접미사를 중심으로 자연스런 의미 군을 형성함으로써 정보검색 등의 전문적인 지식의 접근에 유용하게 쓰일 수 있으며, 검색의 성능을 향상시키기 위한 추론의 기반으로도 이용할 수 있다.

위키피디아 링크를 이용한 랭크 기반 개념 계층구조의 자동 구축 (Automated Development of Rank-Based Concept Hierarchical Structures using Wikipedia Links)

  • 이가희;김한준
    • 한국전자거래학회지
    • /
    • 제20권4호
    • /
    • pp.61-76
    • /
    • 2015
  • 흔히 대용량 텍스트 데이터의 분류를 위한 인덱싱 데이터 구조로서 계층 개념 트리가 활용된다. 본 논문은 개념 계층구조를 자동적으로 구축하기 위해 위키피디아를 이용한 일반성 랭크 기반 기법을 제안한다. 이것의 목적은 위키피디아 문서를 하나의 개념으로 정의하여 이들 간의 계층적 위상관계를 생성하는 것이다. 이를 위해 위키피디아 문서들 간의 링크 개수를 주요 인자로 하여 개념 일반성을 가늠하는 랭킹함수를 고안하였으며, 이를 활용하여 개념 간 확률적 포함관계를 산출함으로써 안정적인 개념 간 계층 구조를 생성한다. 결과적으로 계층적 관계를 담은 개념쌍은 DAG 구조로 시각화 된다. Open Directory Project 계층구조를 사용한 성능 분석을 통해 제안 기법이 기준 기법에 비해 성능이 우수하며 고품질 계층 관계를 안정적으로 추출할 수 있음을 확인하였다.