• 제목/요약/키워드: Web-based Retrieval

검색결과 457건 처리시간 0.033초

객체지향 설계 유형에 의한 온톨로지 기반 정보검색 및 관리시스템 구현 (Implementation of Information Retrieval and Management System Based on Ontology Using Object Oriented Design Pattern)

  • 이홍로
    • 한국지리정보학회지
    • /
    • 제12권4호
    • /
    • pp.146-157
    • /
    • 2009
  • 본 논문은 온톨로지 정보검색 시스템을 구현하기 위해서 Event Process 모델과 디자인 패턴을 이용하여 효과적으로 요구조건에 대해 분석하는 방법에 대해 연구하였다. 이러한 분석 방법은 시스템의 재사용성을 향상시키는 객체지향 프로세스 모델에 대한 기법과 사용자의 더 많은 정보의 획득을 위한 것이다. 우리는 이러한 온톨로지 데이터의 재사용성에 대한 분석 방법을 제안하고자 한다. 본 논문에서 온톨로지에 기반한 데이터의 검색은 사용자에게 정확한 정보의 획득을 보여준다. 또한 관리모듈을 통한 온톨로지 데이터의 관리를 통해서 온톨로지의 재사용성을 보여주었고, 기존 다른 데이터와의 연동 및 공유를 할 수 있다. 따라서, 객체지향 설계 유형에 의한 온톨로지 기반 정보검색 시스템은 높은 안정성과 신뢰성을 보여주고, 모듈 및 소프트웨어의 재사용과 확장성을 높이며 사용자에게 신뢰도 있는 정보를 보여주는데 기여 할 것이다.

  • PDF

블로그 검색 성능 향상을 위한 주제-랭크 기법 (The Topic-Rank Technique for Enhancing the Performance of Blog Retrieval)

  • 신현일;윤은일;류근호
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권1호
    • /
    • pp.19-29
    • /
    • 2011
  • 1인 미디어인 블로그에 대한 관심이 증가함에 따라, 블로그 검색과 관련된 다양한 랭킹 알고리즘들이 제안되었다. 이러한 알고리즘들은 블로그가 웹 페이지와 다르게 갖는 구조적 특징에 맞게 변형되었으며, 각 블로그간의 연결이나, 댓글, 트랙백들을 통해 이루어진 상호소통 속에서 나타난 결과들을 바탕으로 블로그의 평판이나 인기도를 수치화하여 검색 시스템에 반영한다. 하지만 실제 블로그 검색에서는 블로그 자체의 랭크뿐만 아니라 검색어와 블로그 글과의 적합성과시간등의요소를복합적으로사용하게된다. 그런데기존에알려진요소만으로는검색결과의품질이낮을수 있다. 본 논문에서는 블로그의 주제와 관련도가 가장 높은 블로그를 찾아 낼 수 있는 주제-랭크 기법을 제안한다. 이 기법은 블로그와 블로그 글의 색인어뿐만 아니라, 블로그 글을 대표하는 주제와의 관계까지 랭킹을 매기는 방법이다. 제안된 기법을 통해 블로그 검색에서 검색어와 블로그의 연관성에 따라 랭킹을 효과적으로 부여할 수 있다. 본 논문 제안하는 주제-랭크 기법을 적용한 블로그 검색 시스템의 정확률과 적용률을 국내의 다른 블로그 검색 시스템들과 비교해 본 결과, 주제-랭크 기법을 사용한 블로그 검색 시스템의 성능이 타 시스템에 비해 더 우수함을 알 수 있었다.

FCA 기반 계층적 구조를 이용한 문서 통합 기법 (Methods for Integration of Documents using Hierarchical Structure based on the Formal Concept Analysis)

  • 김태환;전호철;최종민
    • 지능정보연구
    • /
    • 제17권3호
    • /
    • pp.63-77
    • /
    • 2011
  • 월드와이드웹(World Wide Web)은 인터넷에 연결된 컴퓨터를 통해 사람들이 정보를 공유할 수 있는 매우 큰 분산된 정보 공간이다. 웹은 1991년에 시작되어 개인 홈페이지, 온라인 도서관, 가상 박물관 등 다양한 정보 자원들을 웹으로 표현하면서 성장하였다. 이러한 웹은 현재 5천억 페이지 이상 존재할 것이라고 추정한다. 대용량 정보에서 정보를 효과적이며 효율적으로 검색하는 기술을 적용할 수 있다. 현재 존재하는 몇몇 검색 도구들은 초 단위로 gigabyte 크기의 웹을 검사하여 사용자에게 검색 정보를 제공한다. 그러나 검색의 효율성은 검색 시간과는 다른 문제이다. 현재 검색 도구들은 사용자의 질의에 적합한 정보가 적음에도 불구하고 많은 문서들을 사용자에게 검색해준다. 그러므로 대부분의 적합한 문서들은 검색 상위에 존재하지 않는다. 또한 현재 검색 도구들은 사용자가 찾은 문서와 관련된 문서를 찾을 수 없다. 현재 많은 검색 시스템들의 가장 중요한 문제는 검색의 질을 증가 시키는 것이다. 그것은 검색된 결과로 관련 있는 문서를 증가시키고, 관련 없는 문서를 감소시켜 사용자에게 제공하는 것이다. 이러한 문제를 해결하기 위해 CiteSeer는 월드와이드웹에 존재하는 논문에 대해 한정하여 ACI(Autonomous Citation Indexing)기법을 제안하였다. "Citaion Index"는 연구자가 자신의 논문에 다른 논문을 인용한 정보를 기술하는데 이렇게 기술된 논문과 자신의 논문을 연결하여 색인한다. "Citation Index"는 논문 검색이나 논문 분석 등에 매우 유용하다. 그러나 "Citation Index"는 논문의 저자가 다른 논문을 인용한 논문에 대해서만 자신의 논문을 연결하여 색인했기 때문에 논문의 저자가 다른 논문을 인용하지 않은 논문에 대해서는 관련 있는 논문이라 할지 라도 저자의 논문과 연결하여 색인할 수 없다. 또한 인용되지 않은 다른 논문과 연결하여 색인할 수 없기 때문에 확장성이 용이하지 못하다. 이러한 문제를 해결하기 위해 본 논문에서는 검색된 문서에서 단락별 명사와 동사 및 목적어를 추출하여 해당 동사가 명사 및 목적어를 취할 수 있는 가능한 값을 고려하여 하나의 문서를 formal context 형태로 변환한다. 이 표를 이용하여 문서의 계층적 그래프를 구성하고, 문서의 그래프를 이용하여 문서 간 그래프를 통합한다. 이렇게 만들어진 문서의 그래프들은 그래프의 구조를 보고 각각의 문서의 영역을 구하고 그 영역에 포함관계를 계산하여 문서와 문서간의 관계를 표시할 수 있다. 또한 검색된 문서를 트리 형식으로 보여주어 사용자가 원하는 정보를 보다 쉽게 검색할 수 있는 문서의 구조적 통합 방법에 대해 제안한다. 제안한 방법은 루씬 검색엔진이 가지고 있는 순위 계산 공식을 이용하여 문서가 가지는 중요한 단어를 문서의 참조 관계에 적용하여 비교하였다. 제안한 방법이 루씬 검색엔진보다15% 정도 높은 성능을 나타내었다.

WWW상에서의 온라인 정보통신표준 개발 시스템 설계 및 구현 (Design and Implementation of On-line Standards Development System on the World Wide Web)

  • 구경철;김형준;박기식;송기평;조인준;정회경
    • 한국정보통신학회논문지
    • /
    • 제2권4호
    • /
    • pp.559-573
    • /
    • 1998
  • 정보통신 표준화 기구들은 최근 동 분야가 국가 및 시장 경쟁력제고에 있어 전략적 수단으로 부상됨에 따라 더 많은 새롭고 복잡한 표준들을 보다 짧은 시간 내에 개발해야 한다는 문제에 직면하고 있으며, 이러한 문제 의 해결을 위해 이들은 표준개발절차의 많은 부분들을 전자화 시킨 소위 전자적 표준개발시스템 혹은 전자적 문서처리시스템의 구현을 꾀하고 있다. 본 논문에서는 이러한 정보통신분야의 환경변화에 효율적으로 대처하기 위해 국내 표준화 환경 및 표준화 순기(표준(안)연구개발표준(안)제안의견수렴표준화위원회 승인표준(안)확정)에 따른 Workflow기반 표준(안) 개발 환경을 WWW상에서 설계 구현한 표준정보유통망(SICN : Standards Information Cooperation Network) 시스템을 소개한다 구현된 온라인 표준개발 시스템은 기존의 인터라넷(Intranet)기반의 시스템과는 달리 개념적으로 인터넷의 제3물결이라 할 수 있는 엑스트라넷(Extranet) 개념의 Workflow 기반 시스템이라 할 수 있으며, 이는 향후 '가 상 표준 개발망(VSDN : Virtual Standards Development Network)'으로 확장 구현될 예정이다.

  • PDF

Incorporation of Fuzzy Theory with Heavyweight Ontology and Its Application on Vague Information Retrieval for Decision Making

  • Bukhari, Ahmad C.;Kim, Yong-Gi
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제11권3호
    • /
    • pp.171-177
    • /
    • 2011
  • The decision making process is based on accurate and timely available information. To obtain precise information from the internet is becoming more difficult due to the continuous increase in vagueness and uncertainty from online information resources. This also poses a problem for blind people who desire the full use from online resources available to other users for decision making in their daily life. Ontology is considered as one of the emerging technology of knowledge representation and information sharing today. Fuzzy logic is a very popular technique of artificial intelligence which deals with imprecision and uncertainty. The classical ontology can deal ideally with crisp data but cannot give sufficient support to handle the imprecise data or information. In this paper, we incorporate fuzzy logic with heavyweight ontology to solve the imprecise information extraction problem from heterogeneous misty sources. Fuzzy ontology consists of fuzzy rules, fuzzy classes and their properties with axioms. We use Fuzzy OWL plug-in of Protege to model the fuzzy ontology. A prototype is developed which is based on OWL-2 (Web Ontology Language-2), PAL (Protege Axiom Language), and fuzzy logic in order to examine the effectiveness of the proposed system.

지능형 기상 서비스를 위한 기상 온톨로지의 설계 (A Design of Weather Ontology for Intelligent Weather Service)

  • 정의현
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권4호
    • /
    • pp.185-193
    • /
    • 2008
  • IT기반의 기상학과 기상 서비스의 급속한 발전에도 불구하고, 아직까지 사람들이 직접 기상 정보를 받아와 판단하는 전통적인 방식으로 기상 정보가 이용되고 있다. 특히 지능화된 기상 정보 처리가 유비쿼터스 컴퓨팅과 개개인의 생활에 매우 유용할 것으로 기대됨에도 불구하고, 기계 주도의 자동화된 기상정보 처리에 대한 연구는 오랫동안 주목을 받지 못했다. 본 논문에서는 지능형 기상 정보처리를 가능하게 하는 GRIB기반의 온톨로지의 설계에 대해서 논한다. GRIB은 세계적으로 널리 사용되는 범용 목적의 기상 데이터 포맷으로 세계 기상기구에 의해 승인된 형식이다. 설계된 온톨로지와 Jess 엔진으로 구성된 추론 시스템으로 지능형 기상 애플리케이션을 구현하고 실험하여, 기계 주도의 기상 정보 처리에 대한 효과를 검증하였다.

  • PDF

Sorting Instagram Hashtags all the Way throw Mass Tagging using HITS Algorithm

  • D.Vishnu Vardhan;Dr.CH.Aparna
    • International Journal of Computer Science & Network Security
    • /
    • 제23권11호
    • /
    • pp.93-98
    • /
    • 2023
  • Instagram is one of the fastest-growing online photo social web services where users share their life images and videos with other users. Image tagging is an essential step for developing Automatic Image Annotation (AIA) methods that are based on the learning by example paradigm. Hashtags can be used on just about any social media platform, but they're most popular on Twitter and Instagram. Using hashtags is essentially a way to group together conversations or content around a certain topic, making it easy for people to find content that interests them. Practically on average, 20% of the Instagram hashtags are related to the actual visual content of the image they accompany, i.e., they are descriptive hashtags, while there are many irrelevant hashtags, i.e., stophashtags, that are used across totally different images just for gathering clicks and for search ability enhancement. Hence in this work, Sorting instagram hashtags all the way through mass tagging using HITS (Hyperlink-Induced Topic Search) algorithm is presented. The hashtags can sorted to several groups according to Jensen-Shannon divergence between any two hashtags. This approach provides an effective and consistent way for finding pairs of Instagram images and hashtags, which lead to representative and noise-free training sets for content-based image retrieval. The HITS algorithm is first used to rank the annotators in terms of their effectiveness in the crowd tagging task and then to identify the right hashtags per image.

퍼지연상기억장치에 기반한 협력 추천 방법 (A Collaborative Recommendation Method based on Fuzzy Associative Memory)

  • 이동섭;고일주;김계영
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권8호
    • /
    • pp.1054-1061
    • /
    • 2004
  • 최근 인터넷의 발전으로 정보의 접근이 용이할 뿐 아니라 그 양 또한 기하급수적으로 증가하고 있다. 정보의 홍수 속에서 원하는 정보만을 자동으로 추출할 수 있는 기술은 정보검색에 소요되는 시간과 노력을 절약할 수 있는 매우 중요한 연구이다. 본 논문에서는 관심 범위가 유사한 사용자에게 양질의 정보를 자동으로 추천하기 위하여 협력적 여과방법에 관하여 제안한다. 제안하는 방법의 기본적인 배경은 사용자는 선택항목의 선호도를 입력하고, 여과 장치는 이 선호도에 근거하여 추천집합을 자동으로 생성하는 것이다. 선호도로부터 추천집합을 추론하기 위하여 본 논문에서 퍼지 연상기억장치에 기반한 방법을 제안한다. 제안된 방법은 웹 서버상에서 기술문서 특히, 정보기술문서를 검색하는 분야에 대하여 구현하였으며 그 결과를 보인다.

비디오 콘텐츠를 위한 색인 온톨로지 저장소 (Index Ontology Repository for Video Contents)

  • 황우연;양정진
    • 한국멀티미디어학회논문지
    • /
    • 제12권10호
    • /
    • pp.1499-1507
    • /
    • 2009
  • 나날이 방대해지는 디지털 콘텐츠들의 홍수 속에서 원하는 정보를 찾아내는 데 필요한 정밀한 색인 기술의 필요성은 날로 증대되어 가고 있다. 이러한 요구 수용을 위해서는 지능형 개체가 정보의 검색 주체가 되어야 하며, 지능형 개체간의 상호 운용성이 뒷받침되어져야 한다. 본 논문에서는 Snoek, Worring들이 제안한 다중 형상 색인을 위한 통합 기반구조를 분석하고 콘텐츠 기반의 자동화된 색인 기법에서 색인정보의 신뢰성을 높이기 위한 방법을 살펴본다. 그리고 이를 통해 시맨틱 웹 기술의 온톨로지 개념을 적용하여 추상화된 색인 정보의 생성과 제어를 지원하고 사람과 기계간, 기계와 기계간의 의미적 상호 운용성이 보장되는 기반 모델을 제시하고자 한다. 온톨로지의 메모리 상주 모델 처리 방식은 방대한 색인 정보를 수용하기에 부적절하기 때문에 온톨로지 저장소의 사용을 필요로 하며, 논리적으로 표현된 지식의 일관성과 추론을 위해 추론엔진의 사용이 요구된다. 본 논문에서는 온톨로지 저장소의 기능 및 성능적인 요구사항을 모두 만족시키는 Minerva 온톨로지 저장소를 이용하여 비디오 콘텐츠를 표현한 설계 지식을 저장하고 회수하는 실험을 하였다. 또한 마지막으로는 다른 연구과제들과 연계한 효율적인 색인 가능성에 대해 고찰해 본다.

  • PDF

분산 정보 검색을 위한 신경망 에이전트의 계층적 구성 (Hierarchical Organization of Neural Agents for Distributed Information Retrieval)

  • 최용석
    • 컴퓨터교육학회논문지
    • /
    • 제8권6호
    • /
    • pp.113-121
    • /
    • 2005
  • 웹과 같은 분산 정보 검색 환경에서 문서들은 많은 문서 데이터베이스들에 자연스럽게 분할되어서 존재한다. 그러므로 이러한 문서들의 효율적인 검색을 위해서는 먼저 질의에 관련되는 문서들을 제공할 것으로 판단되는 문서 데이터베이스를 찾아내고 다음으로 그 문서 데이터베이스에 질의를 줌으로써 분산 정보 검색을 수행해야 한다. 본 논문에서는 이러한 분산 정보 검색을 위한 신경망 에이전트를 소개하고, 확장성을 가지게 하기 위하여 신경망 에이전트들이 계층적으로 구성된 다중신경망 에이전트 시스템을 제안한다. 신경망 에이전트들의 계층적 구성은 정보 검색 성능을 저하시키지 않으면서도 각 신경망 에이전트의 학습을 위한 전체 훈련 비용을 허용할 만한 범위 내에서 유지시켜 주므로 대규모 문서 데이터베이스 환경에서의 분산 정보 검색에도 신경망 에이전트를 적용할 수 있게 해준다. 제안된 신경망 에이전트를 단일 에이전트와 계층적 다중 에이전트 시스템으로 실현 환경에서 구현하여 각각의 정보 검색 성능을 기존의 통계적 분산 정보 검색 기법을 사용했을 때와 비교함으로써 신경망 에이전트의 유용성을 예증한다.

  • PDF