• Title/Summary/Keyword: 파일 내용 검색

Search Result 81, Processing Time 0.023 seconds

A Signature-based Video Indexing Scheme using Spatio-Temporal Modeling for Content-based and Concept-based Retrieval on Moving Objects (이동 객체의 내용 및 개념 기반 검색을 위한 시공간 모델링에 근거한 시그니쳐 기반 비디오 색인 기법)

  • Sim, Chun-Bo;Jang, Jae-U
    • The KIPS Transactions:PartD
    • /
    • v.9D no.1
    • /
    • pp.31-42
    • /
    • 2002
  • In this paper, we propose a new spatio-temporal representation scheme which can model moving objets trajectories effectively in video data and a new signature-based access method for moving objects trajectories which can support efficient retrieval on user query based on moving objects trajectories. The proposed spatio-temporal representation scheme supports content-based retrieval based on moving objects trajectories and concept-based retrieval based on concepts(semantics) which are acquired through the location information of moving objects trajectories. Also, compared with the sequential search, our signature-based access method can improve retrieval performance by reducing a large number of disk accesses because it access disk using only retrieved candidate signatures after it first scans all signatures and performs filtering before accessing the data file. Finally, we show the experimental results that proposed scheme is superior to the Li and Shan's scheme in terns of both retrieval effectiveness and efficiency.

Discovery and Recommendation of User Search Patterns from Web Data (웹 데이터에서의 사용자 탐색 패턴 발견 및 추천)

  • 구흠모;양재영;홍광희;최중민
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2002.11a
    • /
    • pp.287-296
    • /
    • 2002
  • 웹 사용 마이닝은 데이터마이닝을 바탕으로 사용자의 로그 파일 정보를 이용하여 웹이 이용되는 패턴을 발견한다. 이를 이용하여 웹을 개선하여 사용자들이 보다 빨리 원하는 내용을 검색할 수 있도록 할 수 있으며 시스템 관리자에게는 효율적인 웹 구조를 인한 정보를 제공할 수 있다. 웹 사용 마이닝에서 사용하는 데이터는 성형화되어 있지 않으며 웹 사용 패턴을 분석하는데 방해가 되는 잡음 데이터까지 포함하고 있다. 이것은 기존에 개발된 여러 데이터마이닝 기법을 적용하는데 어려움으로 작용한다. 이러한 어려움을 해결하기 위해 본 논문에서는 새로운 방법을 도입한 SPMiner을 .제안한다. SPMiner는 웹의 구조를 이용하여 로그 파일의 전처리 과정을 줄이며 사용자의 탐색 패턴 분석을 효율적으로 수행 할 수 있는 시스템이다. SPMiner는 WebTree 에이전트를 이용하여 웹 사이트 구조를 분석하여 WebTree를 생성하고 사용자 로그 파일을 분석하여 각 웹 페이지의 사용빈도에 대한 정보를 추출한다. WebTree와 로그 파일에서 추출된 웹 페이지에 대한 정보는 SPMiner에 의해 패턴을 분석할 퍼 이용될 수 있는 형태인 WebTree$^{+}$로 병합된다 WebTree$^{+}$는 패턴 발견을 쉽게 해주며 사용자에게 추천할 정보나 웹 페이지를 능동적으로 추천할 수 있게 만들어 준다.

  • PDF

Effective Mood Classification Method based on Music Segments (부분 정보에 기반한 효과적인 음악 무드 분류 방법)

  • Park, Gun-Han;Park, Sang-Yong;Kang, Seok-Joong
    • Journal of Korea Multimedia Society
    • /
    • v.10 no.3
    • /
    • pp.391-400
    • /
    • 2007
  • According to the recent advances in multimedia computing, storage and searching technology have made large volume of music contents become prevalent. Also there has been increasing needs for the study on efficient categorization and searching technique for music contents management. In this paper, a new classifying method using the local information of music content and music tone feature is proposed. While the conventional classifying algorithms are based on entire information of music content, the algorithm proposed in this paper focuses on only the specific local information, which can drastically reduce the computing time without losing classifying accuracy. In order to improve the classifying accuracy, it uses a new classification feature based on music tone. The proposed method has been implemented as a part of MuSE (Music Search/Classification Engine) which was installed on various systems including commercial PDAs and PCs.

  • PDF

A Study on Educational Data Mining for Public Data Portal through Topic Modeling Method with Latent Dirichlet Allocation (LDA기반 토픽모델링을 활용한 공공데이터 기반의 교육용 데이터마이닝 연구)

  • Seungki Shin
    • Journal of The Korean Association of Information Education
    • /
    • v.26 no.5
    • /
    • pp.439-448
    • /
    • 2022
  • This study aims to search for education-related datasets provided by public data portals and examine what data types are constructed through classification using topic modeling methods. Regarding the data of the public data portal, 3,072 cases of file data in the education field were collected based on the classification system. Text mining analysis was performed using the LDA-based topic modeling method with stopword processing and data pre-processing for each dataset. Program information and student-supporting notifications were usually provided in the pre-classified dataset for education from the data portal. On the other hand, the characteristics of educational programs and supporting information for the disabled, parents, the elderly, and children through the perspective of lifelong education were generally indicated in the dataset collected by searching for education. The results of data analysis through this study show that providing sufficient educational information through the public data portal would be better to help the students' data science-based decision-making and problem-solving skills.

Design and Implementation of a Clip-Based Video Retrieval System Supporting Internet Services (인터넷 서비스를 지원하는 클립 기반 비디오 검색 시스템의 설계 및 구현)

  • 양명섭;이윤채
    • Journal of Internet Computing and Services
    • /
    • v.2 no.1
    • /
    • pp.49-61
    • /
    • 2001
  • Internet has been becoming widely popular and making rapid progress and network technologies is showing extension in data transmission speeds. Rapid and convenient multimedia services supplied with high quality and high speed are being needed, This paper treats of the design and implement method of clip-based video retrieval system on the world-wide-web environments. The implemented system consists of the content-based indexing system supporting convenient services for video contents providers and the web-based retrieval system in order to make it easy and various information retrieval for users on the world-wide-web. Three important methods were used in the content-based indexing system. Key frame extracting method by dividing video data, clip file creation method by clustering related information and video database build method by using clip unit, In web-based retrieval system, retrieval method by using a key word, two dimension browsing method of key frame and real-time display method of the clip were used. As a result. the proposed methodologies showed a usefulness of video content providing. and provided an easy method for searching intented video content.

  • PDF

대화방식(對話方式)의 특징(特徵)을 가진 SDI 시스팀의 성능(性能)

  • Saskova, V.;Kosik, J.
    • Journal of Information Management
    • /
    • v.8 no.5
    • /
    • pp.130-140
    • /
    • 1975
  • 이용자(利用者) 중심(中心)의 대화방식(對話方式) 시스팀을 개발(開發)하고 시험(試驗)하였다. 2년(年)동안 280개의 프로파일로 CA - Condensates 데이터 베이스내에서 정보(情報)를 검색(檢索)해 보았다. 그 시스팀의 작업능률(作業能率)을 사용(使用)한 데이터 베이스와 하드웨어의 구조(構造), 소프트웨어 패키지, 이용자(利用者)의 수(數), 그리고 정보(情報)센터에서 제공(提供)한 보조(補助)에 따라 평가(評價)하였다. 대화식(對話式) 검색방법(檢索方法)이나 이용자(利用者)의 요구(要求)를 양화(量化)하는 것, 그리고 여러가지 분야별(分野別)로 검색(檢索)하는 방법(方法) 등 이용자(利用者)의 요구(要求)를 보다 충실(充實)하게 만족(滿足)시킬 수 있는 여러가지 방법(方法)들을 논의(論議)하였다. 모든 정보(情報)시스팀의 목적(目的)은 적시(適時)에 올바른 정(情)보를 적자(適者)에게 제공(提供)하는 것이라고 잘 알려져 있다. 다시 말해서, 정보(情報)시스팀의 주요목적(主要目的)은 이용자(利用者)의 요구(要求)를 충족(充足)시켜 주는 것이다. 이러한 관념(觀念)의 변화(變化)는 정보처리(情報處理)에 큰 변화(變化)를 가져와 정보(情報)시스팀의 적응성(適應性)을 증가(增加)시키기 위해 여러 가지 새로운 방법(方法)들이 개발(開發)되었다. 정보(情報)시스팀들 사이의 상호작용(相互作用), 사람과 컴퓨터와의 대화(對話), 그리고 컴퓨터의 조력(助力)으로 이용자(利用者)의 프로파일을 작성(作成)하는 것 등은 이용자(利用者)의 요구(要求)를 존중(尊重)하고, 필요(必要)한 정보(情報)를 쉽게 찾기 위해서 고안(考案)된 것이다. 한편, 우리들은 이용자(利用者)의 특성(特性)이나 배경(背景), 그리고 문헌(文獻)에 대한 그의 습성(習性) 등에 대해서 얼마나 모르고 있는가를 깨닫게 된다. 상기(上記)의 내용(內容)을 요약(要略)하면, 근대정보(近代情報) 시스팀은 다음의 필요조건(必要條件)을 만족(滿足)해야 한다. 1) 이용자(利用者)의 요구(要求)에 호응(呼應)하기 위해서 적합(適合)한 일련(一連)의 정보(情報)를 제공(提供)해야 한다. 2) 이용자(利用者)와의 관계(關系)에서 시스팀은 적극적(積極的)이어야 한다. 즉, 프로파일 검색공식(檢索公式)에서 유발(誘發)되는 잘못을 지시(指示)하고 지적(指適)할 수 있어 야 한다. 나아가서 컴퓨터의 조력(助力)으로 프로파일을 작성(作成)하고 쉽게 수정(修正)할 수 있는 바람직하다. 우리들은 상기(上記)한 필수조건(必須條件)에 일치(一致)하도록 노력(努力) 하고 Bratislava에 위치(位置)하고 있는 슬로박 과학원(科學院)의 무기화학연구소(無機化學硏究所)와 화학공업경제연구소(化學工業經濟硏究所)가 공동(共同)으로 개발(開發)한 시스팀이 상기(上記)의 특수성(特殊性) 최소(最少)한 몇가지 도입(導入)하였다. 시스팀은 CACS라는 작업명하(作業名下)에서 운영(運營)되었다. 대략 15개월동안 280여개의 프로파일로 CA- Condensates 데이터베이스에서 정보(情報)를 검색(檢索)하여 이용자(利用者)들에게 최신정보(最新情報) 주지사업(周知事業)을 해 보았다. 우리들은 시스팀의 작업능률(作業能率)을 평가(評價)하고 이용자(利用者)의 요구(要求)를 만족(滿足)시키는 최선(最善)의 방법(方法)을 모색(摸索)하였다. 우선 이용자(利用者)와 시스팀사이를 밀접(密接)하게 연결(連結)하는데 중점(重點)을 두었다. 작업능률(作業能率Z)을 분석(分折)해 보고 우리들은 효율(效率)에 영향(影響)을 주는 인자(因子)는 다음의 4가지 주요분류(主要分類)에 속한다는 결론(結論)을 얻었다. (1) 검색(檢索)하는 데이터 베이스 (2) 情報시스팀, 소프트웨어 패키지 그리고 하드웨어 구조(構造) (3) 이용자(利用者)의 특성(特性)과 그의 요구(要求) (4) 정보(情報)센터가 이용자(利用者)에게 제공(提供)하는 보조(補助)

  • PDF

A Design and Implementation for Data Sharing Interface in based XML (XML 기반 데이터 공유 Interface 설계 및 구현)

  • 김철원;김상영;박종훈
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2004.05b
    • /
    • pp.424-428
    • /
    • 2004
  • Study related to a system that saves a n document, and to search is consisting actively and has a lot of cases to have left emphasis in the function that these systems efficiently save a XML document and can search. Also, It has a table or the storage structure which was especially designed in order to save a XML document and can save structure information of a document in addition to contents of a XML document together and can efficiently do content retrieval of a XML document or a structure search with an early base. As for this paper, a design implemented the data which the many different kinds of database that had currently used had with you so that did recycling and shared conversion and this XML file in Web, and output can become a XML format through various interrace.

  • PDF

A Case Study on the Next Generation Library Catalogs (차세대 도서관 목록 사례의 고찰)

  • Yoon, Cheong-Ok
    • Journal of Korean Library and Information Science Society
    • /
    • v.41 no.1
    • /
    • pp.5-28
    • /
    • 2010
  • The purpose of this study is to investigate the major features of Next Generation Library Catalogs. 'Next Generation Melvyl Pilot' of University of California Library System and 'SearchWorks' of Stanford University Library are examined. While the former is developed, based on OCLC WorldCat Local, the latter is based on the Blacklight, an Open Source Catalog Software. Both commonly provide the features, including enriched contents, facet navigation, keyword searching, relevancy ranking of search results, and user contribution, etc., but some functions vary in scopes and contents. Also, it seems that both are in process of development rather than complete implementations.

  • PDF

Software Component Retrieval System for Version Control (버전제어를 위한 소프트웨어 구성요소의 검색 시스템)

  • O, Sang-Yeop;Kim, Heung-Jin;Jang, Deok-Cheol
    • The Transactions of the Korea Information Processing Society
    • /
    • v.3 no.5
    • /
    • pp.1093-1102
    • /
    • 1996
  • For the reuse, configuration management, and version control of softwares, the composition of retrieval systems and library are most important matters, which makes it possible to retrieve the concerned software components. Retrieval systems, which is able to store many components, must make it possible to retrieve the concerned components with deadwoods in the fastest way. Based either on keyboards or the concept of inverted file on the part of content is usually used in the current retrieval systems. However, in this paper, new retrieval systems are suggested with using set and bag class with Smalltalk language, one of object- oriented programming language, based either on the keywords or on the part of content to find out the concerned components. This method is improved the function of user interface and its management, In this paper, library is also suggested along with the new retrieval systems, and user interface is designed and implemented for its management and control. The new retrial systems of this paper can be employed by interface in another language, and this system is to provide the concerned user with the appropriate retrieval systems and library for the version control.

  • PDF

Implementation of Intelligent Medical Image Retrieval System HIPS (지능형 의료영상검색시스템 HIPS 구현)

  • Kim, Jong-Min;Ryu, Gab-Sang
    • Journal of Internet of Things and Convergence
    • /
    • v.2 no.4
    • /
    • pp.15-20
    • /
    • 2016
  • This paper describes the construction of knowledge data retrieval management system based on medical image CT. The developed system is aimed to improve the efficiency of the hospital by reading the medical images using the intelligent retrieval technology and diagnosing the patient 's disease name. In this study, the medical image DICOM file of PACS is read, the image is processed, and feature values are extracted and stored in the database. We have implemented a system that retrieves similarity by comparing new CT images required for medical treatment with the feature values of other CTs stored in the database. After converting 100 CT dicom provided for academic research into JPEG files, Code Book Library was constructed using SIFT, CS-LBP and K-Mean Clustering algorithms. Through the database optimization, the similarity of the new CT image to the existing data is searched and the result is confirmed, so that it can be utilized for the diagnosis and diagnosis of the patient.