• Title/Summary/Keyword: 데이터 탐색

Search Result 2,154, Processing Time 0.028 seconds

Discovery of Interesting Knowlege using Concept Hierarchy (개념 계층 이용 흥미로운 부분 데이터의 탐색)

  • 홍정희;김성민;남도원;이동하;이전영
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2000.04a
    • /
    • pp.261-270
    • /
    • 2000
  • 개념 계층(Concept Hierarchy)은 데이터베이스 분야에서 사용되는 대표적인 배경 지식(Background Knowledge)으로써, 데이터베이스에 내재되어 있는 구조적인 정보, 데이터의 분포, 영역전문가(Domain Expert)에 의해 주어지는 외부 지식 등이 반영되어 있다. 개념 계층의 특성상 부모(parent)-자식(child) 관계가 있는 두 노드가 있을 때, 한 노드의 값으로부터 다른 노드의 값을 추정할 수 있다. 이 추정된 값을 기대치라고 하고, 한 노드의 값으로부터 추정된 기대치와 실제치가 상당히 상이한 값을 보이는 노드가 있을 때, 이를 흥미롭다(interesting)라고 할 수 있다. 그러나 아직까지 개념계층상에서의 흥미로운 부분 탐색에 대한 연구가 없었으며, 흥미로움(interestingness)의 척도(measurement)에 대한 연구로서는 신뢰도(confidence), 리프트(lift), 컨빅션(conviction)등이 있다. 그러나 이런 흥미도의 척도에 관한 연구도 연관규칙에 한정되어 이루어졌으므로 개념계층상의 데이터에 적용하기 위해서는 약간의 수정 및 새로운 정의가 필요하다. 본 논문에서는 데이터의 특성에 따른 개념계층이 존재할 때, 이를 이용하여 기대치와 실제치가 상이한 흥미로운 부분을 발견하고자 하며, 이를 위하여 개념계층이 존재할 때, 이를 이용하여 기대치와 실제치가 상이한 흥미로운 부분을 발견하고자 하며, 이를 위하여 개념계층상에서의 흥미도의 척도를 제안하고 흥미로운 부분을 탐색하는 방법을 기술하고자 한다. 또한 데이터마이닝의 결과인 연관규칙을 개념계층에 적용하여 연관규칙을 통해 얻어질 수 있는 기대치를, 지지도(support), 신뢰도(confidence), 리프트(lift), 컨빅션(conviction)등의 관계를 통해 다양한 방법으로 모색해본다. 이 연구에서 제안하는 이러한 개념계층상의 흥미로운 부분의 탐색은, 전자 상거래에서의 CRM(Customer Relationship Management)나 틈새시장(niche market) 마케팅 등에 적용가능하리라 여겨진다.

  • PDF

Reusing Search Window Data and Exploiting Early Termination in Variable Block Size Motion Estimation (가변 블록 크기 움직임 추정 기법에서 탐색 영역 데이터의 재사용과 조기 중단 기법의 적용)

  • Park, Taewook;Hur, Ahrum;Lee, Seongsoo
    • Journal of IKEEE
    • /
    • v.20 no.1
    • /
    • pp.111-114
    • /
    • 2016
  • In HEVC, motion estimation is performed independently for each variable block size. So it requires several times of search window data, and also it is difficult to exploit early termination. In this paper, a new method is proposed to exploit search window data and early termination in variable block size. When applied to TZS algorithm, it reduces pixel comparison and search window data accesses to 1/3.7 ~ 1/2.9 with negligible image quality degradation.

Discovery of Interesting Knowledge using Concept Hierarchy (개념 계층 이용 흥미로운 부분 데이터의 탐색)

  • 홍정희;김성민;남도원;이동하;이전영
    • Journal of Intelligence and Information Systems
    • /
    • v.6 no.2
    • /
    • pp.77-89
    • /
    • 2000
  • 개념 계층(Concept Hierarchy)은 데이터베이스 분야에서 사용되는 대표적인 배경 지식(Background Knowledge)으로써, 데이터베이스에 내재되어 있는 구조적인 정보, 데이터의 분포, 영역전문가 (Domain Expert)에 의해 주어지는 외부 지식 등이 반영되어 있다. 개념계층의 특성상 부모(parent)-자 식(child) 관계가 있는 두 노드가 있을 때, 한 노드의 값으로부터 다른 노드의 값을 추정할 수 있다 이 추정된 값을 기대치라고 하고, 한 노드의 값으로부터 추정된 기대치와 실제치가 상당히 상이한 값을 보이는 노드가 있을 때, 이를 흥미롭다(interesting)고 말할 수 있다. 그러나 아직까지 개념계층 상에서의 흥미로운 부분 탐색에 대한 연구가 없었으며, 흥미로움(interestingness)의 척도(measurement) 에 대한 연구로서는 신뢰도(confidence),리프트(lift),컨빅션(conviction)등이 있었다. 그러나 이런 흥미도 의 척도에 관한 연구도 연관규칙에 한정되어 이루어졌으므로 개념계층상의 데이터에 적용하기 위해 서는 약간의 수정 및 새로운 정의가 필요하다. 본 논문에서는 데이터의 특성에 따른 개념계층이 존재할 때, 이를 이용하여 기대치와 실제치가 상이한 흥미로운 부분을 발견하고자 하며, 이를 위하여 개념계층상에서의 흥미도의 척도를 제안하고 흥미로운 부분을 탐색하는 방법을 기술하고자 한다. 또한 데이터마이닝의 결과인 연관규칙을 개념 계층에 적용하여 연관규칙을 통해 얻어질 수 있는 기대치를, 지지도(support), 신뢰도(confidence), 리프트(lift), 컨빅션(conviction)등의 관계를 통해 다양한 방법으로 모색해본다. 이 연구에서 제안하는 이러한 개념계층상의 흥미로운 부분의 탐색은, 전자 상거래에서 CRM(Customer Relationship Management)나 틈새시장(niche market) 마케팅 등에 적용 가능하리라 여겨진다.

  • PDF

Interactive Searching Behavior with Elements-Based on XML Documents Retrieval System (엘리먼트 기반 XML 검색 시스템에서의 이용자의 정보 탐색 행태 연구)

  • Jung, Young-Mi
    • Journal of Korean Library and Information Science Society
    • /
    • v.40 no.4
    • /
    • pp.159-176
    • /
    • 2009
  • The aim of this study was to investigate the users' behaviour when interacting with elements based on XML documents retrieval system and develop approaches for XML retrieval which are effective in user-based environment. We followed the experimental guidelines from the INEX 2006 iTrack organizers. For the research goals, 16 responses from the questionnaires per subject and system logs were collected and analyzed using Excel and SPSS 17.0.

  • PDF

Performance Evaluation of Large Vocabulary Continuous Speech Recognition System (대어휘 연속음성 인식 시스템의 성능평가)

  • Kim Joo-Gon;Chung Hyun-Yeol
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.99-102
    • /
    • 2002
  • 본 논문에서는 한국어 대어휘 연속음성 인식 시스템의 성능향상을 위하여 Multi-Pass 탐색 방법을 도입하고, 그 유효성을 확인하고자 한다. 연속음성 인식실험을 위하여, 최근 실험용으로 널리 사용되고 있는 HTK와 Multi-Pass 탐색 방법을 이용한 음성인식 시스템의 비교 실험을 수행한다. 대어휘 연속음성 인식 시스템에 사용한 언어 모델은 ARPA 표준 형식의 단어 N-gram 언어모델로, 1-pass에서는 2-gram 언어모델을, 2-pass 에서는 역방향 3-gram 언어모델을 이용하여 Multi-Pass 탐색 방법으로 인식을 수행한다. 본 논문에서는 Multi-Pass 탐색 방법을 한국어 연속음성인식에 적합하게 구성한 후, 다양한 한국어 음성 데이터 베이스를 이용하여 인식실험을 수행하였다. 그 결과, 전화망을 통하여 수집된 잡음이 포함된 증권거래용 연속음성 데이터 베이스를 이용한 연속음성 인식실험에서 HTK가 $59.50\%$, Multi-Pass 탐색 방법을 이용한 시스템은 $73.31\%$의 인식성능을 나타내어 HTK를 이용한 연속음성 인식률 보다 약 $13\%$의 인식률 향상을 나타내었다.

  • PDF

An Improved Skyline Query Scheme for Recommending Real-Time User Preference Data Based on Big Data Preprocessing (빅데이터 전처리 기반의 실시간 사용자 선호 데이터 추천을 위한 개선된 스카이라인 질의 기법)

  • Kim, JiHyun;Kim, Jongwan
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.11 no.5
    • /
    • pp.189-196
    • /
    • 2022
  • Skyline query is a scheme for exploring objects that are suitable for user preferences based on multiple attributes of objects. Existing skyline queries return search results as batch processing, but the need for real-time search results has increased with the advent of interactive apps or mobile environments. Online algorithm for Skyline improves the return speed of objects to explore preferred objects in real time. However, the object navigation process requires unnecessary navigation time due to repeated comparative operations. This paper proposes a Pre-processing Online Algorithm for Skyline Query (POA) to eliminate unnecessary search time in Online Algorithm exploration techniques and provide the results of skyline queries in real time. Proposed techniques use the concept of range-limiting to existing Online Algorithm to perform pretreatment and then eliminate repetitive rediscovering regions first. POAs showed improvement in standard distributions, bias distributions, positive correlations, and negative correlations of discrete data sets compared to Online Algorithm. The POAs used in this paper improve navigation performance by minimizing comparison targets for Online Algorithm, which will be a new criterion for rapid service to users in the face of increasing use of mobile devices.

Survey of Fresh Application Areas with Smart Sensor Data (센싱 데이터의 새로운 활용 분야 탐색)

  • Kim, JinYoung;Kim, HyunJin;Paik, Juryon;Ahn, Woo-Young
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2019.01a
    • /
    • pp.133-134
    • /
    • 2019
  • 스마트 센서는 센싱 기능 외에 통신, 데이터 처리, 의사결정 기능을 추가로 갖추고, 수집한 데이터를 바탕으로 자체적으로 판단하고 처리하는 기능을 포함된 지능적 센서이다. 실생활에도 밀접한 연관을 가질 수 있고 범위 또한 점차 확대되어가고 있다. 본 논문에서는 센싱 데이터의 IoT 활용과 맞물려 스마트 센싱 데이터의 다양하고 새로운 활동 분야에 대해서 탐색하고자 한다.

  • PDF

Spatio-Temporal Visualization of Cultural Heritage Collections (문화유산 데이터의 시공간상 시각화 연구)

  • Park, Narae;Jeon, Moongu
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2020.07a
    • /
    • pp.55-57
    • /
    • 2020
  • 본 연구는 문화유산 데이터의 효과적 정보 시각화 방안을 탐색한다. 문화유산 데이터는 역사적 사회적 맥락 속에서 충실히 이해될 수 있기에, 지리적 평면과 시간 축으로 이루어지는 3차원 시공간 큐브상에 문화유산 데이터들을 배치하는 것은 문화유산의 특성을 반영하면서도 통시적·공시적 조망을 동시에 제공하는 유익한 시각화 방안이 될 수 있다. 이를 확인하기 위해 문화유산 컬렉션 데이터를 지도 평면과 시간 축으로 구성된 시공간 큐브 상에서 탐색·체험할 수 있는 웹 어플리케이션과 AR 어플리케이션을 구현하고, 이에 대한 사용자 평가를 실시했다. 평가 분석 결과 문화유산 데이터의 3차원 시각화는 데이터에 대한 총체적 시야를 제공하고 새로운 체험에 대한 관심과 호기심을 유발하는 한편, 낯선 형식으로 인한 인지적 피로가 뒤따를 수 있어 대상 데이터의 특성, 매체 형식의 특성, 사용자의 경험적 이해, 인간의 지각방식을 고려한 다각적 정보 체험 설계가 필요할 것으로 파악되었다.

  • PDF

Efficient Shortest Path Techniques on a Summarized Graph based on the Relationships (관계기반 요약그래프에서 효율적인 최단경로 탐색기법)

  • Kim, Hyunwook;Seo, HoJin;Lee, Young-Koo
    • Journal of KIISE
    • /
    • v.44 no.7
    • /
    • pp.710-718
    • /
    • 2017
  • As graphs are becoming increasingly large, the costs for storing and managing data are increasing continuously. Shortest path discovery over a large graph requires long running time due to frequent disk I/Os and high complexity of the graph data. Recently, graph summarization techniques have been studied, which reduce the size of graph data and disk I/Os by representing highly dense subgraphs as a single super-node. Decompressing should be minimized for efficient shortest path discovery over the summarized graph. In this paper, we analyze the decompression performance of a summarized graph and propose an approximate technique that discovers the shortest path quickly with a minimum error ratio. We also propose an exact technique that efficiently discovered the shortest path by exploiting an index built on paths containing super-nodes. In our experiments, we showed that the proposed technique based on the summarized graph can reduce the running time by up to 70% compared with the existing techniques performed on the original graph.

The Study on the comparative analysis of EFA and CFA (탐색적요인분석과 확인적요인분석의 비교에 과한 연구)

  • Choi, Chang Ho;You, Yen Yoo
    • Journal of Digital Convergence
    • /
    • v.15 no.10
    • /
    • pp.103-111
    • /
    • 2017
  • This study was performed with a view to examine the nature and difference of EFA(Exploratory Factor Analysis) and CFA(Confirmatory Factor Analysis), and to compare the analysis process and result of EFA and CFA with the same data. The result of empirical analysis was as follows. Meanwhile, p.1, p.3 was removed owing to hampering the convergent validity in EFA, p.3 was removed owing to hampering the discriminent validity in CFA. EFA was reduction process of muti measurement variables to a few factor, but CFA was understanding and confirmatory process of measurement and latent variables' relation. Eventually, this study showed that EFA and CFA used different methology, thus the different outcomes appeared although using the same data, and implicated resonable application of methology according to given data.