• 제목/요약/키워드: Extracting Patterns

검색결과 211건 처리시간 0.024초

시간의 흐름과 위치 변화에 따른 멀티 블록 스트림 데이터의 의미 있는 패턴 추출 방법 (The Method for Extracting Meaningful Patterns Over the Time of Multi Blocks Stream Data)

  • 조경래;김기영
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제3권10호
    • /
    • pp.377-382
    • /
    • 2014
  • 모바일 통신과 사물 인터넷(IoT) 환경에서 시간에 따른 데이터의 분석 기술은 주로 의미 있는 정보를 찾기 위해 수집 된 데이터에서 의미있는 패턴을 추출하기 위해 사용된다. 기존의 데이터 마이닝을 이용한 분석 방법은 데이터 수집이 어렵고 시간의 경과와 관련된 시계열 데이터의 변경을 반영하기 위해 완료 상태에 기초하여 해석되어야 한다. 이러한 패턴의 다양성, 대용량성, 연속성 등의 여러 가지 특성을 가진 데이터 스트림의 분석을 위한 방법으로 멀티 블록 스트리밍 데이터 분석(AM-MBSD) 방법을 제안한다. 의미 있는 데이터 추출을 위해 멀티 블록 스트리밍 데이터의 패턴을 추출하고 추출된 연속적 데이터를 여러 개의 블록으로 정의하고 제안 방법의 검증을 위해 각 데이터 블록의 데이터 패턴 생성 시간, 주파수를 수집하고 시계열 데이터를 분석, 실험하였다.

원형 정합 방법을 이용한 방송 프로그램의 등급 인식 시스템 (A Rating Recognition System of Broadcast Program using Template Matching)

  • 황선주;조대제
    • 한국콘텐츠학회논문지
    • /
    • 제4권1호
    • /
    • pp.24-31
    • /
    • 2004
  • 논문에서는 등급이 표시된 방송 영상을 입력으로 하는 등급 인식 시스템을 구현하였다. 본 논문에서는 인식하고자 하는 방송 프로그램의 등급 표시 기호가 정형화된 틀을 가지고 있기 때문에 원형 정합 방법을 사용하였다. 실험에서 방송업자가 사용하는 글자체의 표준 숫자 에서 숫자가 가지는 특성 패턴들을 추출하고, 특성 패턴들 가운데서 해당 등급의 숫자만이 가지는 고유 패턴을 추출한 다음, 고유 패턴을 입력 영상과 비교하여 정합하는 과정으로 진행하였다. 3$\times$3크기의 패턴을 적용하였을 때는 88.6%의 인식률을 보였으나 패턴크기가 등급기호의 원형에 가까울수록 100%에 가까운 인식률을 보였다.

  • PDF

Building Domain Ontology Based on Linguistic Patterns

  • Kim, Kweon-Yang;Lim, Soo-Yeon
    • 한국지능시스템학회논문지
    • /
    • 제16권6호
    • /
    • pp.766-771
    • /
    • 2006
  • In this paper, we focus on the building domain ontology from corpus by extracting concepts and properties relationships based on linguistic patterns. The pharmacy field is selected as an experiment domain and we present an algorithm to extract hierarchical structure for terminology based on the noun/suffix patterns of terminology in domain texts. In order to show usefulness of our domain ontology, we compare a typical keyword based retrieval method with an ontology based retrieval mettled which uses related information in an ontology for a related feedback. As a result, our method shows the improvement of precision by 4.97% without losing recall.

웹 사용자의 선호도 추출을 위한 지능모델 설계 및 평가 (Design & Evaluation of an Intelligent Model for Extracting the Web User' Preference)

  • 김광남;윤희병;김화수
    • 한국지능시스템학회논문지
    • /
    • 제15권4호
    • /
    • pp.443-450
    • /
    • 2005
  • 본 논문에서는 웹 사용자의 선호도를 추출하기 위한 지능적 모델을 제안하고 이에 대한 평가결과를 제시한다. 이를 위해 현재 정보검색엔진의 문제점을 분석하고, 선호도 가중치를 학습기에 반영한다. 이것은 키워드에 의한 단어별 빈도수에 의존하지 않고 지능적으로 사용자의 행동유형을 학습하게 함으로써 질의에 대한 결과집합을 사용자의 의도에 맞게 제공하는 메커니즘이다. 다음으로 선호도 유행성에 대한 개념과 고려요소를 제안하며, 선호도 추출 알고리즘과 이에 대한 예를 제시한다. 또한 행동유형 추출을 위한 지능모델을 설계하고 HTML 색인과 선호도 결정 지능학습과정을 제안한다. 마지막으로 선호도를 적용한 후의 문서 랭킹 측정결과를 비교함으로써 본 논문에서 제안한 모델의 타당성을 검증한다.

용어 간의 다양한 관계 추출을 통해 온톨로지를 자동으로 생성하는 방법 (A Method on Automatically Creating an Ontology by Extracting Various Relationships between Terms)

  • 김영태
    • 실천공학교육논문지
    • /
    • 제15권2호
    • /
    • pp.321-330
    • /
    • 2023
  • 본 논문에서는 특정 도메인의 온톨로지 구성에 필요한 용어 간의 다양한 관계를 추출하여 자동으로 온톨로지를 생성하는 방법을 제안하고자 한다. 추출된 관계를 온톨로지의 구조에 공리 집합으로 인코딩하여 온톨로지로 구성한다. 효율적으로 해결하기 위해 집합의 검색 공간을 정수 프로그래밍 문제로 표현하며, 최적화를 위해 별로 도움이 되지 않는 규칙은 제거하는 단순한 축소를 사용하여 행렬을 감소시킨다. 결론적으로 본 논문에서는 주어진 데이터를 이용하여 패턴을 일반화하고, 유용한 패턴을 유지하면서 검색 공간을 줄이는 방법을 제시하며, 구조화된 온톨로지로 구성하는 알고리즘을 적용하여 추출된 관계를 이용해 자동으로 효율적인 온톨로지로 생성하는 방법을 제안한다.

Automatic identification of Java Method Naming Patterns Using Cascade K-Medoids

  • Kim, Tae-young;Kim, Suntae;Kim, Jeong-Ah;Choi, Jae-Young;Lee, Jee-Huong;Cho, Youngwha;Nam, Young-Kwang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권2호
    • /
    • pp.873-891
    • /
    • 2018
  • This paper suggests an automatic approach to extracting Java method implementation patterns associated with method identifiers using Cascade K-Medoids. Java method implementation patterns indicate recurring implementations for achieving the purpose described in the method identifier with the given parameters and return type. If the implementation is different from the purpose, readers of the code tend to take more time to comprehend the method, which eventually affects to the increment of software maintenance cost. In order to automatically identify implementation patterns and its representative sample code, we first propose three groups of feature vectors for characterizing the Java method signature, method body and their relation. Then, we apply Cascade K-Medoids by enhancing the K-Medoids algorithm with the Calinski and Harrabasez algorithm. As the evaluation of our approach, we identified 16,768 implementation patterns of 7,169 method identifiers from 50 open source projects. The implementation patterns have been validated by the 30 industrial practitioners with from 1 to 6 years industrial experience, resulting in 86% of the precision.

복수 패턴 인식을 위한 변형된 네오코그니트론 (Modified neocognitron for recognizing multi-patterns)

  • 김태우;최병욱
    • 전자공학회논문지B
    • /
    • 제31B권10호
    • /
    • pp.140-148
    • /
    • 1994
  • 본 논문에서는 입력영상에 존재하는 복수 패턴을 한번의 패스(pass)로 인식할 수 있는 변형된 네오코그니트론을 제안한다. 변형된 네오코그니트론은 특징을 추출하는 S세포층 및 V세포층과 패턴의 크기, 이동, 회전 등 변형에 덜 민감하게 하는 C세포층으로 구성된 계층적 신경망이다. S세포와 V세포들은 DCC(don't care condition)을 적용하여 영상에 존재하는 모든 패턴에 대한 특징을 추출하는 역할을 하며, S세포와 C세포는 추출된 패턴에 대한 위치정보도 함께 가진다. 위치정보는 추출된 특징들이 서로 간섭을 받지 않고 올바른 특징만이 추출되도록 하는 데 이용된다. 제안한 방법은 피드백이 존재하는 선택적 주의 방법과는 달리 단일패스로 인식이 가능하므로 인식시간이 짧으며, DCC와 위치정보를 이용하므로 서로 접촉되어 있는 복수 패턴의 인식도 가능하다.

  • PDF

An Incremental Statistical Method for Daily Activity Pattern Extraction and User Intention Inference

  • Choi, Eu-Ri;Nam, Yun-Young;Kim, Bo-Ra;Cho, We-Duke
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제3권3호
    • /
    • pp.219-234
    • /
    • 2009
  • This paper presents a novel approach for extracting simultaneously human daily activity patterns and discovering the temporal relations of these activity patterns. It is necessary to resolve the services conflict and to satisfy a user who wants to use multiple services. To extract the simultaneous activity patterns, context has been collected from physical sensors and electronic devices. In addition, a context model is organized by the proposed incremental statistical method to determine conflicts and to infer user intentions through analyzing the daily human activity patterns. The context model is represented by the sets of the simultaneous activity patterns and the temporal relations between the sets. To evaluate the method, experiments are carried out on a test-bed called the Ubiquitous Smart Space. Furthermore, the user-intention simulator based on the simultaneous activity patterns and the temporal relations from the results of the inferred intention is demonstrated.

일반적인 웹 검색 경로패턴 추출 알고리즘 (Algorithm for Extracting the General Web Search Path Pattern)

  • 장민석;하은미
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 춘계종합학술대회
    • /
    • pp.771-773
    • /
    • 2005
  • 웹 환경에서 사용자들의 정보검색 패턴을 얻어내기 위해 흔히 로그 파일의 정보검색 패턴을 분석하는 기존 연구들이 있어 왔다. 이들에서 흔히 사용하는 방법은 경로 순회 패턴(path traversal patterns)에서 효율적으로 빈번 패턴(frequent patterns)을 찾아내는 알고리즘을 제안하는 것이다. 하지만 이들의 기존 연구의 가장 일반적인 문제점들 중의 하나는 일반적인 패턴 즉, 복잡한 형태 패턴(topological patterns)에 대한 적절한 해답을 찾아주지는 못한다는 것이다. 따라서 본 논문에서는 일반적인 패턴 유형을 정의하고 이들로부터 정보검색 패턴을 알아내는 효율적인 알고리즘을 제안하고자 한다.

  • PDF

차량 규격과 특징 패턴을 이용한 자동차 번호판 추출 (Extracting Of Car License Plate Using Motor Vehicle Regulation And Character Pattern Recognition)

  • 남기환;배철수
    • 한국정보통신학회논문지
    • /
    • 제6권2호
    • /
    • pp.339-345
    • /
    • 2002
  • 자동차의 번호판을 인식하는 것은 차량을 식별하는데 있어서 매우 중요하다. 어두운 조명에서나 날씨가 나쁠 경우 차량의 형상이 왜곡 될 수 있고, 번호판을 식별하는데 어려움이 있다. 본 논문은 차량의 규격을 이용하여 효율적으로 번호판을 추출하는 방법을 제안한다. 이 방법에서 색상이나 형태처럼 차량의 규격을 따르는 자동차 번호판의 특징들은 번호판의 후보영역으로 결정되고, 신경망에 의해 숫자나 문자의 패턴 갖는 영역이 번호판 영역으로 인식된다. 또한 특징패턴인식의 결과로서 번호판을 확정하였다. 70개 차량영상을 실험해 본 결과 번호판 추출률에서는 84.29 %, 인식률에서는 80.81 %의 결과를 나타내었다.