• Title/Summary/Keyword: 패턴자료

Search Result 1,988, Processing Time 0.045 seconds

Detection of Characteristics by Pattern Classification of Water Quality and Runoff Data in a River (하천의 수질 및 유량자료의 패턴분류에 의한 특성 파악)

  • Park, Sung-Chun;Jin, Young-Hoon;Roh, Kyong-Bum;Kim, Yong-Gu;Lee, Yong-Hui
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2010.05a
    • /
    • pp.1380-1384
    • /
    • 2010
  • 현재 환경부에서는 수질오염총량관리제를 위하여 각 단위유역의 말단지점에서 8일 간격으로 수질 및 유량을 측정하고 있으며, 이 자료들을 공개하고 있다. 이러한 양질의 자료의 활용성을 제고하기 위해서는 무엇보다도 자료의 분석을 위한 다양한 기법이 개발되고 제안되어야 한다. 따라서 본 연구에서는 수질 및 유량자료를 동시에 적용하여 두 자료 사이의 관계를 조사하고 특성을 파악하기 위하여 자기조직화 특성지도(Self-Organizing Feature Map: SOFM) 이론을 적용하였다. 시행착오법에 의해 적정한 SOFM 구조를 결정하였으며, 그 결과 $4{\times}4$ 구조의 육각형 배열을 갖는 구조를 이용하였다. SOFM에 의해 분류된 3개의 패턴 중 패턴-1은 유량자료의 크기에 의해 분류되었고, 패턴-2와 패턴-3은 BOD 농도의 크기에 따라 분류된 것으로 파악되었다. 따라서 SOFM의 적용에 의한 자료의 분류를 수행하고, 그 분류기준을 파악할 경우 SOFM의 자료 분석 도구로서의 활용성이 더욱 높아질 것으로 판단된다.

  • PDF

Self Organized Pattern Classification and Analysis of Hydrologic Data in Juam Lake (주암호 수문자료의 자기조직화 패턴분류 및 분석)

  • Park, Sung-Chun;Jin, Young-Hoon;Roh, Kyong-Bum;Yang, Dong-Hyun
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2012.05a
    • /
    • pp.790-794
    • /
    • 2012
  • 우리나라는 여름철에 강우가 편중되어 있고 동고서저의 산악지형으로 수자원확보가 어려운 실정이며 이는 곧 하천의 유지유량확보의 어려움과도 직결된다. 이러한 수자원확보를 위해 최근 기존 저수지 둑을 높이는 사업이 전국적으로 활발히 진행되고 있으며 이는 저수지나 댐의 수체와 같은 수자원을 보다 적극적으로 활용하여 그 가치를 높임과 동시에 하천에 대한 활용도를 높이고자 하는 데 그 목적이 있다. 따라서 저수지나 댐의 저류량에 기여하는 강우량, 유입량과 같은 수문학적 자료의 심도 있는 분석이 필요하며 수문변수들이 나타내는 복잡한 패턴에 대한 연구가 이루어져야 할 것이다. 본 연구에서는 저수지나 댐의 저류량에 직접적으로 영향을 주는 수문변수들을 전체적으로 파악하기 위해 수집된 수문자료의 각각의 특성 및 자료들 사이의 복합적인 관계를 파악하였으며 이를 위하여 패턴분류 분야에서 그 적용타당성이 입증된 자기조직화 지도(Self-Organizing Map: SOM)를 이용하였다. 본 연구의 대상지점은 섬진강 유역내에 위치한 주암호를 대상지점으로 선정하였으며 패턴분석에 사용한 수문자료의 기간은 2007~2010년까지 5년간의 월평균 자료를 활용하였다. SOM의 적용 결과, 측정수문자료에 대한 전체적인 특성을 패턴분류를 통해 분류하였으며, 각 변수에 대한 패턴별 상대성을 고려한 클러스터별 특성 및 시간적 이질성을 파악할 수 있었다. 이는 측정 자료에 대한 분석 기법개발의 일환으로 향후 수자원 확보에 대한 개발 및 정책의 기초자료로 활용될 것으로 기대된다.

  • PDF

A new approach to estimate the link travel time by using AVL technology (AVL을 이용한 구간통행시간 산출기법 개발)

  • 김성인;이영호;남기효
    • Journal of Korean Society of Transportation
    • /
    • v.17 no.2
    • /
    • pp.91-103
    • /
    • 1999
  • 이 연구는 자동 차량위치 측정기법(Automatic Vehicle Location, AVL)을 이용해서 수집한 교통상황자료를 가지고 구간 통행시간을 산출하는 알고리즘을 개발한다. AVL기법을 이용하는 경우, 처리해야 할 자료량이 많아서 실시간에 정보를 산출하는 것이 힘들다. 따라서 이 연구는 처리해야 할 자료량을 가능한 한 줄이고 자료량이 적은 경우에도 효율적인 구간통행시간을 산출하는 알고리즘을 제시한다. 이 연구의 방법론은 크게 4가지인데, 첫째, 해석 기법, 둘째, 회귀분석, 셋째, 인공지능 및 전문가 시스템, 넷째, 통계분석이다. 이 방법론을 이용해서 세 단계 알고리즘을 개발하는데, 첫째는 실시간 분석통계 알고리즘, 둘째는 과거자료분석 알고리즘, 셋째는 자료응합 알고리즘이다. 이 알고리즘 가운데 자료융합 알고리즘 결과가 산출하고자 하는 구간 통행시간이다. 실시간 분석통계 알고리즘은 연속하는 세 개 구간의 통행 패턴을 이용해서 가운데 구간의 통행시간을 산출하는 방법을 제시한다. 또 실시간 분석통계 알고리즘으로 산출하지 못한 구간은 인접구간 상관도 정보를 이용해서 구간통행시간을 추정한다. 과거자료분석 알고리즘은 회귀분석을 이용해서 시간대별 통행시간 평균과 분산을 구하고, 이 결과를 바탕으로 인접구간 상관도 정보를 오프라인으로 구하는 알고리즘이다. 자료융합 알고리즘은 2가지 단계를 거치는데, 그것은 실시간 자료융합과 최종 자료융합이다. 실시간 자료융합은 실시간에 가까운 자료원의 실시간 분석통계 알고리즘 결과 패턴과 인접구간 상관도 정보를 이용한 구간통행시간 추정 결과를 이용해서 패턴에 따라 다른 방법으로 융합을 하는 알고리즘을 개발한다. 최종 자료융합은 실시간 자료융합 결과와 회귀분석 결과의 패턴을 이용해서 구간 통행시간을 산출한다. 이 연구를 기존 연구와 비교할 때, 세 가지 독차성이 있다. 첫째는 연속하는 세 구간 통행 패턴을 분석하였기 때문에 기존의 노드의존 방식을 탈피하였다는 점이다. 따라서 자료량이 적은 경우도 믿을만한 통행시간을 산출할 수 있다는 것이다. 둘째는 인접구간 상관도 정보를 구간통행시간 산출에 이용하였기 때문에 자료를 효율적으로 이용할 수 있다는 점이다. 셋째는 자료원 패턴을 분류하고 전문가 시스템을 이용하여 자료융합 하였기 때문에 수행속도가 빠르고, 신뢰성있는 정보를 제공한다는 점이다. 이 연구는 개발한 알고리즘 정확도를 검증하기 위해서 두 가지 검증방법을 이용하였다. 첫째는 시뮬레이션을 이용한 것이고, 둘째는 실제 주행조사 분석을 이용한 것이다. 두 가지 검증 결과는 알고리즘 정확도를 보여준다.

  • PDF

Pattern Classification and Analysis of Rainfall-Runoff and TOC Variation by the application of Self Organizing Map (자기조직화방법을 적용한 강우 유출과 강우-TOC변동에 관한 패턴 분류 및 분석)

  • Park, Sung-Chun;Kim, Jong-Rok;Jin, Young-Hoon;Jeong, Cheon-Lee
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2008.05a
    • /
    • pp.2061-2065
    • /
    • 2008
  • 본 연구는 강우-유출 및 TOC의 패턴 분류를 위하여 광주 광산 강우관측소의 강우량자료와 나주지점의 유출량 그리고 기존의 BOD 및 COD 수질농도 측정값에 비하여 적은 오차요인과 빠른 시간에 결과 값을 얻을 수 있으며 유출량과 난분해성 물질에 대한 해석이 가능하고 재현성이 탁월한 TOC자료를 사용하였다. SOM을 적용하기 위해 먼저 Map의 크기는 Garcia가 제시한 $M=5{\sqrt{N}}$을 이용하여 결정한다. 이러한 비선형적인 다변량 자료를 분석하기 위해서 Map에 의해 구분된 자료 위치를 추출하여 원자료를 재구축하고 이를 통해 원자료를 패턴별로 분류 할 수 있었다. 이러한 패턴별 분류를 통해 유출량에 따른 TOC자료를 2차원의 Map 상에 시각적으로 가시화하여 비선형적인 경향이 강한자료의 분포적 양상을 이해하는데 큰 도움이 되며, 향후 이를 통해 예측을 위한 모형화 과정에도 크게 도움을 줄 것으로 기대된다. 또한, 강우자료 또는 유출량 자료만을 이용한 단일변량의 패턴분류를 위해 SOM의 적용이 가능할 것으로 판단되며, 이는 각 변량의 본질적인 특성을 파악할 수 있을 것으로 기대된다.

  • PDF

A Pattern Consistency Index for Detecting Heterogeneous Time Series in Clustering Time Course Gene Expression Data (시간경로 유전자 발현자료의 군집분석에서 이질적인 시계열의 탐지를 위한 패턴일치지수)

  • Son, Young-Sook;Baek, Jang-Sun
    • The Korean Journal of Applied Statistics
    • /
    • v.18 no.2
    • /
    • pp.371-379
    • /
    • 2005
  • In this paper, we propose a pattern consistency index for detecting heterogeneous time series that deviate from the representative pattern of each cluster in clustering time course gene expression data using the Pearson correlation coefficient. We examine its usefulness by applying this index to serum time course gene expression data from microarrays.

Microarray 자료분석에서 표준화

  • 이성곤;박태성;최호식
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2001.11a
    • /
    • pp.149-153
    • /
    • 2001
  • 본 논문은 microarray를 분석하기위한 표준화에 대한 여러 방법들을 소개하고 비교해보았다. Microarray 연구는 Human Genome Project에서 파생된 여러 생명공학 기술 중 가장 널리 사용되는 기술로 기존에는 하지 못했던 총체적인 유전자의 발현상황을 탐색할 수 있다는 장점을 지니고 있으나, 자료들에 일정한 패턴이 나타나거나 잡음이 첨가되어 정보의 추출이 용의하지 않다는 단점을 지니고 있다. 특히 자료에 일정한 패턴이 있는 경우에 올바르지 못한 결론을 이끌어낼 수도 있기에 이 패턴을 제거하는 표준화작업은 microarray 분석에 있어서 매우 중요한 처리과정이다. 본 논문에서는 표준화방법들을 소개하고 각각 가지고 있는 장단점을 실제 국내에서 얻어진 자료를 통해 비교하였고, 그 결과 LOWESS 적합을 통한 표준화방법이 타 방법에 비해 유용한 점이 많음을 확인할 수 있었다.

  • PDF

A Bibliometric Analysis of Citation Patterns in Conference Papers of Information Science (학술대회 논문의 참고자료 인용패턴 분석 - 정보과학 분야를 중심으로 -)

  • Lee, Danielle
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.51 no.4
    • /
    • pp.35-52
    • /
    • 2017
  • This paper aims to explore the citation patterns of conference papers in 'Information Science' discipline and to analze impacts of various cited works-related factors on future citations of conference papers. Existing bibliometric studies has investigated citation patterns and the statistical relations between a variety of bibliographic factors and the future citations of literature. However, the attentions have been focused largely on journal articles, and the bibliometric studies targeting conference papers are still in an infant stage. Therefore, this study, which is based on 1,904 conference papers in 'Information Science' field, examined several citation patterns and the contributions of the factors about cited works - the number of cited works, type of cited works, citation rates and ages of cited works at the time of being cited and the rate of self-citedness - to the future citation of the citing target articles. The data source of this study including the properties of target articles and cited works and citation rates of target articles was Scopus. As the results, 53% and 29% of the cited works were conference papers and journal articles, respectively. 14% of them are non-traditional types such as web pages, technical reports, patent, etc. More than 60% of the cited works were 5 years old or less. Among several factors considered in this paper, the number of conference papers and the number of non-traditional types of works are the most contributing factors on the citation rates of target articles. The recency of the cited works is also significant contributor on the citation rates of target articles. That is, the target articles citing more conference papers and non-traditonal types of works earned more citations. The target articles citing recent works also earned more citations.

패널자료의 종단적 결측패턴에 관한 실증분석 연구

  • Son, Chang-Gyun
    • Proceedings of the Korean Association for Survey Research Conference
    • /
    • 2011.10a
    • /
    • pp.273-285
    • /
    • 2011
  • 본 논문에서는 패널조사와 같은 종단면 연구에서 시간의 흐름에 따라 패널의 노후화 등의 원인으로 각 조사주기별로 발생하는 무응답(결측)에 대해 특정한 패널집단을 대상으로 무응답 패턴을 통계모형을 이용하여 분석하였다. 이러한 무응답 패턴분석을 기반으로 결측자료가 존재하는 종단자료의 분석에서 적절한 방법을 선택하여 분석을 수행할수 있으며, 만일 무응답 대체가 필요한 경우 적절한 대체 방법을 결정할 수 있을 것이다. 횡단면 조사와는 달리 이용가능한 보조정보가 각 웨이브별로 다양하게 존재하며, 이와 같은 보조정보를 무응답 대체에 활용할수 있다면, 결측자료가 존재하는 패널 자료에 비해 전통적인 통계분석 방법을 적용하여 표준적인 결과를 산출할 수 있을 것으로 기대된다.

  • PDF

Generating Technology of the Association Rule for Analysis of Audit Data on Intrusion Detection (침입탐지 감사자료 분석을 위한 연관규칙 생성 기술)

  • Soh, Jin;Lee, Sang-Hoon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11b
    • /
    • pp.1011-1014
    • /
    • 2002
  • 최근 대규모 네트워크 데이터에 대한 패턴을 분석하기 위한 연구에 대하여 관심을 가지고 침입탐지 시스템을 개선하기 위해 노력하고 있다. 특히, 이러한 광범위한 네트워크 데이터 중에서 침입을 목적으로 하는 데이터에 대한 탐지 능력을 개선하기 위해 먼저, 광범위한 침입항목들에 대한 탐지 적용기술을 학습하고, 그 다음에 데이터 마이닝 기법을 이용하여 침입패턴 인식능력 및 새로운 패턴을 빠르게 인지하는 적용기술을 제안하고자 한다. 침입 패턴인식을 위해 각 네트워크에 돌아다니는 관련된 패킷 정보와 호스트 세션에 기록되어진 자료를 필터링하고, 각종 로그 화일을 추출하는 프로그램들을 활용하여 침입과 일반적인 행동들을 분류하여 규칙들을 생성하였으며, 생성된 새로운 규칙과 학습된 자료를 바탕으로 침입탐지 모델을 제안하였다. 마이닝 기법으로는 학습된 항목들에 대한 연관 규칙을 찾기 위한 연역적 알고리즘을 이용하여 규칙을 생성한 사례를 보고한다. 또한, 추출 분석된 자료는 리눅스 기반의 환경 하에서 다양하게 모아진 네트워크 로그파일들을 분석하여 제안한 방법에 따라 적용한 산출물이다.

  • PDF

Analysis of relation between rainfall pattern and runoff response in Andong-dam catchment (안동댐유역의 강우패턴과 유출반응의 관계 분석)

  • Kim, Nam Won;Shin, Mun-Ju
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2018.05a
    • /
    • pp.361-361
    • /
    • 2018
  • 강우패턴이 유출반응에 미치는 영향을 분석하는 것은 수문연구에서 중요한 주제 중 하나이며 댐유역에 대해 기상 및 유출자료를 사용하여 이를 상세히 분석함으로써 이수기에 필요한 수자원을 예측 및 확보하는 것은 중요하다. 강우패턴이 유출반응에 미치는 영향을 상세히 분석하기 위해서는 댐유역의 상류부터 하류까지 많은 유출관측지점의 자료를 사용해야 하지만 상류의 소유역들은 대부분 미계측유역이라는 문제점이 있다. 본 연구에서는 자료공간확장 방법을 사용하여 미계측유역의 유출자료를 생성하고 이 자료들을 분석함으로써 강우패턴이 유출반응에 미치는 영향을 자세히 분석하였다. 먼저 안동댐유역내 관측유역인 안동댐, 도산, 소천유역을 대상으로 1989년부터 2009년까지의 기간 중 20개의 사상에 대하여 분포형 모형인 GRM 모형의 적용성을 조사하였으며 전반적으로 0.5 Nash-Sutcliffe 계수 이상의 타당한 모형효율성 결과를 얻었다. 그 후 자료공간확장 방법을 사용하여 안동댐 상류에 위치한 47개의 미계측 소유역들의 유출자료를 생성하였으며 세 관측유역을 포함한 총 50개 유역의 유출자료를 연구에 사용하였다. 그리고 총 50개 유역의 평균강우량 시계열 자료를 생성하고 이동평균방법을 사용하여 이 평균강우량 자료를 강우강도-지속시간 곡선으로 변환하였다. 강우패턴과 유출반응간의 관계를 분석하기 위해 합리식의 유출계수와 강우강도비율을 사용하였으며 유출계수와 강우강도비율을 계산하기 위해 유역별 도달시간을 사용하였다. 여기서 강우강도비율은 강우강도지속시간 곡선을 사용하여 첨두강우강도를 도달시간에 해당하는 평균강우강도로 나눠준 값이다. 그리고 이 유출계수와 강우강도비율을 유역면적에 대해 도시함으로써 그 경향을 조사하였다. 그 결과 20개 사상은 유출계수, 강우강도비율과 유역면적을 사용하여 물리적으로 타당한 네 가지의 타입으로 분류될 수 있었다. 이 네 가지 타입은 강우의 이동 및 분포와 상관이 있었는데 첫번째 타입은 안동댐 유역전체에 강우가 거의 등분포하는 경우, 두 번째는 강우가 유역의 상류방향으로 이동하는 경우, 세 번째는 강우가 유역의 하류방향으로 이동하는 경우, 그리고 네 번째는 강우가 유역에 무작위로 분포하는 경우였다. 이것은 어떠한 사상에 대해서도 유출계수와 강우강도비율을 유역면적에 대해 도시함으로써 강우패턴과 유출간의 관계를 분석할 수 있다는 것을 나타낸다. 그리고 이 네 가지 타입에 대한 강우사상들의 비율은 각각 65%, 20%, 10%, 그리고 5% 였다. 이 타입별 강우사상의 비율은 향후 강우-유출관계에 의한 수자원 예측 및 확보에 활용될 수 있다.

  • PDF