• 제목/요약/키워드: 빈도 분석

검색결과 9,594건 처리시간 0.041초

IRFP-tree(Intersection Rule Based FP-tree): 메모리 효율성을 향상시키기 위해 교집합 규칙 기반의 패러다임을 적용한 FP-tree (IRFP-tree: Intersection Rule Based FP-tree)

  • 이정훈
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권3호
    • /
    • pp.155-164
    • /
    • 2016
  • 대용량 데이터베이스의 빈도패턴 분석을 위해 기존의 Apriori 방식의 단점을 보완할 수 있는 새로운 트리 기반의 빈도 패턴 분석 알고리즘이 최근 다양하게 연구되고 있다. 그 중 FP-tree는 이러한 빈도 패턴을 분석하기 위해 빈도 패턴을 표현하는 트리 구조로 단 두 번의 전체 데이터베이스 스캔을 통해 빠르게 트리를 구성할 수 있으며 FP-grwoth를 통해 빈도 패턴을 분석할 수 있다. 이처럼 빈도 패턴 트리의 노드 수는 트리 자체의 메모리 할당량과도 연관이 있지만 그 후 growth의 메모리 자원 소비 및 처리 속도에도 영향을 미치게 된다. 따라서 빈도 패턴 트리의 노드 수의 감소는 트리 자체뿐만 아니라 빈도 패턴 분석에 있어서도 매우 중요하다. 하지만 FP-tree는 전체 아이템 수 라는 고정된 기준 문제로 인해 충분한 노드 수의 압축률을 갖지 못하고 있다. 본 논문에서는 이러한 FP-tree의 문제를 보완하여 좀 더 노드 수를 감소시킬 수 있도록 교집합 규칙이라는 새로운 패러다임을 적용한 빈도 패턴 트리인 IRFP-tree를 제시하고 실험을 통해 그 성능에 대해 증명하였다.

강우-유출 모형의 불확실성을 고려한 확률홍수량의 보정식 개발 (Development of Calibration Equation Considering Uncertainty of Rainfall-Runoff Model)

  • 채병석;박동혁;이진영;김태웅
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.396-396
    • /
    • 2017
  • 최근 기후변화에 효과적으로 대응하기 위해서 신뢰성 높은 설계홍수량을 산정할 필요성이 커지고 있다. 설계홍수량 산정법은 홍수빈도해석법과 설계강우법으로 대별된다. 홍수빈도해석법은 홍수량 자료에 대한 통계학적 빈도분석을 실시하여 확률홍수량을 산정하는 방법이다. 홍수빈도해석법은 관측된 자료를 활용하기 때문에 이론적으로 불확실성이 상대적으로 작은 장점을 가지고 있지만, 자료의 수가 적거나 시간에 따라 변하는 유역특성에 대한 불확실성을 함께 고려해야 한다. 관측 유량 자료가 없거나 적은 유역에서는 설계강우법이 주로 사용되고 있다. 설계강우법은 강우자료에 대해서 빈도분석을 실시하여 확률강우량을 산정한 후, 이를 강우-유출 모형에 적용하여 확률 홍수 수문곡선을 작성하고 첨두치를 확률홍수량으로 선정하는 방법이다. 그러나, 설계강우법도 강우-유출 모형에서 유역특성을 나타내는 매개변수 추정과정에서 불확실성을 내포하고 있기 때문에 추정된 홍수량 결과에 대한 불확실성을 감안해야 한다. 또한, 강우량과 홍수량의 발생빈도가 같다는 가정의 명확한 근거가 없다. 더욱이 두 가지 설계홍수량 산정법을 같은 유역에 적용하는 경우라도 종종 매우 다른 결과값을 나타낸다. 따라서, 본 연구에서는 국내 유역의 현실을 고려하여 설계강우법으로 산정된 확률홍수량을 홍수빈도해석법으로 산정된 확률홍수량을 변환할 수 있는 보정식을 개발하였다. 국내 9개의 댐 유역에서 확보된 일 단위 강우량 및 유출량 자료를 홍수빈도해석법과 설계강우법을 적용하여 대상 유역의 설계홍수량을 산정하였다. 그리고, 홍수빈도해석법으로 산정된 설계홍수량을 참값이라 가정한 후, 산정된 설계홍수량의 대상 유역별 오차율을 산정하였다. 이를 바탕으로 홍수빈도해석법과 설계강우법으로 산정된 설계홍수량 간의 관계를 회귀분석을 통하여 설계강우법으로 산정된 확률홍수량을 보정하는 관계식을 제시하였다.

  • PDF

초등 고학년 아동의 과일 및 채소 섭취 수준 평가를 위한 간단한 식품 섭취 빈도 조사지의 개발과 평가 (Development and Evaluation of a Brief Fruit and Vegetable Food Frequency Questionnaire for Higher-Grade Elementary School Children)

  • 이승민
    • 동아시아식생활학회지
    • /
    • 제18권5호
    • /
    • pp.675-683
    • /
    • 2008
  • 본 연구는 초등 고학년 아동의 과일과 채소 섭취 수준 측정을 위한 간단한 식품 섭취 빈도 조사지를 개발 및 평가하고자 실시되었다. 2001년도 국민건강영양조사에 참가한 만 $9{\sim}11$세 아동의 24-시간 회상 자료에 기초하여 식품섭취빈도 조사지의 항목 선정을 위한 기초 조사를 하였다. 각 과일과 채소 식품의 일일 평균 섭취량을 전체 아동 및 섭취량의 4분위 집단 별로 산출한 후, 이 자료를 바탕으로 전체 인구 집단의 섭취량을 대변할 수 있을 뿐만 아내라 고 섭취군과 저 섭취군 간의 차이도 나타낼 수 있는 항목을 선정하였다. 총 9개의 과일 항목과 11개의 채소 항목이 식품 섭취 빈도지에 포함되도록 선정되었으며, 섭취 빈도에 대한 응답 항목은 지난 7일 간의 섭취에 대하여 1개의 선택 범주가 제시되었다. 개발된 조사지의 신뢰도와 상대적 타당도에 대한 평가는 서울에 위치한 한 공립 초등학교에 재학 중인 153명의 $4{\sim}6$학년 학생들을 대상으로 실시하였다. 한 달간의 간격을 두고 2회에 걸쳐 조사를 실시한 자료를 이용하여 검사-재검사 신뢰도를 평가하였으며, 두 번째 방문 시에 28개의 과일 및 채소 항목을 추가로 포함하고 있는 식품섭취빈도 조사지를 더불어 실시한 자료를 바탕으로 상대적 타당도를 평가하였다. 상관 분석과 항목 별 빈도 응답 및 섭취 수준에 따른 집단내 순위 분류의 일관성에 대한 분석을 실시한 결과, 본 연구에서 개발된 20개 항목의 과일 채소 식품 섭취빈도 조사지의 신뢰도와 상대적 타당도가 적정 수준 이상으로 나타났다. 신뢰도를 살펴보기 위한 개별 항목 및 과일, 채소, 과일+채소 섭취 빈도에 대한 상관계수는 $0.22{\sim}0.64$(p<0.001)이었으며, 항목별 빈도 응답의 일관도는 평균 69.3%(<=1 빈도 응답차이)와 81.3%(<=2 빈도 응답 차이)로 나타났다. 상대적 타당도를 살펴보기 위한 과일, 채소, 과일+채소 섭취 빈도에 대한 상관계수는 $0.91{\sim}0.93$(p<0.0001)로 높게 나타났다. 따라서 본 연구를 통하여 개발된 식품섭취빈도 조사지는 초등고학년 아동의 과일채소 섭취 수준을 간단히 심사하거나 평가하는 도구로서 유용하리라 사료된다.

  • PDF

가뭄빈도별 농업용저수지의 공급능력평가 (Evaluation of Water Supply Capacity of Agriculture Reservoir According to Drought Frequency)

  • 최시중;문장원;이동률;강성규;서재승
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2011년도 학술발표회
    • /
    • pp.449-449
    • /
    • 2011
  • 우리나라의 수자원 총이용량 가운데 농업용수가 차지하는 비율은 1965년 88%에 비해 현저히 줄어들고 있지만 2003년 47%에 해당하고 있다. 또한 그 수요도 점점 복잡하고 다양하게 변하고 있으며 이에 대한 공급원으로써 국내에 약 18,000여개의 농업용 저수지가 건설되어 있는 실정이다. 농업용 저수지의 주목적은 갈수시 안정적인 관개용수 공급과 하류의 생활용수를 공급함에 있다. 하지만 대부분의 농업용 저수지가 소규모로 건설되어 있어 지속적인 가뭄을 극복하기에 충분한 저수용량을 가지고 있지 않으며 설계 가뭄빈도도 대략 10년이다. 따라서 수자원 평가 및 계획 수립 시 공급원으로서 농업용 저수지의 역할에 대해 많은 논란이 있어 왔다. 농업용 저수지의 설계 가뭄빈도는 10년이고 이에 반해 수자원장기종합계획에서는 과거 최대가뭄 년을 대상으로 분석하고 있기 때문에 수요량, 하천유량 및 댐 등을 통해 물 수지 분석을 산정한 후 그 결과에 중권역별로 분포되어 있는 농업용 저수지 유효저수용량을 고려하여 지역별 과부족량을 산정하고 있다. 본 연구에서는 기존의 수자원장기종합계획 물 수급 전망 방법과는 달리 중권역에 속해 있는 모든 농업용 저수지를 포함하여 물 수지 분석을 수행함으로써 농업용 저수지의 용수 공급능력을 평가하였다. 기존의 농업용 저수지 반영 방법은 농업용수의 공급시기인 관개기 초기에 저수지 만수위를 유지하는 실무운영 상황을 반영하여 농업용 저수지의 유효저수용량을 해당 저수지의 공급가능량으로 설정하여 지역공급원으로써 고려 하였다. 이에 반해 본 연구에서는 각 중권역에 존재하는 모든 농업용 저수지의 용량 및 유역면적 등을 총합한 대표저수지를 선정하고 유역별 농업용 수요처로만 물을 공급하는 방식으로 물 수지 분석에 운영함으로써 모든 농업용 저수지의 영향을 고려하였다. 농업용 저수지를 제외한 나머지 제반 사항은 기존의 수자원장기종합계획과 동일한 자료를 이용하여 분석하였으며 분석 결과를 통해 연도별 농업용 저수지의 공급능력을 평가하였다. 분석결과 가뭄빈도가 클수록 공급능력은 현저히 낮아지는 것을 분석을 통해 확인할 수 있었으며 유역별 존재하는 농업용 저수지의 가뭄빈도별 공급가능량 평가를 통해 보다 현실적인 저수지 운영에 관한 정보를 제공할 수 있으리라 판단된다.

  • PDF

화학공정의 사고 빈도 분석 S/W 개발 (Development of Accident Frequency Analysis S/W for Chemical Processes)

  • 서재민;신동일;고재욱
    • 한국가스학회지
    • /
    • 제3권3호
    • /
    • pp.29-33
    • /
    • 1999
  • 본 연구는 정량적 위험 평가의 기반 조성을 위해서 다양한 위험 평가 기법 중에서 이상 트리 분석(Fault Tree Analysis) 방법을 이용하여 빈도 분석 프로그램을 개발하였다. 빈도 분석 프로그램을 구축하기 위하여 계산 과정에서는 gate-by-gate 방법과 부울 대수 (Boolean algebra) 방법을 이용하였고, minimal cut set 방법을 이용하여 사고 발생 경로를 정량적으로 표현하였다 결론적으로 본 연구에서 개발한 빈도 분석 프로그램을 이용하여 사고 발생 빈도를 낮출 수 있다면 공정 전체의 안전성을 높이는데 큰 도움이 될 것이며, 기존에 사용되고 있는 외국의 S/W를 대체할 수 있을 것이라고 사료된다.

  • PDF

수문학적 데이터의 자릿수 빈도 분석 적용가능성 연구 (A study on applicability of the digit frequency analysis to Hydrological Data)

  • 박정은;맹승진;임광섭
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.102-102
    • /
    • 2023
  • 벤포드 법칙(Benford's Law)은 실생활에서 관찰되는 수치 데이터를 첫 자리 숫자에 따라 분류할 때 첫 자리의 숫자가 커질수록 그 분포가 점차 감소되는 현상을 말한다. 이러한 벤포드 법칙은 일반식으로 도출하여 다양한 자릿수로 확장하여 적용할 수 있는 연구결과가 제시되었으며, 회계학, 사회과학, 물리학, 컴퓨터과학, 생물학 등 다방면의 수치 자료에서 그 유효성이 확인되고 있다. 자릿수의 관찰빈도를 분석하는 것만으로 많은 양의 실생활 데이터에서 빠르고 쉽게 데이터 조작여부를 탐지하거나 1차적인 데이터 품질검사에 효과적으로 활용되고 있다. 본 연구에서는 다학제적 연구의 측면에서 수학·물리적 법칙인 벤포드 법칙을 일유량 등 다양한 수문학 측정자료에 적용하여 그 적용가능성을 확인하고 자료의 불균질성과 신뢰성을 빠르게 탐지할 수 있는 방법론을 제시하고자 한다. 수문자료는 공인심의를 통해 자료의 신뢰도를 확보하고 있으나 확정·배포까지 약 2년이 소요되어 활용기간 단축에 대한 사용자 요구가 지속되고 있는 실정이다. 따라서 본 연구에서는 분석대상 데이터의 자릿수 관찰빈도가 벤포드 법칙에 의한 예상자릿수 빈도를 따르는지 여부에 대한 가설을 설정하고 카이제곱 검정 또는 Kolmogorov-Smirnov(K-S) 검정 등을 통해 적합도에 대한 통계적 유의미함을 분석함으로써 대략적으로나마 빠르고 쉽게 측정자료의 신뢰성을 판단할 수 있다. 본 연구는 다양한 학문과의 결합을 통한 새로운 접근을 시도함으로써 빅데이터 시대에 효과적으로 수자원의 개발, 관리 및 운영의 의사결정을 하는데 도움이 될 수 있을 것으로 판단된다.

  • PDF

우리나라 지역최대 일우량의 빈도분석에 관한 연구 (The regional frequency analysis of the annual max. daily rainfall in Korea.)

  • 고재웅
    • 물과 미래
    • /
    • 제13권1호
    • /
    • pp.39-48
    • /
    • 1980
  • 우리나라 5대 하천유역 즉 한강, 낙동강, 금강, 영산강 및 섬진강에 대한 지역최대일 강우량의 실측기록을 써서 지역강우빈도 분석을 실시한바 분석방법으로는 다섯가지 방법을 활용하여 비교 검토하였다. 지역강우에 대한 빈도분석은 많이 이루어졌으나 지역강우에 대한 연구는 찾아 볼 수 없었기 때문에 이 성과를 쓴다면 홍수해석에 도움을 줄 수 있겠다 하겠다. 본 연구에서 제시한 강우량의 빈도별 산정식을 쓴다면 수문관측 기록이 나와 있지 않은 기타 지역에도 지역확률 강우량을 산정 할 수 있다.

  • PDF

수문변화 지표법에 의한 다목적댐의 유입량과 방류량 변화분석 (Inflow and Outflow Variation Analysis of the Multi-Purpose Dam by Indicators of Hydrologic Alterations)

  • 박봉진;강기호;정관수
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2008년도 학술발표회 논문집
    • /
    • pp.219-223
    • /
    • 2008
  • 본 연구에서는 수문변화 지표법을 적용하여 11개 주요 다목적댐의 월 유량 크기, 연 최소 대유량 크기와 지속기간, 고 저맥파 빈도와 주기, 수문곡선 변화 비율과 빈도를 분석하였다. 월 유량변화 분석 결과, 갈수기에 해당하는 10월부터 다음 해의 6월까지는 유입량이 $6.38\;m^3/sec{\sim}39.84\;m^3/sec$이었으나, 방류량은 $20.36\;m^3/sec{\sim}49.43\;m^3/sec$$1.84%{\sim}200.98%$까지 증가하였다. 우기철인 7월부터 9월까지는 유입량이 $79.06\;m^3/sec{\sim}137.12\;m^3/sec$이었으나, 방류량은 $65.32\;m^3/sec{\sim}80.16\;m^3/sec$$18.19%{\sim}40.39%$가 감소하였다. 년 최소 최대 유량변화 분석 결과는 1일 최소유량이 $82.86%{\sim}2,950%$까지 증가하였으며, 년 최소 및 최대 유량변화는 1일 최소유량은 $82.86%{\sim}2,950%$까지 증가하였으나, 1일 최대유량은 $34.78%{\sim}83.96%$까지 감소하였다. 고 저맥파의 빈도와 주기의 분석 결과, 저맥파의 발생 횟수는 댐 조절후 $29.67%{\sim}99.07%$가 감소하였으며, 고맥파의 발생횟수도 $4.6%{\sim}92.35%$가 감소하였다. 수문곡선 변화 비율과 빈도의 분석 결과 상승률은 $15.84%{\sim}79.31%$가 감소하였으며, 하강율은 $1.97%{\sim}107.10%$가 감소하였다. 유량변화정도 분석 결과는 1일 최소유량은 $0.60{\sim}2.67$ 증가하였으며, 1일 최대유량은 $0.50{\sim}1.00$으로 감소하였다.

  • PDF

인공신경망 군집분석을 이용한 지역빈도해석에 관한 연구 - 낙동강 유역을 중심으로 (A Study on the Regional Frequency Analysis Using the Artificial Neural Network Method - the Nakdong River Basin)

  • 안현준;김성훈;정진석;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.404-404
    • /
    • 2017
  • 이상기후현상으로 인해 극치 수문 사상들이 빈번히 발생함에 따라 상대적으로 높은 재현기간에 해당하는 극치 수문 사상해석에 대한 관심이 높아지고 있다. 그러나 우리나라의 경우 이러한 극치 수문 사상을 추정하기 위한 표본의 수가 부족한 실정이다. 지역빈도해석은 지점의 표본 수가 적거나 수문자료의 수집이 불가능한 미계측지점인 경우, 해당 지점과 수문학적으로 동질하다고 여겨지는 주변 지점들의 자료를 확보하여 확률수문량을 추정함으로써 상대적으로 지점빈도해석 보다 roubst한 추정값을 얻을 수 있다는 장점을 가지고 있다. 따라서 최근 확률수문량 산정 기법으로 지역빈도해석 방법에 관한 관심이 높아지고 있다. 지역구분은 지역빈도해석이 지점빈도해석과 구분될 수 있는 큰 특징이고 지역구분 결과 따라 지역의 표본 크기가 결정되기 때문에 수문학적으로 동질한 지역을 나누는 방법은 매우 중요하다고 볼 수 있다. 인공신경망은 인간의 뇌가 학습하는 방식을 모사한 통계적 모델링 기법이다. 즉, 인간의 뇌가 일정한 반복 학습을 통해 어떠한 문제의 해법을 추론하거나 예측, 또는 패턴을 인식하는 일련의 과정을 알고리즘화 하여 목적함수의 해를 찾는 방식이다. 특히, 주어진 자료들로 부터 특징을 추출하고 그 특징을 학습하여 전체 자료의 분류나 군집화를 이루는데 널리 이용되고 있다. 본 연구에서는 낙동강유역을 대상으로 인공신경망을 이용한 군집분석을 수행하고 구분된 지역을 이용하여 지역빈도해석을 수행하였다.

  • PDF

범죄 발생 빈도수와 웹 검색 빈도수의 관계 분석 연구 (Analysis of relationship between frequency of crime occurrence and frequency of web search)

  • 박정민;박구락;정영석
    • 한국융합학회논문지
    • /
    • 제9권5호
    • /
    • pp.15-20
    • /
    • 2018
  • 현대사회에서 범죄는 큰 사회문제 중의 하나이다. 범죄는 피해자뿐만 아니라 피해자 주변인들에게도 큰 영향을 미친다. 범죄는 발생하기 전에 예측하여 범죄 발생을 막는 것이 중요하다. 범죄를 예측하기 위한 다양한 연구가 진행되었다. 범죄 예측에 중요한 요소 중에 하나가 범죄 발생 빈도수 이다. 범죄 발생 빈도수는 범죄를 예측하는 분야의 기본 데이터로 많이 사용되고 있다. 그러나 범죄 발생 빈도수는 통계처리기간을 거쳐 약 2년 뒤에 발표된다. 본 논문은 범죄 발생 빈도수를 간접적으로 파악할 수 있는 방법으로 웹에서 검색되는 범죄 관련 키워드의 빈도수 분석을 제안한다. 범죄 발생 빈도수의 키워드와 실제 범죄 발생빈도수의 관계를 상관 계수로 분석하여 관련이 있음을 확인하였다.