• 제목/요약/키워드: 빈도분석

검색결과 9,556건 처리시간 0.042초

텍스트마이닝을 활용한 핀테크 및 디지털 금융 서비스 트렌드 분석 (Trend Analysis of FinTech and Digital Financial Services using Text Mining)

  • 김도희;김민정
    • 디지털융복합연구
    • /
    • 제20권3호
    • /
    • pp.131-143
    • /
    • 2022
  • 본 연구는 핀테크를 중심으로 국내 디지털 금융 서비스 시장의 트렌드를 파악하고자 신문기사와 트위터 데이터를 대상으로 텍스트마이닝 기법을 사용하여 분석을 진행하였다. 핀테크 시장의 성장 과정에 있어서 간편결제 서비스 도입, 인터넷전문은행 출범, 데이터 3법 개정안 통과, 마이데이터 사업 신청 등 중요하게 작용을 한 4가지 시점을 기준으로 빈도분석을 수행하여 핵심 키워드 간의 차이를 살펴보았다. 또한 핀테크 선도 국가인 중국·미국과 미래 키워드를 핀테크 키워드와 결합한 빈도분석 결과를 통해 세계 시장 속에서 국내 핀테크 산업의 현 위치와 미래 시장 전망을 예측하였다. 마지막으로 트위터 트윗을 대상으로 감성분석을 진행하여 핀테크 서비스에 대한 소비자의 기대와 우려를 정량화하였다. 따라서 본 연구는 금융 생태계 변화 과정을 살펴보고, 분석 결과를 종합함으로써 정부와 기업이 향후 핀테크 시장 발전에 있어서 활용할 수 있는 전략적 방향성 및 대응 전략을 제시한 점에서 의의가 있다.

강우의 증가경향성을 고려한 확률강우량 산정법의 적용성 분석 (Analysis of Applicability of Nonstationary Rainfall Frequency Analysis)

  • 이창환;안재현;김태웅
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2009년도 학술발표회 초록집
    • /
    • pp.1277-1281
    • /
    • 2009
  • 본 연구에서는 권영문 등(2009)에서 제시한 강우의 증가경향성을 고려한 목표년도 확률강우량 산정법의 적용성을 검토하기 위하여 누적평균강우량 회귀직선의 적합도 분석과 모수와 누적평균강우량의 상관분석을 실시하였다. 서울지점의 1961-2006년 관측 강우자료를 바탕으로 지속기간 24시간 연 최대치 자료계열을 구축하여, 정상성 강우빈도해석법을 이용한 확률강우량과 비정상성 강우빈도해석법에 의한 확률강우량을 비교 분석하였다. 여러 가지 경우의 누적평균강우량에 대해서 분석을 실시한 결과, 비정상성 강우빈도해석법에 의한 확률강우량의 적용성이 우수한 것으로 나타났다.

  • PDF

다변량 고빈도 금융시계열의 변동성 분석 (Multivariate volatility for high-frequency financial series)

  • 이근주;황선영
    • 응용통계연구
    • /
    • 제30권1호
    • /
    • pp.169-180
    • /
    • 2017
  • 본 논문은 다변량 변동성을 다루고 있다. 최근 들어 활발하게 연구가 되고 있는 고빈도(high frequency)자료에 기초한 변동성 측정방법인 실현변동성을 계산하고 기존의 다변량 GARCH 모형과 비교분석하였다. 정준상관분석과 VaR분석을 이용하여 실현변동성과 다양한 다변량 GARCH 모형을 비교하였으며 최근 6년 동안의 삼성전자/현대차 거래 가격 고빈도 데이터를 이용하여 실증분석을 실시하였다.

한국인 집단의 유전학적 연구 29. 약물치료를 받은 정신분열 살인환자의 자매염색분체 교환 빈도 (Genetic Studies of Korean Population 29. Sister Chromatid Exchange Frequency in Homicidal Schizophrenic Patient Treated with Antipsychotic Drugs)

  • 김영진;강남이
    • 한국동물학회지
    • /
    • 제37권4호
    • /
    • pp.533-544
    • /
    • 1994
  • 정신분열 살인환자로 격리 치료를 받고 있는 집단을 대상으로 이들을 치료하고자 복용시키는 Haloperidol, Perphenazine, Lithium carbonate 등과 같은 항정신질환 치료제가 자매염색분체 교환(Sister Chromatid Exchange SCE)에 미치는 영향을 조사하였다. 항정신질환 치료제를 계속적으로 복용하고 있는 환자 100명(남자: 76명, 여자: 24명)과 치료제를 전혀 복용하지 않은 남자 환자 10명을 대조군으로 하여 SCE의 빈도를 분석한 결과 항정신질환 치료제를 복용한 환자군에서의 SCE 평균빈도는 세포당 12.24$\pm$0.20으로 항정신질환 치료제를 복용하지 않은 대조군에서의 평균빈도인 세포당 8.77$\pm$0.20보다 높아 유의한 차이를 볼 수 있었다 그러나 항정신질환 치료제를 복용하지 않은 대조군에서의 평균빈도는 이미 보고된 바 있는 정상인 한국인 집단에서의 평균빈도인 세포당 8.78$\pm$0.24(Park et al. , 1992)와 별 차이가 없었다 한편 항정신질환 치료제를 장기간 복용하는데 따른 SCI 빈도의 차이가 있는지의 여부를 보기 위하여 1년 미만에서 6년 정도까지의 치료제 복용기간에 따른 SCE의 평균빈도를 비교 분석한 바 복용기간에 따른 SCE 평균빈도의 유의한 차이는 볼 수 없었다. 정신분열환자들이 복용하고 있는 항정신질환 치료제가 SCE에 영향을 줄 수 있다는 결과를 얼었다.

  • PDF

우리나라 기상자료를 이용한 통계학적 가능최대강수량 빈도계수 산정 (Estimation of the frequency coefficient for statistical probable maximum precipitation (PMP) using the weather data in Korea)

  • 서미루;이주형;김교범;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.169-169
    • /
    • 2021
  • 통계학적 가능최대강수량방법은 가능최대강수량(Probable Maximum Precipitation, PMP) 측정 방법 중 하나로 WMO에서 통계학적인 PMP 추정 방법으로 Hershfield가 제안한 공식을 제시했다. Hershfield는 95,000개의 자료를 분석하였으며, 기본적으로 통계학적 PMP 추정방법의 빈도계수는 km = 15로 제안하였다. 그러나 강우 지속기간 및 연최대 시계열의 평균에 따라 값이 변하게 되며, Hershfield(1965)는 지속시간과 연최대 시계열의 평균에 따른 빈도계수가 5 ~ 20 사이의 값을 갖는다고 제안한 바 있다. Hershfield의 빈도계수는 미국 지역의 2,645개의 관측소의 95,000개의 강우 자료 이용했기 때문에 우리나라의 적용하였을 때 신뢰성에 문제가 있을수 있으며, 우리나라에서는 통계학적 방법보다는 수문기상학적 PMP 추정 방법을 주로 사용하고 있다. 따라서 본 연구에서는 우리나라의 기상 자료중에서 가장 많은 양을 가지는 지점 10개를 선정하여 빈도계수를 산정하였다. 빈도계수를 산정하기 위해서는 시계열로 구성된 강우 자료를 사용해야하며, 본 연구에서는 기상 자료의 이상치 검정을 진행하였으며, 경향성의 경우 정상성을 가지는 것으로 가정하였다. 확률 분포형은 극치분포인 GEV분포, Gumbel분포, Log-Gumbel분포, Weibull분포를 비교하여 가장 적절한 분포형을 선정하여 진행하였다. 최종적으로 얻은 빈도계수를 이용하여 구한 PMP값과 기존 Hershfield가 제시한 빈도계수 값 km = 15를 이용한 PMP값을 비교하여 차이를 분석하였으며, 그 적용성을 평가하였다.

  • PDF

공간확장자료를 이용한 지역빈도분석 : I. 지역홍수빈도분석의 실증적 검토 (Regional frequency analysis using spatial data extension method : I. An empirical investigation of regional flood frequency analysis)

  • 김남원;이정은;이정우;정용
    • 한국수자원학회논문집
    • /
    • 제49권5호
    • /
    • pp.439-450
    • /
    • 2016
  • 본 연구에서는 미계측유역에서의 수공구조물의 설계를 위한 홍수량을 추론하는데 있어, 공간자료 확장기법에 의해 모의된 다지점의 첨두홍수량 자료를 이용한 지역홍수빈도분석의 가능성을 검토하였다. 충주댐 상류유역을 대상으로 지역홍수빈도분석의 표준방법인 지수홍수법을 중심으로 공간확장 자료의 활용에 대한 타당성을 입증하고, 대상유역 내 22개 지점의 확장자료를 이용하여 지역홍수빈도분석을 수행하였다. 지역의 동질성 가정을 구체적으로 검토하기 위해 수문학적 개념의 누가유역과 독립적인 자체유역으로 구분하여 분석을 시도하였다. 자체유역에 대한 지역의 동질성 분석결과는 이질지역으로 평가되었으며, 이러한 가장 큰 원인은 강우의 공간적인 불균등한 분포에서 기인한 것으로 분석되었다. 지역확률분포형을 선정하기 위해 적합성척도와 Floodfreq (Cost action ES0901)에서 제시한 가중이동평균(WMA) 방법으로 검토한 결과, 홍수빈도해석에 널리 이용되는 GEV 분포가 적정 확률분포형으로 채택되었으며, 그에 따른 유역의 무차원 성장곡선(분위수)을 제시하였다. 본 연구는 미계측유역에 대한 빈도홍수량 추정을 위해 지역홍수빈도분석을 중심으로 국내 관측자료의 한계를 극복하기 위한 시도이다.

비매개변수적 Kernel Function을 이용한 지역빈도해석 (Regional Frequency Analysis using Nonparametric Kernel Function)

  • 문영일;오태석;김종석;정민수
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2006년도 학술발표회 논문집
    • /
    • pp.1492-1496
    • /
    • 2006
  • 수공구조물의 설계에 있어 가중 중요한 변수 중에 하나가 확률 강우량이다. 우리나라의 경우 매개변수적인 지점빈도해석을 통해 확률 강우량을 산정하고 있으나, 최근 들어 지점별 관측자료의 부족으로 인한 지역빈도해석을 수행하여 확률강우량을 산정하고 있는 실정이다. Index Flood 기법이나 L-moment 기법과 같은 기존의 지역빈도해석은 여러 관측 지점에서 관측된 강우자료를 이용하여 매년최대 시간강우량 자료를 추출하여 동질성 분석을 통해 이질성이 없는 것으로 분석된 연최대 강우량을 빈도해석 하여 확률 강우량을 결정한다. 그러나 이와 같은 지역빈도해석은 매개변수적 지점빈도해석과 마찬가지로 적합도 검정에 통과한 다수의 분포형이 선정되는 경우에 어떤 분포형을 사용하느냐 하는 문제점이 발생할 수 있다. 그리고 선정된 여러 강우 관측 지점의 연최대 강우량 자료에 모두 동일한 확률 분포형을 이용하므로 선정된 확률 분포형이 모든 지점의 강우 자료와 적합하지 못할 가능성을 내포하고 있으며, 또한 수문자료가 여러가지 요인으로 인하여 복합분포(mixed distribution)형태를 가질 때, 매개변수적 해석방법으로는 다중 첨두를 갖는 확률밀도함수를 해석하는데는 여러 가지 어려움이 따른다. 따라서 이러한 매개변수적 확률분포형을 이용한 빈도해석의 문제점을 해결할 수 있는 비매개변수적 빈도해석이 하나의 대안으로 제시될 수 있다. 본 연구에서는 강우자료의 선별을 통해 신뢰성 있는 자료를 구축하고, 기존의 매개변수를 갖는 확률 분포형을 이용한 지역빈도해석을 적용하여 확률 강우량을 산정하였다. 그리고 동질성분석을 통해 선정된 강우자료에 대해 비매개변수적 지역빈도해석을 적용하여 확률 강우량을 산정하고 각각의 방법에 대한 빈도해석 결과를 비교하여 확률강우량 해석에 있어 하나의 대안을 제시하고자 한다.X>${\mu}_{max,A}$는 최대암모니아 섭취률을 이용하여 구한 결과 $0.65d^{-1}$로 나타났다.EX>$60%{\sim}87%$가 수심 10m 이내에 분포하였고, 녹조강과 남조강이 우점하는 하절기에는 5m 이내에 주로 분포하였다. 취수탑 지점의 수심이 연중 $25{\sim}35m$를 유지하는 H호의 경우 간헐식 폭기장치를 가동하는 기간은 물론 그 외 기간에도 취수구의 심도를 표층 10m 이하로 유지 할 경우 전체 조류 유입량을 60% 이상 저감할 수 있을 것으로 조사되었다.심볼 및 색채 디자인 등의 작업이 수반되어야 하며, 이들을 고려한 인터넷용 GIS기본도를 신규 제작한다. 상습침수지구와 관련된 각종 GIS데이타와 각 기관이 보유하고 있는 공공정보 가운데 공간정보와 연계되어야 하는 자료를 인터넷 GIS를 이용하여 효율적으로 관리하기 위해서는 단계별 구축전략이 필요하다. 따라서 본 논문에서는 인터넷 GIS를 이용하여 상습침수구역관련 정보를 검색, 처리 및 분석할 수 있는 상습침수 구역 종합정보화 시스템을 구축토록 하였다.N, 항목에서 보 상류가 높게 나타났으나, 철거되지 않은 검전보나 안양대교보에 비해 그 차이가 크지 않은 것으로 나타났다.의 기상변화가 자발성 기흉 발생에 영향을 미친다고 추론할 수 있었다. 향후 본 연구에서 추론된 기상변화와 기흉 발생과의 인과관계를 확인하고 좀 더 구체화하기 위한 연구가 필요할 것이다.게 이루어질 수 있을 것으로 기대된다.는 초과수익률이 상승하지만, 이후로는 감소하므로, 반전거래전략을 활용하는 경우 주식투자기간은 24개월이하의 중단기가 적합함을 발견하였다. 이상의 행태적 측면과 투자성과측면의 실증결과를 통하여 한국주식시장에 있어서 시장수익률을 평균적으로 초과할 수 있는 거래전

  • PDF

한강유역에 대한 강우지역빈도해석의 적용성 연구 (Application of Rainfall frequency Analysis in Han River Basin)

  • 허준행;이영석;남우성;김경덕
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2004년도 학술발표회
    • /
    • pp.168-172
    • /
    • 2004
  • 본 연구에서는 지점빈도해석의 단점을 보완하기 위해 지역화의 개념을 사용한 지역빈도해석을 수행하였다. 지점빈도해석은 수문자료의 관측기간이 짧은 경우 정확도에 문제를 발생시킬 수 있으므로 지점 내 충분한 수의 자료 확보가 선행되어야 하나, 우리나라의 경우 지점별로 자료수가 많지 않기 때문에 지역빈도해석을 통해서 보다 정확하고 안정적인 확률수문량을 산정할 수 있다. 본 연구에서는 한강유역의 강우자료 선별을 통해서 신뢰성 있는 자료를 구축한 후, Regional Shape Estimation법과 Index Flood법을 사용한 지역빈도해석을 각각 실시하여 지점빈도해석을 시행한 결과와 비교 분석하였다. 그 결과, 한강유역의의 경우 Regional Shape Estimation 법보다 Index Flood 법이 약간 우수하게 나타났으며, 이질성이 내포되어 있는 경우라도 지점빈도해석보다는 지역빈도해석 기법이 우수하게 나타났다. 국내의 경우와 같이 관측 자료기간이 짧은 경우에는 지점빈도해석 기법보다는 지역빈도해석 기법을 적용하는 것이 보다 신뢰할 수 있는 확률수문량을 도출할 수 있을 것으로 판단된다.

  • PDF

IRFP-tree(Intersection Rule Based FP-tree): 메모리 효율성을 향상시키기 위해 교집합 규칙 기반의 패러다임을 적용한 FP-tree (IRFP-tree: Intersection Rule Based FP-tree)

  • 이정훈
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권3호
    • /
    • pp.155-164
    • /
    • 2016
  • 대용량 데이터베이스의 빈도패턴 분석을 위해 기존의 Apriori 방식의 단점을 보완할 수 있는 새로운 트리 기반의 빈도 패턴 분석 알고리즘이 최근 다양하게 연구되고 있다. 그 중 FP-tree는 이러한 빈도 패턴을 분석하기 위해 빈도 패턴을 표현하는 트리 구조로 단 두 번의 전체 데이터베이스 스캔을 통해 빠르게 트리를 구성할 수 있으며 FP-grwoth를 통해 빈도 패턴을 분석할 수 있다. 이처럼 빈도 패턴 트리의 노드 수는 트리 자체의 메모리 할당량과도 연관이 있지만 그 후 growth의 메모리 자원 소비 및 처리 속도에도 영향을 미치게 된다. 따라서 빈도 패턴 트리의 노드 수의 감소는 트리 자체뿐만 아니라 빈도 패턴 분석에 있어서도 매우 중요하다. 하지만 FP-tree는 전체 아이템 수 라는 고정된 기준 문제로 인해 충분한 노드 수의 압축률을 갖지 못하고 있다. 본 논문에서는 이러한 FP-tree의 문제를 보완하여 좀 더 노드 수를 감소시킬 수 있도록 교집합 규칙이라는 새로운 패러다임을 적용한 빈도 패턴 트리인 IRFP-tree를 제시하고 실험을 통해 그 성능에 대해 증명하였다.

초등 고학년 아동의 과일 및 채소 섭취 수준 평가를 위한 간단한 식품 섭취 빈도 조사지의 개발과 평가 (Development and Evaluation of a Brief Fruit and Vegetable Food Frequency Questionnaire for Higher-Grade Elementary School Children)

  • 이승민
    • 동아시아식생활학회지
    • /
    • 제18권5호
    • /
    • pp.675-683
    • /
    • 2008
  • 본 연구는 초등 고학년 아동의 과일과 채소 섭취 수준 측정을 위한 간단한 식품 섭취 빈도 조사지를 개발 및 평가하고자 실시되었다. 2001년도 국민건강영양조사에 참가한 만 $9{\sim}11$세 아동의 24-시간 회상 자료에 기초하여 식품섭취빈도 조사지의 항목 선정을 위한 기초 조사를 하였다. 각 과일과 채소 식품의 일일 평균 섭취량을 전체 아동 및 섭취량의 4분위 집단 별로 산출한 후, 이 자료를 바탕으로 전체 인구 집단의 섭취량을 대변할 수 있을 뿐만 아내라 고 섭취군과 저 섭취군 간의 차이도 나타낼 수 있는 항목을 선정하였다. 총 9개의 과일 항목과 11개의 채소 항목이 식품 섭취 빈도지에 포함되도록 선정되었으며, 섭취 빈도에 대한 응답 항목은 지난 7일 간의 섭취에 대하여 1개의 선택 범주가 제시되었다. 개발된 조사지의 신뢰도와 상대적 타당도에 대한 평가는 서울에 위치한 한 공립 초등학교에 재학 중인 153명의 $4{\sim}6$학년 학생들을 대상으로 실시하였다. 한 달간의 간격을 두고 2회에 걸쳐 조사를 실시한 자료를 이용하여 검사-재검사 신뢰도를 평가하였으며, 두 번째 방문 시에 28개의 과일 및 채소 항목을 추가로 포함하고 있는 식품섭취빈도 조사지를 더불어 실시한 자료를 바탕으로 상대적 타당도를 평가하였다. 상관 분석과 항목 별 빈도 응답 및 섭취 수준에 따른 집단내 순위 분류의 일관성에 대한 분석을 실시한 결과, 본 연구에서 개발된 20개 항목의 과일 채소 식품 섭취빈도 조사지의 신뢰도와 상대적 타당도가 적정 수준 이상으로 나타났다. 신뢰도를 살펴보기 위한 개별 항목 및 과일, 채소, 과일+채소 섭취 빈도에 대한 상관계수는 $0.22{\sim}0.64$(p<0.001)이었으며, 항목별 빈도 응답의 일관도는 평균 69.3%(<=1 빈도 응답차이)와 81.3%(<=2 빈도 응답 차이)로 나타났다. 상대적 타당도를 살펴보기 위한 과일, 채소, 과일+채소 섭취 빈도에 대한 상관계수는 $0.91{\sim}0.93$(p<0.0001)로 높게 나타났다. 따라서 본 연구를 통하여 개발된 식품섭취빈도 조사지는 초등고학년 아동의 과일채소 섭취 수준을 간단히 심사하거나 평가하는 도구로서 유용하리라 사료된다.

  • PDF