• 제목/요약/키워드: 통계적 유사성

검색결과 378건 처리시간 0.026초

한반도에서 발생한 지진의 통계적 자기 유사성 분석 및 시각화 (Stochastic Self-similarity Analysis and Visualization of Earthquakes on the Korean Peninsula)

  • 황재민;임지영;정해덕
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권11호
    • /
    • pp.493-504
    • /
    • 2023
  • 대한민국은 지진 판의 경계로부터 멀리 떨어진 지역에 있으며, 이러한 지역에서 발생하는 판 내부 지진은 판 경계부 지진과 비교하면 일반적으로 규모가 작고 발생빈도도 낮다. 그럼에도 불구하고 과거 2년부터 1904년 사이 한반도에서 발생했던 지진과 최근 한반도 지진을 관측한 이래에 발생한 지진을 조사 및 분석한 결과 진도 규모 9까지 이르는 것으로 나타났다. 본 논문에서는 한반도에서 발생한 지진과 통계적 자기 유사성과의 관계를 분석하기 위해서 국립기상연구소에서 발표한 「한반도 역사지진 기록 (2년~1904년)」을 이용한다. 또한 본 논문을 통해서 해결한 문제는 한반도에서 발생한 지진데이터와 통계적 자기 유사성과 시각화의 관계 연구를 처음으로 규명하였으며, 그 결과 한반도 지진의 자기 유사성 정도를 판단하는 3가지 정량적인 추정방법으로 측정한 결과 자기 유사성 파라메터 H 값(0.5 < H < 1)이 0.8이상으로 자기 유사성 정도가 높은 것으로 나타났다. 그리고 그래프의 시각화를 통해 지진이 어느 지역에서 많이 발생했는지를 쉽게 파악할 수 있고, 향후 지진 발생시 피해를 예측하고 재산과 인명 피해를 최소화할 수 있는 예측 시스템 개발과 지진 데이터 분석 및 모델링 연구에 활용될 수 있을 것으로 보인다. 뿐만아니라 본 연구결과를 토대로 자기 유사성 프로세스는 지진활동의 패턴과 통계적 특성을 이해하고, 유사한 지진 사건을 그룹화하고 분류하는데 도움을 줄 수 있으며, 지진 활동에 대한 예측, 지진 위험 평가 및 지진 공학 관련 연구에 활용될 것으로 예상된다.

차우검정을 활용한 선형회귀모형간 유사성 검증 (A Stability Test of the Regression Coefficients for the Linear Models using Chow Test)

  • 이기영;이성관;정소영;허태영
    • 한국ITS학회 논문지
    • /
    • 제16권2호
    • /
    • pp.73-82
    • /
    • 2017
  • 회귀모형은 현실세계 모사를 위해 우리가 흔히 활용하고 있는 통계적 방법이다. 교통분야에서도 계획이나 공학부문에 활발하게 활용되고 있지만 여러 개의 모형이 구축될 경우 개별모형의 유의성 검증에 치중하여, 모형 간의 유사성을 검증하는 단계가 부재했다. 따라서 본 연구에서는 두 선형회귀모형 간의 유사성 확인을 위해 "차우(Chow) 검정"이라는 통계적 검정 방법을 적용하였다. 차우검정은 서로 다른 두 회귀모형에서 산출된 모수의 추정값을 근거로 하여, 두 모형 사이에 어떤 유사성이 존재하는지를 통계적으로 검증하는 기법으로 오래전부터 활용되고 있는 기법이다. 차우검정의 적용성을 확인하기 위해 우선, 우천시 주야간 고속도로 교통데이터를 수집하여 각각의 속도-밀도 회귀모형을 개발하였으며 차우검정을 통해 우천시 주야간 두 모형간의 유사성을 검증함으로써 이러한 통계적 절차가 객관적인 자료분석 과정에서 중요한 역할을 수행할 수 있음을 입증하였다. 본 연구에서는 선형회귀모형들에 대한 차우검정의 적용성을 확인해 보았으며, 향후 비선형 모형간의 유사성 검증 작업이 이어질 수 있을 것으로 기대한다.

패턴매칭을 이용한 유사도 비교 분석 (A Similarity Valuating System using The Pattern Matching)

  • 고방원;김영철
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권1호
    • /
    • pp.185-192
    • /
    • 2010
  • 본 논문에서는 서로 다른 두 개의 문서에 등장하는 패턴 매칭을 이용하여 유사도를 평가하는 시스템을 제안한다. 기존의 문서들의 유사도를 평가하는 방법에는 지문법과 같은 통계적 방법을 주로 이용하였다. 하지만 이 방법은 관련이 없는 두 문서에서 우연히 유사한 단어가 많이 등장 할 때 유사성이 높게 나오는 정확성의 문제점이 있다. 이러한 문제점은 단순히 두 문서의 통계적인 수치를 비교하기 때문에 발생한다. 하지만 본 논문에서 제시하는 패턴을 이용한 방법은 일치하는 패턴을 검색하여 유사성을 판별하기 때문에 이러한 문제를 해결하였다. 하지만 패턴을 검색하는 시간이 오래 걸리는 단점이 있는데 이를 개선하는 알고리즘 또한 본문에서 소개한다.

유사측도를 이용한 신뢰성 있는 데이터의 추출 (Reliable Data Selection using Similarity Measure)

  • 류수록;이상혁
    • 한국지능시스템학회논문지
    • /
    • 제18권2호
    • /
    • pp.200-205
    • /
    • 2008
  • 데이터 분석을 위하여 데이터의 불확실성에 대한 측도로서 퍼지 집합에 대한 엔트로피를 소개하였고, 또한 데이터간의 유사도를 나타내는 유사측도를 구성하였다. 퍼지 소속 함수간의 유사측도는 거리측도를 이용하여 구성하였고, 제안한 유사측도를 증명을 통하여 확인하였다. 제안한 유사측도의 유용성을 확인하기 위하여 신뢰성 있는 데이터추출 예제에 적용하였다. 적용결과를 퍼지 엔트로피와 통계적 지식을 통하여 얻어진 이전의 결과와 비교하였다.

유사의 입경분포 모의를 위한 방안 연구 - 비점착성 유사의 경우 (An approach to predict size distribution of suspended sediment - noncohesive sediment)

  • 손민우;변지선;박병은
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2018년도 학술발표회
    • /
    • pp.289-289
    • /
    • 2018
  • 하천의 유사는 이동 형태에 따라 소류사와 부유사로 분류되는데, 대부분의 자연하천에서 유사는 난류로 인해 부유사의 형태로 이송된다. 하천 흐름 내 부유사는 크기와 모양이 서로 다른 입자들로 구성되어 있으며, 부유사의 입도 분포는 유사의 특성 뿐 아니라 흐름의 유사 이동 능력과 같은 유수동역학적 특성 또한 함께 고려되어야 한다. 유사의 입도 분포는 통계적인 방법을 통해 결정되며, 일반적으로 모래 하천의 입도 분포는 로그 정규 분포를 따르는 것으로 알려져 있다. 이에 본 연구에서는 부유사의 입도 분포 모형을 이용하여 다양한 흐름 조건 하에서의 입도분포를 살펴본다. 비점착성 유사의 입도 분포 모형은 점착성 유사의 입도 분포 모형으로부터 얻어지며, 1차원 유사 이동 모형과의 결합을 통해 다양한 흐름 조건에서 부유된 유사의 입도 분포를 모의할 수 있다. 여러 연구결과를 분석한 결과, 부유사의 입도 분포는 최빈치가 하나인 단최빈 분포(Unimodal Distribution)가 대다수를 차지하였으나, 최대 빈도가 두 개 이상 나타나는 쌍최빈 분포(Bimodal Distribution) 또한 흔히 나타나는 것이 확인된다. 본 연구에서 개발된 비점착성 유사의 입도 분포모형은 단최빈 및 쌍최빈이 나타난 실험실 실험 자료를 이용하여 검증된다. 단최빈의 입도 분포를 나타내는 실험 결과 2가지와 쌍최빈의 입도 분포를 나타내는 실험 결과 2가지를 이용하였을 때, 총 4가지의 다양한 유수동역학적 조건 하에서 비점착성 유사의 입도 분포가 합리적으로 모의되는 것이 확인된다.

  • PDF

문서구조 정보 기반의 유사도 측정 (A Similarity Evaluation using Structural Information of Documents)

  • 신미해;고방원;김영철;정진영
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2010년도 제42차 하계학술발표논문집 18권2호
    • /
    • pp.499-502
    • /
    • 2010
  • 인터넷의 발달로 인한 수많은 정보의 공유는 지식 정보사회의 발전을 가져왔다. 이러한 정보사회의 발전과 동시에 표절과 같은 새로운 지식 범죄도 급증하고 있다. 표절은 연구의 정직성과 창의성을 떨어뜨리고 학문의 발전을 저해하는 요소이다. 이러한 표절을 근절하기 위해서 그동안 많은 방법들과 시스템들이 제시되었다. 이중 자연어로 구성된 구조가 없는 일반 문서의 표절을 검사하는 방법은 지문법을 이용하였다. 지문법과 같이 통계적인 방법을 이용한 유사도 검사 방법은 문서 대 문서 전체를 비교하기 때문에 부분적 유사성, 즉 문장이나 문단 단위의 비교를 할 수 없는 단점이 있다. 본 논문에서 제시하는 시스템은 자연어로 이루어진 일반문서 중 특별한 문서의 구조 정보를 가질 수 있는 일반 텍스트 문서를 대상으로 유사도를 측정하였다. 즉 텍스트 문서 구조를 AST 형태의 자료구조로 표시하고 이를 이용하여 사용자가 원하는 부분 또는 전체 유사도 측정 방법을 제시한다.

  • PDF

한국어 텍스트 내 용어연관성 분석을 위한 기초 연구 (Preliminary Study on the Analysis of Term Associations in Korean Text)

  • 정영미;이재윤
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1998년도 제5회 학술대회 논문집
    • /
    • pp.243-246
    • /
    • 1998
  • 텍스트 자동분석을 통해 얻어진 통계적인 용어연관성은 정보검색 및 언어 처리와 관련된 여러 분야에서 폭넓게 이용되고 있다. 용어연관성을 구하기 위한 연관계수는 여러 가지가 있지만 적용분야에 관계없이 유사계수 공식이나 상호정보량 공식이 주류를 차지하고 있다. 이런 공식들은 그 통계적 특성이 서로 다르기 때문에 알맞은 적용분야를 파악할 필요가 있다. 이 연구에서는 필요 연관계수 공식의 특성을 이론적으로 파악하였고, 실험으로 검증하기 위하여 240만 어절 분량의 실험용 한국어 신문기사 데이터베이스를 구축하였다.

  • PDF

유추에 의한 문제제기 활동을 통해 본 통계적 개념 이해 (Understanding of Statistical concepts Examined through Problem Posing by Analogy)

  • 박미미;이동환;이경화;고은성
    • 대한수학교육학회지:수학교육학연구
    • /
    • 제22권1호
    • /
    • pp.101-115
    • /
    • 2012
  • 유사성을 근거로 하는 개연적 추론인 유추는 수학뿐만 아니라 물리 등의 여러 분야에서 개념 형성, 문제해결, 새로운 발견 등을 위해 사용되는 하나의 사고전략이다. 통계교육자들은 통계에서도 역시 유추가 유용한 사고전략으로 사용될 수 있다고 언급한다. 본 연구에서는 수학과는 다른 특성을 지닌 통계에서 학생들의 유추적 사고의 특징을 살펴본다. 이를 위해 수학영재학급 학생들을 대상으로 실생활 맥락이 담긴 통계문제를 기저문제로 제시하고 이와 유사한 문제를 만들도록 하였다. 학생들이 만든 문제는 기저문제의 통계적 맥락의 보존 여부 및 기저문제의 기본구조 유지 여부에 따라 다섯 가지 유형으로 분류되었다. 각 유형의 특징을 분석한 결과 다음과 같은 시사점을 얻을 수 있었다. 통계에서는 기본구조가 유지되어도 통계적 맥락이 훼손되는 경우 그 문제의 의미를 찾을 수 없으나, 기본구조가 변형되었다 하더라도 통계적 맥락이 보존되는 경우 통계적 개념에 대한 재개념화에 기여할 수 있다는 가능성을 확인하였다.

  • PDF

다중선택 시험에서 부정행위자 발견을 위한 새로운 통계적 측도 (A New Statistical Index for Detecting Cheaters on Multiple Choice Tests)

  • 한은수;임요한;이경은
    • 응용통계연구
    • /
    • 제26권1호
    • /
    • pp.81-92
    • /
    • 2013
  • 학문적 진실성(academic integrity)을 위반하는 잠재적 부적행위를 판단할 때, 잘못된 결정을 피하기 위해서는 확고한 근거를 마련하는 것이 중요하다. 교육학 연구자들은 부정행위를 발견 혹은 확신 할 수 있는 많은 통계적인 방법들을 발전시켰다. 그러나, 대부분의 방법들은 단순히 상관계수를 기초로한 방법들이어서 종종 응답자들의 패턴을 설명하기가 어렵다. 이 논문에서는, 이런 어려움을 해결하기 해결하기 위하여 표준화된 부호 엔트로피 유사성 점수(Standardized Signed Entropy Similarity Score)라는 새로운 통계적인 측도를 제안한다. 또한, 이 제안한 방법을 실제 시험 자료를 이용 부정행위자를 발견하는데 적용하였고, 다른 기존의 방법들과 비교하였다.

붓스트랩을 이용한 다차원척도법의 효율성 연구 (A study on the efficiency of multidimensional scalin using bootstrap method)

  • 김우종;강기훈
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권2호
    • /
    • pp.301-309
    • /
    • 2009
  • 다차원척도법은 다변량분석에서 개체들을 대상으로 변수들을 측정한 후에 개체들 사이의 비유사성을 측정하고, 그 값들 혹은 반복하여 측정된 경우에는 그 값들의 평균을 이용하여 개체들을 저차원의 공간상에 도시화시켜 표현하는 분석방법이다. 본 논문에서는 응답자의 답변에 기초하여 비유사성을 측정할 때 이상치 또는 응답자의 답변이 불성실할 경우 발생하는 변이문제와 개체들 간의 거리에 대한 통계적 추론 문제에 붓스트랩 방법을 적용하는 내용을 다루고, 활용가능성을 무료일간지에 대한 유사성 평가 자료를 이용하여 실증적으로 분석하였다.

  • PDF