• 제목/요약/키워드: 확률 및 통계

검색결과 664건 처리시간 0.023초

우리나라 자료에 적합한 생명표 작성방법에 대한 연구 (A Method for Construction of Life Table in Korea)

  • 박유성;김성용
    • 응용통계연구
    • /
    • 제24권5호
    • /
    • pp.769-789
    • /
    • 2011
  • 생명표는 특정 집단의 사망 경험(mortality expereience)을 반영하여 각 연령에서의 기대여명을 추정하는 통계적 모형이다. 사망 경험은 사망확률(death probability)을 통해 반영되는데, 사망확률을 추정하기 위해서는 세 가지 사항이 고려되어야 한다. 첫째는 사망률(death rate)로부터 사망확률을 추정하는 방법의 선택이며, 둘째는 사망확률의 불규칙성을 해결하기 위한 평활 방법, 셋째는 초고령 자료의 신뢰성 문제를 해결하기 위한 사망확률 추정 및 확장 문제이다. 본 논문에서는 사망확률 추정방법의 선택을 위해 Chiang 방법, 상수방법, Greville 방법, Reed and Merrell 방법 및 Keyfitz and Frauenthal 방법을 비교하며, 평활 방법으로는 Beers 방법, Greville 방법 및 이동평균 방법을 비교하도록 한다. 또한 초고령에서 사망확률 추정 및 확장을 위해 총 12가지 수학적 함수를 비교한다. 본 논문에서는 각 방법들을 비교함으로써 우리나라에 적합한 생명표 작성 방법을 제시하고, 이를 이용하여 2005년부터 2009년까지의 생명표를 작성하도록 한다. 또한 기간별 성별 기대여명의 역전현상(cross-over)현상을 해결하기 위한 방법을 제시한다.

다중 시기/센서 원격탐사 자료의 통계비 기반 분류 (Statistical ratio based classification of multi-temporal/sensor remote sensing data)

  • 박노욱;지광훈
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2006년도 춘계학술대회 논문집
    • /
    • pp.3-6
    • /
    • 2006
  • 이 연구에서는 다중 센서 융합과 시간적 문맥 정보의 결합을 통한 분류 정확도 향상을 목적으로 통계비 기반 결정수준 융합 기법을 제안하였다. 다중 센서 융합을 목적으로 개별 센서 자료로부터 얻어진 사후 확률의 결합에 기존 확률론적 자료 융합에서 널리 사용되어온 조건부 독립의 가정을 완화한 통계비 기반 결합 규칙을 적용하였다. 그리고 시간적 문맥 정보를 새로운 정보 근원으로 간주하고 이전 시기 자료의 분류결과로부터 추출 및 결합하였다. 이 제안기법은 통계비 기반의 틀 안에서 다중 센서의 분광정보 및 시간적 문맥 정보의 결합이 용이한 장점이 있다 제안기법의 적용성 평가를 위해 다중 시기/센서 융합의 사례연구를 수행하였다.

  • PDF

띄어쓰기 비종속 품사 태깅 시스템 개발 (Development of POS Tagging System Independent to Word Spacing)

  • 이경일;안태성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2003년도 제15회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.69-72
    • /
    • 2003
  • 본 논문에서는 입력된 한국어 문자열로부터 형태소를 분석하고, 품사를 태깅하는 방법에 있어 개선된 통계적 모델을 제안하고, 이에 기반한 띄어쓰기 비종속 형태소 분석 및 태깅 시스템의 개발과 성능 평가에 대한 결과를 소개하고 있다. 제안된 통계 기반품사 태깅 시스템은 입력된 문자열로부터 음절의 띄어쓰기 확률값을 계산하여 유사어절을 생성하고, 유사어절 단위로 사용자 띄어쓰기와 상관없이 형태소 후보 리스트를 생성하며, 인접한 후보 형태소들의 접속 확률 계산에 있어 어절 간 접속 확률과 어절 내 접속 확률을 모두 사용함으로, 최적의 형태소 리스트를 결정하는 모델을 사용하고 있다. 특히, 형태소들의 접속 확률 계산 시 어절 간 접속 확률과 어절 내 접속 확률의 결합 비율이 음절의 띄어쓰기 확률 값과 사용자의 띄어쓰기 여부에 따라 자동으로 조절되는 특징을 가지고 있으며, 이를 통해 극단적으로 띄어 쓰거나 붙여 쓴 문장에 대해서도 평균 90%수준의 품사 태깅 성능을 달성할 수 있었다.

  • PDF

고등학교 확률과 통계영역에서 현실적 수학교육의 적용을 위한 문맥 연구

  • 김원경;백경호
    • 한국수학교육학회지시리즈E:수학교육논문집
    • /
    • 제18권1호
    • /
    • pp.137-155
    • /
    • 2004
  • 현실적 수학교육은 탐구학습, 열린학습 등을 통해 수학적 사고력, 문제해결력을 신장하려는 최근의 수학교육의 방향에 걸맞는 새로운 교수${\cdot}$학습 방법의 하나로 주목받고 있다. 이에 따라 본 연구에서는 고등학교 확률과 통계 영역에서 현실적 수학교육을 적용하기 위한 문맥을 개발하였다. 이 문맥들은 수학사, 자연 및 사회 현상, 실생활의 상황, 타 교과에서의 활용 상황 등 다양한 분야에서 고등학교 2${\sim}$2학년 수준에 알맞게 개발되었다.

  • PDF

세 집단 판별분석 상황에서의 영향함수 유도 및 그 응용 (Derivation and Application of In uence Function in Discriminant Analysis for Three Groups)

  • 이혜정;김홍기
    • 응용통계연구
    • /
    • 제24권5호
    • /
    • pp.941-949
    • /
    • 2011
  • 본 논문에서는 세 집단만을 판별분석 할 경우에 계산되는 오분류확률에 영향을 미치는 이상치 판별을 목적으로 하며, 쉽게 응용 가능한 간단한 영향함수식을 제시하였다. 그리고 제시된 수식을 이용하여 안면 데이터로 세 가지 사상체질을 분류해보고 각 관찰값들의 오분류확률에 대한 영향함수를 계산하였다. 이상치를 제거하고 재 판별분석을 하는 데 있어, 오분류확률에 대한 영향함수를 이용하는 것이 효율적인 방법임을 확인하였다.

통계계산을 위한 Fortran과 C라이브러리의 구현 (Implementation of Fortran and C Libraries for Statistical computing)

  • 신봉섭;박춘성
    • 한국컴퓨터정보학회논문지
    • /
    • 제4권2호
    • /
    • pp.113-119
    • /
    • 1999
  • 본 연구에서는 여러 응용분야에서 자주 사용되는 통계적 모의실험이나 통계계산에 유용하게 사용될 루틴들을 Fortran과 C 언어의 Subroutine이나 함수 형태로 작성하여 라이브러리로 구현하였다. 여기에는 일반적으로 자주 사용되는 확률변수들의 난수생성기와 대표적인 확률분포들의 확률 계산이나 상위확률 및 상위백분위수의 계산 등에 유용한 루틴들을 포함하고 있다.

  • PDF

복합확률에 의한 우리나라 주요항만의 최극해면분석

  • 최병호;노상준
    • 한국해안해양공학회:학술대회논문집
    • /
    • 한국해안해양공학회 1996년도 정기학술강연회 발표논문 초록집
    • /
    • pp.50-54
    • /
    • 1996
  • 극치확률 모델과 더불어 최극해면분석에 이용되는 또 하나의 방법은 조석 및 비조석성분의 복합확률방법(joint probability method)으로 Pugh와 Vassie(1978)에 의해 제시되었다. 이 방법은 조석(tide)과 비조석성분(surge)이 통계적으로 독립적인 변수(statistically independent variable)로 취득될 수 있는 가를 일차적으로 분석한 후 해면의 확률분포를 조위분석함수(tidal probability distribution function)와 비조석성분분포함수(surge probability distribution function)의 복합으로서 산정하는 것이다. (중략)

  • PDF

한국어 품사 태깅을 위한 다이내믹 링크 모델 (A Dynamic Link Model for Korean POS-Tagging)

  • 황명진;강미영;권혁철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2007년도 제19회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.282-289
    • /
    • 2007
  • 통계를 이용한 품사 태깅에서는 자료부족 문제가 이슈가 된다. 한국어나 터키어와 같은 교착어는 어절(word)이 다수 형태소로 구성되어 있어서 자료부족 문제가 더 심각하다. 이러한 문제를 극복하고자 교착어 문장을 어절 열이 아니라 형태소의 열이라 가정한 연구도 있었으나, 어절 특성이 사라지기 때문에 파생에 의한 어절의 문법 범주 변화 등의 통계정보와 어절 간의 통계정보를 구하기 어렵다. 본 논문은 효율적인 어절 간 전이확률 계산 방법론을 고안함으로써 어절 단위의 정보를 유지하면서도 자료부족문제를 해결할 수 있는 확률 모델을 제안한다. 즉, 한국어의 형태통사적인 특성을 고려하면 앞 어절의 마지막 형태소와 함께 뒤 어절의 처음 혹은 끝 형태소-즉 두 개의 어절 간 전이 링크만으로도 어절 간 전이확률 계산 시 필요한 대부분 정보를 얻을 수 있고, 문맥에 따라 두 링크 중 하나만 필요하다는 관찰을 토대로 규칙을 이용해 두전이링크 중 하나를 선택해 전이확률 계산에 사용하는 '다이내믹 링크 모델'을 제안한다. 형태소 품사 bi-gram만을 사용하는 이 모델은 실험 말뭉치에 대해 96.60%의 정확도를 보인다. 이는 같은 말뭉치에 대해 형태소 품사 tri-gram 등의 더 많은 문맥 정보를 사용하는 다른 모델을 평가했을 때와 대등한 성능이다.

  • PDF

언어 정보 획득을 위한 한국어 코퍼스 분석 도구 (A Korean Corpus Analysis Tool for Language Information Acquisition)

  • 이호;김진동;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1994년도 제6회 한글 및 한국어정보처리 학술대회
    • /
    • pp.297-304
    • /
    • 1994
  • 코퍼스는 기계 가독형으로 개장되어 있는 실제 사용 언어의 집합으로 자연어 처리에 필요한 여러 가지 언어 정보를 내재하고 있다. 이들 정보는 코퍼스 분석기를 이용하여 획득할 수 있으며 용례와 각종 통계 정보 및 확률 정보, 연어 목록 등은 코퍼스에서 추출할 수 있는 대표적인 언어 정보들이다. 그러나 기존의 한국어 코퍼스 분석 도구들은 용례 추출 기능만을 보유하여 활용 범위가 제한되어 있었다. 이에 본 논문에서는 대량의 한국어 코퍼스를 분석하여 용례뿐만 아니라 자연어 처리의 제분야에서 필요한 언어 정보들을 추출하는 방법에 대해 연구하였으며 이의 검증을 위해 KCAT(Korean Corpus Analysis Tool)를 구현하였다. KCAT는 코퍼스 색인, 용례 추출, 통계 정보 추출, 연어 추출 부분으로 구성되어 있다. 용례 색인을 위해서는 여러 가지 사전과 용례 색인 구조가 필요한데 KCAT에서는 가변 차수 B-Tree 구조를 이용하여 사전을 구성하며 용례 색인을 위해 버킷 단위의 역 화일 구조를 이용한다. 질 좋은 용례의 추출을 위해 KCAT는 다양한 용례 연산 및 정렬 기능을 제공한다. 또한 통계적 방법의 자연어 처리 분야를 위해 어휘 확률, 상태 전이 확률, 관측 심볼 확률, 상호 정보, T-score 등을 제공하며, 기계 번역 분야에서 필요한 연어를 추출한다.

  • PDF

실 호우의 발생빈도를 고려한 확률강우량 산정연구 (A Study on Estimation of Design Rainfall considering Frequency of Real Rainfall)

  • 문영일;김민석;목지윤;육지문
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2018년도 학술발표회
    • /
    • pp.189-189
    • /
    • 2018
  • 확률강우량은 수공구조물 설계, 목표강우량과 같은 방재성능목표 그리고 방재성능평가에 활용되는 기준으로 활용되고 있다. 과거 강우자료계열을 기반으로 통계분석 과정을 걸쳐 산정되는 확률강우량은 재현기간별 발생빈도에서 실제 발생한 강우량보다 과소 산정되는 문제점이 있다. 이에 본 연구에서는 강우자료를 최대치계열과 초과치계열로 구분하여 각각 확률강우량을 산정하고, 확률분포형별 확률강우량과 실제 강우량의 비교분석을 실시하였다. 또한, 실제 강우의 재현기간별 발생빈도를 기반으로 과소 추정되는 확률강우량의 문제점을 보완하는 산정방안을 제시하였다. 본 연구의 결과는 과소 추정되는 확률강우량의 문제점을 보완하여 적정 확률강우량 산정함으로써, 수공구조물 설계 및 방재성능평가에 기여할 것으로 판단된다.

  • PDF