• 제목/요약/키워드: 이용통계

검색결과 12,051건 처리시간 0.049초

다변량 정규성검정을 위한 근사 SHAPIRO-WILK 통계량의 일반화

  • 김남현
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2003년도 춘계 학술발표회 논문집
    • /
    • pp.243-248
    • /
    • 2003
  • Fattorini(1986)의 통계량은 Shapiro와 Wilk의 일변량 정규분포를 위한 검정통계량을 다변량으로 확장한 것이다. 본 논문에서는 Kim과 Bickel(2003)에서 제안한 이변량 정규분포를 위한 검정통계량을 Fattorini(1986)의 방법을 이용하여 이변량 이상인 경우에도 실제적으로 사용가능하도록 일반화하였다. 제안된 통계량은 Fattorini(1986) 통계량의 근사통계량으로 생각할 수 있으며 표본의 크기가 클 때도 사용가능하다.

  • PDF

KINITI의 문헌제공서비스에 관한 이용연구 - 1996년 이용데이터를 중심으로 - (A Usage Study of KINITI Document Delivery Service:Centered around the Statistical Data of FY 1996)

  • 김홍렬
    • 정보관리연구
    • /
    • 제28권2호
    • /
    • pp.54-70
    • /
    • 1997
  • 국내 최대 문헌복사기관인 산업기술정보원의 문헌복사이용에 관한 통계를 기반으로 KINITI의 문헌복사활동현황과 국내 이용자들의 문헌복사 이용형태를 조사하였다. 1996년도 이용통계를 중심으로 문헌복사 처리건수, 이용자의 신청방법, 제공방법, 불능건수, 문헌처리일수, 연간물 이용빈도별 문헌순위 등을 통계적으로 산출하여 설명하였다. 1996년말 현재 문헌신청건수는 456,829건으로 전년도 대비(446,065건) 2.4% 증가하였다.

  • PDF

언어 사용환경에 적응적인 영어 문맥의존 철자오류 교정 기법 (Adaptive English Context-Sensitive Spelling Error Correction Techniques for Language Environments)

  • 김민호;김경식;권혁철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.133-136
    • /
    • 2015
  • 문서 교정기에서 문맥의존 철자오류를 교정하는 방법은 크게 규칙을 이용한 방법과 통계 정보를 이용한 방법으로 나뉜다. 한국어와 달리 영어는 오래전부터 통계 모형에 기반을 둔 문맥의존 철자오류 교정 연구가 활발히 이루어졌다. 그러나 대부분 연구가 문맥의존 철자오류 교정 문제를 특정 어휘 쌍을 이용한 분류 문제로 간주하기 때문에 실제 응용에는 한계가 있다. 또한, 대규모 말뭉치에서 추출한 통계 정보를 이용하지만, 통계 정보 자체에 오류가 있을 경우를 고려하지 않았다. 본 논문에서는 텍스트에 포함된 모든 단어에 대하여 문맥의존 철자오류 여부를 판단하고, 해당 단어가 오류일 경우 대치어를 제시하는 영어 문맥의존 철자오류 교정 기법을 제안한다. 또한, 통계 정보의 오류가 문맥의존 철자오류 교정에 미치는 영향과 오류 발생률의 변화가 철자오류 검색과 교정의 정확도와 재현율에 미치는 영향을 분석한다. 구글 웹데이터에서 추출한 통계 정보를 바탕으로 통계 모형을 구성하고 평가를 위해 브라운 말뭉치에서 무작위로 2,000문장을 추출하여 무작위로 문맥의존 철자오류를 생성하였다. 실험결과, 문맥의존 철자오류 검색의 정확도와 재현율은 각각 98.72%, 95.79%였으며, 문맥의존 철자오류 교정의 정확도와 재현률은 각각 71.94%, 69.81%였다.

  • PDF

언어 지식과 통계 정보의 보완적 특성을 이용한 품사 태깅 (Part-of-Speech Tagging Using Complemental Characteristics of Linguistic Knowledge and Stochastic Information)

  • 임희석;김진동;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.102-108
    • /
    • 1997
  • 기존의 품사 태깅 방법에서 독립적으로 사용해온 언어 지식과 통계 정보는 품사 태깅의 정확도와 처리 범위의 향상을 위해서 상호 보완적인 특성을 갖는다. 이에 본 논문은 언어 지식과 통계 정보의 보완적 특성을 이용한 규칙 우선 직렬 품사 태깅 방법을 제안한다. 제안된 방법은 언어 지식에 의한 품사 태깅 결과를 선호함으로써 규칙 기반 품사 태깅의 정확도를 유지하며, 언어 지식에 의해서 모호성이 해소되지 않은 어절에 통계 정보에 의한 품사 태깅 결과를 할당함으로써 통계 기반 품사 태깅의 처리 범위를 유지한다. 또한, 수정 언어 지식에 의해 태깅 결과의 오류를 보정함으로써 품사 태깅의 정확도를 향상시킨다. 약 2만 어절 크기의 외부 평가 코퍼스에 대해 수행된 실험 결과, 규칙 우선 직렬 품사 태깅 시스템은 통계 정보만을 이용한 품사 태깅의 정확도보다 32.70% 향상된 95.43%의 정확도를 보였다.

  • PDF

규칙과 비감독 학습 기반 통계정보를 이용한 품사 태깅 시스템 (Part-of-Speech Tagging System Using Rules/Statistics Extracted by Unsupervised Learning)

  • 이동훈;강미영;황명진;권혁철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.445-447
    • /
    • 2005
  • 본 논문은 규칙 기반 방법과 통계 기반 방법을 동시에 사용함으로써 두 가지 방법의 장단점을 상호 보완한다. 한 문장에 대한 최적의 품사열은 HMM을 기반으로 Viterbi Algorithm을 사용하여 선택한다. 이때 파라미터 값은 규칙에 의한 가중치 값과 통계 정보를 사용한다. 최소한의 일반규칙을 사용하여 구축한 규칙의 적용에 따라 가중치 값을 구하며 규칙을 적용받지 못하는 경우는 비감독학습으로 추출한 통계정보에 기반을 둔 가중치 값을 이용하여 파라미터 값을 구한다. 이러한 기본 모델을 여러 회 반복하여 학습함으로써 최적의 통계기반 가중치를 구한다. 규칙과 비감독 학습으로 추출한 통계정보를 이용한 본 품사 태깅 시스템의 어절 기반 정확도는 $97.78\%$이다.

  • PDF

확률화 블럭 계획법에서 최적 가중치를 이용한 우산형 대립가설의 비모수검정법 (Nonparametric tests using optimal weights for umbrella alternatives in a randomized block design)

  • 김동희;김영철
    • 응용통계연구
    • /
    • 제9권1호
    • /
    • pp.139-152
    • /
    • 1996
  • 확률화 블럭 계획법에서 최적 가중치를 이용한 우산형 대립가설에 대한 비모수검정법을 제안하고자 한다. Mack과 Wolfe(1981) 형태의 통계량에 대한 제안된 통계량의 점근상대효율을 최대로 하는 가중치를 구하고, 이러한 가중치를 가지는 제안된 통계량과 Mack과 Wolfe 형태의 통계량 및 선형 순위 통계량의 점근상대 효율을 고려하였다. 소표본에서 모의 실험을 통하여 블럭의 크기가 다른 경우 제안된 통계량의 검정력이 우수함을 보였다.

  • PDF

주성분점수를 이용한 이변량 공간자료에 대한 감도분석 (Sensitivity Analysis for Bivariate Spatial Data Using Principal Component Score)

  • 최승배;강창완
    • 응용통계연구
    • /
    • 제14권2호
    • /
    • pp.415-427
    • /
    • 2001
  • 공간통계학에서는 다변량 공간자료에 대한 예측방법으로서 코크리깅 기법을 이용한다. 본 논문에서는 코크리깅을 위한 첫 번째 단계인 교차베리오그램의 추정에 대한 감도분석 대신에 일반통계학적 측면에서 주성분점수를 이용한 감도분석방법을 제안한다. 변수가 2개인 경우, 교차베리오그램에 대한 감조분석의 결과와 제안된 주성분점수를 이용한 감도분석의 결과를 비교해 본다. 모의실험을 통하여 제안한 방법의 타당을 검증하고, 실제 자료를 이용한 사례분석의 결과로써 재확인해 본다.

  • PDF

효율적 시장가설과 서브마팅게일의 검증

  • 옥기율;송영효
    • 재무관리연구
    • /
    • 제14권1호
    • /
    • pp.207-217
    • /
    • 1997
  • 본 연구에서는 효율적 시장가설을 검증할 때 일반적으로 이용하는 주가의 로그변환방법은 마팅게일과 서브마팅게일을 구분할 수 없다는 것을 이론적으로 보여주고, 이러한 문제를 해결하기 위해서는 로그변환없이 일차 차분을 한 시계열 데이타를 이용하는 것이 바람직하다는 것을 제시한다. 또한 마팅게일과 서브마팅게일의 구분하기 위해서는 주가 차분 시계열 데이타의 공분산이라는 검정통계량을 이용하는데, 이 공분산이라는 검정통계량을 이용하여 실증적으로 검증을 하기 위해서는 이 통계량의 분포를 알아야 한다. 본 연구에서는 bootstrap방법론을 이용하여 이 공분산의 분포를 구하는 방법론을 제시한다.

  • PDF

대학도서관에서의 전자저널 이용 통계 제공 및 활용 현황 (The Current Status of the Electronic Journal Usage Statistics at the Academic Libraries)

  • 황옥경
    • 정보관리연구
    • /
    • 제38권4호
    • /
    • pp.68-87
    • /
    • 2007
  • 본 연구의 목적은 국내 대학도서관에서의 전자저널 이용 통계 제공 및 활용 현황을 조사하는 데 있다. 이를 위하여 서울 및 경기 소재 63개 대학교 및 대학도서관을 대상으로 온라인 설문지조사를 시행하였고 이 중 48개 도서관으로부터 응답지를 회수하여 그 결과를 분석하였다. 분석 결과 현재 제공되고 있는 이용 통계 데이터에 대한 만족도는 낮게 나타났으며 특히 비교 가능한 데이터의 부재 문제와 구독 대학도서관 전체의 평균 이용률에 대한 정보가 제공되지 않는 데 따른 불만이 높은 것으로 나타났다. 더불어 선행연구 조사 및 현행 이용 데이터에 대한 분석을 통해 전자저널 평가에 활용할 수 있는 이용 데이터 통계치로서 5가지 유형을 고찰하였다.

척도모수가 미지인 임의중도절단자료의 EDF 통계량을 이용한 지수 검정 (Testing Exponentiality Based on EDF Statistics for Randomly Censored Data when the Scale Parameter is Unknown)

  • 김남현
    • 응용통계연구
    • /
    • 제25권2호
    • /
    • pp.311-319
    • /
    • 2012
  • 수명시간 분석에서 가장 간단하고 또한 자주 이용되는 분포는 지수분포이다. Koziol과 Green (1976)은 Cram$\acute{e}$r-von Mises 통계량을 Kaplan-Meier의 product limit 경험분포함수를 이용하여 임의중도절단자료에 대해서 일반화하였다. 그러나 이 통계량은 모수의 값이 주어진 단순귀무가설을 가정하고 있으므로 실제 자료에 적용하기에는 어려운 점이 있다. 본 논문에서는 척도모수가 미지인 지수분포의 적합도 검정에 모수를 추정하여 Koziol-Green 통계량을 적용하였다. 그리고 같은 방법으로, 전통적인 Kolmogorov-Smirnov 검정통계량을 일반화하고 두 가지 통계량의 검정력을 모의실험을 통하여 비교하였다. 그 결과 전반적으로 일반화된 Koziol-Green 통계량이 Kolmogorov-Smirnov 통계량보다 지수분포의 검정에 있어서는 좀 더 좋은 검정력을 보여주었다.