• 제목/요약/키워드: 통계적 거리

검색결과 272건 처리시간 0.033초

2X2 생물학적 동등성 시험에서 이상치 검출을 위한 통계적 방법 (Detecting an Outlier in 2X2 Bioequivalence Trial)

  • 정규진;박상규;우화형
    • Communications for Statistical Applications and Methods
    • /
    • 제16권5호
    • /
    • pp.745-751
    • /
    • 2009
  • 생물학적 동등성 시험에서 피험자로부터 얻어진 생체 이용률 자료들 중 하나 혹은 일부가 다른 자료에 비해 크게 차이가 나는 자료를 이상치라 정의한다. 이러한 이상치의 존재는 소수의 피험자로 이루어지는 생물학적 동등성 시험의 결과에 큰 영향을 주는 것으로 알려져 있다. 생물학적 생동성 시험에서 이상치를 판별하는 통계적 방법 중 우도거리 혹은 추정량거리를 비교하는 통계적 검정이 많이 활용되고 있는데 본 연구논문에서는 이러한 통계적 방법을 보다 일반화하여 이상치를 판단하는데 보다 효율적인 검정 방법을 제안한다. 제안된 방법은 예제를 통해 자세하게 논의된다.

한국어 정보검색에서 위치관계에 기반한 통계적 구 색인 (Statistical Phrase Indexing Based on Positional Relation for Korean Information Retrieval)

  • 홍금원;김상범;이상주;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.76-82
    • /
    • 2001
  • 최근 웹 문서의 규모가 커짐에 따라 높은 정확도를 필요로하는 정보검색시스템이 요구되고 있다. 구 색인은 정확도를 향상시킬 수 있는 방법으로 전통적으로 많이 사용되어 왔으며, 정보검색에서 사용하는 구는 크게 통계적인 구와 구문적인 구로 나눌 수 있다. 한국에서는 주최 복합명사를 처리하거나, 구문적인 구를 이용한 방법들만이 사용되어 왔고, 통계적인 구를 이용한 검색은 연구되지 않았다. 질의에 존재하는 구의 위치관계와 문서에 존재하는 구의 위치관계가 서로 동일하다면 그 문서는 그 질의와 더욱 유사할 것이라 판단하고, 본 논문에서는 통계적인 구에서 구 구성요소간의 위치관계를 고려한 정보검색 시스템을 제안한다. 명사구 이치의 유용한 구를 생성하기 위하여 내용어를 색인했으며 색인어간의 거리와 순서를 고려하여 가중치를 부여하였다. 명사구와 내용어에 기반한 구를 사용한 각각의 실험에서 거리에 따른 가중치를 부여하는 방법이 거리를 무시한 방법에 비해서 효과적이었고 구 구성요소간의 위치관계를 고려하는 것이 성능향상의 주요한 요인임을 알 수 있었다. 또한 명사위주의 질의에서는 내용어보다는 명사만을 색인하는 것이 효과적임을 알 수 있었다.

  • PDF

체육,스포츠과학 분야의 학문적 성장: 통계적 방법 적용의 역사

  • 강상조
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2002년도 추계 학술발표회 논문집
    • /
    • pp.43-49
    • /
    • 2002
  • 이 글은 체육 및 운동과학 연구에서 각종 통계적 방법의 출현을 역사적으로 개관하고 이들 통계적 방법의 출현시기를 미국의 경우와 비교함으로써 한국 체육학연구의 학문적 성장을 확인하고 이들 방법 적용과정에서 나타난 문제점을 밝히는데 목적이 있다. 이러한 목적을 달성하기 위해 통계적 방법 관련논문을 분석하고 통계적 방법이 체육 현장에서 어느 정도 중요하게 다루어 질 수 있는지를 확인하기 위해 측정,평가 담당교수의 학문적 배경과 교육적 경력을 조사하였다. 전공자의에 대한 의 체육학이 아직 학문적으로 자리를 잡기 전인 최초 태동 시기에 적용된 통계적 방법을 미국의체육학회지(RQES)와 비교해 볼 때 동일한 통계적 방법의 적용시기는 약 30년 차이가 있다. 이러한 차이는 미국에서 1980년도에 나타나기 시작한 진보된 다변량 통계기법을 1990년대에 적용하기 시작하면서 급속도로 좁혀졌으며 현재는 동일한 시기에 나타나고 있다. 그러나 진보된 통계적 기법의 출현에도 불구하고 이들 기법을 적용하는데 필요한 기본가정이 충족되었는지에 대한 검토 없이 적지않은 논문이 보고되고 있다. 담당교수의 학문적, 교육적 배경이 통계학과 거리가 있는 교수가 47%로 나타남으로써 가르치는 내용과 범위에서 적지않은 제약이 따르고 있다. 또한 전문가에 의한 평가체제가 확립되지 못함으로써 적용된 통계적 기법의 적절성을 평가하는데 장애가 되고 있다.

  • PDF

Default 연산 알고리즘을 적용한 통계적 문맥의존 철자오류 교정 기법의 성능 향상 (Improving the Performance of Statistical Context-Sensitive Spelling Error Correction Techniques Using Default Operation Algorithm)

  • 이정훈;김민호;권혁철
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.165-170
    • /
    • 2016
  • 본 논문에서 제안하는 문맥의존 철자오류 교정은 통계 정보를 이용한 방법으로 통계적 언어처리에서 가장 널리 쓰이는 샤논(Shannon)이 발표한 노이지 채널 모형(noisy channel model)을 기반으로 한다. 선행연구에서 부족하였던 부분의 성능 향상을 위해 교정대상단어의 오류생성 및 통계 데이터의 저장 방식을 개선하여 Default 연산을 적용한 모델을 제안한다. 선행 연구의 모델은 교정대상단어의 오류생성 시 편집거리의 제약을 1로 하여 교정 실험을 하지만 제안한 모델은 같은 환경에서 더욱 높은 검출과 정확도를 보였으며, 오류단어의 편집거리(edit distance) 제약을 넓게 적용하더라도 신뢰도가 있는 검출과 교정을 보였다.

  • PDF

동적 서명의 특징 정보에 대한 통계적 분석에 관한 연구 (A Study on a Statistical Analysis of the Feature Information for the Dynamic Signature Verification)

  • 김진환;조재현
    • 한국정보통신학회논문지
    • /
    • 제13권8호
    • /
    • pp.1693-1698
    • /
    • 2009
  • 본 논문에서는 서명에서 생성되는 속도 성분(방향 정보, 거리 정보)에서 방향 정보만을 특징 정보로 서명DB에서 저장하고 거리(속력) 정보는 조정상수(w)를 이용함으로써 오류율에 영향을 주지 않으면서 처리속도를 개선하고, 특징 정보 크기도 줄일 수 있었다. 이를 위해 통계적 검정 T-test를 이용하여 확인하였다.

Default 연산 알고리즘을 적용한 통계적 문맥의존 철자오류 교정 기법의 성능 향상 (Improving the Performance of Statistical Context-Sensitive Spelling Error Correction Techniques Using Default Operation Algorithm)

  • 이정훈;김민호;권혁철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.165-170
    • /
    • 2016
  • 본 논문에서 제안하는 문맥의존 철자오류 교정은 통계 정보를 이용한 방법으로 통계적 언어처리에서 가장 널리 쓰이는 샤논(Shannon)이 발표한 노이지 채널 모형(noisy channel model)을 기반으로 한다. 선행연구에서 부족하였던 부분의 성능 향상을 위해 교정대상단어의 오류생성 및 통계 데이터의 저장 방식을 개선하여 Default 연산을 적용한 모델을 제안한다. 선행 연구의 모델은 교정대상단어의 오류생성 시 편집거리의 제약을 1로 하여 교정 실험을 하지만 제안한 모델은 같은 환경에서 더욱 높은 검출과 정확도를 보였으며, 오류단어의 편집거리(edit distance) 제약을 넓게 적용하더라도 신뢰도가 있는 검출과 교정을 보였다.

  • PDF

직류전위차법 자료에 대한 통계적 자료분석 (Statistical analysis of direct current potential drop data)

  • 이정희;이우동
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권1호
    • /
    • pp.139-146
    • /
    • 2010
  • 비파괴검사방법 중 직류전위차법은 표면균열 측정에 유효한 수단으로 알려져 있다. 이차원 표면 균열을 가진 시험편에서 전류입출력점사이의 거리가 직류전위차에 미치는 영향을 알아보는 실험을 실시하여 자료를 얻었다. 이 자료로부터 전위차 값은 일정 전위차계측점사이의 거리에 있어 전류입출력점사이의 거리가 증가함에 따라 반비례적으로 감소하고, 노치의 길이에 비례하고 있었다. 이 실험에서 관찰된 자료를 통계적 모형에 적합시키고, 적합된 모형에서 전위차에 영향을 주는 유의한 변수를 알아보는 것은 비파괴검사에서 중요하다고 할 수 있다. 본 연구에서는 관찰된 자료를 적절하게 설명할 수 있는 통계적 모형을 제안하고, 제안된 모형에서 유의한 독립변수를 찾아보는 것이 목적이다.

상관관계를 가진 센서 요동에 의한 표적거리평가 (Range estimation with receiving hydrophones Subject to spatially correlated random motion)

  • 이효근
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1984년도 추계학술발표회 논문집
    • /
    • pp.107-112
    • /
    • 1984
  • 수동 Wave-front curvature ranging 방법의 통계적성능에 대한 일반적 결과가 유도된다. 센서들의 비선형 및 부동간격 센서들의 운동효과로 인한 표적거리의 편의(bias) 및 편차9variance)가 센서간의 운동이 상관관계를 가지고 있을 때 유도된다. 이 논문은 센서운동이 정규분포(normal distribution)를 가지며 평균이 0, 같은 편차 및 투시할 수 있는 higher moment를 가지고 있다고 가정한다. 유도된 일반적 결과를 이용하여 거리편의 및 편차는 표적거리, 방위, 센서운동의 상관계수 및 방향각(heading)표준편차 변화에 대해 그림으로 나타나 있다. 표적거리가 센서간격보다 아주 큰 경우 센서간격이 감소할수록, 표적거리가 증가할수록, 거리편의 및 편차는 증가한다. 상관계수가 증가할수록 거리편의는 직선적으로 감소하며, 거리편차는 센서 방향각 오차가 클 때 최소가 되는 상관계수가 존재하며 이는 표적거리, 방위 및 센서간격의 복합함수이다.

  • PDF

지진하중을 받는 사장교의 상태평가를 위한 새로운 통계적 패턴 인식 기술 (New Statistical Pattern Recognition Technology for Condition Assessment of Cable-stayed Bridge on Earthquake Load)

  • 허광희;김충길
    • 대한토목학회논문집
    • /
    • 제34권3호
    • /
    • pp.747-754
    • /
    • 2014
  • 마할라노비스 거리 이론에 기초한 통계적 패턴 인식 기술은 안정된 외부하중에 대한 구조물 상태 평가에 대한 유용성에도 불구하고 지진과 같이 큰 변동성의 외부하중에 대한 구조물의 건전도 모니터링에는 취약하다. 손상은 일반적으로 손상되지 않은 구조물의 측정된 값의 평균과 손상된 구조물의 측정값 사이의 차이에 의해 결정된다. 외부 하중의 변동성이 커질수록 더 큰 차이가 발생하고, 이는 손상으로 인식되기 쉽다. 본 논문에서는 이러한 문제를 극복하고 불확실한 외부 하중을 받는 구조물을 지속적으로 모니터링 할 수 있도록 외부 변동성을 감소시키기 위해 마할라노비스 거리 이론을 수정한 통계적 패턴 인식 기술인 개선된 마할라노비스 거리 이론을 개발하였다. 이 방법은 일반적인 임의의 하중과 지진하중에서 정확하게 사장교의 건전도를 평가하는 것을 실험적으로 확인 하였다. 그 결과, IMDT는 손상되지 않은 케이블로부터 획득한 데이터로 손상된 케이블에 의한 구조물의 손상을 파악하는 데 유효한 것을 확인하였다. 따라서 변동성을 지닌 외부하중에 의한 교량의 건전도 모니터링에 효과적으로 적용할 수 있음을 입증하였다.

축구 경기에서 선수의 이동 거리와 경기 승율과의 관련성에 관한 통계적 연구 (A Statistical Study on Relationship between Running Distance of Players and Strike Rate in A Soccer Game)

  • 오경석;최유주;양장훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.1577-1578
    • /
    • 2015
  • 다양한 객체 추적 기술들이 스포츠 분야에 활용이 되면서, 방송이나 경기력 분석에 많이 사용되고 있다. 이 연구에서는 2014년도 K리그 경기중 승패가 결정된 17경기를 동영상 경기 분석 프로그램으로 처리된 데이터를 활용하여 뛴 거리와 경기 승패와의 관련성에 대해서 통계적으로 분석한다. 뛴거리는 총 뛴거리, 점유시 뛴거리, 비점유시 뛴거리로 나누어 분석하고, 그 결과 비점유시 뛴거리의 차이가 경기의 승패에 영향을 준다는 것을 카이검정을 통해 확인하였다.