• Title/Summary/Keyword: 통계적 거리

Search Result 272, Processing Time 0.032 seconds

Usenet News Filtering by Using Statistical Coefficient of Determination (통계적 결정계수를 이용한 유즈넷 뉴스 필터링)

  • 김종완;김희재;김병만
    • Proceedings of the Korea Society for Industrial Systems Conference
    • /
    • 2003.11a
    • /
    • pp.747-752
    • /
    • 2003
  • 많은 양의 유즈넷 뉴스 중에서 사용자가 찾고자 하는 정확한 정보를 빠른 시간 안에 검색하고, 원하는 정보만 필터링 하는 것은 중요하다. 그러나 뉴스 문서는 이메일과 달라서 미리 자신에게 맞는 뉴스그룹을 등록해 주어야만 정보를 얻을 수 있다. 본 연구에서는 다양한 뉴스그룹들 중에서 사용자와 취향이 가장 유사한 뉴스그룹을 분류하여 뉴스 문서의 키워드들을 선택하기 위해 예제 문서들로부터 후보 용어들을 추출하고 퍼지 추론을 적용하여 대표용어들을 선택한다. 이에 본 연구에서는 통계적인 결정계수를 도입하여 불필요한 차원을 제거한 후 신경망을 학습시키는 새로운 방법을 제안한다. 제안된 방법은 모든 차원을 활용할 때 보다 클러스터간 거리와 표준편차, 클러스터간 거리의 척도 면에서 우수한 분류 성능을 보여줌을 확인하였다.

  • PDF

Analysis of Trip Length Distribution between Commodity-Based Model and Truck Trip-Based Model in Seoul Metropolitan Area (화물기반모형과 트럭통행기반모형의 통행거리분포 분석에 관한 연구)

  • 권혁구;김건영;임홍상;강경우
    • Journal of Korean Society of Transportation
    • /
    • v.20 no.2
    • /
    • pp.125-134
    • /
    • 2002
  • 도시화물수요예측모형에는 화물기반모형과 트럭통행기반모형이 있는데 화물기반모형은 화물체계가 기본적으로 화물운송과 관계가 있다는 개념에 기초를 두고 있으며, 차량이 아닌 화물의 움직임을 주요 분석대상으로 삼고 있다. 반면에, 트럭통행기반모형은 집합화된 독립변수를 이용하여 각 죤(Zone)에 유·출입하는 트럭의 통행을 분석하는 것이다. 본 연구의 목적은 트럭통행기반모형의 O-D 추정시 화물통행과 트럭통행 사이의 관계식을 산출하고 이를 설명할 수 있는 통행거리분포함수(Trip Length Distribution : TLD)를 추정함에 있다. 본 연구의 자료는 교통개발연구원에서 수행한 '서울시 물류조사 및 물류종합계획수립구상(1998)'의 화물 물동량 조사 자료를 이용하였으며, 이를 통해 통행거리분포에 따르는 화물 및 차량의 비율을 함수로서 나타내었다. 본 연구를 통하여 트럭통행기반모형에서 트럭통행거리분포를 이용하여 화물기반모형에서 도출할 수 있는 화물의 통행거리분포를 추정할 수 있었으며, 또한 각각의 통행거리분포는 감마분포를 이용하여 함수식으로 도출하고 상기한 두 가지 분포모형을 하나의 관계식을 통해 재산정할 수 있는 이론적인 틀을 제공하였다는 데 의의가 있다고 하겠다. 트럭통행거리분포, 화물통행거리분포 모두 통계적인 검증을 통해 적합한 것으로 분석되었으며, 전체화물의 통행거리분포와 매개함수를 통해 재산정된 모형의 결과 값 또한 통계적으로 유의하였다. 품목별 적용에서는 잡공업품과 화학공업품은 본 연구의 매개함수식을 통해 화물거리분포 모형이 적합하였으나 금속공업 품과 경공업품은 다소 차이가 있는 것으로 분석되었다.

Post-Processing of Speech Recognition Using Phonological Variables and Improved Edit-distance (발음 변이와 개선된 편집 거리를 이용한 음성 인식 후처리)

  • Kim, Yejin;Park, Youngmin;Kang, Sangwoo;Jung, Sangkeon;Lee, Cheongjae;Seo, Jungyun
    • Annual Conference on Human and Language Technology
    • /
    • 2014.10a
    • /
    • pp.9-12
    • /
    • 2014
  • 본 논문에서는 오인식된 고유명사의 후처리 방법을 제안한다. 최근 음성 인식 후처리를 위해 통계적 방법을 이용하는 연구가 활발히 진행되어 왔다. 하지만 고유명사의 음성 인식 후처리는 대용량의 데이터 수집에 많은 비용이 필요하므로 통계적 방법을 효과적으로 적용하기 어렵다. 따라서 본 논문에서는 발음 변이 현상을 고려하여 편집 거리 알고리즘을 개선한 기법을 제안한다. 본 논문에서는 고유명사의 음성 오인식 교정 성능을 검증하였고, 그 결과 P@3의 결과가 비교 모델보다 55%의 성능 향상률을 보였다.

  • PDF

Statistical Analysis of VHF Channel Over the Sea Surface for Various Ranges (거리에 따른 해상 초단파 채널의 통계적 특성 분석)

  • Kim, Sea-Moon;Byun, Seong-Hoon;Kim, Seung-Geun;Yun, Chang-Ho;Lim, Yong-Kon
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.36 no.8B
    • /
    • pp.1021-1027
    • /
    • 2011
  • VHF is generally used for data or voice communications between ships and land stations. Although there exist many analytical and empirical channel models for radio waves on land, over-the-sea models are very limited to basic description. In this paper, a VHF channel is measured using vertical and/or horizontal whip antennas on shore and a moving ship for various ranges. The results show that the Doppler shift and changes in power for various ranges are observed. We can also find that the statistical analysis results in that the statistical parameters are rapidly changes, especially for V/H and H/V channels.

The Application of Bootstrap Methods for Correspondence Analysis (대응분석에 있어서 붓스트랩 방법의 활용에 대한 고찰)

  • 강창완;김대학;전명식
    • The Korean Journal of Applied Statistics
    • /
    • v.14 no.2
    • /
    • pp.401-413
    • /
    • 2001
  • 이차원 분할자료에 대해서 행과 열의 관계를 저차원상에 시각적으로 표현하는 탐색적대응분석에 대하여 붓스트랩방법의 사용가능성을 살펴보았다. 기존의 탐색적 면만이 강조되어 왔던 대응분석에서 좌표점의 변이와 좌표점간의 거리에 대한 통계적 추론을 붓스트랩방법으로 해결할 수 있음을 보이고 또한 좌표축의 설명력에 대하여 붓스트랩신뢰구간의 포함확률의 일치성을 모의실험을 통해 제시하였다.

  • PDF

Disease Dispersal Gradients of Rice Blast from a Point Source (점접종원으로부터 벼 도열병 확산의 경사)

  • Kim Choong Hoe
    • Korean Journal Plant Pathology
    • /
    • v.3 no.2
    • /
    • pp.131-136
    • /
    • 1987
  • Rates of lesion development over time and disease gradients over distance for blast disease on the two rice varieties, Brazos and M-20 1 were significantly affected by two different cultural conditions, upland and flooded conditions. Flooding rice field plots lowered the rates of lesion increase and flattened the disease gradients for both varieties. Despite absence of statistically significant differences in the rate of lesion increase between four sampled distances from infection focus, rate of lesion development tended to be slightly greater as distance from the infection focus increases. Rate of lesion increase was greater with more susceptible variety M-201 than with Brazos. Disease gradient was steeper for M-201 than for Brazos. As blast disease progressed, disease gradients became flattened regardless of variety due to the infections originated from secondary foci. Between two empirical disease gradient models examined, Kiyosawa & Shiyomi model was fitted better over Gregory model. Rates of blast isopath movement under upland conditions were calculated as approximately 0.2m/day and 0.4 m/day for Brazos and M-201, respectively. The results in this study suggest that differences in varietal resistance to blast could be detected by measuring disease gradient as efficiently as by measuring infection rate.

  • PDF

Determination of Usenet News Groups by Fuzzy Inference and Neural Network (퍼지추론과 신경망을 사용한 유즈넷 뉴스그룹 결정)

  • 김종완;김희재;김병만
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2004.04a
    • /
    • pp.401-404
    • /
    • 2004
  • 본 연구에서는 다양한 뉴스그룹들 중에서 사용자의 취향과 유사한 뉴스그룹들을 코호넨 신경망을 이용하여 추천해주는 방법을 제시한다. 신경망을 학습시키기 위한 뉴스 문서의 키워드들을 선택하기 위해 여러 문서들로부터 후보 용어들을 추출하고 퍼지 추론을 적용하여 대표 용어들을 선택한다. 하지만 신경망의 학습패턴을 관찰해 보면, 맡은 부분이 비어있는 희소성 문제를 발견할 수 있다. 이에 본 연구에서는 통계적인 결정계수를 도입하여 불필요한 차원을 제거한 후 신경망을 학습시키는 새로운 방법을 제안한다. 제안된 방법은 모든 차원을 활용할 때 보다 클러스터내 거리와 클러스터간 거리의 척도를 이용한 클러스터 중첩도 면에서 우수한 분류 성능을 보여줌을 확인하였다.

  • PDF

Statistical Analysis of ESDD on the Distance from the Coast (해안거리에 따른 ESDD의 통계적 분석)

  • Kim, Chan-Young;Kim, Dong-Myung;Chang, Joon-Soo
    • Proceedings of the KIEE Conference
    • /
    • 2007.07a
    • /
    • pp.1474-1475
    • /
    • 2007
  • 해안거리에 따른 등가염분부착밀도(Equivalent Salt Deposit Density)의 수동오손측정은 동해, 서해, 남해의 해안가 및 제주도, 진도, 거제도의 도서지역에 설치되어 있는 112개소에서 매월 1개월 누적오손을 측정하였다. 이와 같이 수동으로 측정된 ESDD는 전력연구원에서 수행한 "전력설비의 염진해 대책에 관한연구(1988)" 및 "염진해 오손정도 및 기준정립에 관한 연구(2002)"에서 분석기법으로 활용한 통계분석기법을 사용하여 분석하였다.

  • PDF

Comparison of Kinematic Variables Between Elite Golfer and Novice During Golf Putting (골프 퍼팅 시 엘리트와 초보자들의 퍼팅 동작에 따른 운동학적 비교 분석)

  • Park, Jun-Sung;Lim, Young-Tae;Lee, Jae-Woo;Kwon, Moon-Seok
    • Journal of the Korean Applied Science and Technology
    • /
    • v.36 no.3
    • /
    • pp.789-796
    • /
    • 2019
  • The purpose of this study was to compare kinematic variables between elite golfer and novice during golf putting. 23 elite golfers and 19 novice were participated, and SAM Putt was used to collect kinematic variables. To identify main effect and interaction effect, it was performed Two-way Mixed ANOVA at a significant level of a .05. Elite and novice group, follow-through was significantly different and indicated main effect between distance and skill level. Impact, backswing, and loft angle were significantly different and showed main effect between skill level. Also, backswing rhythm and impact timing were significantly different and indicated main effect between skill level. Therefore, minimizing the movement of the wrist and keeping the putting strike rhythm may improve the putting ability.

A Study on the Signature Verification Feature by Statistical Analysis (통계적 분석에 의한 서명 특징정보에 관한 연구)

  • Kim, Jin-whan;Cho, Jae-hyun
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2009.05a
    • /
    • pp.865-867
    • /
    • 2009
  • This paper is a research on the statistical analysis of the feature information for the dynamic signature verification. we could improved processing time and reduce signature database without increase of error rate. We have used statistical analysis method T-test for the verification based on the experimental results.

  • PDF