• Title/Summary/Keyword: 통계 처리

Search Result 3,103, Processing Time 0.03 seconds

Labeled Statistical Korean Dependency Parsing with Global and Local Information (전역 및 지역 정보를 이용한 SVM 기반 한국어 문장 구조 및 격 레이블 분석)

  • Lim, Soojong;Lee, Changki;Jang, Myung-Gil;Ra, DongRyul
    • Annual Conference on Human and Language Technology
    • /
    • 2009.10a
    • /
    • pp.207-212
    • /
    • 2009
  • 한국어 문장의 구조 및 격 레이블 분석을 위해서 SVM 모델을 이용하여 얻어진 전역 및 지역 정보 통계 모델에 기반한 방법을 제안한다. 제안하는 방법은 후방 beam search 알고리즘을 이용하여 부분 구문 분석을 하는 과정에서 지역 의존 정보를 사용하였고 이렇게 구성된 문장의 후보 구조에 대해서는 전역 정보 모델를 사용하여 최적의 문장 구조 및 격 레이블을 분석하였다. 제안하는 방법은 지역이나 전역 중 한 개의 모델만을 사용할 때 발생할 수 있는 오류를 최소화하였다. 지식 DB 사업의 한국어 의존 구문 분석 말뭉치를 이용하여 실험한 결과 전역 정보나 지역 정보만을 사용한 결과보다 각각 1.2%, 3.3% 높은 79.1%의 문장 구조 및 격 레이블 분석 정확률을 나타냈고 전역 정보만을 사용할 때보다 약 76배 이상의 빠른 속도 향상을 보였다. 향후 연구로는 지배소 단위, 구 묶음 단위 등으로 통계 정보를 세분화하여 좀더 높은 성능 향상을 기대한다.

  • PDF

Imputation for Binary or Ordered Categorical Traits Based on the Bayesian Threshold Model (베이지안 분계점 모형에 의한 순서 범주형 변수의 대체)

  • Lee Seung-Chun
    • The Korean Journal of Applied Statistics
    • /
    • v.18 no.3
    • /
    • pp.597-606
    • /
    • 2005
  • The nonresponse in sample survey causes a problem when it comes time to analyze dataset in public-use files where the user has only complete-data methods available and has limited information about the reasons for nonresponse. Recently imputation for nonresponse is becoming a standard approach for handling nonresponse and various imputation methods have been devised . However, most imputation methods concern with continuous traits while many interesting features are measured by binary or ordered categorical scales in sample survey. In this note. an imputation method for ignorable nonresponse in binary or ordered categorical traits is considered.

Effect of Balance Ability and Walking in the Elderly by Taekwon-do Program (태권도 프로그램이 노인의 체중심 동요와 보행에 미치는 영향)

  • Kim, Jun-Hyun;Park, Sung-Jin
    • Journal of the Korean Society of Physical Medicine
    • /
    • v.7 no.3
    • /
    • pp.379-385
    • /
    • 2012
  • 연구목적 : 본 연구의 목적은 태권도 프로그램이 노인의 균형능력에 어떠한 영향을 미치는지에 대해 알아보는 것이다. 연구방법 : 대상자는 본 연구에 대해 설명을 들은 후 자원한자로서 65세 이상의 노인이었다. 실험군은 태권도 프로그램 그룹으로서 17명이었다. 태권도 프로그램을 주3회씩 6주간 시행하였고 모든 대상자의 균형능력을 평가하기 위하여 BPM, GAITrite, Berg 균형척도를 실험전후로 평가하여 자료를 수집하였다. 수집된 자료는 SPSS 14.0으로 대응표본 t-test를 사용하여 유의수준 ${\alpha}$=.05에서 통계 처리 하였다. 연구결과 : 태권도 프로그램을 시행한 결과 프로그램 실행 전에 비해 오른쪽 활보폭, 왼쪽 보폭, 왼쪽 활보폭, 버그 균형척도에서 통계적으로 유의한 증가를 나타내었다. 그리고 최대 동요속도, 동요거리, 오른쪽 기저 지지면, 오른쪽 양하지 지지기, 왼쪽 기저지지면, 왼쪽 양하지 지지기에서 통계적으로 유의한 감소가 있었다. 결론 : 태권도 프로그램을 시행한 결과 오른쪽 활보폭, 왼쪽 보폭, 왼쪽 활보폭, 버그 균형척도에서 유의한 증가와 최대 동요속도, 동요거리, 오른쪽 기저 지지면, 오른쪽 양하지 지지기, 왼쪽 기저지지면, 왼쪽 양하지 지지기에서 유의한 감소는 균형 제어에 긍정적인 영향을 미칠 것으로 판단된다. 따라서 이러한 균형 제어 능력의 향상은 노인의 보행에 있어서의 낙상 예방에 효과적일 것으로 사료된다.

Comparison of Statistical Models for Analysis of Fatigue Life of Cable (케이블 피로 수명 해석 통계 모델 비교)

  • Suh, Jeong-In;Yoo, Sung-Won
    • Journal of the Korea institute for structural maintenance and inspection
    • /
    • v.7 no.4
    • /
    • pp.129-137
    • /
    • 2003
  • The cable in the cable-supported structures is long, therefore it can be reasonable to apply the different models, compared with those used for general steel elements. This paper compares the statistical models with existing cable fatigue data, after deriving the cdf(cumulative distibution function) with modifying the log-normal distribution, the existing extremal distributions so as to include length effect. The paper presents the appropriate model for analyzing and assessing the fatigue behavior of cable which is being used for actual structures.

Comparison of Scala and R for Machine Learning in Spark (스파크에서 스칼라와 R을 이용한 머신러닝의 비교)

  • Woo-Seok Ryu
    • The Journal of the Korea institute of electronic communication sciences
    • /
    • v.18 no.1
    • /
    • pp.85-90
    • /
    • 2023
  • Data analysis methodology in the healthcare field is shifting from traditional statistics-oriented research methods to predictive research using machine learning. In this study, we survey various machine learning tools, and compare several programming models, which utilize R and Spark, for applying R, a statistical tool widely used in the health care field, to machine learning. In addition, we compare the performance of linear regression model using scala, which is the basic languages of Spark and R. As a result of the experiment, the learning execution time when using SparkR increased by 10 to 20% compared to Scala. Considering the presented performance degradation, SparkR's distributed processing was confirmed as useful in R as the traditional statistical analysis tool that could be used as it is.

A Computerized Acqusition System Design and Implement for an University Library (대학도서관 전산화 수서업무 시스템의 설계와 구현)

  • 김상기;이용민
    • Journal of the Korean Society for information Management
    • /
    • v.11 no.1
    • /
    • pp.167-187
    • /
    • 1994
  • This project is to design and to implement an cornputenzed acquisition system by structured analysis technique for the Yomi university library. In result of desgmng, we added three subsystems, whlch are accession control, account, and print out system, to DOBIS/E acquisition system because we found that our DOBIS/E acquision system is able to use as we do ordenng and receiving in traditional process. DOBIS/E system and three added subsystems is closely related, and allow acquisition librarians to work more efficiently than before.

  • PDF

Estimation Methods for Linear Spatial Model on Lattice (Lattice형 공간정보의 선형모형 추정방법)

  • Gwon, O-Ryong;Yeom, Jun-Geun
    • The Transactions of the Korea Information Processing Society
    • /
    • v.3 no.1
    • /
    • pp.153-159
    • /
    • 1996
  • Linear models for spatial data are proposed by example in the paper. This method was introduced to Korea for the first time in the early part of 1990's. The correlation of spatial patterns is computed by Moran Index., and then correlogram is proposed as the method to identify correlation of spatial patterns. Due to computational difficulties with ML, an alternative estimator has been used as an eigenvalue method.

  • PDF

The phoneme segmentatioi with MLP-based postprocessor on speech synthesis corpora (합성용 운율 DB 구축에서의 MLP 기반 후처리가 포함된 음소분할)

  • 박은영
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.08a
    • /
    • pp.344-349
    • /
    • 1998
  • 음성/언어학적 및 음성의 과학적 연구를 위해서는 대량의 음소 단위 분절 레이블링된 데이터베이스 구축이 필수적이다. 따라서, 본 논문은 음성 합성용 DB 의 구축 및 합성 단위 자동 생성 연구의 일환으로 자동 음소 분할기의 경계오류를 보상할 목적으로 MLP 기반 호처리기가 포함된 음소 분할 방식을 제안한다. 최근 자동 음소 분할기의 성능 향상으로 자동 분절 결과를 이용하여 음성 합성용 운율 DB를 작성하고 있으나, 여전히 경계오류를 수정하지 않고서는 합성 단위로 직접 사용하기 어렵다. 이로 인해 보다 개선된 자동 분절 기술이 요구된다. 따라서, 본 논문에서는 음성에 내제된 음향적 특징을 다층 신경회로망으로 학습하고, 자동 분절기 오류의 통계 특성을 이용하여 자동 분절 경계 수정에 용이한 방식을 제안한다. 고립단어로 발성된 합성 데이터베이스에서, 제안된 후처리기를 도입 후, 기존 자동 분절 시스템이 분할율에 비해 약 25% 의 향상된 성능을 보였으며, 절대 오류는 약 39%가 향상되었다.

  • PDF

A Design and Implementation for a Bibliography Support System with XML Data Processing (XML 데이터 처리 기반의 참고문헌 지원 시스템의 설계 및 구현)

  • 신행자
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.726-728
    • /
    • 2000
  • 본 논문에서는 최근 인터넷 상에서 표준 공통 포맷으로 대두되고 있는 XML을 이용하여 웹 기반 원격 교육 시스템에서 강의 내용에 참조도리 참고문헌 지원 시스템을 설계하고 구현하였다. Three-tier 환경에서 구현한 이 시스템은 middle-tier인 웹 서버에서 데이터베이스에 저장된 참고문헌을 XML 데이터로 변환하여 효과적으로 처리함으로써 서버의 부하를 감소시키며 이것은 성능 향상으로 이어져 학습자에게 더 나은 속도로 원격 교육의 참고문헌 정보서비스를 제공할 수 있다. 또한 동적으로 서버와 상호작용 가능하도록 학습자가 c마고 문헌의 유익함 정도를 매긴 등급 점수 계산에 직접 참여시켜 그 결과를 볼 수 있도록 하여 학습 의욕을 더욱 고취시킬 수 있다. 앞으로 웹기반 원격교육의 참고문헌 지원 시스템은 세계 각 대학이나 연구소에 분산되어 있는 여러 데이터 소스로부터 필요한 정보만을 실시간으로 추출하여 수집, 통합, 통계 처리할 수 있도록 확장될 수 있을 것이다.

  • PDF

Separation of Mixed Fingerprints Using Fired-point ICA and Robust ICA (Fixed-point ICA와 Robust ICA에 의한 혼합지문영상 분리)

  • Cho, Yong-Hyun;Kim, A-Ram;Oh, Jeung-Eun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.11b
    • /
    • pp.627-630
    • /
    • 2003
  • 본 연구에서는 고정점 알고리즘의 독립성분분석과 원 신호의 시간적 상관성을 고려한 견실 알고리즘의 독립성분분석을 각각 이용하여 혼합지문영상을 분리하였다. 여기서 고정점 알고리즘은 뉴우턴법의 경신규칙을 이용함으로써 빠른 분리속도를 가진다. 견실 알고리즘은 2차적 통계성의 일괄처리 알고리즘으로 시간적 상관성과 낮은 kurtosis를 가진 영상분리에 효과적이다. 이들 기법들을 $256{\times}256$ 픽셀의 8개 지문으로부터 임의의 혼합행렬에 따라 발생되는 지문의 분리에 적용한 결과, 견실 알고리즘이 고정점 알고리즘의 독립성분분석에 비해 우수한 분리성능과 빠른 분리속도가 있음을 확인하였다.

  • PDF