• Title/Summary/Keyword: 통계적 학습

Search Result 506, Processing Time 0.024 seconds

Scaling Documents' Semantic Transparency Spectrum with Semantic Hypernetwork (Semantic Hypernetwork 학습에 의한 자연언어 텍스트의 의미 구분)

  • Lee, Eun-Seok;Kim, Joon-Shik;Shin, Won-Jin;Park, Chan-Hoon;Zhang, Byoung-Tak
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2008.06c
    • /
    • pp.289-294
    • /
    • 2008
  • 어떤 자연언어 문서가 전달하려는 의미는 그 텍스트의 성격에 따라 아주 명확할 수도(예: 뉴스 문서), 아주 불분명할 수도 있다(예: 시). 이 연구는 이러한 '의미의 명확성(semantic transparency)'을 정량적으로 측정할 수 있다고 가정하고, 이 의미의 명확성을 판단하는 데에 단어들의 연쇄(word association)의 확률통계적 성질들이 어떻게 기능하는지에 대해 논한다. 이를 위해 특정 단어가 연쇄체를 형성하면서 발생하는 neighboring frequency와 degeneracy를 중심으로 Markov chain Monte Carlo scheme을 적용하여 의미망('Semantic Hypernetwork')으로 학습시킨 후 문서의 구성 단어들과 그 집합들 간의 연결 상태를 파악하였다. 우리는 의미적으로 그 표상이 분명하게 나뉘는 문서들(뉴스와 시)을 대상으로 이 모델이 어떻게 이들의 의미적 명확성을 분류하는지 분석하였다. Neighboring frequency와 degeneracy, 이 두 속성이 언어구조에서의 의미망 기억과 학습 탐색 기제에 유의한 기질로서 제안될 수 있다. 본 연구의 주요 결과로 1) 텍스트의 의미론적 투명성을 구별하는 통계적 증거와, 2) 문서의 의미구조에 대한 새로운 기질 발견, 3) 기존의 문서의 카테고리 별 분류와는 다른 방식의 분류 방식 제안을 들 수 있다.

  • PDF

Bayesian Parameter Estimation Considering User-input for Korean Word Spacing Model (한국어 띄어쓰기 모델에서 사용자 입력을 고려한 베이지언 파라미터 추정)

  • Lee, Jeong-Hoon;Hong, Gum-Won;Lee, Do-Gil;Rim, Hae-Chang
    • Annual Conference on Human and Language Technology
    • /
    • 2008.10a
    • /
    • pp.5-11
    • /
    • 2008
  • 한국어 띄어쓰기에서 통계적 모델을 사용한 기존의 연구들은 최대우도추정(Maximum Likelihood Estimation)에 기반하고 있다. 그러나 최대우도추정은 자료부족 시 부정확한 결과를 주는 단점이 있다. 본 연구는 이에 대한 대안으로 사용자 입력을 고려하는 베이지언 파라미터 추정(Bayesian parameter estimation)을 제안한다. 기존 연구가 사용자 입력을 교정 대상으로만 간주한 것에 비해, 제안 방법은 사용자 입력을 교정 대상이면서 동시에 학습의 대상으로 해석한다. 제안하는 방법에서 사용자 입력은 학습 말뭉치의 자료부족에서 유발되는 부정확한 파라미터 추정(parameter estimation)을 방지하는 역할을 수행하고, 학습 말뭉치는 사용자 입력의 불확실성을 보완하는 역할을 수행한다. 실험을 통해 문어체 말뭉치, 통신환경 구어체 말뭉치, 웹 게시판 등 다양한 종류의 말뭉치와 다양한 통계적 모델에 대해 제안 방법이 효과적임을 알 수 있다.

  • PDF

Preliminary Research on Domestic Application of Vegetation Drought Response Index (VegDRI) (식생가뭄반응지수(VegDRI) 국내 적용방안 기초연구)

  • Park, Junehyeong;Ji, Hee-sook;Lim, Yoon-Jin;Kim, Baek-Jo
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.248-248
    • /
    • 2017
  • 최근 가뭄 모니터링을 위해 과거에 비하여 고해상도의, 물리적으로 기반을 두는 정보가 요구되고 있다. 기존에 주로 활용하고 있는 통계적 방법론 기반의 가뭄지수들은 지니고 있는 한계에 대해 여러 개선과정을 거치고 있으나, 기상변수로부터 지표상의 식생 관련 변수로의 전파 과정에 대한 개별 통계적 가뭄지수 간의 관계 설명이 매우 어렵다. 이와 같은 관계로, 국내 유역에서의 물리적 기반을 둔 고해상도 가뭄 판단방법에 대한 시도가 필요한 시점이다. Brown et al. (2008)은 위성기반 식생정보, 기상학적 가뭄지수, 지형학적 조건을 고려한 식생가뭄반응지수(Vegetation Drought Response Index; 이하 VegDRI)를 개발하였다. 학습자료에 대해 CART 기반의 경험적 모델을 구축하여, 격자마다 근-실시간 자료를 적용한 VegDRI를 산출하여 고해상도의 지도를 산출하는 방식을 제시하였다. VegDRI는 NCDC의 U.S. Drought Monitoring에 활용되고 있으며, NOAA의 Drought Task Force Assessment Protocol에서는 가뭄 모니터링의 기준으로 설정되어 있다. 본 연구에서는 국내에 VegDRI를 적용하고자 필요한 자료수집 및 전처리 과정을 거쳐 결과를 도출하였다. 기상청 ASOS 기상관측소에서 얻은 기상변수, MODIS 위성으로부터 추출된 정규식생지수(Normalized Difference Vegetation Index; NDVI), 지형학적 정보와 기상학적 가뭄지수(SPI, PDSI)를 기계학습으로 모델링하여 VegDRI를 산출하였다. 산출된 VegDRI 공간분포도에 대하여 기존에 활용되던 유관기관의 가뭄 판단방법과의 유사성과 차이점을 비교 검토하여 적용성을 평가하였다.

  • PDF

Voice Activity Detection Based on Discriminative Weight Training with Feedback (궤환구조를 가지는 변별적 가중치 학습에 기반한 음성검출기)

  • Kang, Sang-Ick;Chang, Joon-Hyuk
    • The Journal of the Acoustical Society of Korea
    • /
    • v.27 no.8
    • /
    • pp.443-449
    • /
    • 2008
  • One of the key issues in practical speech processing is to achieve robust Voice Activity Deteciton (VAD) against the background noise. Most of the statistical model-based approaches have tried to employ equally weighted likelihood ratios (LRs), which, however, deviates from the real observation. Furthermore voice activities in the adjacent frames have strong correlation. In other words, the current frame is highly correlated with previous frame. In this paper, we propose the effective VAD approach based on a minimum classification error (MCE) method which is different from the previous works in that different weights are assigned to both the likelihood ratio on the current frame and the decision statistics of the previous frame.

Three-Dimensional Active Shape Models for Medical Image Segmentation (의료영상 분할을 위한 3차원 능동 모양 모델)

  • Lim, Seong-Jae;Jeong, Yong-Yeon;Ho, Yo-Sung
    • Journal of the Institute of Electronics Engineers of Korea SC
    • /
    • v.44 no.5
    • /
    • pp.55-61
    • /
    • 2007
  • In this paper, we propose a three-dimensional(3D) active shape models for medical image segmentation. In order to build a 3D shape model, we need to generate a point distribution model(PDM) and select corresponding landmarks in all the training shapes. The manual determination method, two-dimensional(2D) method, and limited 3D method of landmark correspondences are time-consuming, tedious, and error-prone. In this paper, we generate a 3D statistical shape model using the 3D model generation method of a distance transform and a tetrahedron method for landmarking. After generating the 3D model, we extend the shape model training and gray-level model training of 2D active shape models(ASMs) and we use the integrated modeling process with scale and gray-level models for the appearance profile to represent the local structure. Experimental results are comparable to those of region-based, contour-based methods, and 2D ASMs.

A Case Study aimed at Junior High School 3rd Grade Student's Understanding of Variability (중학교 3학년 학생들의 변이성 이해에 대한 사례 연구)

  • Song, Seon-A;Lee, Kyung-Hwa
    • School Mathematics
    • /
    • v.9 no.1
    • /
    • pp.29-44
    • /
    • 2007
  • The aim of statistics education is to enhance statistical thinking. Variability is the key components of statistical thinking. The research has been reviewed preceding research about variability of data. Proceeding from what has been considered above, this research developed learning materials that investigated the concept of variability as it relates to Freudenthal's context by having students sort a particular context. The research is executed the case study evidently aimed at Junior High School 3rd Grade Student's Understanding of Variability. The study of variability in data can be an important start to reach a testing of statistical hypothesis; students reduce data and draw graphs by relating probability distribution to relative frequency and normal distribution. Thus, this study offers basic materials into developing both contents and methods of education need to consider with this sense of purpose held by students to achieve this goal.

  • PDF

Semi-Automatic Tree Annotating Workbench Using Neural-Networks (신경망을 이용한 반자동 구문분석 말뭉치 구축도구)

  • 임준호;곽용재;박소영;임해창
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.483-485
    • /
    • 2003
  • 구문분석 말뭉치는 통계적 구문분석 분야의 필수적인 항목으로 많은 유용성을 가지지만, 말뭉치를 구축할 때 막대한 시간과 비용이 요구되기 때문에 구축자의 수작업을 감소시키는 방법에 대한 연구가 필요하다. 본 논문에서는 대량의 신뢰도 있는 구문분석 말뭉치를 구축하기 위해 신경망을 사용하는 반자동 구문 분석 말뭉치 구축도구에 대해서 설명한다. 개발된 도구는 구문패턴 추골, 신경망 학습, 반자동 구축의 세 단계로 구성된다. 구문패턴 추출 단계에서는 사용자가 정의한 자질집합을 사용하여 기존에 구축된 말뭉치에서 구문패턴들을 추출하고, 신경망 학습의 단계에서는 추출된 구문패턴들을 사용하여 신경망을 학습한다. 그리고, 반자동 구축 단계에서는 학습된 신경망을 사용하여 반자동으로 구문분석 말뭉치를 구축한다. 본 논문에서 제안하는 방법은 다양한 자질집합을 조합하여 사용할 수 있고, 학습을 사용하기 때문에 학습 집합에 나타나지 않은 경우에 대해서도 합리적인 결정을 내릴 수 있다. 소량의 구문분석 말뭉치를 대상으로 실험한 결과, 본 논문에서 제안하는 방법이 약 42.5%의 수작업 횟수 감소율을 보였음을 알 수 있었다.

  • PDF

The Study of an Improvement of Learning understanding Ability Throught Practice to Based Evidence (EBP를 통한 학습 이해 능력 개선에 관한 연구)

  • Lee, Dong-Yeop
    • Proceedings of the KAIS Fall Conference
    • /
    • 2011.05b
    • /
    • pp.590-593
    • /
    • 2011
  • 본 연구는 물리치료학과 학생들을 대상으로 근거중심의 학습을 통해 학습 이해도와 성취도, 실무능력을 증진시키고자 하는 연구를 실시하였다. 과학적이고 근거중심의 단계별 수업을 이수한 1학년 대상자인 17명이 연구에 참여하였고, 남자와 여자로 구분하여 강의전, 후로 나누었다. 성별에 따른 성취도 분석과 강의 전, 후에 따른 근거중심 학습의 효용성에 관한 특성을 비교하였다. 통계처리 방법으로 실험 전 후 차이를 검증하였고, 모든 통계적 유의수준은 0.05로 하였다. 본 연구의 결과 근거중심 학습의 필요성, 학습 시너지 효과, 전문학술지 접근도에서 강의 전에 비해 후에 유의한 감소를 보였다. 향후 저학년인 1, 2학년 물리치료학과 학생들에게 흥미를 유발하고 동기를 부여하여 저널 탐색을 통한 임상 물리치료에 대한 접근도를 강화시킬 필요가 있고 이를 통해 이론중심의 수업보다 실무중심의 명확한 근거 위주의 수업을 지향해야 할 필요성이 있다고 생각한다.

  • PDF

초등학교 확률 학습 프로그램 개발과 적용에 관한 사례 연구 - 초등학교 6학년을 대상으로 -

  • Lee, So-Yeon;Kim, Won-Gyeong
    • Communications of Mathematical Education
    • /
    • v.11
    • /
    • pp.127-144
    • /
    • 2001
  • 본 연구는 확률의 다양한 의미를 반영한 초등학교 확률 학습 프로그램을 개발하고, 개발된 프로그램의 적용 가능성을 알아보는데 목적을 두고 있다. 먼저 확률의 다양한 의미를 반영한 초등학교 확률 학습프로그램을 개발하기 위하여, 프로그램의 기본 방향을 설정하고, 확률의 다양한 의미를 반영하기 위한 교수 방법을 마련하였다. 개발된 프로그램은 초등학교 6학년 한 단원 분량인 7차시로 이루어져 있다. 다음으로 프로그램 시행 전에 실시한 검사에서 확률적 사고 수준이 상 ${\cdot}$${\cdot}$ 하인 것으로 나타난 세 명의 학생을 연구 대상으로 개발된 프로그램을 시행하였다. 프로그램 적용 전 ${\cdot}$ 후에 실시한 지필 평가와 비디오 카메라로 녹음한 수업 내용과 학생들의 학습지를 검토하여 프로그램 적용 전, 1${\sim}$7 각 차시 후, 프로그램 적용 후의 시기로 나누어 분석한 결과, 세 학생 모두 확률적 사고 수준이 가장 높은 수준인 4수준으로 발전하였다. 본 연구의 결과, 확률을 이론적 의미 뿐 아니라 경험적 ${\cdot}$ 통계적 의미로 접근하면 초등학교 학생들도 확률 개념을 학습할 수 있었다. 따라서 확률을 다양한 관점으로 접근한다면, 초등학교에서도 독립성, 조건부 확률 같은 개념을 유의미하게 학습할 수 있을 것이다.

  • PDF