• 제목/요약/키워드: 확률들의 평균

검색결과 456건 처리시간 0.026초

띄어쓰기 비종속 품사 태깅 시스템 개발 (Development of POS Tagging System Independent to Word Spacing)

  • 이경일;안태성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2003년도 제15회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.69-72
    • /
    • 2003
  • 본 논문에서는 입력된 한국어 문자열로부터 형태소를 분석하고, 품사를 태깅하는 방법에 있어 개선된 통계적 모델을 제안하고, 이에 기반한 띄어쓰기 비종속 형태소 분석 및 태깅 시스템의 개발과 성능 평가에 대한 결과를 소개하고 있다. 제안된 통계 기반품사 태깅 시스템은 입력된 문자열로부터 음절의 띄어쓰기 확률값을 계산하여 유사어절을 생성하고, 유사어절 단위로 사용자 띄어쓰기와 상관없이 형태소 후보 리스트를 생성하며, 인접한 후보 형태소들의 접속 확률 계산에 있어 어절 간 접속 확률과 어절 내 접속 확률을 모두 사용함으로, 최적의 형태소 리스트를 결정하는 모델을 사용하고 있다. 특히, 형태소들의 접속 확률 계산 시 어절 간 접속 확률과 어절 내 접속 확률의 결합 비율이 음절의 띄어쓰기 확률 값과 사용자의 띄어쓰기 여부에 따라 자동으로 조절되는 특징을 가지고 있으며, 이를 통해 극단적으로 띄어 쓰거나 붙여 쓴 문장에 대해서도 평균 90%수준의 품사 태깅 성능을 달성할 수 있었다.

  • PDF

사후 확률.확률 밀도 함수의 추정과 Probabilistic neural network을 이요한 모음 인식에 의한 평가

  • 허강인;이광석;김명기
    • 한국음향학회지
    • /
    • 제12권6호
    • /
    • pp.21-27
    • /
    • 1993
  • 계층형 신경망은 패턴 분류를 위해 사용되어 왔다. 이것은 주어진 교사패턴들의 학습으로 원하는 입력-출력 간의 매핑을 할 수 있기 때문이다. 신경망은 타겟ㅌ트 패턴이 입력 패턴의 카테고리에 일치할 때 타겟트 패턴을 학습하므로서 사후 확률을 근사화할 수 있다. 그리고 입력 공간을 부분 공간으로 나누어 학습 데이터들의 비율로서 만든 타겟트 벡터들로 학습한 신경망은 확률밀도 함수를 나타낼 수 있다. 본 연구에서는 역전파 학습법을 이용한 계층형 NN 과 코드북으로서 사후 확률과 확률밀도함수의 측정방법을 제안하였다. VQ 로 추정한 사후확률고 확률밀도함수를 이용하여 학습이 필요없는 RBF network 의 일종인 PNN으로 모음 인식을 수행 하였다. 인식 실험에서 PNN 의 결과는 역전파 학습법을 이용항 3층 신경망과 VQ 의 평균 인식율과 비교되었다. VQ-PNN의 인식율이 다른 것보다 우수하게 나타났다.

  • PDF

반연속 HMM과 RBF 혼합 시스템을 이용한 화자독립 음성인식에 관한 연구 (A Study on Speaker-Independent Speech Recognition Using a Hybrid System of Semi-Continuous HMM and RBF)

  • 문연주;전선도;강철호
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 1호
    • /
    • pp.36-39
    • /
    • 1999
  • 본 논문에서는 기존의 반연속 HMM과 신경망 알고리즘인 RBF(Radial Basis Function)를 혼합한 형태를 음성인식에 적용한다. 기존의 반연속 HMM은 학습 과정에서 모든 모델과 상태에서 공유되는 L개의 가우시안 확률 밀도들과 각가우시안 확률 밀도들의 가중치를 결정하는 흔합 밀도계수 의해 입력 음성의 특징을 확률적으로 모델링하는 혼합 확률을 얻고 또 Maximum likelihood와 Baum-Welch 알고리즘을 이용해 초기확률, 전이확률, 관측확률, 평균벡터 $\mu$, 공분산 행렬 $\Sigma$을 학습해 나간다. 그러나 제안한 RBF/반연속 HMM 혼합형태는 RBF의 변형된 방식을 첨가해 반연속 HMM 관측 파라미터를 RBF에 의해 결정함으로써 보단 분별릭 있는 화자독립 인식 시스템이 된다. 그래서 인식 실험결과 인식률에 있어서 기존의 반연속 HMM보다 향상된 인식률을 얻는다.

  • PDF

구성요소 기반 확률 전파를 이용한 2D 사람 자세 추정 (2D Human Pose Estimation Using Component-Based Density Propagation)

  • 차은미;이경미
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2007년도 학술대회 1부
    • /
    • pp.725-730
    • /
    • 2007
  • 본 논문에서는 인체 추적에 필요한 인체의 각 부위들을 구성요소로 각각 검출하여 연결하는 인체 모델을 통해 각 구성요소를 개별적으로 추정하게 된다. 여기서 인체의 구성요소 중 동작 추적에 가장 필요한 6개 부위로 구성된 구성요소인 머리, 몸통, 왼팔, 오른팔, 왼발, 오른발 등을 검출하여 추적한 후, 각 구성요소의 중심값과 색상정보를 이용하여 이전 프레임과 현재 프레임 간에 연결성을 두여 각 구성요소를 개별적으로 확률 전파를 통해 추적되어지고, 각 구성요소의 추적 결과는 구성요소들의 추정 결과를 구성요소 기반 확률 전파를 이용하여 인체의 동작을 추정하는 방법을 제안한다. 입력 영상에서 피부색 등의 색상 정보를 이용하여 인체 부위 또는 인체 모델의 구성 요소들 각각의 중심값과 색상정보를 가지고 확률전파를 통해 이것이 어떤 동작인지 동작 추정이 가능하다. 본 논문에서 제안하는 인체 동작 추적 시스템은 유아의 동작교육에 이용되는 7가지 동작인 걷기, 뛰기, 앙감질, 구부리기, 뻗기, 균형 잡기, 회전하기 등에 적용하였다. 본 논문에서 제안한 인체 모델의 각 구성요소 부위들을 독립적으로 검출하여 평균 96%의 높은 인식률을 나타냈고, 앞서 적용한 7가지 동작에 대해서 실험한 결과 평균 88.5% 성공률을 획득함으로써 본 논문에서 제안한 방법의 타당성을 보였다.

  • PDF

멀티 디스크 방송 환경을 위한 인덱스 기술 (An Indexing Technique for Multi-Disks Broadcast Environments)

  • 박기영;정성원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.215-218
    • /
    • 2007
  • 모바일 환경에서는 상향링크와 하향링크의 대역폭이 비대칭적이며 전력이 한정되어 있기 때문에 효율적인 데이터 전송기술로 브로드캐스팅 방법이 연구되어 왔다. 브로드캐스트에서 인덱스를 사용하면 원하는 데이터가 언제 방송되는지를 알 수 있어 튜닝 시간을 줄이고, 전력의 소비를 줄이는 효과가 있다. 지금까지 연구된 싱글 채널 인덱스 기법들은 모든 데이터 아이템이 동일한 확률로 접근되는 flat 브로드캐스트 방송에 적합한 인덱스 기법들이다. 데이터 아이템에 대한 접근 확률이 편향되는 경우에는 멀티디스크 방송 기법을 사용해야 효과적이지만, 기존의 인덱스 기법들은 인덱스가 한 방송 주기 내에서 반복되어 방송되는 데이터 아이템을 가리킬 수 없기 때문에 멀티디스크 방송 기법에는 효과적이지 않다. 본 논문에서는 싱글 채널 인덱스 기법으로서 멀티디스크 방송에 적용되는 인덱스 기법인 MDEI (Multi-disk Exponential Index) 기법을 제안한다. 제안 하는 MDEI 기법은 각 디스크 별로 인덱스를 구성하기 때문에 데이터에 대한 접근확률이 편향되는 경우에 멀티디스크 방송을 기반으로 이 인덱스 기법을 사용하면 flat 브로드캐스트를 사용하는 다른 인덱스 기법을 사용했을 때보다 평균 접근지연시간 시간을 크게 줄일 수 있다. 실험 결과는 데이터에 대한 접근 확률이 편향된 환경에서 MDEI가 평균 접근지연시간에 있어서 매우 좋은 성능을 갖는 것을 보여준다.

학생정보를 이용한 대졸 취업에 미치는 영향력 분석 (Determinants of job finding using student's characteristic information)

  • 조장식
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권5호
    • /
    • pp.849-856
    • /
    • 2011
  • 본 논문은 K-대학교 졸업생들의 취업여부에 미치는 영향력을 분석하기 위해 입학, 재학 및 개인특성 관련 변수들을 사용하였다. 이를 위해 모수적인 방법인 로지스틱 회귀분석을 사용하여 독립변수들의 주효과를 분석하였다. 또한 회귀분석 방법에서 독립변수들의 주효과 결과에 대한 보완으로, 비모수적인 방법인 의사결정나무 분석을 통하여 취업여부에 영향을 주는 독립변수들의 상호작용효과를 분석하였다. 먼저 회귀분석결과, 입학관련 변수들 중에서는 외국어영역 점수가 높을수록 취업확률이 높게 나타났으며, 재학 관련 변수들 중에서는 평균평점이 높을수록 취업확률이 높게 나타났다. 그리고 계열은 예체능계열에 비해서 자연계열이 취업확률이 높게 나타났으며, 개인특성 관련 변수들은 졸업 당시 연령이 작을수록 취업확률이 높게 나타났으며, 졸업시기는 8월 졸업생들에 비해서 2월 졸업생들이 취업확률이 높은 것으로 나타났다. 한편, 의사결정나무분석 결과에서는 졸업시기가 2월이면서 평균평점이 3.51점보다 높으면서 연령이 26.51세보다 작고 자연계열인 경우 취업률이 특히 높게 나타났다. 또한 졸업시기가 8월이면서 예체능계열의 졸업생인 경우 취업률이 특히 낮은 것으로 나타났다.

가스터빈 블레이드의 신뢰성 해석 (Reliability Analysis of Gas Turbine Engine Blades)

  • 이광주;임성한;황종욱;정용운;양계병
    • 한국항공우주학회지
    • /
    • 제36권12호
    • /
    • pp.1186-1192
    • /
    • 2008
  • 가스터빈 엔진 블레이드의 신뢰성을 해석하였다. 항복강도, 탄성계수, 엔진속도 및 기체온도를 서로 독립적인 확률변수로 가정하였다. 파손확률을 구하기 위하여 사용한 방법들 중에서 Advanced Mean Value Method가 가장 효율적임을 알 수 있었다. 동일한 평균과 표준편차를 갖는 정규, 대수정규 및 Weibull 분포로 확률변수 형상을 가정하였을 경우, 극한상태방정식의 누적분포함수는 확률변수 분포형상에 의하여 큰 영향을 받지 않음을 알 수 있었다. 확률변수의 표준편차에 대한 파손확률의 민감도는 기체온도의 경우에 가장 크다는 것을 알 수 있었다. 확률변수의 평균과 표준편차의 효과를 검토하였다. 기체온도의 평균과 엔진속도의 표준편차의 증가가 파손확률을 가장 크게 증가시킴을 알 수 있었다.

평균밝기와 대비성의 차원으로 구성된 결 공간에서 결 분리에 작용하는 두 가지 기제 (Two independent mechanisms mediate discrimination of IID textures varying in mean luminance and contrast)

  • 남종호
    • 인지과학
    • /
    • 제10권3호
    • /
    • pp.39-49
    • /
    • 1999
  • 본 연구에서 사용된 결 자극(texture stimulus)은 확률의 개념을 이용하여 만들어졌다. 결 자극은 결 요소들의 확률분포로부터 계산된 평균과 분산으로 완전하게 기술되어 질 수 있으며, 또한 평균과 분산이 서로 직교로(orthogonal) 변화할 수 있는 유클리드 공간 속에 위치할 수 있게 된다. 결 분리과정에 관여하는 기제로는 결의 평균정보를 사용하는 기제와 결의 분산정보를 사용하는 기제가 있을 것으로 가정하였다. 본 실험에서는 유클리드 결 공간에서 짝 지워진 결 자극을 분리하는 확률을 결 자극의 평균차이와 분산차이의 함수로서 측정하였다. 두 명의 피험자로부터 얻어진 자료는 평균과 분산으로 정의된 결 공간에 두 가지 기제가 결 분리과정에 관여하고 있음을 보여주었다. 그리고 두 기제의 반응을 확률 총합(probability summation) 원리에 따라 종합적으로 처리한다는 모형이 자료를 잘 설명하였다. 그러나 두 기제가 담당하는 결 자극의 각각의 차원이 결의 평균과 분산은 아닌 것으로 밝혀졌다. 그러므로 평균과 분산이 독립적인 축을 형성하도록 구성된 유클리드 공간에서 생성된 결 자극의 분리과정에는 두 개의 상호 독립적인 기제가 관여하고 있다. 각 기제의 특성을 살펴보면, 한 기제는 결 자극의 밝기 정보를 처리하고, 다른 기제는 결의 밝기(luminance)정보와 대비 성(contrastness) 정보를 동시에 처리하는 것처럼 보인다.

  • PDF

명사칼럼-예방과 조기검진이 가장 중요한 '암'

  • 김영곤
    • 건강소식
    • /
    • 제32권7호
    • /
    • pp.4-5
    • /
    • 2008
  • 오래 사는 것 보다 건강을 유지하며 사는 것을 더욱 중요시하는 시대에 한국인이 가장 조심해야 할 질병은 암. 우리나라 국민들이 평균수명까지 생존할 경우 암에 걸릴 확률은 남자 27.7%, 여자 22.2%로 국민 3명 당 1명은 암에 걸릴 수 있다. 그러나 암은 금연, 균형 잡힌 식단, 꾸준한 운동 등 생활 습관을 올바르게 유지함으로써 예방 할 수 있고, 초기에 발견하면 치료 확률도 높다.

  • PDF

IoT 정보 수집을 위한 확률 기반의 딥러닝 클러스터링 모델 (Probability-based Deep Learning Clustering Model for the Collection of IoT Information)

  • 정윤수
    • 디지털융복합연구
    • /
    • 제18권3호
    • /
    • pp.189-194
    • /
    • 2020
  • 최근 IoT 네트워크는 이기종의 IoT 장치에서 발생하는 데이터를 효율적으로 처리하기 위해서 다양한 클러스터링 기법들이 연구되고 있다. 그러나, 기존 클러스터링 기법들은 정적으로 네트워크를 분할하는데 초점을 맞추고 있어서 이동이 가능한 IoT 장치에는 기존 클러스터링 기법들이 적합하지 않다. 본 논문에서는 에지 네트워크를 이용하여 IoT 장치의 정보를 수집·분석하기 위한 확률적 딥러닝 기반의 동적 클러스터링 모델을 제안한다. 제안 모델은 수집된 정보의 속성값의 빈도수를 확률적으로 딥러닝에 적용하여 서브넷을 구축한다. 구축된 서브넷은 시드로 추출된 연계 정보를 계층적 구조로 그룹핑할 때 사용하며, IoT 장치에 대한 동적 클러스터링의 속도 및 정확도를 향상시킨다. 성능평가 결과, 제안모델은 기존 모델에 비해 데이터 처리 시간이 평균 13.8% 향상되었고, 서버의 오버헤드는 기존 모델보다 평균 10.5% 낮게 나타났다. 서버에서 IoT 정보를 추출할 때의 정확도는 기존모델보다 평균 8.7% 향상되었다.