• 제목/요약/키워드: markov models

검색결과 490건 처리시간 0.022초

상황 인식 모바일 컴퓨팅을 위한 사운드 분류 시스템의 설계 및 구현 (Design and Implementation of a Sound Classification System for Context-Aware Mobile Computing)

  • 김주희;이석준;김인철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권2호
    • /
    • pp.81-86
    • /
    • 2014
  • 본 논문에서는 스마트폰 사용자의 실시간 상황 인식을 위한 효과적인 사운드 분류 시스템을 제안한다. 이 시스템은 전처리 과정에서 입력 사운드 데이터로부터 고요한 사운드와 화이트 노이즈를 미리 여과해버림으로써, 제한적인 계산 자원의 불필요한 소모를 막을 수 있다. 또한 에너지 레벨이 낮은 사운드 데이터들은 사전에 증폭시킴으로써, 이들에 대한 분류 성능을 향상시킬 수 있다. 또, 제안하는 사운드 분류 시스템은 HMM 분류 모델의 효율적인 학습과 적용을 위해 k-평균 군집화를 이용하여 특징 벡터들에 대한 차원 축소와 이산화를 수행한다. 한 대학 연구동내 일상생활로부터 수집한 8가지 유형의 사운드 데이터 집합을 이용하여 제안한 시스템의 성능 분석 실험을 수행하였다. 이 실험을 통해 본 논문에서 제안한 사운드 분류 시스템은 높은 분류 성능을 보여 주었다.

가우시안 분포에서 Maximum Log Likelihood를 이용한 벡터 양자화 기반 음성 인식 성능 향상 (Vector Quantization based Speech Recognition Performance Improvement using Maximum Log Likelihood in Gaussian Distribution)

  • 정경용;오상엽
    • 디지털융복합연구
    • /
    • 제16권11호
    • /
    • pp.335-340
    • /
    • 2018
  • 정확한 인식률을 보이고 있는 상업적인 음성인식 시스템은 화자종속 고립데이터로부터 학습 모델을 사용한다. 그러나 잡음 환경에서 데이터양에 따라 음성인식의 성능이 저하되는 문제점이 있다. 본 논문에서는 가우시안 분포에서 Maximum Log Likelihood를 이용한 벡터 양자화 기반 음성 인식 성능 향상을 제안한다. 제안하는 방법은 음성에 대한 특징을 가지고 벡터 양자화와 Maximum Log Likelihood 음성 특징 추출 방법을 이용하여 유사 음성에 대한 음성 인식의 정확성을 높이는 최적 학습 모델 구성 방법이다. 이를 위해 HMM을 기반으로 음성 특징을 추출하는 방법을 사용한다. 제안하는 방법을 사용하여 기존 시스템에서 생성되어 사용되는 음성 모델에 대한 부정확한 음성 모델에 대한 정확성을 향상시킬 수 있으므로 음성 인식에 강인한 모델을 구성할 수 있다. 제안하는 방법은 음성 인식 시스템에서 향상된 인식의 정확도를 보인다.

개념적 수문분할모형의 보정에 미치는 수문기후학적 조건의 영향 (Effects of Hydro-Climate Conditions on Calibrating Conceptual Hydrologic Partitioning Model)

  • 최정현;서지유;원정은;이옥정;김상단
    • 한국물환경학회지
    • /
    • 제36권6호
    • /
    • pp.568-580
    • /
    • 2020
  • Calibrating a conceptual hydrologic model necessitates selection of a calibration period that produces the most reliable prediction. This often must be chosen randomly, however, since there is no objective guidance. Observation plays the most important role in the calibration or uncertainty evaluation of hydrologic models, in which the key factors are the length of the data and the hydro-climate conditions in which they were collected. In this study, we investigated the effect of the calibration period selected on the predictive performance and uncertainty of a model. After classifying the inflows of the Hapcheon Dam from 1991 to 2019 into four hydro-climate conditions (dry, wet, normal, and mixed), a conceptual hydrologic partitioning model was calibrated using data from the same hydro-climate condition. Then, predictive performance and post-parameter statistics were analyzed during the verification period under various hydro-climate conditions. The results of the study were as follows: 1) Hydro-climate conditions during the calibration period have a significant effect on model performance and uncertainty, 2) calibration of a hydrologic model using data in dry hydro-climate conditions is most advantageous in securing model performance for arbitrary hydro-climate conditions, and 3) the dry calibration can lead to more reliable model results.

In silico genome wide identification and expression analysis of the WUSCHEL-related homeobox gene family in Medicago sativa

  • Yang, Tianhui;Gao, Ting;Wang, Chuang;Wang, Xiaochun;Chen, Caijin;Tian, Mei;Yang, Weidi
    • Genomics & Informatics
    • /
    • 제20권2호
    • /
    • pp.19.1-19.15
    • /
    • 2022
  • Alfalfa (Medicago sativa) is an important food and feed crop which rich in mineral sources. The WUSCHEL-related homeobox (WOX) gene family plays important roles in plant development and identification of putative gene families, their structure, and potential functions is a primary step for not only understanding the genetic mechanisms behind various biological process but also for genetic improvement. A variety of computational tools, including MAFFT, HMMER, hidden Markov models, Pfam, SMART, MEGA, ProtTest, BLASTn, and BRAD, among others, were used. We identified 34 MsWOX genes based on a systematic analysis of the alfalfa plant genome spread in eight chromosomes. This is an expansion of the gene family which we attribute to observed chromosomal duplications. Sequence alignment analysis revealed 61 conserved proteins containing a homeodomain. Phylogenetic study sung reveal five evolutionary clades with 15 motif distributions. Gene structure analysis reveals various exon, intron, and untranslated structures which are consistent in genes from similar clades. Functional analysis prediction of promoter regions reveals various transcription binding sites containing key growth, development, and stress-responsive transcription factor families such as MYB, ERF, AP2, and NAC which are spread across the genes. Most of the genes are predicted to be in the nucleus. Also, there are duplication events in some genes which explain the expansion of the family. The present research provides a clue on the potential roles of MsWOX family genes that will be useful for further understanding their functional roles in alfalfa plants.

HMM Based Part of Speech Tagging for Hadith Isnad

  • Abdelkarim Abdelkader
    • International Journal of Computer Science & Network Security
    • /
    • 제23권3호
    • /
    • pp.151-160
    • /
    • 2023
  • The Hadith is the second source of Islamic jurisprudence after Qur'an. Both sources are indispensable for muslims to practice Islam. All Ahadith are collected and are written. But most books of Hadith contain Ahadith that can be weak or rejected. So, quite a long time, scholars of Hadith have defined laws, rules and principles of Hadith to know the correct Hadith (Sahih) from the fair (Hassen) and weak (Dhaif). Unfortunately, the application of these rules, laws and principles is done manually by the specialists or students until now. The work presented in this paper is part of the automatic treatment of Hadith, and more specifically, it aims to automatically process the chain of narrators (Hadith Isnad) to find its different components and affect for each component its own tag using a statistical method: the Hidden Markov Models (HMM). This method is a power abstraction for times series data and a robust tool for representing probability distributions over sequences of observations. In this paper, we describe an important tool in the Hadith isnad processing: A chunker with HMM. The role of this tool is to decompose the chain of narrators (Isnad) and determine the tag of each part of Isnad (POI). First, we have compiled a tagset containing 13 tags. Then, we have used these tags to manually conceive a corpus of 100 chains of narrators from "Sahih Alboukhari" and we have extracted a lexicon from this corpus. This lexicon is a set of XML documents based on HPSG features and it contains the information of 134 narrators. After that, we have designed and implemented an analyzer based on HMM that permit to assign for each part of Isnad its proper tag and for each narrator its features. The system was tested on 2661 not duplicated Isnad from "Sahih Alboukhari". The obtained result achieved F-scores of 93%.

최소 표현 라플라스 변환에 기초한 단계형 확률변수의 시뮬레이션에 관한 연구 (Simulation of the Phase-Type Distribution Based on the Minimal Laplace Transform)

  • 김선교
    • 한국시뮬레이션학회논문지
    • /
    • 제33권1호
    • /
    • pp.19-26
    • /
    • 2024
  • 단계형 확률분포는 마코프 체인이 특정 상태로 흡수되는 시점까지 거쳐가는 여러 단계에서 체재하는 시간들의 합으로 정의되며 대기행렬 시스템과 신뢰성 분석 모형 등에 광범위하게 사용된다. 연속적 단계형 분포의 경우 흡수 상태로 진입하기까지 거쳐가는 각각의 단계에서의 체재 시간이 지수분포를 따르므로 연속적 단계형 분포는 다양한 지수분포들의 합 또는 볼록 결합으로 나타낼 수 있다. 단계형 분포를 생성하는 가장 일반적이면서도 직관적인 방법은 마코비안 표현방법이라 불리는 초기 확률벡터와 전이 생성행렬에 의해 주어지는 조건부 확률을 이용하는 것이다. 적률이 주어진 상황에서 단계형 변수를 생성하는 방법에 대한 기존의 연구들은 대부분 적률을 마코비안 표현방법으로 변환하는 것을 전제로 하고 있다. 본 연구에서는 적률을 마코비안 표현방법으로 변환하지 않고 확률 분포함수를 결정하여 단계형 확률변수를 생성하는 방법에 대해 살펴보고 마코프 표현을 사용하는 기존의 방법 대신에 조단 분해법과 최소 표현 라플라스 변환을 이용하여 2계 단계형 확률변수를 분포함수를 결정하는 공식과 절차를 제시한다. 이러한 접근 방법은 고차원의 단계형 확률분포를 이용하여 대기행렬의 시뮬레이션을 하는 경우에 마코비안 표현방법의 전이행렬을 결정하여 변수를 생성하는 경우보다 효율적이다.

적대적 멀티 에이전트 환경에서 효율적인 강화 학습을 위한 정책 모델링 (Policy Modeling for Efficient Reinforcement Learning in Adversarial Multi-Agent Environments)

  • 권기덕;김인철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권3호
    • /
    • pp.179-188
    • /
    • 2008
  • 멀티 에이전트 강화 학습에서 해결해야 할 중요한 문제는 자신의 작업 성능에 영향을 미칠 수 있는 다른 에이전트들이 존재하는 동적 환경에서 한 에이전트가 시행착오적 상호작용을 통해 어떻게 자신의 최적 행동 정책을 학습할 수 있느냐 하는 것이다. 멀티 에이전트 강화 학습을 위한 기존 연구들은 대부분 단일 에이전트 MDP 기반의 강화 학습기법들을 큰 변화 없이 그대로 적용하거나 비록 다른 에이전트에 관한 별도의 모델을 이용하더라도 다른 에이전트에 관해 요구되는 정보나 가정이 현실적이지 못하다는 한계점을 가지고 있다. 본 논문에서는 멀티 에이전트 강화 학습기술에 기초가 되는 기본 개념들을 정형화하고 이들을 기초로 기존 연구들의 특징과 한계점을 비교한다. 그리고 새로운 행동 정책 모델을 소개한 뒤, 이것을 이용한 강화 학습 방법을 설명한다. 본 논문에서 제안하는 멀티 에이전트 강화학습 방법은 상대 모델을 이용하는 기존의 멀티 에이전트 강화 학습 연구들에서 주로 시도되었던 상대 에이전트의 Q 평가 함수 모델 대신 상대 에이전트의 행동 정책 모델을 학습하며, 표현력은 풍부하나 학습에 시간과 노력이 많이 요구되는 유한 상태 오토마타나 마코프 체인과 같은 행동 정책 모델들에 비해 비교적 간단한 형태의 행동 정책 모델을 이용함으로써 학습의 효율성을 높였다. 또한, 본 논문에서는 대표적인 적대적 멀티 에이전트 환경인 고양이와 쥐게임을 소개하고, 이 게임을 테스베드삼아 비교 실험들을 수행하고 그 결과를 설명함으로써 본 논문에서 제안하는 정책 모델 기반의 멀티 에이전트 강화 학습의 효과를 분석해본다.

베이지안 순서형 프로빗 준모수 회귀 모형 : 국민건강영양조사 2016 자료를 통한 흡연양태와 커피섭취 간의 관계 분석 (Bayesian ordinal probit semiparametric regression models: KNHANES 2016 data analysis of the relationship between smoking behavior and coffee intake)

  • 이다솜;이은지;조성일;최태련
    • 응용통계연구
    • /
    • 제33권1호
    • /
    • pp.25-46
    • /
    • 2020
  • 본 논문에서는 Bayesian spectral analysis regression (BSAR) 방법론을 이용한 베이지안 순서형 프로빗 준모수 회귀모형에 대해서 고찰한다. 순서형 프로빗 회귀모형은 순서가 있는 범주형 자료를 모형화하는 방법으로, 정규 분포의 분포함수의 역함수인 프로빗 연결함수를 이용해 각 범주의 확률과 설명변수을 연결함으로써 반응변수의 확률을 모형화한다. 베이지안 프로빗 회귀 모형은 정규 분포를 따르는 잠재변수를 도입함으로써 사후 분포 도출을 용이하게 하고, 절단점에 따라 나뉘어지는 잠재변수들의 값에 따라서 반응 변수들이 범주화된다. 본 논문에서는 이러한 잠재 변수 방법을 확장해 BSAR 방법론에 기반하여 단조증가/감소와 같은 형태제약을 반영할 수 있는 베이지안 이항형 및 순서형 프로빗 준모수 회귀모형에 대해 연구한다. 모의실험을 통하여 이항형 프로빗 준모수 회귀모형과 기존의 다른 모형들 간의 적합결과를 비교하고, 형태 제약에 따른 순서형 프로빗 준모수 회귀모형의 적합결과를 비교 분석하도록 한다. 아울러, 국민건강영양조사 제 7기 1차년도 (2016) 자료(Korean National Health and Nutrition Examination Survey (KNHANES), 2016)를 바탕으로, 본 논문에서 고찰한 이항형 및 순서형 프로빗 준모수 회귀모형을 적용하여, 흡연양태와 커피섭취 간의 관계에 대한 실증적 분석을 수행한다.

하이테크 제품에 대한 소비자의 주관적 평가와 객관적 정보 구전 활동에 대한 연구 (Modeling Consumers' WOM (Word-Of-Mouth) Behavior with Subjective Evaluation and Objective Information on High-tech Products)

  • 정재학
    • Asia Marketing Journal
    • /
    • 제11권1호
    • /
    • pp.73-92
    • /
    • 2009
  • 소비자들은 때로 특정 제품에 대한 정보들을 다른 소비자에게 전달하여 그들의 제품 선택에 영향을 미치는 전달자 역할을 한다. 본 연구는 구전 전달자로서 소비자가 다른 소비자에게 전달하는 제품 정보를 주관적 (긍정적 또는 부정적) 정보와 객관적 정보로 구분하여, 소비자가 어떤 정보를 어떤 경우 더욱 활발히 전달하는 지를 분석하고자 한다. 본 연구는 이를 위해, 소비자의 메시지 전달 행위를 제품 선택과 같이 또 다른 형태의 선택 행위로 보고, 고객의 제품 구매 선택 행위를 연구하는 데 주로 적용되어 온 소비자 선택 모형(consumer choice model)를 이용하여 소비자의 메시지 전파(구전) 활동을 분석하였다. 소비자 선택 모형을 이용하여, 구전 전달자들이 제품에 관한 객관적 정보와 주관적 평가를 언제 더욱 많이 확산 시키는 지를 알아보고, 더 나아가서는 소비자들이 제품 관련 정보를 확산하는 과정에 구전 활동을 더욱 활성화 또는 약화시키는 요인이 무엇인지를 살펴 보았다. 본 연구는 실증 분석 결과를 통해, 구전 전달자의 메시지 확산 행위는 정보를 획득하게 된 경로/원천(source)의 유형에 따라 더욱 활발해 지거나 위축될 수 있다는 점을 발견하였다. 또한, 이러한 구전 활동은 전달하는 제품관련 메시지가 주관적 제품 평가에 관한 것인지 아니면 제품에 대한 객관적 정보인지에 따라 그 정도가 달라진다. 본 연구의 결과가 의미하는 바는, 소비자의 제품에 관한 메시지 확산 활동은 소비자의 구전 메시지 선택 행위에 영향을 미치는 효과적인 커뮤니케이션 계획을 통하여 더욱 확산 또는 위축시킬 수 있다는 점을 보여준다. 본 연구는 기업이 확산되기를 바라는 제품 정보가 구전을 통하여 효과적으로 확산되도록 계획을 수립하는 데 필요한 방법론을 제공하고 있으며, 실증 분석 결과를 기반으로 제품구전의 성공적인 확산을 위한 커뮤니케이션 전략 수립에 필요한 가이드라인을 제공하여 준다.

  • PDF

키워드검색광고 포트폴리오 구성을 위한 통계적 최적화 모델에 대한 실증분석 (An Empirical Study on Statistical Optimization Model for the Portfolio Construction of Sponsored Search Advertising(SSA))

  • 양홍규;홍준석;김우주
    • 지능정보연구
    • /
    • 제25권2호
    • /
    • pp.167-194
    • /
    • 2019
  • 본 논문은 키워드검색광고와 관련하여 의사결정자인 광고주의 입장에서 분석한 통계모델 기반 검색엔진최적화(Search Engine Optimization)논문이다. 일반적으로 키워드입찰은 노출순위를 대상으로 하는 입찰가액에 의해 이루어지고 있다. 그런데, 대부분 광고주는 수천 개 이상의 많은 키워드를 관리함에 있어, 매시간적으로 바뀌는 키워드별 입찰가액을 통해 입찰광고시스템을 관리하고 있는데, 사실상 시간과 인력자원측면에서 비효율적이다. 따라서, 본 논문에서는 기존의 입찰가액을 중심으로 하는 입찰시스템에 대해 의문점을 제기하고, 새로운 관점에서 노출순위를 의사결정변수로 하는 새로운 검색광고모델을 재정의하여 제시하였다. 새로운 검색광고모델에 대한 최적화실증분석을 위해 예측모델과 최적화모델을 제시하였다. 연구과정은 우선 키워드의 특성에 따라 키워드그룹을 원천 제조브랜드 유통브랜드의 범주화기준을 제시한 후, PC 와 모바일 매체별로 대표 키워드 선정한 후 노출순위와 클릭률이 비선형분포임을 보였고, 통계적 관계를 검토하였다. 클릭률예측 및 입찰가액예측을 위한 통계적 시나리오를 제시하였고, 적합성 분석을 통해 최적의 예측모델을 선정한 후, 선정된 예측모델을 기반으로 하여 클릭률과 기대이익(전환율)에 관한 최적화목적함수를 정의하고 실증분석을 진행하였다. 분석결과, 본 논문에서 제시한 검색광고모델은 클릭률 기반의 클릭수와 전환율 기반의 기대이익으로 표현되는 최적화모델 모두에서 개선효과가 있음을 확인하였다. 다만, 기대이익 최적화모델의 경우에는 핵심키워드임에도 불구하고 기대이익이 낮아 광고에서 배제되는 문제를 있음을 확인하고 대안을 제시했다. 마코브체인분석을 통해 핵심 경유키워드 개념을 도입하였고, 최적화목적함수에 대해 핵심경유키워드의 기회이익을 반영한 최적화수정모델을 제시하여 적용가능성을 확인하였다. 본 논문은 키워드입찰시스템의 의사결정변수를 노출순위의 관점으로 전환하는 새로운 모델을 제안하였고, 키워드 범주별 및 노출순위 기반의 통계적 예측을 제시하고, 포트폴리오 구성에서의 최적화실증분석을 통해 노출순위 기반 예측모델의 유효성을 확인함과 동시에, 키워드간의 확산효과를 포함하는 수정모델제시 등 전략적인 입찰을 제안한 점에 시사점이 있다.