• 제목/요약/키워드: 가중치 모델

검색결과 938건 처리시간 0.028초

가중치 워크플로우 소셜 네트워크의 사이중심도 분석방법 (A Betweenness Centrality Analysis Method in Valued Workflow-supported Social Networks)

  • 김미선;김광훈
    • 인터넷정보학회논문지
    • /
    • 제17권1호
    • /
    • pp.65-71
    • /
    • 2016
  • 본 논문에서는 가중치 및 방향성 워크플로우 소셜네트워크의 사이중심도 분석방법과 그에 따른 알고리듬을 제안한다. 기존의 워크플로우 소셜네트워크는 워크플로우 모델을 구성하는 단위업무를 처리하는 과정에서 수행자들간의 업무전달관계 유무를 이진 소셜네트워크 모델로 표현한 것이다. 그러나, 워크플로우 기반 조직을 구성하는 수행자들간의 업무전달관계를 효과적으로 분석하기 위해서는 기존의 수행자들간의 관계유무를 기본으로 하는 이진 소셜네트워크 정보 뿐 만 아니라 수행자들간의 정량적 업무전달관계와 그 업무전달관계의 방향성 또한 효과적인 분석결과를 획득하는데 있어서 매우 중요한 요인이다. 결과적으로, 본 논문에서는 수행자 그룹의 효과적인 업무전달관계 분석을 수행하기 위하여 정량적 업무전달관계 수준과 그의 방향성을 고려한 가중치 및 방향성 워크플로우 소셜네트워크 개념과 수행자 그룹의 사이중심도 분석방법 및 알고리듬을 제안한다. 특히, 제안한 분석방법을 검증하기 위하여 기존의 이진 워크플로우 소셜네트워크에 대한 사이중심도 분석방법과 본 논문에서 제안한 가중치 및 방향성 워크플로우 소셜네트워크에 대한 사이중심도 분석방법을 특정 워크플로우 모델에 적용하여 그 분석결과를 비교한다.

가중치를 이용한 통계 기반 한국어 동형이의어 분별 모델 (A Korean Homonym Disambiguation Model Based on Statistics Using Weights)

  • 김준수;최호섭;옥철영
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권11호
    • /
    • pp.1112-1123
    • /
    • 2003
  • 본 논문은 한국어 정보처리에서 발생하는 어휘 중의성 문제 중 한국어에서 그 심각성이 큰 동형이의어 중의성을 해결하기 위하여, 사전 뜻풀이 말뭉치에서 구축한 의미정보(Semantic Information)와 이를 이용한 기존의 통계기반 동형이의어 분별 모델에 대한 실험 결과를 분석하여, 정확률 향상을 위한 새로운 동형이의어 NPH(New Prior Probability of Homonym sense) 가중치 및 인접 어절에 대한 거리 가중치 적용 모델을 제안한다. 사전 뜻풀이 말뭉치의 상위 고빈도 동형이의어 200개 중 중의성이 높은 46개(명사 30개, 동사 16개)를 선별하고, 21세기 세종 계획에서 제공하는 350만 어절 품사 부착 말뭉치에서 이들 동형이의어를 포함하는 47,977개의 문장을 추출하여 실험을 하였다. 기존의 통계기반 동형이의어 분별 모델에서는 72.08%(명사78.12%, 동사 62.45%)의 정확률을 나타냈으나, NPH 가중치를 부여한 실험 결과 정확률이 평균 1.70% 향상되었으며, NPH와 거리 가중치를 함께 이용한 결과 평균 2.01% 정확률이 향상되었다.

컨셉 변동 스트리밍 데이터를 위한 적응적 가중치 조정을 이용한 동적 앙상블 방법 (A Dynamic Ensemble Method using Adaptive Weight Adjustment for Concept Drifting Streaming Data)

  • 김영덕;박정희
    • 정보과학회 논문지
    • /
    • 제44권8호
    • /
    • pp.842-853
    • /
    • 2017
  • 스트리밍 데이터는 시간에 따라 지속적으로 생성되는 데이터 시퀀스이다. 시간이 지남에 따라 데이터의 분포 또는 컨셉이 변화할 수 있으며, 이러한 변화는 분류 모델의 성능을 저하시키는 요인이 된다. 점층적 적응적 학습 방법은 컨셉 변화의 정도에 따라 현재 분류 모델의 가중치를 조절하여 업데이트를 수행함으로써 컨셉 변화에 대한 분류 모델의 성능을 유지할 수 있게 한다. 그러나, 컨셉 변화의 정도에 맞는 적절한 가중치를 결정하기가 어렵다는 문제점이 있다. 본 논문에서는 컨셉 변화에 따른 적응적 가중치 조정에 기반한 동적 앙상블 방법을 제안한다. 실험 결과는 제안한 방법이 다른 비교 방법들에 비해 높은 성능을 보여줌을 입증한다.

Self-Attention 기반의 문장 임베딩을 이용한 효과적인 문장 유사도 기법 기반의 FAQ 시스템 (An Effective Sentence Similarity Measure Method Based FAQ System Using Self-Attentive Sentence Embedding)

  • 김보성;김주애;이정엄;김선아;고영중;서정연
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.361-363
    • /
    • 2018
  • FAQ 시스템은 주어진 질문과 가장 유사한 질의를 찾아 이에 대한 답을 제공하는 시스템이다. 질의 간의 유사도를 측정하기 위해 문장을 벡터로 표현하며 일반적으로 TFIDF, Okapi BM25와 같은 방법으로 계산한 단어 가중치 벡터를 이용하여 문장을 표현한다. 하지만 단어 가중치 벡터는 어휘적 정보를 표현하는데 유용한 반면 단어의 의미적인(semantic) 정보는 표현하기 어렵다. 본 논문에서는 이를 보완하고자 딥러닝을 이용한 문장 임베딩을 구축하고 단어 가중치 벡터와 문장 임베딩을 조합한 문장 유사도 계산 모델을 제안한다. 또한 문장 임베딩 구현 시 self-attention 기법을 적용하여 문장 내 중요한 부분에 가중치를 주었다. 실험 결과 제안하는 유사도 계산 모델은 비교 모델에 비해 모두 높은 성능을 보였고 self-attention을 적용한 실험에서는 추가적인 성능 향상이 있었다.

  • PDF

실시간 변별적 가중치 학습에 기반한 음성 검출기 (Voice Activity Detection Based on Real-Time Discriminative Weight Training)

  • 강상익;조규행;장준혁
    • 대한전자공학회논문지SP
    • /
    • 제45권4호
    • /
    • pp.100-106
    • /
    • 2008
  • 본 논문에서는 다양한 잡음 환경에서 음성의 통계적 모델에 기반한 음성 검출기의 성능향상을 위해 PSFM (Power Spectral Flatness Measure)을 이용하여 실시간으로 변별적 가중치 학습 (Discriminative Weight Training) 기반의 최적화된 우도비 테스트 (Likelihood Ratio Test, LRT)를 제안한다. 먼저, 기존의 통계모델기반의 음성 검출기를 분석하고, 이를 기반으로 MCE (Minimum Classification Error)방법을 도입하여 도출한 각 주파수 채널별 가중치를 PSFM 값에 기반하여 실시간 매 프레임마다 다른 가중치를 적용한 우도비 기반의 음성 검출 결정법을 제시한다. 제안된 알고리즘은 다양한 잡음 환경에서 기존에 제시된 음성 검출기와 비교하였으며, 우수한 성능을 보인다.

은닉 마코프 모델 확률 보정을 이용한 음성 인식 성능 향상 (Performance Improvement in Speech Recognition by Weighting HMM Likelihood)

  • 권태희;고한석
    • 한국음향학회지
    • /
    • 제22권2호
    • /
    • pp.145-152
    • /
    • 2003
  • 본 논문에서는 인식 단위로서의 개개의 은닉 마코프 모델 (HMM: Hidden Markvo Model)에 대응하는 가중치를 도입하여 HMM출력 스코어는 HMM출력 확률과 HMM 가중치의 곱으로 표현된다고 가정하고 기존의 최소 분류 오류 훈련 방법과 유사하게 HMM 가중치를 반복적으로 훈련하는 방법을 제안하였다. 제안된 방법은 오인식 척도에 대해 차분 (delta) 계수를 정의하고 이를 이용하여 HMM 가중치를 반복하여 훈련하는 방법이다. 이러한 방법은 HMM 가중치의 합을 HMM 개수의 총합으로 제한함으로써 기존의 파라미터 추정 방법과 비터비 (Viterbi) 알고리즘에 큰 변화 없이 음성 인식에 효과적으로 적용될 수 있다. 제안된 방법은 기존의 분할 (segmental) 최소 분류 오류훈련 방법과 비교하여 추정하는 파라미터의 개수가 감소되었으며 훈련 모델의 최적 상태열을 이용한 경도 계산 과정이 포함되지 않음으로써 계산량을 효과적으로 단축할 수 있다. HMM가중치를 이용한 HMM기반의 음성 인식기의 성능 평가를 위해서 단독 숫자음 인식 실험을 실시하였다. 실험적 결과들은 HMM 확률 보정을 이용한 음성 인식 시스템이 베이스라인 시스템보다 음성 인식 성능이 더 우수함을 보여준다. 제안된 방법은 기존의 최소 분류 오류 훈련 방법에 비하여 구현하기 간편한 반면에 더욱 우수한 음성 인식 성능 향상을 보여준다.

발전용 댐 유입량 예측 정확도 향상을 위한 레이더와 수치예보 예측강우 병합기법 연구 (Study on blending radar and numerical rainfall prediction to improve hydroelectric dam inflow forecasts accuracy)

  • 윤성심;신홍준
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.112-112
    • /
    • 2023
  • 발전용댐의 댐 유입량 예측 및 운영을 위해서 (주)한국수력원자력에서는 수자원통합 운영시스템(Water resources Integrated System, WIOS)을 운영 중에 있다. 해당 시스템에서는 댐 유입량을 예측하기 위해서 기상청 수치예보모델 중 하나인 국지예보모델(Local Data Assimilation and Prediction System, LDAPS)의 예측강우를 수문모형의 입력자료로 활용하고 있으며, 레이더 기반의 초단시간 강우예측 기법을 자체 개발 중에 있다. 기상청 국지예보모델은 강우의 on/off에 대한 정확도는 90%를 상회할 만큼 높으나 정량적인 강우량의 정확도는 매우 낮고, 레이더 기반의 초단시간 예측 강우는 선행 1~2시간 예측에서는 정량적 정확도는 높으나, 그 이후 예측성능이 급격히 떨어지는 경향을 보인다. 따라서 댐 유입량의 정량적 예측 정확도를 확보하기 위해 초단시간 모델과 국지예보모델의 강우예측 결과를 병합(blending)하는 기법을 적용하여 초기 6시간 동안의 예측 성능을 향상시켜야 한다. 본 연구에서는 선행시간 0~6시간에 대해서 병합하는 기법들을 적용하고 평가하고자 한다. 기본적으로 병합은 초단시간 예측강우와 수치예보자료 간 가중치를 통해 수행된다. 일반적으로 초기 1시간 선행시간에서 레이더 기반 예측강우는 완벽한 예측자료(외삽 관측자료의 가중치는 1.0)로 가정하며, tanh 함수를 이용하여 선행시간의 증가에 따라 가중치를 감소시키면서, 6시간 선행시간에서는 수치예보 예측강우가 완벽한 예측자료라고 가정한다. 본 연구에서는 일반적인 병합 방법 외에 병합된 예측강우에 과거 관측강우와 예측강우의 평균편이를 적용하여 보정하는 방법, 사례별 변동성이 큰 병합된 예측강우 특성을 고려하여 병합 가중치를 신뢰도에 따라 가변시키는 방법을 적용하여 평가한다. 이를 통해 댐 유입량 예측에 최적이 되는 병합기법을 선정하고자 한다.

  • PDF

가중치를 가지는 의존관계를 이용한 구문분석 후보의 순위화 방법 (A Method for Ranking Candidate Parse Trees using Weighted Dependency Relation)

  • 류재민;김민호;권혁철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.924-927
    • /
    • 2017
  • 통계 모형에 기반을 둔 구문분석기는 자료 부족 문제에 취약하거나 장거리 의존관계와 같은 특정 언어현상에 대한 처리가 어렵다는 단점이 있다. 이러한 한계점을 극복하고자 본 연구진은 규칙에 기반을 둔 한국어 구문분석기를 개발하고 있다. 다른 구문 분석기와 다르게 형태소 단위 구문분석을 시도하며 생성 가능한 모든 구문분석 후보를 보여주는 것이 특징이다. 본 연구진의 기존 연구에서 개발한 한국어 구문분석기는 형태소의 입력순서와 구문분석 후보의 생성 순서에 의존하여 구문분석 후보를 순서화하였다. 그러나 생성되는 구문분석 후보 중 가장 정답에 가까운 구문분석 후보의 순위를 낮추기 위해서는 각 구문분석 트리가 특정한 점수를 가질 필요가 있다. 본 논문에서는 품사 태거(tagger)에서 출력하는 어절별 형태소의 순위에 따른 가중치, 수식 거리에 따른 가중치, 특정한 지배-의존 관계에 대한 가중치를 이용해 가중치 합을 가지는 구문분석 후보를 구성하고 이를 정렬하여 이전 연구보다 향상된 성능을 가진 한국어 구문분석기 모델을 제안한다. 실험은 본 연구진이 직접 구축한 평가데이터를 기반으로 진행하였으며 기존의 Unlabeled Attachment Score(UAS) 87.86%에서 제안 모델의 UAS 93.34%로 약 5.48의 성능향상을 확인할 수 있었다.

언어모델 군집화와 동적 언어모델 보간을 통한 음성인식 성능 향상 (LM Clustering based Dynamic LM Interpolation for ASR N-best Rescoring)

  • 정의석;전형배;정호영;박전규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.240-245
    • /
    • 2015
  • 일반영역 음성인식은 n-gram 희소성 문제로 인해 대용량의 언어모델이 필요하다. 대용량 언어모델은 분산형 모델로 구현될 수 있고, 사용자 입력에 대한 동적 언어모델 보간 기술을 통해 음성인식 성능을 개선할 수 있다. 본 논문은 동적 언어모델 보간 기술에 대한 새로운 접근방법을 시도한다. 텍스트 군집화를 통해 주제별 언어모델을 생성한다. 여기서 주제는 사용자 입력 영역에 대응한다. 본 논문은 사용자 입력에 대하여 실시간으로 주제별 언어모델의 보간 가중치 값을 계산하는 접근 방법을 제시한다. 또한 언어모델의 보간 가중치 값 계산의 부담을 감소하기 위해 언어모델 군집화를 통해 대용량 언어모델 보간 접근 방법의 연산 부담을 해소하기 위한 시도를 한다. 주제별 언어모델에 기반하고 언어모델 군집화를 통한 동적 언어모델 보간 기술의 실험 결과 음성인식 오류 감소율 6.89%를 달성했다. 또한 언어모델 군집화 기술은 음성인식 정확도를 0.09% 저하시켰을 때 실행 시간을 17.6% 개선시키는 실험결과를 보였다.

  • PDF

메타데이터를 활용한 조사자료의 문서범주화에 관한 연구 (An Exploratory Study on Survey Data Categorization using DDI metadata)

  • 박자현;송민
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2012년도 제19회 학술대회 논문집
    • /
    • pp.73-76
    • /
    • 2012
  • 본 연구는 DDI 메타데이터를 활용하여 귀납적 학습모델(supervised learning model)의 문서범주화 실험을 수행함으로써 조사자료의 체계적이고 효율적인 분류작업을 설계하는데 그 목적이 있다. 구체적으로 조사자료의 DDI 메타데이터를 대상으로 단순 TF 가중치, TF-IDF 가중치, Okapi TF 가중치에 따른 나이브 베이즈(Naive Bayes), kNN(k nearest neighbor), 결정트리(Decision tree) 분류기의 성능비교 실험을 하였다. 그 결과, 나이브 베이즈가 가장 좋은 성능을 보였으며, 단순 TF 가중치와 TF-IDF 가중치는 나이브 베이즈, kNN, 결정트리 분류기에서 동일한 성능을 보였으나, Okapi TF 가중치의 경우 나이브 베이즈에서 가장 좋은 성능을 보였다.

  • PDF