• Title/Summary/Keyword: 통계 처리

Search Result 3,103, Processing Time 0.035 seconds

Speech enhancement based on reinforcement learning (강화학습 기반의 음성향상기법)

  • Park, Tae-Jun;Chang, Joon-Hyuk
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.05a
    • /
    • pp.335-337
    • /
    • 2018
  • 음성향상기법은 음성에 포함된 잡음이나 잔향을 제거하는 기술로써 마이크로폰으로 입력된 음성신호는 잡음이나 잔향에 의해 왜곡되어지므로 음성인식, 음성통신 등의 음성신호처리 기술의 핵심 기술이다. 이전에는 음성신호와 잡음신호 사이의 통계적 정보를 이용하는 통계모델 기반의 음성향상기법이 주로 사용되었으나 통계 모델 기반의 음성향상기술은 정상 잡음 환경과는 달리 비정상 잡음 환경에서 성능이 크게 저하되는 문제점을 가지고 있었다. 최근 머신러닝 기법인 심화신경망 (DNN, deep neural network)이 도입되어 음성 향상 기법에서 우수한 성능을 내고 있다. 심화신경망을 이용한 음성 향상 기법은 다수의 은닉 층과 은닉 노드들을 통하여 잡음이 존재하는 음성 신호와 잡음이 존재하지 않는 깨끗한 음성 신호 사이의 비선형적인 관계를 잘 모델링하였다. 이러한 심화신경망 기반의 음성향상기법을 향상 시킬 수 있는 방법 중 하나인 강화학습을 적용하여 기존 심화신경망 대비 성능을 향상시켰다. 강화학습이란 대표적으로 구글의 알파고에 적용된 기술로써 특정 state에서 최고의 reward를 받기 위해 어떠한 policy를 통한 action을 취해서 다음 state로 나아갈지를 매우 많은 경우에 대해 학습을 통해 최적의 action을 선택할 수 있도록 학습하는 방법을 말한다. 본 논문에서는 composite measure를 기반으로 reward를 설계하여 기존 PESQ (Perceptual Evaluation of Speech Quality) 기반의 reward를 설계한 기술 대비 음성인식 성능을 높였다.

Bias corrected non-response estimation using nonparametric function estimation of super population model (선형 응답률 모형에서 초모집단 모형의 비모수적 함수 추정을 이용한 무응답 편향 보정 추정)

  • Sim, Joo-Yong;Shin, Key-Il
    • The Korean Journal of Applied Statistics
    • /
    • v.34 no.6
    • /
    • pp.923-936
    • /
    • 2021
  • A large number of non-responses are occurring in the sample survey, and various methods have been developed to deal with them appropriately. In particular, the bias caused by non-ignorable non-response greatly reduces the accuracy of estimation and makes non-response processing difficult. Recently, Chung and Shin (2017, 2020) proposed an estimator that improves the accuracy of estimation using parametric super-population model and response rate model. In this study, we suggested a bias corrected non-response mean estimator using a nonparametric function generalizing the form of a parametric super-population model. We confirmed the superiority of the proposed estimator through simulation studies.

Design and Implementation of Trading Analysis System based on Multi-Dimensional Modeling (다차원 모델링 기반의 거래분석 시스템 설계 및 구현)

  • Lee, Sung-Wun;Choi, Jin-Young
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2008.05a
    • /
    • pp.423-426
    • /
    • 2008
  • 한국증권선물거래소의 유가증권 매매체결시스템은 안정적이고 신속한 데이터 처리에 초점을 둔 시스템이다. 인터넷과 HTS(Home Trading System)의 대중화로 인해 대량의 데이터로부터 적시에 정보를 추출하고 분석하고자 하는 요구가 증가하고 있다. 그러나 현재의 통계정보시스템은 이와 같은 요구를 수용하기 어려우며 개발자의 별도 노력이 요구된다. 또한 목표성능에 대한 요구가 매우 높아짐에 따라 시스템 및 어플리케이션의 증설과 개선작업이 빈번하지만 그 효과를 예측하기 어려우며 정량화 된 근거자료의 부재로 의사결정을 지연시킨다. 따라서 이와 같은 요구사항들을 해결하기 위해 기존의 통계정보시스템을 활용하고 추가적인 데이터들을 다양한 차원에서 분석 가능하도록 웨어하우스 데이터베이스를 구축하며 성능예측을 위한 요소들을 추출하고 데이터마이닝을 수행하여 의사결정에 도움을 줄 수 있는 다차원 모델링 기반의 거래분석 시스템을 제안한다. 거래분석 시스템의 구축으로 사용자는 웹상에서 적시에 다차원 분석보고서를 생성할 수 있다. 또한 관리자는 외부적 환경변화에 따른 향후 시스템 성능 감소를 예측할 수 있으며 내부적 요인을 제어하여 이를 상쇄할 수 있는 방안을 찾을 수 있게 된다.

Rhipe Platform for Big Data Processing and Analysis (빅데이터 처리 및 분석을 위한 Rhipe 플랫폼)

  • Jung, Byung Ho;Shin, Ji Eun;Lim, Dong Hoon
    • The Korean Journal of Applied Statistics
    • /
    • v.27 no.7
    • /
    • pp.1171-1185
    • /
    • 2014
  • Rhipe that integrates R and Hadoop environment, made it possible to process and analyze massive amounts of data using a distributed processing environment. In this paper, we implemented multiple regression analysis using Rhipe with various data sizes of actual data and simulated data. Experimental results for comparing the computing speeds of pseudo-distributed and fully-distributed modes for configuring Hadoop cluster, showed fully-distributed mode was more fast than pseudo-distributed mode and computing speeds of fully-distributed mode were faster as the number of data nodes increases. We also compared the performance of our Rhipe with stats and biglm packages available on bigmemory. The results showed that our Rhipe was more fast than other packages owing to paralleling processing with increasing the number of map tasks as the size of data increases.

A Parallel System for predicting protein-protein interactions (병렬 단백질 상호작용 예측 시스템)

  • 김세영;정유진
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10a
    • /
    • pp.709-711
    • /
    • 2004
  • 최근 단백질간의 상호작용의 중요성의 이해와 함께 축적되어 가는 단백질 정보들 간의 상호작용을 예측하기 위하여 통계학적 모델인 Support Vector Machine(SVM)을 사용한 예측 실험이 활발하다. 하지만 이는 거대한 생물 데이터를 처리하기 위해 많은 연산시간을 필요로 한다. 즉, 방대하게 존재하는 데이터를 처리하기 위해 SVM을 통한 실험은 정확한 결과뿐만 아니라 빠른 처리속도를 요구하게 되었다. 따라서 본 논문에서는 SVM의 개선을 통해 빠른 처리속도로 데이터를 처리하는 incremental SVM과 이를 병렬화 하여 더욱 빠른 처리시간을 가지는 Parallel SVM(PSVM)을 소개하고 실험해 본다. 즉, 단백질 상호작용에 사용되어지는 데이터를 PSVM을 사용한 실험을 통하여 정확성과 처리속도를 측정, 비교함으로써 단백질 상호작용 예측에 적합한지를 검증해본다.

  • PDF

Development of a system for confirming the failure of equipment in Web Site (Web Site에서의 교내 기자재고장처리 확인을 위한 시스템 개발)

  • Cho, Kyu Cheol;Jeon, Se Yeon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2019.01a
    • /
    • pp.219-220
    • /
    • 2019
  • 교내 기자재가 고장이 나면 사용자는 수리하는 담당자에게 직접 연락을 하여 조취를 취한다. 고장수리 담당자의 처리 여부에 대한 확인은 유선으로 상호간에 확인하는 방법뿐이다. 본 연구를 통해 고장 난 기자재를 처리하고 싶은 사용자를 위해 실시간으로 처리 현황을 확인 할 수 있는 인터페이스와 기능을 지원하는 시스템을 개발하였다. 관리자는 해당 분류에 맞게 처리하는 담당자를 구별해 시스템에 글을 게시하고, 담당자는 담당 부서 게시물만 열람할 수 있도록 하여 빠른 일처리를 지원할 수있는 기능을 중점으로 개발하였다. 또한 하나의 기자재마다 책임자를 구별하고 처리 완료된 기자재의 종류의 기록과 통계를 사용자와 담당자가 보기 어려운 단위나 수치보다는 시각적인 효과를 받기 위한 그래프의 사용과 색상을 통하여 알림을 전해준다.

  • PDF

A Study on Buffer Optimization System for Improving Performance in Spark Cluster (Spark 클러스터 환경에서 분산 처리 성능 향상을 위한 Buffer 최적화 시스템 연구)

  • Seok-Min Hong;So-Yeoung Lee;Yong-Tae Shin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.05a
    • /
    • pp.396-398
    • /
    • 2023
  • Statista 통계 조사에 따르면 데이터의 규모는 매년 증가할 것으로 예상하고 빅데이터 처리 프레임워크의 관심이 높아지고 있다. 빅데이터 처리 프레임워크 Spark는 Shuffle 과정에서 노드 간 데이터 전송이 일어난다. 이때 분산 처리한 데이터를 네트워크로 전송하기 위해 객체를 바이트 스트림으로 변환하여 메모리 buffer에 담는 직렬화 작업이 필요하다. 그러나 바이트 스트림을 buffer에 담는 과정에서 바이트 스트림의 크기가 메모리 buffer보다 클 경우, 메모리 할당 과정이 추가로 발생하여 전체적이 Spark의 성능 저하로 이어질 수 있다. 이에 본 논문에서는 Spark 환경에서 분산 처리 성능 향상을 위한 직렬화 buffer 최적화 시스템을 제안한다. 제안하는 방법은 Spark Driver가 Executor에게 작업을 할당하기 전 직렬화된 데이터 크기 측정과 직렬화 옵션 설정을 통해 Executor에게 적절한 buffer를 할당할 수 있다. 향후 제안하는 방법의 검증을 위해 실제 Spark 클러스터 환경에서 성능 평가가 필요하다.

Speaker Identification Using Higher-Order Statistics In Noisy Environment (고차 통계를 이용한 잡음 환경에서의 화자식별)

  • Shin, Tae-Young;Kim, Gi-Sung;Kwon, Young-Uk;Kim, Hyung-Soon
    • The Journal of the Acoustical Society of Korea
    • /
    • v.16 no.6
    • /
    • pp.25-35
    • /
    • 1997
  • Most of speech analysis methods developed up to date are based on second order statistics, and one of the biggest drawback of these methods is that they show dramatical performance degradation in noisy environments. On the contrary, the methods using higher order statistics(HOS), which has the property of suppressing Gaussian noise, enable robust feature extraction in noisy environments. In this paper we propose a text-independent speaker identification system using higher order statistics and compare its performance with that using the conventional second-order-statistics-based method in both white and colored noise environments. The proposed speaker identification system is based on the vector quantization approach, and employs HOS-based voiced/unvoiced detector in order to extract feature parameters for voiced speech only, which has non-Gaussian distribution and is known to contain most of speaker-specific characteristics. Experimental results using 50 speaker's database show that higher-order-statistics-based method gives a better identificaiton performance than the conventional second-order-statistics-based method in noisy environments.

  • PDF

A study on the improvement of academic achievement of probability and statistics in the hardware curriculum (하드웨어 전공자들의 확률 및 통계 관련 학업성취도 제고에 관한 연구)

  • Lee, Seung-Woo
    • Journal of the Korean Data and Information Science Society
    • /
    • v.27 no.4
    • /
    • pp.887-898
    • /
    • 2016
  • The purpose of this study is to improve the learning ability of probability/statistics for H/W majors. Firstly, we developed a teaching method coupling probability/statistics with programming and multimedia signal processing courses that are opened in the H/W major curriculum. By use of its teaching-learning, we tried to verify the effectiveness on the improvement of learner's academic achievement and then analyze its educational efficiency through the regression analysis. Secondly, by analyzing the surveys and the statistical results of the education cases, we proposed a management plan on efficient teaching-learning in order to cultivate the learning ability of probability/statistics at a future time. Lastly, we concluded that probability/statistics is a required course of learners so as to contribute for the advanced technical development and the enhanced competitiveness in the field of the H/W.

Variogram Analysis for Spatial Similarity Measures : A Case Study using Geochemical Data Sets in the Taebaek Area (공간적 상관도 측정을 위한 변이도 분석 : 태백지역의 지화학자료를 이용한 사례 연구)

  • Lee, Kiwon;Kwon, Byung-Doo
    • Economic and Environmental Geology
    • /
    • v.28 no.3
    • /
    • pp.271-277
    • /
    • 1995
  • The geological information analysis based on spatial statistical techniques have been studied in relation to mineral exploration. The applicability of outlier detection using moving-window statistics and directional cross-variography analysis have been verified by using geochemical data sets surveyed in the Taebaek area for mineral exploration. The directional variogram analysis has been basically known as a geostatistical method for spatial continuity measures. In this study, the application of this proposed method was extended to measure spatial correlation or similarity problems between two geochemical elements. For the appraisal of the usefulness of this scheme, five kinds of variogram functions were computed for original data and revised data, obtained by removing outliers detected by moving-window statistics and the results were compared. It is concluded that these advanced spatial statistical methods at the interpretation stage of spatial similarity provide us with valuable quantitative results as decision-supporting information for regional mineral exploration task.

  • PDF