• 제목/요약/키워드: Random selection

검색결과 638건 처리시간 0.036초

영상 디블러링에서의 임의 잡음 제거를 위한 로지스틱 회귀 (A Logistic Regression for Random Noise Removal in Image Deblurring)

  • 이남용
    • 한국멀티미디어학회논문지
    • /
    • 제20권10호
    • /
    • pp.1671-1677
    • /
    • 2017
  • In this paper, we propose a machine learning method for random noise removal in image deblurring. The proposed method uses a logistic regression to select reliable data to use them, and, at the same time, to exclude data, which seem to be corrupted by random noise, in the deblurring process. The proposed method uses commonly available images as training data. Simulation results show an improved performance of the proposed method, as compared with the median filtering based reliable data selection method.

표본 선택 모형을 이용한 국내 여성 임금 데이터 분석 (Korean women wage analysis using selection models)

  • 정미량;김미정
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권5호
    • /
    • pp.1077-1085
    • /
    • 2017
  • 본 연구에서는 한국노동연구원의 "2015년 한국노동패널조사 (KLIPS)" 자료를 활용하여 국내 여성의 임금 결정요인을 분석하기 한다. 일반적으로 임금 자료는 랜덤 추출이 불가능하기 때문에 분석하기가 쉽지 않다. 표본 선택 편의 (sampling bias)가 있는 자료를 분석하는 방법으로 Heckman 표본 선택 모형이 가장 널리 알려져 있다. Heckman은 크게 두 가지 모형을 제안했는데, 그 중 하나는 최대 우도 방법을 이용하는 것이고, 다른 하나는 2단계 표본 선택 모형이다. 이 중 Heckman 2단계 표본 선택 모형은 주된 결과 모형 (outcome model)과 경제 활동 여부를 결정짓는 선택 모형 (selection model)을 포함한 모형으로써, 이 모형이 최대 우도 방법을 이용한 모형에 비해 이변수 오차의 정규분포 가정에 덜 민감하다고 알려져 있다. 그럼에도 불구하고 이변수 오차에 대한 정규 분포 가정은 꽤 강한 가정이라고 볼 수 있는데, 최근에 이 모형의 단점을 보완하는 모형으로 Marchenko와 Genton (2012)의Heckman 표본 선택 t 모형이 제시되었다. Heckman 2단계 모형과 Heckman 표본 선택 t 모형을 이용하여 국내 여성의 임금 결정 요인을 분석하고 비교하도록 한다.

랜덤한 릴레이를 갖는 추가 기회전송 협동 릴레이 시스템의 릴레이 선택법에 따른 성능비교 (Performance Comparison of Relay Selection Methods for Incremental Cooperative Relaying Systems with Spatially Random Relay)

  • 김남수
    • 한국인터넷방송통신학회논문지
    • /
    • 제16권3호
    • /
    • pp.65-71
    • /
    • 2016
  • 무선 페이딩 채널에서 시스템의 성능 저하를 효과적으로 개선하기 위하여 협동 릴레이 시스템에 관한 연구가 활발히 진행되고 있다. 그동안의 연구는 고정된 릴레이를 가정하였는데, 최근에는 실제 이동통신 환경을 고려하여 공간적으로 랜덤하게 분포된 릴레이를 갖는 협동 릴레이 시스템의 연구가 시작되고 있다. 특히 통신 자원의 효율이 높은 추가 기회전송 협동 릴레이 시스템에서는 릴레이를 선택하는 방법에 따라서 시스템의 성능이 변화하는데, 이에 대한 비교 연구는 발표되지 않았다. 따라서 본 논문에서는 최대 SNR 선택법과 최대-최소 SNR 선택법을 대상으로 최대비 결합을 사용한 추가 기회전송 협동 릴레이 시스템의 성능을 유도하였고, 송신전력이 소스와 릴레이로 배분되었을 때의 오수신율을 비교하였다. 본 논문의 해석적 결과는 이동통신 시스템에 기회전송 증가 릴레이 시스템을 도입하였을 경우 릴레이를 선택하고 송신 전력을 배분하는데 이론적 근거로 활용할 수 있을 것으로 생각된다.

속성선택방법과 워드임베딩 및 BOW (Bag-of-Words)를 결합한 오피니언 마이닝 성과에 관한 연구 (Investigating Opinion Mining Performance by Combining Feature Selection Methods with Word Embedding and BOW (Bag-of-Words))

  • 어균선;이건창
    • 디지털융복합연구
    • /
    • 제17권2호
    • /
    • pp.163-170
    • /
    • 2019
  • 과거 10년은 웹의 발달로 인한 데이터가 폭발적으로 생성되었다. 데이터마이닝에서는 대용량의 데이터에서 무의미한 데이터를 구분하고 가치 있는 데이터를 추출하는 단계가 중요한 부분을 차지한다. 본 연구는 감성분석을 위한 재표현 방법과 속성선택 방법을 적용한 오피니언 마이닝 모델을 제안한다. 본 연구에서 사용한 재표현 방법은 백 오즈 워즈(Bag-of-words)와 Word embedding to vector(Word2vec)이다. 속성선택(Feature selection) 방법은 상관관계 기반 속성선택(Correlation based feature selection), 정보획득 속성선택(Information gain)을 사용했다. 본 연구에서 사용한 분류기는 로지스틱 회귀분석(Logistic regression), 인공신경망(Neural network), 나이브 베이지안 네트워크(naive Bayesian network), 랜덤포레스트(Random forest), 랜덤서브스페이스(Random subspace), 스태킹(Stacking)이다. 실증분석 결과, electronics, kitchen 데이터 셋에서는 백 오즈 워즈의 정보획득 속성선택의 로지스틱 회귀분석과 스태킹이 높은 성능을 나타냄을 확인했다. laptop, restaurant 데이터 셋은 Word2vec의 정보획득 속성선택을 적용한 랜덤포레스트가 가장 높은 성능을 나타내는 조합이라는 것을 확인했다. 다음과 같은 결과는 오피니언 마이닝 모델 구축에 있어서 모델의 성능을 향상시킬 수 있음을 나타낸다.

네트워크 라우팅을 위한 개선된 AntNet 알고리즘 (Modified AntNet Algorithm for Network Routing)

  • 강득희;이말례
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권5호
    • /
    • pp.396-400
    • /
    • 2009
  • 다량의 데이터를 전송할 때, 시간 단축과 효율적인 트래픽관리를 위해 네트워크의 라우팅 선택 방법이 사용되고 있다. Ant 알고리듬을 적용한 AntNet은 라우팅 선택 확률이 동일할 때, 랜던선택을 한다. 그로인해서 불필요한 가중치가 발생하여 트래픽이 증가한다. 본 논문은 이를 해결하기 위해 GA 알고리듬을 AntNet에 적합하여 데이터 전송을 위한 전송시간 감소와 효율적인 트래픽 분산을 해결하였다. 제안한 알고리즘 성능평가를 위해서 본 논문에서는 대량의 데이터를 전송하기 위한 경로를 설정하고, 전송시간과 전송 오류율을 평가하여 우수성을 보였다.

CRF Based Intrusion Detection System using Genetic Search Feature Selection for NSSA

  • Azhagiri M;Rajesh A;Rajesh P;Gowtham Sethupathi M
    • International Journal of Computer Science & Network Security
    • /
    • 제23권7호
    • /
    • pp.131-140
    • /
    • 2023
  • Network security situational awareness systems helps in better managing the security concerns of a network, by monitoring for any anomalies in the network connections and recommending remedial actions upon detecting an attack. An Intrusion Detection System helps in identifying the security concerns of a network, by monitoring for any anomalies in the network connections. We have proposed a CRF based IDS system using genetic search feature selection algorithm for network security situational awareness to detect any anomalies in the network. The conditional random fields being discriminative models are capable of directly modeling the conditional probabilities rather than joint probabilities there by achieving better classification accuracy. The genetic search feature selection algorithm is capable of identifying the optimal subset among the features based on the best population of features associated with the target class. The proposed system, when trained and tested on the bench mark NSL-KDD dataset exhibited higher accuracy in identifying an attack and also classifying the attack category.

Development of an index that decreases birth weight, promotes postnatal growth and yet minimizes selection intensity in beef cattle

  • Kenji Togashi;Toshio Watanabe;Atsushi Ogino;Masakazu Shinomiya;Masashi Kinukawa;Kazuhito Kurogi;Shohei Toda
    • Animal Bioscience
    • /
    • 제37권5호
    • /
    • pp.839-851
    • /
    • 2024
  • Objective: The main goal of our current study was to improve the growth curve of meat animals by decreasing the birth weight while achieving a finishing weight that is the same as that before selection but at younger age. Methods: Random regression model was developed to derive various selection indices to achieve desired gains in body weight at target time points throughout the fattening process. We considered absolute and proportional gains at specific ages (in weeks) and for various stages (i.e., early, middle, late) during the fattening process. Results: The point gain index was particularly easy to use because breeders can assign a specific age (in weeks) as a time point and model either the actual weight gain desired or a scaled percentage gain in body weight. Conclusion: The point gain index we developed can achieve the desired weight gain at any given postnatal week of the growing process and is an easy-to-use and practical option for improving the growth curve.

머신러닝 기반 가치투자를 통한 주식 종목 선정 연구: 내재가치를 중심으로 (Selecting Stock by Value Investing based on Machine Learning: Focusing on Intrinsic Value)

  • 김윤승;유동희
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제32권1호
    • /
    • pp.179-199
    • /
    • 2023
  • Purpose This study builds a prediction model to find stocks that can reach intrinsic value among KOSPI and KOSDAQ-listed companies to improve the stability and profitability of the stock investment. And investment simulations are conducted to verify whether stock investment performance is improved by comparing the prediction model, random stock selection, and the market indexes. Design/methodology/approach Value investment theory and machine learning techniques are applied to build the model. Various experiments find conditions such as the algorithm with the best predictive performance, learning period, and intrinsic value-reaching period. This study selects stocks through the prediction model learned with inventive variables, does not limit the holding period after buying to reach the intrinsic value of the stocks, and targets all KOSPI and KOSDAQ companies. The stock and financial data are collected for 21 years (2001-2021). Findings As a result of the experiment, using the random forest technique, the prediction model's performance was the best with one year of learning period and within one year of the intrinsic value reaching period. As a result of the investment simulation, the cumulative return of the prediction model was up to 1.68 times higher than the random stock selection and 17 times higher than the KOSPI index. The usefulness of the prediction model was confirmed in that the number of intrinsic values reaching the predicted stock was up to 70% higher than the random selection.

Exploring the Feature Selection Method for Effective Opinion Mining: Emphasis on Particle Swarm Optimization Algorithms

  • Eo, Kyun Sun;Lee, Kun Chang
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권11호
    • /
    • pp.41-50
    • /
    • 2020
  • 감성분석 연구에서는 문장에 내포된 감성을 결정짓는 단어를 찾는 것으로부터 시작된다. 경영자는 소비자가 주로 사용하는 단어를 분석함으로써 시장의 반응을 이해할 수 있다. 본 연구에서는 감성분류의 성능에 영향을 미치는 단어를 찾기 위하여 입자군집최적화 탐색방법과 다목적진화 알고리즘이 적용된 속성선택 방법을 제안한다. 속성선택 방법은 기존 머신러닝 분류기를 벤치마킹함으로써 성능이 비교된다. 벤치마킹된 분류기는 의사결정나무, 나이브 베이지안 네트워크, 서포터 벡터 머신, 랜덤포레스트, 배깅, 랜덤 서브스페이스, 로테이션 포레스트이다. 연구결과에 따르면, 입자군집 최적화 알고리즘이 적용된 속성선택방법으로 선택된 속성을 사용한 경우에 속성의 수를 상당히 줄일 수 있었고, 분류기의 성능을 유지시킬 수 있었다. 특히, 정확도 결과에서는 입자군집 최적화 탐색방법으로 선택된 속성을 사용한 경우의 서포터 벡터 머신의 성능이 가장 높게 나타났다. AUC 결과에서는 랜덤 서브스페이스가 가장 높게 나타났다. 본 연구의 결과는 해당 탐색방법과 분류기를 적용함으로써 오피니언 마이닝 모델의 성능을 효율적으로 유지 및 개선시키도록 도움을 준다.

포아송 모형에서의 설명변수 선택문제 - 정규분포 설명변수하에서 - (Subset Selection in the Poisson Models - A Normal Predictors case -)

  • 박종선
    • 응용통계연구
    • /
    • 제11권2호
    • /
    • pp.247-255
    • /
    • 1998
  • 일반선형 모형의 하나인 포아송모형에서 설명변수들을 선택하는 문제를 고려하여 보았다 설명변수들이 정규분포를 따르는 확률변수일 때 반응변수의 조건부 분포를 통하여 모형에 필요한 설명변수의 부분집합을 선택하는 방범을 제시하였다.

  • PDF