• Title/Summary/Keyword: 확률데이터연관

Search Result 74, Processing Time 0.026 seconds

Feature Extraction and Classification using SVM for Biomedical Signal (생체 신호의 특징 추출 및 SVM을 이용한 분류)

  • 김만선;이상용
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10a
    • /
    • pp.181-183
    • /
    • 2003
  • 최근 대용량의 데이터베이스로부터 유용한 정보를 발견하고 데이터간에 존재하는 연관성을 탐색하고 분석하는 데이터 마이닝에 관한 많은 연구들이 진행되고 있다. 다양한 생체 신호를 분석하기 위하여 데이터 마이닝 기법을 이용할 수 있다. 본 논문에서는 심전도 신호의 패턴을 분류하기 위하여 신경망 기법을 적용하였다. 최근 패턴분류에 있어서 각광을 받고 있는 SVM 모델은 학습과정에서 얻어진 확률분포를 이용하여 의사결정함수를 추정한 후 이 함수에 따라 새로운 데이터를 이원분류 하는 것으로 분류 문제에 있어서 일반화 기능이 매우 높다. 기존에 많이 이용되던 BP 모델과 비교평가 하였다.

  • PDF

A Study on the Determination of Optimal Preventive Maintenance Periods using Simulation (시뮬레이션을 이용한 최적예방정비주기 결정에 관한 연구)

  • 윤익근;하종만;김호연;김동혁
    • Proceedings of the Korean Operations and Management Science Society Conference
    • /
    • 2002.05a
    • /
    • pp.590-597
    • /
    • 2002
  • LNG고압펌프계통은 천연가스 고압 송출에 있어 가용도가 매우 중요한 계통이다. 본 연구에서는 현재 적용되고 있는 예방(계획)정비주기를 가용성 측면에서 재검토했다. 확률적인 운전대수와 운전 및 보전 형태에 연관된 여러제약이 고려할 때 계통 불가용도를 정량화하기 위하여 시뮬레이션 기법을 적용했다. 중도 절단된 형태의 펌프 수명 데이터를 분석해 욕조형의 고장율 함수를 도출했으며 보수시간 데이터를 분석해 확률분포모수를 구했다. 또한 주요 펌프부대설비에 대해서는 상수형의 고장율과 보전율을 도출했다. 분석된 확률모수를 작성된 시뮬레이션 모형에 입력하고 과거의 운전대수 시나리오를 설정해 실험한 결과와 실제 보수 및 운전 자료를 비교해 모형의 유효성을 보였다. 그리고 차후 예상되는 운전요구대수 시나리오를 기정하고 각 예방정비주기별로 반복 실험하여 계통의 불가용도를 보이고 적합한 예방정비주기를 도출했으며 펌프부품 교체비용의 기대 절감액을 보였다.

  • PDF

초기 투자성과와 연계된 창업기업의 내부 결정요인 분석

  • Gu, In-Hyeok;Kim, Yong-Deok;Jo, Jae-Min
    • 한국벤처창업학회:학술대회논문집
    • /
    • 2022.11a
    • /
    • pp.195-199
    • /
    • 2022
  • 본 연구는 스타트업 투자성과와 연계된 창업가 역량, 재무정보 등 정량데이터를 기반으로 스타트업 투자자들의 투자결정요인을 분석하였다. 주요 실증결과는 다음과 같다. 첫째, 창업 초기 종업원 수가 많고, 최고경영자의 지분비율이 높을수록 투자승인 확률이 높게 나타났다. 둘째, 재무적 특성에서는 기업의 매출액 규모가 작을수록 투자승인 확률이 높게 나타났다. 이러한 결과는 스타트업의 경우, 기업의 단기성과보다는 투자 결정에 있어 미래가치 혹은 다른 정성적인 요인이 더 고려된다는 점을 보여준다. 셋째, 창업가 특성에서는 CEO 교육수준(학력)이 높을수록 투자승인 확률이 높게 나타났다. 즉, 창업자의 학력은 성공적인 투자 여부에 핵심적인 변수이고 이것은 선행연구의 결과와 다르지 않았다. 또한, 학력과 투자유치의 연관성은 창업 3년 미만 스타트업에서 상대적으로 강하게 나타났다. 선행연구에서 투자정보공개, 관련 데이터 확보의 어려움으로 스타트업 투자에 관한 정량적 실증연구가 거의 진행되지 못한 점을 고려한다면, 본 연구는 설문조사 방식을 뛰어넘어 국내 초기 창업기업만을 대상으로 성공적인 투자유치와 연계된 스타트업의 평가요인을 정량적으로 분석했다는 점에서 중요한 의의를 갖는다.

  • PDF

실시간 CRM을 위한 분류 기법과 연관성 규칙의 통합적 활용;신용카드 고객 이탈 예측에 활용

  • Lee, Ji-Yeong;Kim, Jong-U
    • 한국경영정보학회:학술대회논문집
    • /
    • 2007.06a
    • /
    • pp.135-140
    • /
    • 2007
  • 이탈 고객 예측은 데이터 마이닝에서 다루는 주요한 문제 중에 하나이다. 이탈 고객 예측은 일종의 분류(classification) 문제로 의사결정나무추론, 로지스틱 회귀분석, 인공신경망 등의 기법이 많이 활용되어왔다. 일반적으로 이탈 고객 예측을 위한 모델은 고객의 인구통계학적 정보와 계약이나 거래 정보를 입력변수로 하여 이탈 여부를 목표변수로 보는 형태로 분류 모델을 생성하게 된다. 본 연구에서는 고객과의 지속적인 접촉으로 발생되는 추가적인 사건 정보를 활용하여 연관성 규칙을 생성하고 이 결과를 기존의 방식으로 생성된 분류 모델과 결합하는 이탈 고객 예측 방법을 제시한다. 제시한 방법의 유용성을 확인하기 위해서 특정 국내 신용카드사의 실제 데이터를 활용하여 실험을 수행하였다. 실험 결과 제시된 방법이 기존의 전통적인 분류 모델에 비해서 향상된 성능을 보이는 것을 확인할 수 있었다. 제시된 예측 방법의 장점은 기존의 이탈 예측을 위한 입력 변수들 이외에 고객과 회사간의 접촉을 통해서 생성된 동적 정보들을 통합적으로 활용하여 예측 정확도를 높이고 실시간으로 이탈 확률을 갱신할 수 있다는 점이다.

  • PDF

SCOPML and SCOPBrowser (SCOPML과 SCOPBrowser)

  • 윤형석;황의윤;안건태;김진홍;이명준
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10c
    • /
    • pp.286-288
    • /
    • 2002
  • 포스트지놈 시대에 있어서 가장 주된 연구는 단백질의 구조적 유사성이나 분류학적인 연관성을 밝히는 것이다. SCOP 단백질 구조 분류는 이러한 목적을 위하여 3차원 구조가 알려진 단백질에 대한 구조적, 분류학적 관계에 대해 상세한 정보를 제공한다. 그러나 SCOP의 데이터는 단순 텍스트 기반의 자료만 제공되고 있어서, 이를 이용한 다른 분석 도구를 개발하거나 유용한 정보 추출을 할 경우 그 작업이 매우 힘들며 오류 발생의 확률이 높다. 본 논문에서는 단백질 구조 관련 연구자들이 SCOP 데이터를 보다 효과적으로 이용할 수 있도록 구조화된 문서의 표준인 XML을 이용하여 개발된 SCOPML에 대하여 기술한다. 그리고 SCOPML을 이용하여 SCOP 데이터에 대한 효율적인 검색을 지원하는 SCOPBrowser의 개발에 대해 기술한다.

  • PDF

Merge and Split of Players under MeanShift Tracking in Baseball Videos (야구 비디오에 대한 민시프트 추적 하에서 선수 병합 분리)

  • Choi, Hyeon-yeong;Hong, Sung-hwa;Ko, Jae-pil
    • Journal of Advanced Navigation Technology
    • /
    • v.21 no.1
    • /
    • pp.119-125
    • /
    • 2017
  • In this paper, we propose a method that merges and splits players in the MeanShift tracking framework. The MeanShift tracking moves the center of tracking window to the maximum probability location given the target probability distribution. This tracking method has been widely used for real-time tracking problems because of its fast processing speed. However, it hardly handles occlusions in multiple object tracking systems. Occlusions can be usually solved by applying data association methods. In this paper, we propose a method that can be applied before data association methods. The proposed method automatically merges and splits the overlapped players by adjusting the each player's tracking map. We have compared the tracking performance of the MeanSfhit tracking algorithm and the proposed method.

Comparing Accuracy of Imputation Methods for Categorical Incomplete Data (범주형 자료의 결측치 추정방법 성능 비교)

  • 신형원;손소영
    • The Korean Journal of Applied Statistics
    • /
    • v.15 no.1
    • /
    • pp.33-43
    • /
    • 2002
  • Various kinds of estimation methods have been developed for imputation of categorical missing data. They include category method, logistic regression, and association rule. In this study, we propose two fusions algorithms based on both neural network and voting scheme that combine the results of individual imputation methods. A Mont-Carlo simulation is used to compare the performance of these methods. Five factors used to simulate the missing data pattern are (1) input-output function, (2) data size, (3) noise of input-output function (4) proportion of missing data, and (5) pattern of missing data. Experimental study results indicate the following: when the data size is small and missing data proportion is large, modal category method, association rule, and neural network based fusion have better performances than the other methods. However, when the data size is small and correlation between input and missing output is strong, logistic regression and neural network barred fusion algorithm appear better than the others. When data size is large with low missing data proportion, a large noise, and strong correlation between input and missing output, neural networks based fusion algorithm turns out to be the best choice.

Loss-adjusted Regularization based on Prediction for Improving Robustness in Less Reliable FAQ Datasets (신뢰성이 부족한 FAQ 데이터셋에서의 강건성 개선을 위한 모델의 예측 강도 기반 손실 조정 정규화)

  • Park, Yewon;Yang, Dongil;Kim, Soofeel;Lee, Kangwook
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.18-22
    • /
    • 2019
  • FAQ 분류는 자주 묻는 질문을 범주화하고 사용자 질의에 대해 가장 유사한 클래스를 추론하는 방식으로 진행된다. FAQ 데이터셋은 클래스가 다수 존재하기 때문에 클래스 간 포함 및 연관 관계가 존재하고 특정 데이터가 서로 다른 클래스에 동시에 속할 수 있다는 특징이 있다. 그러나 최근 FAQ 분류는 다중 클래스 분류 방법론을 적용하는 데 그쳤고 FAQ 데이터셋의 특징을 모델에 반영하는 연구는 미미했다. 현 분류 방법론은 이러한 FAQ 데이터셋의 특징을 고려하지 못하기 때문에 정답으로 해석될 수 있는 예측도 오답으로 여기는 경우가 발생한다. 본 논문에서는 신뢰성이 부족한 FAQ 데이터셋에서도 분류를 잘 하기 위해 손실 함수를 조정하는 정규화 기법을 소개한다. 이 정규화 기법은 클래스 간 포함 및 연관 관계를 반영할 수 있도록 오답을 예측한 경우에도 예측 강도에 비례하여 손실을 줄인다. 이는 오답을 높은 확률로 예측할수록 데이터의 신뢰성이 낮을 가능성이 크다고 판단하여 학습을 강하게 하지 않게 하기 위함이다. 실험을 위해서는 다중 클래스 분류에서 가장 좋은 성능을 보이고 있는 모형인 BERT를 이용했으며, 비교 실험을 위한 정규화 방법으로는 통상적으로 사용되는 라벨 스무딩을 채택했다. 실험 결과, 본 연구에서 제안한 방법은 기존 방법보다 성능이 개선되고 보다 안정적으로 학습이 된다는 것을 확인했으며, 데이터의 신뢰성이 부족한 상황에서 효과적으로 분류를 수행함을 알 수 있었다.

  • PDF

Standardization for basic association measures in association rule mining (연관 규칙 마이닝에서의 평가기준 표준화 방안)

  • Park, Hee-Chang
    • Journal of the Korean Data and Information Science Society
    • /
    • v.21 no.5
    • /
    • pp.891-899
    • /
    • 2010
  • Association rule is the technique to represent the relationship between two or more items by numerical representing for the relevance of each item in vast amounts of databases, and is most being used in data mining. The basic thresholds for association rule are support, confidence, and lift. these are used to generate the association rules. We need standardization of lift because the range of lift value is different from that of support and confidence. And also we need standardization of support and confidence to compare objectively association level of antecedent variables for one descendant variable. In this paper we propose a method for standardization of association thresholds considering marginal probability for each item to grasp objectively and exactly association level, check the conditions for association criteria and then compare association thresholds with standardized association thresholds using some concrete examples.

A study on asset management investment strategy model by trade probability control on futures market (선물시장에서 거래확률 조정을 통한 자산운용 투자전략 모델에 관한 연구)

  • Lee, Suk-Jun;Kim, Ji-Hyun;Jeong, Suk-Jae
    • Management & Information Systems Review
    • /
    • v.31 no.3
    • /
    • pp.21-46
    • /
    • 2012
  • This paper attempts to offer an effective strategy of hedge fund based on trade probability control in the futures market. By using various technical indicators, we create an association rule and transforms it into a trading rule to be used as an investment strategy. Association rules are made by the combination of various technical indicators and the range of individual indicator value. Adjustments of trade probabilities are performed by depending on the rule combinations and it can be utilized to establish an effective investment strategy onto the risk management. In order to demonstrate the superiority of the investment strategy proposed, we analyzed a profitability using the futures index based on KOSPI200. Experiments results show that our proposed strategy could effectively manage and response the dynamics investment risks.

  • PDF