• Title/Summary/Keyword: 직접 추출 기법

Search Result 259, Processing Time 0.028 seconds

Rule extraction from trained neural network using NofM algorithm with improved clustering step (개선된 군집화 단계의 NofM 알고리즘을 이용한 훈련된 신경망으로부터의 규칙추출)

  • Lee, Han-Yul;Ra, Jong-Hei;Kim, Moon-Hyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.10a
    • /
    • pp.581-584
    • /
    • 2001
  • 신경망이 만들어내는 출력에 대한 정보는 수치적으로 분산되어 신경망에 저장되므로, 인간이 직접 해석하기가 힘들다. 본 논문에서는 LRE(link rule extraction)기법인 NofM 알고리즘의 6단계 중에서 초기 단계인 가중치 군집화 단계를 개선하여 추출되는 규칙들의 전제부에 들어가는 규칙 조건들의 수를 조절함으로써, 추출된 규칙이 입력 특성에 대한 정보를 과잉 일반화하거나, 과잉 구체화하는 것을 피할 수 있음을 실험을 통해 보였다. 일반적으로 NofM 알고리즘에서 가중치들을 군집화한 때는 Join 알고리즘을 사용하는데, 본 논문에서는 Join 알고리즘의 Join condition을 0.05부터 0.25까지 0.05씩 점진적으로 확대하여 클러스터링을 하여줌으로써 신경망의 출력에 중요한 역할을 하는 가중치들을 효과적으로 군집화함을 보였다.

  • PDF

Candidate Significant Gene Recommendation with Symbolic Encoding of Microarray Data (마이크로어레이 데이터의 기호코딩을 통한 유의한 후보 유전자 검출)

  • Lee, Geon-Myeong;Lee, Hye-Ri;Kim, Won-Jae;Yun, Seok-Jung;Kim, Yong-Jun;Jeong, Pil-Du;Kim, Eun-Jeong
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2007.04a
    • /
    • pp.417-420
    • /
    • 2007
  • 마이크로어레이는 생명과학 분야에서 사용되는 대규모의 유전자 발현정도를 동시에 측정할 수 있는 도구이다. 마이크로어레이 실험은 많은 양의 데이터를 생성하기 때문에, 자동화된 효과적인 분석기법이 필요하다. 이 논문에서는 약물의 영향 분석을 위해 약물의 투여량 및 투여후의 시간대별로 샘플을 추출하여, 마이크로어레이를 이용하여 유전자의 발현량을 분석하는 경우에, 약물에 대해서 반응하는 유전자를 추출하는 데이터 마이닝 기법을 제안한다. 제안한 방법에서는 유전자의 발현정도값을 이전 시간의 값을 기준값으로 하여 증가, 감소, 답보에 해당하는 기호로 매핑하여, 분석자가 원하는 패턴을 보이는 유전자를 추천한다. 한편, 유전자의 상호간에 많은 영향을 주고 받기 때문에 특정 약물을 투여할 때, 이에 직접적인 영향을 받는 것도 있지만, 이와는 전혀 상관없이 동작하는 것도 있기 때문에, 제안한 방법에서는 이러한 약물 투여와 유의성이 있을 가능성이 있는 유전자만을 전처리과정을 통해서 필터링하는 기법을 활용한다. 제안한 방법은 실제 약물 투여 실험 샘플에 대한 마이크로어레이 데이터에 적용하여 활용가능성을 확인하였다.

  • PDF

Explanation-Based Data Mining in Data Warehouse (데이터웨어하우스 환경에서의 설명기반 데이터마이닝)

  • 김현수;이창호
    • Journal of Intelligence and Information Systems
    • /
    • v.5 no.2
    • /
    • pp.15-27
    • /
    • 1999
  • 산업계 전반에 걸친 오랜 정보시스템 운용의 결과로 대용량의 데이터들이 축적되고 있다. 이러한 데이터로부터 유용한 지식을 추출하기 위해 여러 가지 데이터마이닝 기법들이 연구되어 왔다. 특히 데이터웨어하우스의 등장은 이러한 데이터마이닝에 있어 필요한 데이터 제공 환경을 주고 있다. 그러나 전문가의 적절한 판단과 해석을 거치지 않은 데이터마이닝의 결과는 당연한 사실이거나, 사실과 다른 가짜이거나 또한 관련성 없는(Trivial, Spurious and Irrelevant) 내용만 무수히 쏟아낼 수 있다. 그러므로 데이터마이닝의 결과가 비록 통계적 유의성을 가진다 하더라고 그 정당성과 유용성에 대한 검증과정과 방법론의 정립이 필요하다. 데이터마이닝의 가장 어려운 점은 귀납적 오류를 없애기 위해 사람이 직접 그 결과를 해석하고 판단하며 아울러 새로운 탐색 방향을 제시해야 한다는 것이다. 본 논문의 목적인 이러한 데이터마이닝에서 추출된 결과를 검증하고 아울러 새로운 지식 탐색 방향을 제시하는 방법론을 정립하는데 있다. 본 논문에서는 데이터마이닝 기법 중 연관규칙탐사(Associations)로 얻어진 결과를 설명가능성 여부의 판단을 통해 검증하는 기법을 제안하였고, 이를 위해 도메인 지식(Domain Knowledge)과 연관규칙탐사를 통해 얻어진 결과를 표현하기 위한 지식표현방법으로 관계형 술어논리(RPL : Relational Predicate Logic)를 개발하였다. 연관규칙탐사로 얻어진 결과를 설명하기 위한 방법으로는 연관규칙탐사로 얻어진 연관규칙에 대한 RPL로 표현된 도메인 지식으로서 설명됨을 보이게 한다. 또한 이러한 설명(Explanation)을 토대로 검증된 지식을 일반화하여 새로운 가설을 연역적으로 생성하고 이를 연관규칙탐사를 통해 검증한 후 새로운 지식을 얻는 설명기반 데이터마이닝 구조(Explanation-based Data Mining Architecture)를 제시하였다.

  • PDF

Arc Detection using Logistic Regression (로지스틱 회기를 이용한 아크 검출)

  • Kim, Manbae
    • Journal of Broadcast Engineering
    • /
    • v.26 no.5
    • /
    • pp.566-574
    • /
    • 2021
  • The arc is one of factors causing electrical fires. Over past decades, various researches have been carried out to detect arc occurrences. Even though frequency analysis, wavelet and statistical features have been used, arc detection performance is degraded due to diverse arc waveforms. On the contray, Deep neural network (DNN) direcly utilizes raw data without feature extraction, based on end-to-end learning. However, a disadvantage of the DNN is processing complexity, posing the difficulty of being migrated into a termnial device. To solve this, this paper proposes an arc detection method using a logistic regression that is one of simple machine learning methods.

Limits of Direct PCR Amplification from Seaweeds Using Arbitrary and ITS Primers (해조류로부터 Arbitrary 및 ITS Primer들을 사용한 직접 PCR 유전자 증폭반응의 한계)

  • 김용국;진형주;박선미;진덕희;홍용기
    • Journal of Life Science
    • /
    • v.9 no.1
    • /
    • pp.15-21
    • /
    • 1999
  • The random amplified ploymorphic DNAs (RAPD) assay is a simple and useful tool in identification of appropriate genetic markers, that requires no knowledge of target DNA sequence. RAPD products were generated directly from seaweed tissues, without prior nucleic acid extraction, of Porphyra yezoensis, Ulva pertusa and Undaria pinnatifida. The nuclear rDNA internal transcribed spacer (ITS) fragment however was not amplified directly from the seaweed tissues. Using DNA extracted by the LiCl method, both the ITS and RAPD's have been amplified by the polymerase chain reaction. RAPD of P yezoensis, thallus (n) and conchocelis (2n) produced lots of different polymorphic bands (36-50$\%$) depending on the arbitrary primers used. Difference was also observed between direct tissues amplification and DNA extracts amplification (53-57$\%$). Thus it is important to use the same ploidy of tissue for DNA extraction and as a RAPD template.

  • PDF

Comparative Assessment of a Method for Extraction of TC-induced Rainfall Affecting the Korean Peninsula (한반도 태풍강우 추출기법 비교 평가)

  • Son, Chan-Young;Kwon, Hyun-Han;Kim, Jong-Suk;Moon, Young-Il
    • Journal of Korea Water Resources Association
    • /
    • v.47 no.12
    • /
    • pp.1187-1198
    • /
    • 2014
  • Strong winds and heavy rainfall from tropical cyclones (TCs) that occur in the Northwestern Pacific cause significant human and material damage to the Korean peninsula and East Asia. Hence, it is important to establish early warning systems and conduct preparedness activities in advance of a TC. This study suggests a technique to extract the value of uniform TC-induced rainfall considering the TC track and TC size. To validate our technique, we compare it to existing TC rainfall techniques using the spatial domain. To determine the TC size required for extracting TC-induced rainfall, this research analyzed the mean of TC-induced rainfall by TC size (1973-2012). As a result of this analysis, the maximum amount of mean of TC-induced rainfall was found for a TC with a radius of 700 km. Other techniques have limitations which this new technique addresses; it can extract TC-induced rainfall in each administrative area and minimize systematic biases of other extraction methods. The result of this study can be utilized in the preparation of rainfall forecasts, designing hydraulic structures, and predicting landslide and debris flows using TC-induced rainfall and downpours.

Scene Change Detection and Key Frame Selection Using Fast Feature Extraction in the MPEG-Compressed Domain (MPEG 압축 영상에서의 고속 특징 요소 추출을 이용한 장면 전환 검출과 키 프레임 선택)

  • 송병철;김명준;나종범
    • Journal of Broadcast Engineering
    • /
    • v.4 no.2
    • /
    • pp.155-163
    • /
    • 1999
  • In this paper, we propose novel scene change detection and key frame selection techniques, which use two feature images, i.e., DC and edge images, extracted directly from MPEG compressed video. For fast edge image extraction. we suggest to utilize 5 lower AC coefficients of each DCT. Based on this scheme, we present another edge image extraction technique using AC prediction. Although the former is superior to the latter in terms of visual quality, both methods all can extract important edge features well. Simulation results indicate that scene changes such as cut. fades, and dissolves can be correctly detected by using the edge energy diagram obtained from edge images and histograms from DC images. In addition. we find that our edge images are comparable to those obtained in the spatial domain while keeping much lower computational cost. And based on HVS, a key frame of each scene can also be selected. In comparison with an existing method using optical flow. our scheme can select semantic key frames because we only use the above edge and DC images.

  • PDF

다중 추출틀 조사기법을 적용한 인터넷 조사와 전화조사의 사례연구

  • 김영권;이계오;김주성;박무익
    • Proceedings of the Korean Association for Survey Research Conference
    • /
    • 2000.11a
    • /
    • pp.141-155
    • /
    • 2000
  • 현재 국내의 여론조사에서는 전화조사가 주로 이용되고 있으며, 최근 들어 인터넷조사를 활용하는 방법들이 연구되고 있다. 그러나 인테넷조사의 경우 모집단 구조가 편향된 특성을 가지고 있으므로 이에 대한 보완 수정없이 결과의 직접적인 이용은 많은 비표본오차를 발생시킬 수 있다. 그러므로 본 연구에서는 사회여론조사를 수행함에 있어서 편향모집단에서의 인터넷조사로부터의 추정값과 전화조사를 통한 추정값의 적절한 결합추정방법을 제안하고, 지난 4.13 총선의 조사자료를 이용하여 이들 결합추정의 효율성을 검토하였다.

  • PDF

A technique for predicting the cutting points of fish for the target weight using AI machine vision

  • Jang, Yong-hun;Lee, Myung-sub
    • Journal of the Korea Society of Computer and Information
    • /
    • v.27 no.4
    • /
    • pp.27-36
    • /
    • 2022
  • In this paper, to improve the conditions of the fish processing site, we propose a method to predict the cutting point of fish according to the target weight using AI machine vision. The proposed method performs image-based preprocessing by first photographing the top and front views of the input fish. Then, RANSAC(RANdom SAmple Consensus) is used to extract the fish contour line, and then 3D external information of the fish is obtained using 3D modeling. Next, machine learning is performed on the extracted three-dimensional feature information and measured weight information to generate a neural network model. Subsequently, the fish is cut at the cutting point predicted by the proposed technique, and then the weight of the cut piece is measured. We compared the measured weight with the target weight and evaluated the performance using evaluation methods such as MAE(Mean Absolute Error) and MRE(Mean Relative Error). The obtained results indicate that an average error rate of less than 3% was achieved in comparison to the target weight. The proposed technique is expected to contribute greatly to the development of the fishery industry in the future by being linked to the automation system.

Small Area Estimation of Unemplyoment Using Kalman Filter Method (KALMAN FILTER기법을 이용한 실업자 수의 소지역 추정)

  • 양영춘;이상은;신민웅
    • The Korean Journal of Applied Statistics
    • /
    • v.16 no.2
    • /
    • pp.239-246
    • /
    • 2003
  • In small area estimation, Best Linear Unbaised Predictor(BLUP) can be directly implicated ,specially, in use of the time series estimation. If there are correlations between observations and error terms over the time, Kalman Filter method can be used. Therefore, using kalman Filtering technique small area estimation of total of unemployments are estimated by BLUP. And for the example of this study, Economic Active Population Survey data were used.