• 제목/요약/키워드: Information classification

검색결과 8,363건 처리시간 0.037초

데이터마이닝 알고리즘의 분류 및 분석 (Classification and Analysis of Data Mining Algorithms)

  • 이정원;김호숙;최지영;김현희;용환승;이상호;박승수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권3호
    • /
    • pp.279-300
    • /
    • 2001
  • 지식탐사 프로세스의 핵심적인 역할을 담당하는 데이터마이닝 단계에서는 여러 가지 목적에 따라 알고리즘을 선택하여 사용한다. 최근 통계, 비즈니스, 전자 상거래, 의학, 생물학 등의 분야에서 데이터마이닝 기술아 적극적으로 활용되고 있으며, 이를 위해 다양한 알고리즘들이 계속해서 연구.개발되고 있다. 그러나 시간이 지나면 이들 중 각 분야 별로 우수한 응용성을 보이는 알고리즘이나 방대한 양의 데이터를 다루는데 있어 좋은 성능을 보이는 몇몇 알고리즘만이 남게 될 것이며 또한 앞으로는 이러한 알고리즘들만을 선별하여 집중 연구할 필요가 있다. 따라서 본 논문에서는 데이터마이닝에 널리 사용되고 활발한 연구가 진행중인 알고리즘들 중에서 연관규칙(association rule), 클러스터링(clustering), 신경망(neural network), 결정트리(decision tree), 유전자 알고리즘(genetic algorithm), 베이지안 네트워크(bayesian network), 메모리 기반 추론(memory-based reasoning)등 7가지 카테고리에 속하는 알고리즘들을 선정하여 분류.분석하였다. 우선 각 알고리즘의 계통과 특성들을 분석하였고 이를 토대로 비교.분석을 위한 14가지의 분류 기준을 제시하였다. 이러한 분류 기준에 근거하여 세부 알고리즘들을 분석해 보고 비교 가능한 일부 알고리즘은 여러 특징과 성능을 중심으로 각각 최상의 알고리즘을 도출해 보았다. 본 연구 결과는 데이터마이닝 분야의 흔재된 알고리즘들을 분류.분석함으로써 마이닝 기술 적용시 사용자에게 알고리즘 선택의 지표를 제시할 수 있을 것이다.

  • PDF

건설폐기물 재활용 2차 제품에 대한 확률모델 기반 비용분석 (Probability-based Cost Analysis for Recycling Secondary Products from Construction Waste)

  • 권기현;김도겸;이호재;서은아
    • 한국건설순환자원학회논문집
    • /
    • 제8권2호
    • /
    • pp.227-234
    • /
    • 2020
  • 본 연구에서는 토목건설 분야에서 활용 가능한 폐기물 재활용 2차 제품 후보군 각각에 대한 비용분석 결과를 제시하였다. 각각의 비용 항목에 내재된 불확실성을 고려하여 확률모델 기반 비용 분석을 수행하였으며, 2차 제품 제작에 의해 발생하는 이익 비용을 제시하였다. 폐기물 재활용 시 각각의 공정별 투입 비용 발생은 불가피하며, 이는 2차 제품 대상 후보군별로 달라지는데 제품별 실용화에서 경제성 확보를 위해서는 제품 품질향상 뿐만 아니라 투입 비용의 정확한 산정이 요구된다. 본 연구에서는 폐기물 재활용에 따른 비용분석을 통해 제품별 발생 가능한 이익과 이익발생 확률 산정법을 제시하였다. 재활용 비용분석 항목으로 폐기물 분류 비용, 재활용 처리시설로의 운반비용, 재활용 제품생산비용 등을 고려하였으며, 또한 재활용 제품생산에 따른 이익분석을 위해 폐기물이 재활용 되지 못하고 폐기될 경우와 재활용될 경우를 서로 비교하여 그 차이를 이익으로 환산하여 추정하였다. 건설폐기물 매립지까지 거리가 늘어날수록 재활용에 따른 이익발생이 증가하였고 재활용 시설까지의 거리는 이익발생에 영향을 주었으며, 또한 재활용 제품 선정, 재활용 처리시설의 최적위치 결정, 목표가격 결정 등에 유용하게 활용할 수 있음을 확인하였다.

다중판별 장치 스크리닝 기법을 이용한 가스공정의 위험성 평가 (Hazard Evaluation of Gas Processes Using a Multi-distinction Equipment Screening Algorithm)

  • 윤인섭;박정수;안성준;한경훈;윤종필;김구회;신동일
    • 한국가스학회지
    • /
    • 제7권1호
    • /
    • pp.1-9
    • /
    • 2003
  • 본 연구에서는 가스공정에서 중요시되는 화재/폭발에 대한 위험성 평가 기법으로, 공정위험 지수법인 Dow's F&EI와 정성적 위험판별기법인 장치스크리닝 기법의 특성에 산업별로 위험시되는 사항에 대한 전문가 의견을 수렴할 수 있도록 전문가 시스템-장치 및 공청의 사고사례 및 전문가의 의견 수렴된 시스템을 도입하여 위험 지수에 전문가적 reward/penalty를 주고 공정 장치의 종합위험도 지수를 계산하여 보다 정밀한 위험장치 검색을 할 수 있는 형태인 다중판별 장치스크리닝 기법(Multi-distinction Equipment Screening Algorithm, MESA)을 제안하였다. 그리고 이에 대한 사례연구로 LPG 지하저장공정의 위험도 순위에 대해 전문가 시스템이 도입되지 않은 경우와 도입된 경우의 위험판단 해상도를 파악하여 제안 알고리즘의 유용성을 입증하였다. 그리고 이와 같은 위험도 순위에 따른 장치의 물리적 특징을 파악함으로써 안전장치 및 mitigation 장치 그리고 비상대응계획에 대한 정보를 제공할 수 있으리라 기대한다.

  • PDF

만성질환 이환율을 이용한 여자노인의 체질량지수에 대한 아시아-태평양지역 기준과 Entropy모델 기준 비교 (A Comparison between Asia-Pacific Region Criteria and Entropy Model Criteria about Body Mass Index of Elderly Females Using Morbidity of Chronic Disease)

  • 정구범;박진용;권세영;박경옥;박필숙;박미연
    • 대한지역사회영양학회지
    • /
    • 제19권5호
    • /
    • pp.490-498
    • /
    • 2014
  • Objectives: This study was conducted to propose the need of re-establishing the criteria of the body weight classification in the elderly. We compared the Asia-Pacific Region Criteria (APR-C) with Entropy Model Criteria (ENT-C) using Morbidity rate of chronic diseases which correlates significantly with Body Mass Index (BMI). Methods: Subjects were 886 elderly female participating in the 2007-2009 Korea National Health and Nutrition Examination Survey (KNHANES). We compared APR-C with those of ENT-C using Receiver Operating Characteristics (ROC) curve and logistic regression analysis. Results: In the case of the morbidity of hypertension, the results were as follows: Where it was in the T-off point of APR-C, sensitivity was 67.5%, specificity was 43.1%, and Youden's index was 10.6. While in the cut-off point of ENT-C, it was 56.7%, 56.6%, and 13.3 respectively. In the case of the morbidity of diabetes, the results were as follows: In the cut-off point of APR-C, Youden's index was 14.2. While in the cut-off point of ENT-C, it was 17.2 respectively. The Area Under the ROC Curve (AUC) of the subjects who had more than 2 diseases among hypertension, diabetes, and dyslipidemia was 0.615 (95% CI: 0.578-0.652). Compared to the normal group, the odds ratio of the hypertension group which will belong to the overweight or obesity was 1.79 (95% CI: 1.30-2.47) in the APR-C, and 2.04 (95% CI: 1.49-2.80) in the ENT-C (p < 0.001). Conclusions: We conclude that the optimal cut-off point of BMI to distinguish between normal weight and overweight was $24kg/m^2$ (ENT-C) rather than $23kg/m^2$ (APR-C).

베이지안 망에 기초한 불임환자 임상데이터의 분석 (Bayesian Network-Based Analysis on Clinical Data of Infertility Patients)

  • 정용규;김인철
    • 정보처리학회논문지B
    • /
    • 제9B권5호
    • /
    • pp.625-634
    • /
    • 2002
  • 본 논문에서는 베이지안 망을 기초로 불임환자의 임상 데이터에 대한 다양한 분석 실험을 전개하였다. 이 실험을 통해 임신여부에 영향을 주는 요인들간의 상호의존성을 분석해보고, 또 NBN, BAN, GBN 등 제약조건이 다른 다양한 유형의 베이지안 망 분류기들의 분류성능을 서로 비교해보았다. 그리고 우리는 이와 같은 실험을 통해 임신가능여부(Clin)에 직접적인 영향을 미치는 중요한 요인들로 증상(IND), 약물치료법(stimulation), 여성의 나이(FA), 미세조작 난자의 수(ICT), Wallace 사용여부(ETM) 등 5개의 특성들을 가려낼 수 있었고, 이 요인들간의 상호 의존성도 찾아낼 수 있었다. 또 서로 다른 유형의 베이지안 망 분류기들 중에서 요인들간의 상호의존관계를 허용하는 좀 더 일반적인 BAN과 GBN 등이 그렇지 못한 NBN에 비해 상대적으로 더 높은 분류 성능을 보여준다는 것을 확인하였다. 또 결정트리와 k-최근접 이웃과 같은 다른 분류기들과의 성능 비교를 통해, 임상 데이터의 특성상 확률적 표현과 추론에 기초한 베이지안 망 분류기들이 보다 높은 성능을 보여준다는 사실도 확인할 수 있었다. 또 본 논문에서는 클래스 노드의 Markov blanket에 속한 특성들로 특성집합을 축소하는 것을 제안하고, 실험을 통해 이 특성 축소방법이 베이지안 망 분류기들의 성능을 높여 줄 수 있는지 알아보았다.

표토유실 보전을 통한 온실가스배출 저감과 수자원 보전 기능의 산출 및 정책제안 (Estimating of the Greenhouse Gas Mitigation and Function of Water Resources Conservation through Conservation of Surface Soils Erosion and Policy Suggestion)

  • 오승민;김혁수;이상필;이종건;정석순;임경재;김성철;박윤식;이기하;황상일;양재의
    • 한국지하수토양환경학회지:지하수토양환경
    • /
    • 제22권6호
    • /
    • pp.74-84
    • /
    • 2017
  • Soil erosion is often extreme in Korea due to high rainfall intensities and steep slopes, and climate change has also increased the risk of erosion. Despite its significane, erosion-induced soil organic carbon (SOC) emission and water resource loss are not well understood, along with the lack of an integrated surface soil erosion protection policy. Therefore, to design adequate protection policies, land users, scientists, engineers and decision makers need proper information about surface soil and watershed properties related to greenhouse gas emission potential and water conservation capability, respectively. Assuming the total soil erosion of $346Tg\;yr^{-1}$, soil organic matter (SOM) content of 2% (58% of SOM is SOC), and mineralization rate of 20% of the displaced carbon, erosion-induced carbon emission could reach $800Gg\;C\;yr^{-1}$. Also the available water capacity of the soil was estimated to be 15.8 billion tons, which was 14 times higher than the yearly water supply demand in Seoul, Korea. Therefore, in order to prevent of soil erosion, this study proposes a three-stage plan for surface soil erosion prevention: 1) classification of soil erosion risk and scoring of surface soil quality, 2) selection of priority areas for conservation and best management practices (BMP), and 3) application of BMP and post management.

재배마의 동위효소와 생육특성 비교 (Comparison of lsozymes and Growth Characteristics of Cultivars in Dioscorea batatas DECNE)

  • 박충헌;성낙술;안병옥;김춘식;이승택
    • 한국약용작물학회지
    • /
    • 제4권1호
    • /
    • pp.52-57
    • /
    • 1996
  • 국내에 재배되는 마(Dioscorea batatas) 주요품종으로는 식용으로 널리 쓰이는 단마, 약용으로 이용되는 장마 그리고 최근 식용마로 도입육성된 축근종(筑根種) 등이 있다. 본 연구는 이들 세종류의 마 주요품종을 대상으로 동위효소 분석과 생육특성 및 수량성을 비교하여 얻어진 결과이다. 1. 마 주요품종의 동위효소 분석 마 주요품종의 동위효소를 분석한 결과 단백질의 band pattern은 잎, 엽병, 줄기 모두에서 Band의 수와 위치의 차이를 보였다. Peroxidase의 동위효소는 잎과 엽병은 거의 동일하게 조사되었으나 줄기조직에 의해 구분이 가능하였다. 그리고 Esterase의 경우는 잎과 엽병, 줄기 모두에서 band pattern의 차이를 보여 품종간 구분이 가능하였다. 2. 마 주요품종의 생육특성 및 수량비교 엽형비교에서 단마와 장마는 상위엽이 피침형이고 축근종(筑根種)은 장심장형 이었으며, 엽서는 장마와 단마의 상위엽이 호. 대생을 보인반면 축근종(筑根種)은 대생이었다. 뿌리 생육과 수량성 비교에서 괴 근수가 단마 1.2개, 장마 1.3개지만 축근종(筑根種)은 1개였다. 괴근장은 단마와 장마가 각각 30cm와 51cm로 길었지만 축근종(筑根種)은 9.7cm로 짧았다. 괴근수량은 단마가 2,751kg/10a로 가장 높았고 장마가 2,288kg/10a였으며, 축근종(筑根種)은 1,785kg/10a였다. 축근종(筑根種)의 수량은 단마와 장마에 비하여 적었으나 단괴형이어서 기계화 수확에 유리한 품종으로 생각되었다.

  • PDF

수치지도 건물데이터의 매칭 기반 갱신 및 이력 데이터 생성 (Updating Building Data in Digital Topographic Map Based on Matching and Generation of Update History Record)

  • 박슬아;유기윤;박우진
    • 한국측량학회지
    • /
    • 제32권4_1호
    • /
    • pp.311-318
    • /
    • 2014
  • 건물 데이터는 지도 데이터베이스에서 차지하는 비중이 높고 객체 수도 많을 뿐만 아니라 형상정보 및 속성정보가 빠르게 변화하기 때문에, 최신 정보에 근거한 효율적인 갱신 작업은 필수적이다. 본 연구에서는 갱신 참조 건물데이터와 갱신 대상 건물 데이터의 중첩분석을 통해 갱신이 필요한 객체만을 탐색하여 갱신을 수행하고자 한다. 즉, 건물의 중첩 면적비를 이용하여 매칭 후보쌍을 탐색한 후, 속성정보 비교를 통해 갱신 케이스 분류 조건식을 정의하였으며, 이때 도형정보 갱신 케이스는 총 8가지, 속성정보 갱신 케이스는 총 4가지로 각각 분류하였다. 또한 갱신정보에 대한 갱신 이력 데이터가 자동으로 생성되도록 하여 두 가지 종류의 갱신 케이스 정보를 저장하도록 구성하였다. 갱신 대상 데이터는 수치지도 1:5,000 건물외곽선 레이어로 하였고, 갱신 참조 데이터는 도로명주소전자지도건물 레이어로 하였으며, 서울시 관악구 지역을 대상지역으로 선정하였다. 본 연구의 매칭기반 갱신기법을 적용한 결과, 전체 건물데이터 중, 82.1%의 건물이 도형정보를 수정하였고, 34.5% 건물이 속성정보를 수정하였다.

데이터 유출 탐지를 위한 이상 행위 탐지 방법의 비교 및 분석 (Comparison and Analysis of Anomaly Detection Methods for Detecting Data Exfiltration)

  • 임원기;권구형;김정재;이종언;차시호
    • 한국산학기술학회논문지
    • /
    • 제17권9호
    • /
    • pp.440-446
    • /
    • 2016
  • 군사 비밀이나 조직의 기밀 데이터는 그 조직의 매우 중요한 자원이며 외부로부터의 접근이 차단되어야 한다. 그러나 최근 인터넷의 접근성이 높아짐으로써 보안이 중요한 이슈로 부상하고 있다. 이를 위해 네트워크 내부에 대한 공격이나 침입행위를 탐지하는 이상 행위 탐지 방법이 제안되었다. 그러나 대부분의 이상 행위 탐지는 외부로부터의 침입에 대한 측면만 다루고 있으며, 공격이나 침입보다 더 큰 피해를 입히는 내부 데이터의 유출에 대해서는 다루고 있지 않다. 또한 기존의 이상 행위 탐지 방법을 데이터 유출 탐지에 적용할 경우 네트워크 내부의 환경과 여러 가지 변수들이 고려되어 있지 않기 때문에 많은 문제점들이 발생한다. 따라서 본 논문에서는 데이터 유출 탐지를 위한 이상 행위 탐지(Data Exfiltrating Detection for Anomaly Detection : DEDfAD) 방법의 정확도 향상을 위하여 DEDfAD에서 고려되어야 하는 이슈 사항들에 대하여 기술하고, 프로파일 기반의 탐지 방법과 머신러닝 기반의 탐지 방법으로 분류하여 이들의 장단점을 분석한다. 또한 분류된 접근 방법을 중심으로 이슈들과의 비교분석을 통해 향후 연구 방향을 제시한다.

프레임워크 가변부위 시험을 위한 객체 구조 패턴의 분류 및 추출 방법 (A Classification and Extraction Method of Object Structure Patterns for Framework Hotspot Testing)

  • 김장래;전태웅
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권7호
    • /
    • pp.465-475
    • /
    • 2002
  • 객체지향 프레임워크는 개조, 합성이 용이한 클래스들로 분해될 수 있는 유연한 아키텍쳐를 제공함으로써 컴포넌트 기반의 효율적인 소프트웨어 개발을 지원한다. 프레임워크는 다수의 응용 소프트웨어의 개발에 반복적으로 재사용되므로 철저한 시험이 요구될 뿐만 아니라 재사용 시 확장된 프레임워크에 대해서도 추가적인 시험이 필요하다. 이를 위해서는 테스트 대상이 실행 가능한 형태로 제공되어야 하는데 그 구성 가능한 형태가 극히 다양할 뿐만 아니라 재사용될 때의 모든 형태를 예측하여 테스트하는 것은 현실적으로 불가능하므로, 재사용될 때마다 재구성되는 객체들의 구성 가능한 형태들을 동일한 특성을 갖는 유한 개의 그룹들로 분류하고, 각 그룹에서 시험 대상 실행 환경을 선정하여 시험하면 효과적인 시험이 가능하다. 본 논문에서는 재사용 시 다양한 형태의 객체 구조들로 개조, 확장될 수 있는 프레임워크의 가변부위 에 대해 객체 구성의 동일한 특성을 갖는 구조적 테스트 패턴들을 조직적으로 추출하는 방법과 각 패턴들로부터 시험 대상 객체 클러스터 즉, 테스트 대상 인스턴스를 선정하는 방법을 제안한다. 이 방법은 불필요한 테스트 케이스의 선정을 피하고, 테스트 대상 실행 환경의 체계적인 구축을 위해 사용될 수 있다.