• 제목/요약/키워드: Unsupervised algorithm

검색결과 279건 처리시간 0.027초

약물부작용감시시스템에서 재현성 평가를 통한 마이닝 모델 개발 (Development of Mining model through reproducibility assessment in Adverse drug event surveillance system)

  • 이영호;윤영미;이병문;황희정;강운구
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권3호
    • /
    • pp.183-192
    • /
    • 2009
  • 약물부작용감시시스템 (Adverse drug event surveillance system)은 약물부작용신호를 이용하여 약물의 부작용 여부를 식별하는 시스템이다. 기존의 자발적 보고나 차트리뷰 보다 효율성이 뛰어난 시스템으로 분류할 수 있다. 본 논문에서는 약물부작용감시시스템을 구현하기 위하여 임상데이터마트(GDM)를 구축하였다. 특히, 데이터 품질관리 기법을 적용하여 구축된 CDM에 지식 탐사 기법 중 비교사학습 기법으로 적용하여 모델의 재현성을 평가하여 최적의 약물부작용 군집화 개수(n=4)를 도출하였다. 군집화 개수(n=4)를 이용하여 약물부작용 판별을 위한 K-means, Kohonen, two-step clustering model 알고리즘에 적용하여 분석함으로써 K-means 알고리즘이 가장 우수한 군집 효과를 나타냄을 확인하였다.

비지도 기계학습을 통한 유출 발생 내 이력 현상 구분 (Classification of hysteretic loop feature for runoff generation through a unsupervised machine learning algorithm)

  • 이은형;전항탁;김다홍;배시배시프라이데이;김상현
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.360-360
    • /
    • 2022
  • 토양수분과 유출 간 관계를 정량화하는 것은 수문 기작 및 유출 발생 과정의 이해를 위한 중요한 정보를 제공한다. 특히, 유출과정의 특성화는 수문 사상에 따른 불포화대 내 토양수 및 토사 손실 제어와 산사태 및 비점오염원 발생 예측을 위해 필수적이다. 유출과정과 관련된 비선형성과 복잡성을 확인하기 위해 토양수분과 유출 사이의 이력 거동이 조사되었다. 특히, 수문 과정 내 이력 현상 구체화를 위해 정성적인 시각적 분류 및 정량적 평가를 위한 이력 지수들이 개발되었다. 정성적인 시각적 분류는 시간에 따라 시계 및 반시계방향으로 다중 루프 형상을 나누는 방식으로 진행되었고, 정량적 평가의 경우 이력 고리(Hysteretic loop) 내 상승 고리(Rising limb)와 하강 고리(Falling limb)의 차이를 기준으로 한 지수로 이력 현상을 특성화하였다. 이전에 제안된 방법론들은 연구자의 판단이 들어가기 때문에 보편적이지 않고 이력 현상을 개발된 지수에 맞춤에 따라 자료 손실이 나타나는 한계가 존재한다. 자료의 손실 없이 불포화대 내 발생 가능한 대표 이력 현상을 자동으로 추출하기 위해 적합한 비지도 학습기반 기계학습 방법론의 제안이 필요하다. 우리 연구에서는 국내 산지 사면에서 강우 사상 동안 다중 깊이(10, 30, 60cm)로 56개의 토양수분 측정지점에서 확보된 토양수분 시계열 자료와 산지 사면 내 위어를 통해 확보된 유출 시계열 자료를 사용하였다. 먼저, 기존에 분류 방법을 기반으로 계절 및 공간특성에 따라 지배적으로 발생하는 토양수분-유출 간 이력 현상을 특성화하였다. 다음으로, 토양수분-유출 간 이력 패턴을 자료 손실 없이 형상화하여 자동으로 데이터베이스화하는 알고리즘을 개발하였다. 마지막으로, 비지도 학습방법을 이용하여 데이터베이스화된 실제 발현 이력 현상 내 확률분포를 최대한 가깝게 추정하는 은닉층을 반복적인 재구성 학습을 통해 구현함으로써 대표 이력 현상 패턴을 추출하였다.

  • PDF

AI 비지도 학습 기반의 학교폭력 예방 데이터 분석 (Analysis of data on prevention of school violence based on AI unsupervised learning)

  • 정소영;마영지;구덕회
    • 한국정보교육학회:학술대회논문집
    • /
    • 한국정보교육학회 2021년도 학술논문집
    • /
    • pp.85-91
    • /
    • 2021
  • 학교폭력은 사회적 문제로 인식되고 있으며 이를 예방하기 위한 다양한 노력도 함께 이루어지고 있다. 본 연구에서는 학생들 상호 간의 대화 빈도 데이터를 분석함으로써 교우 관계를 파악하는 방식으로 학교폭력을 예방할 수 있는 시스템을 제안하고 있다. 평정 척도식 설문을 활용하여 학급 내 학생들과의 대화 빈도를 수치화하였고, 이 데이터는 K-means 알고리즘을 활용하여 일정 개수의 클러스터로 군집화하였다. 담임교사는 학급 내 학생들 간의 대화 빈도를 시각적으로 확인하고, 이를 근거로 특정 그룹의 학생 개별 상담 및 학급 운영 등 학교폭력 예방을 위한 참고 자료로 활용 가능하다. 데이터 분석 결과 기존에 교사가 정성적으로 파악하고 있던 교우관계와 상당 부분 일치하였고, 이는 담임교사의 학급 내 교우 관계 파악을 위한 정량적 근거 자료로 활용될 수 있음을 의미한다. 한계점은 연구 대상이 소규모인 것과 학생들의 주관적인 기준으로 설문 결과가 왜곡될 수 있는 점이다. 본 연구가 담임교사의 학급 내 교우 관계 파악 및 학교폭력 예방을 위한 노력에 실질적인 도움이 되고 학교폭력 예방에 기여될 수 있기를 기대한다.

  • PDF

비교사적 군집화 알고리즘을 이용한 전산화 단층영상의 병소부위 결정에 관한 연구 (Determination of Tumor Boundaries on CT Images Using Unsupervised Clustering Algorithm)

  • 이경후;지영훈;이동한;류성렬;조철구;김미숙;유형준;권수일;전준철
    • Journal of Radiation Protection and Research
    • /
    • 제26권2호
    • /
    • pp.59-66
    • /
    • 2001
  • 정위적분할방사선치료(FSRT)는 병소경계에 대한 공간상위치와 형태를 정확히 결정하는 것이 큰 쟁점이다. 본 연구는 나선형 CT를 이용하여 4명의 뇌종양 환자와 팬톰(파라핀)으로부터 연속적인 횡축 단면상을 얻었다. K-mean 분류 알고리즘을 적용하여 CT영상의 초기정보값을 평균화소값으로 변화시켰다. 영상의 구성은 병소영역, 정상영역, 혼합영역, 바탕영역, 가음영영역의 5영역으로 분류하였다. 주된 관심은 혼합영역 내에서 정상영역과 혼합영역을 어떻게 분리하는 가였다. 5영역 평균화소값 중에서 정상영역과 병소영역에 상대적인 평균편차 분석법을 적용하여 2영역 평균편차 화소값 사이의 최대점을 구하였다. IDL 프로그램을 이용한 반자동윤곽법으로 혼합영역내의 최대점을 연결함으로서 GTV의 경계선을 그렸다. 균일한 팬톰의 관심영역 경계선은 ${\pm}1%$ 이내의 오차로 평가되었다. 환자 4명의 경우는 방사선 전문의들이 그린 병소영역과 K-mean 알고리즘과 상대적인 평균편차 분석법에 의해 자동적으로 묘사된 병소영역과 거의 일치하였다. 이러한 방법들을 사용하여 불분명한 정상영역과 병소영역의 경계선을 명확하게 나타낼 수 있었다. 그러므로 CT 영상이 MRI 영상과 비교하여 간헐적으로 병소윤곽을 보여주지 못할 경우 이 방법은 치료계획을 결정할 때 유용한 CT영상 자료로 활용될 수 있음을 확인하였다.

  • PDF

고해상도 중적외선 영상자료의 주야간 지표면 식별 특성 평가 (Evaluating the Land Surface Characterization of High-Resolution Middle-Infrared Data for Day and Night Time)

  • 백승균;장동호
    • 한국지리정보학회지
    • /
    • 제15권2호
    • /
    • pp.113-125
    • /
    • 2012
  • 다목적실용위성 3A호에 탑재되는 고해상도의 중적외선 영상자료에 대한 지표면 식별 특성을 파악하기 위하여, 고해상도 중적외선 영상 획득이 가능한 AHS(Airborne Hyperspectral Scanner) 자료를 사용하여 중적외선 영상 자료의 지표면 온도 산출 가능성과 토지피복도 분류 정확도를 평가하였다. 먼저 AHS 열적외선 자료로 작성한 지표면 온도 영상과 AHS 중적외선 각 밴드의 화소값을 비교한 결과 주간과 야간 모두 밴드 68(중심파장 $4.64{\mu}m$)의 결정계수가 0.74이상으로 가장 높았다. 다음으로 AHS 중적외선 밴드를 이용하여 토지피복도를 작성한 결과 주간의 경우 지붕, 도로, 초지, 식생, 수역 등이 구분 가능했지만 야간의 경우 초지와 식생, 도로와 수역, 지붕과 도로 등 일부 클래스들이 서로 중복되어 나타났다. AHS 중적외선 밴드의 지표면 식별 능력의 향상 가능성을 파악하기 위하여 주간과 야간자료의 편차 영상을 구하여 토지피복도를 작성한 결과 Zone 1과 Zone 2의 소지역별 분류정확도가 각각 67.5%, 64.3%로서, 주간 또는 야간 중적외선 밴드로 작성된 토지피복도에 비해 10% 이상 향상된 것으로 나타났다. 결과적으로 고해상도 중적외선 밴드 영상자료는 지표면온도 산출시 지표 피복 특성을 고려한 알고리즘 개발이 요구되며, 지표면 식별 능력은 주간에 비해 야간이 낮으므로 주간과 야간의 편차 영상을 이용할 경우 지표면 식별 능력을 향상시킬 수 있을 것으로 판단된다.

한국어 정보 검색에서 의미적 용어 불일치 완화 방안 (Alleviating Semantic Term Mismatches in Korean Information Retrieval)

  • 윤보현;박성진;강현규
    • 한국정보처리학회논문지
    • /
    • 제7권12호
    • /
    • pp.3874-3884
    • /
    • 2000
  • 정보검색시스템은 색인어와 질의어가 정확히 일치하지 않더라도 사용자 질의에 적합한 문서를 검색할 수 있어야 한다. 그러나, 색인어와 질의어간의 용어 불일치는 검색성능의 개선에 심각한 장애요소로 작용해 왔다. 따라서, 본 논문에서는 문서 코퍼스의 단어들간에 자동 용어 정규화를 수행하고, 용어 정규화의 산물을 한국어 정보검색 시스템에 적용하는 방안을 제시한다. 용어 불일치를 완화하기 위해 두가지 용어 정규화, 동치부류와 공기단어 클러스터를 수행한다. 첫째, 음역어, 절차오류, 그리고 동의어를 위해 문맥 유사도를 이용하여 동치부류로 구축하는 작업이다. 둘째, 상호정보와 단어 문맥의 조합을 이용하여 단어 유사도를 계산하고 문맥 기반 용어를 정규화한다. 그런 다음, K-means 알고리즘을 이용하여 자율 클러스터링을 수행하고 공기단어 클러스터를 구축한다. 본 논문에서는 이러한 용어 정규화의 산물들을 용어 불일치를 완화하기 위해 질의어 확장과정에서 사용한다. 다시 말해서 동치부류와 공기단어 클러스터는 새로운 용어로 질의를 확장하는 자원으로서 사용된다. 이러한 질의확장으로 사용자는 질의어에 음역어를 추가하여 질의어를 포괄적으로 만들거나 특정어를 추가하여 질의어를 세밀하게 만들 수 있다. 질의어 확장을 위해 두 가지 상호보완적인 방법인 용어 제시와 용어 적합성 피드백을 이용한다. 실험 결과는 제안된 시스템이 의미적 용어 불일치를 완화할 수 있고, 적절한 유사도 값을 제공할 수 있음을 보여준다. 결과적으로 제안한 시스템이 정보 검색 시스템의 검색 효율을 향상시킬 수 있음을 알 수 있다.

  • PDF

PFCM 클러스터링 기법의 개선 (Improvement of the PFCM(Possibilistic Fuzzy C-Means) Clustering Method)

  • 허경용;최세운;우영운
    • 한국정보통신학회논문지
    • /
    • 제13권1호
    • /
    • pp.177-185
    • /
    • 2009
  • 클러스터링은 주어진 데이터 포인트들을 주어진 개수의 그룹으로 나누는 비지도 학습의 한 방법이다. 클러스터링의 방법 중 하나로 널리 알려진 퍼지 클러스터링은 하나의 포인트가 모든 클러스터에 서로 다른 정도로 소속될 수 있도록 함으로써 하나의 클러스터에만 속할 수 있도록 하는 K-means와 같은 방법에 비해 자연스러운 클러스터 형태의 유추가 가능하고, 잡음에 강한 장점이 있다. 이 논문에서는 기존의 퍼지 클러스터링 방법 중 소속도(membership)와 전형성(typicality)을 동시에 계산해 낼 수 있는 Possibilistic Fuzzy C-Means(PFCM) 방법에 Gath-Geva(CG)의 방법을 적용하여 PFCM을 개선한다. 제안한 방법은 PFCM 장점을 그대로 가지면서도, GG의 거리 척도에 의해 클러스터들 사이의 경계를 강조함으로써 분류 목적에 적합한 소속도를 계산할 수 있으며 전형성은 가우스 형태의 분포에서 생성된 포인트들의 분포 함수를 정확하게 모사함으로써 확률 밀도 추정의 방법으로도 사용될 수 있다. 또한 GG 방법은 Gustafson-Kessel 방법과 달리 클러스터에 포함된 포인트의 개수가 확연히 차이나는 경우에도 정확한 결과를 얻을 수 있다. 이러한 사실들은 실험 결과를 통해 확인할 수 있다.

Detection of Clavibacter michiganensis subsp. michiganensis Assisted by Micro-Raman Spectroscopy under Laboratory Conditions

  • Perez, Moises Roberto Vallejo;Contreras, Hugo Ricardo Navarro;Herrera, Jesus A. Sosa;Avila, Jose Pablo Lara;Tobias, Hugo Magdaleno Ramirez;Martinez, Fernando Diaz-Barriga;Ramirez, Rogelio Flores;Vazquez, Angel Gabriel Rodriguez
    • The Plant Pathology Journal
    • /
    • 제34권5호
    • /
    • pp.381-392
    • /
    • 2018
  • Clavibacter michiganensis subsp. michiganesis (Cmm) is a quarantine-worthy pest in $M{\acute{e}}xico$. The implementation and validation of new technologies is necessary to reduce the time for bacterial detection in laboratory conditions and Raman spectroscopy is an ambitious technology that has all of the features needed to characterize and identify bacteria. Under controlled conditions a contagion process was induced with Cmm, the disease epidemiology was monitored. Micro-Raman spectroscopy ($532nm\;{\lambda}$ laser) technique was evaluated its performance at assisting on Cmm detection through its characteristic Raman spectrum fingerprint. Our experiment was conducted with tomato plants in a completely randomized block experimental design (13 plants ${\times}$ 4 rows). The Cmm infection was confirmed by 16S rDNA and plants showed symptoms from 48 to 72 h after inoculation, the evolution of the incidence and severity on plant population varied over time and it kept an aggregated spatial pattern. The contagion process reached 79% just 24 days after the epidemic was induced. Micro-Raman spectroscopy proved its speed, efficiency and usefulness as a non-destructive method for the preliminary detection of Cmm. Carotenoid specific bands with wavelengths at 1146 and $1510cm^{-1}$ were the distinguishable markers. Chemometric analyses showed the best performance by the implementation of PCA-LDA supervised classification algorithms applied over Raman spectrum data with 100% of performance in metrics of classifiers (sensitivity, specificity, accuracy, negative and positive predictive value) that allowed us to differentiate Cmm from other endophytic bacteria (Bacillus and Pantoea). The unsupervised KMeans algorithm showed good performance (100, 96, 98, 91 y 100%, respectively).

인공신경망을 이용한 남한의 저서성 대형 무척추동물 군집 유형 (Community Patterning of Bethic Macroinvertebrates in Streams of South Korea by Utilizing an Artificial Neural Network)

  • 곽인실;류광순;박영석;전태수
    • 생태와환경
    • /
    • 제33권3호통권91호
    • /
    • pp.230-243
    • /
    • 2000
  • 1995년까지 우리 나라의 주요 하천을 대상으로 하여 출판된 논문에서 저서성 대형무척추 동물의 주요 분류군 출현현황을 종합적으로 고찰하고 인공신경회로망을 이용하여 유형분석을 하였다. 한강 수계의 11개 지류를 포함한 총 27개 하천에서 5문 10강 26목 108과 571종이 보고되었으며 주로 파리류, 하루살이류, 날도래류, 강도래류, 딱정벌레류, 잠자리류, 빈모류, 복족류 등이 출현하였고 주요 출현분류과는 Ephemerellidae, Baetidae, Heptageniidae, Hydropsychidae, Chironomidae, Hirudinae, Tubificidae, Perlodidae 등이었다. 하천의 군집구성은 환경교란 정도에 따라 세 그룹으로 나뉘어졌고 환경교란에 따라 군집의 종풍부도가 영향을 받았으며 Ephemeroptera, Plecoptera, Trichoptera, Diptera 및 Diptera 내의 Chironomidae에서는 환경교란이 클수록 종풍부도가 많이 감소되었다. 반면 Chironomus속은 교란이 커질수록 종풍부도가 증가되었다. 전 자료를 대상으로 코호넨망에 입력하여 유형화하였을 때 일차적으로 한강, 낙동강, 섬진강 등 주요 수계에 따라 군집이 묶여졌고 다음으로 환경교란에 따라 무리화 되었다. 비교적 청정하거나 오염이 심한 곳의 군집은 비교적 무리화가 잘된 반면 중간 정도로 오염된 곳은 세부군집으로 묶여져 흩어져 나타났다.

  • PDF

중소하천유역에서 Hybrid Neural Networks에 의한 수문학적 예측 (Hydrological Forecasting Based on Hybrid Neural Networks in a Small Watershed)

  • 김성원;이순탁;조정식
    • 한국수자원학회논문집
    • /
    • 제34권4호
    • /
    • pp.303-316
    • /
    • 2001
  • 본 연구에서는 중소하천수계에서 수문학적 예측을 위하여 Hybrid Neural Networks의 일종인 반경기초함수(RBF) 신경망모형이 적용되었다. RBF 신경망모형은 4종류의 매개변수로 구성되어 있으며, 지율 및 지도훈련과정으로 이루어져있다. 반경기초함수로서 가우스핵함수(GKF)가 이용되었으며, GKF의 매개변수인 중심과 폭은 K-Means 군집알고리즘에 의해 최적화 된다. 그리고 RBF 신경망모형의 매개변수인 중심, 폭, 연결강도와 편차벡터는 훈련을 통하여 최적 매개변수의 값이 결정되며, 이 매개변수들을 이용하여 모형의 검증과정이 이루어진다. RBF 신경망모형은 한국의 IHP 대표유역중 하나인 위천유역에 적용하였으며, 모형의 훈련과 검증을 위하여 10개의 강우사상을 선택하였다. 또한 RBF 신경망모형과 비교검토하기 위하여 엘만 신경망(ENN)모형을 이용하였으며, ENN 모형은 일단게 할선역전파(OSSBP) 및 탄성역전파(RBP)알고리즘으로 이루어져 있다. 모형의 훈련과 검증과정을 통하여 RBF 신경망모형이 ENN 모형보다 양호한 결과를 나타내는 것으로 분석되었다. RBF 신경망모형은 훈련시키는데 시간이 적게 들고, 이론적 배경이 부족한 수문학자들도 쉽게 사용할 수 있는 신경망모형이다.

  • PDF