• 제목/요약/키워드: Cluster validation

검색결과 61건 처리시간 0.028초

MODIS 자료를 이용한 한반도 지면피복 분류 (Classification of Land Cover over the Korean Peninsula using MODIS Data)

  • 강전호;서명석;곽종흠
    • 대기
    • /
    • 제19권2호
    • /
    • pp.169-182
    • /
    • 2009
  • To improve the performance of climate and numerical models, concerns on the land-atmosphere schemes are steadily increased in recent years. For the realistic calculation of land-atmosphere interaction, a land surface information of high quality is strongly required. In this study, a new land cover map over the Korean peninsula was developed using MODIS (MODerate resolution Imaging Spectroradiometer) data. The seven phenological data set (maximum, minimum, amplitude, average, growing period, growing and shedding rate) derived from 15-day normalized difference vegetation index (NDVI) were used as a basic input data. The ISOData (Iterative Self-Organizing Data Analysis), a kind of unsupervised non-hierarchical clustering method, was applied to the seven phenological data set. After the clustering, assignment of land cover type to the each cluster was performed according to the phenological characteristics of each land cover defined by USGS (US. Geological Survey). Most of the Korean peninsula are occupied by deciduous broadleaf forest (46.5%), mixed forest (15.6%), and dryland crop (13%). Whereas, the dominant land cover types are very diverse in South-Korea: evergreen needleleaf forest (29.9%), mixed forest (26.6%), deciduous broadleaf forest (16.2%), irrigated crop (12.6%), and dryland crop (10.7%). The 38 in-situ observation data-base over South-Korea, Environment Geographic Information System and Google-earth are used in the validation of the new land cover map. In general, the new land cover map over the Korean peninsula seems to be better classified compared to the USGS land cover map, especially for the Savanna in the USGS land cover map.

진화연산과 적응적 ${\alpha}$-cut 기반 평가를 이용한 유전자 발현 데이타의 퍼지 클러스터 분석 (Fuzzy Cluster Analysis of Gene Expression Profiles Using Evolutionary Computation and Adaptive ${\alpha}$-cut based Evaluation)

  • 박한샘;조성배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권8호
    • /
    • pp.681-691
    • /
    • 2006
  • 유전자 데이타의 클러스터링은 방대한 유전자 정보를 발현 정도에 따라 비슷한 그룹으로 나누어 분석하는 방법으로 유전자의 기능을 분석하는데 사용되어 왔다. 클러스터링의 한 종류인 퍼지 클러스터링은 하나의 샘플이 소속정도에 따라 여러 그룹에 동시에 소속되도록 나누는 방법으로, 하나의 유전자 데이타는 여러가지 유전 정보를 가칠 수 있기 때문에 유전자 발현 데이타의 분석에 보다 적절한 방법이다. 그러나 보통 클러스터링 방법은 초기 값에 민감하고, 지역해에 빠질 수 있는 단점을 갖는다. 이런 단점을 해결하기 위해 본 논문에서는 진화 연산을 이용한 퍼지 클러스터링 방법을 제안한다. 이때, 적합도 평가를 위해서 모든 데이타에 대해 동일한 기준을 적용하는 베이지안 검증방법의 단점을 개선하여, 데이타의 특성 을 고려하여 결정된 적용적 ${\alpha}$-cut 기반 평가방법을 사용한다. SRBCT 데이타와 효모 세포주기 데이타를 이용해 실험을 하고 결과를 분석하여 제안하는 방법의 유용성을 확인하였다.

HPLC-UV 방법을 이용한 향부자 분석법 개발과 국산 및 중국산 향부자의 패턴비교 (Development of Content Analysis for Cyperus rotundus by HPLC-UV and a Comparison between Chinese and Domestic Cyperi Rhizoma)

  • 서지윤;김진아;김성건;유정;황완균
    • 약학회지
    • /
    • 제56권5호
    • /
    • pp.280-287
    • /
    • 2012
  • A high-performance liquid chromatography (HPLC) combined with ultraviolet (UV) method for the simultaneous determination of ${\alpha}$-cyperone and nootkatone was developed for the quality control of Cyperus rotundus Linne. The separation was performed on a KR100-$5C_{18}$ ($4.6{\times}250mm$) column, and an elution gradient composed of methanol and water with a flow-rate of 1.0 ml/min. Detection wavelength was set at 254 nm. The optimum extraction for the detection of the ${\alpha}$-cyperone and nookatone was achieved by ultrasonic with methanol for an hour. Two marker compounds ${\alpha}$-cyperone and nootkatone in Cyperi Rhizoma showed good linearity ($R^2$ >0.999) in the concentration range of $12.5{\mu}g/ml$ to $200{\mu}g/ml$. The developed method provided satisfactory precision and accuracy with overall intra-day and inter-day variations of 0.04~1.23% and 0.08~0.68%, respectively, and the overall recoveries of 97.45~105.58% for the two compounds analyzed. Additionally, a difference was observed in the cluster analysis and principal component analysis between Cyperi Rhizoma in Korea and China. The result demonstrated that the principal component analysis is useful to distinguish between Cyperi Rhizoma in Korea and China.

Scale Development and Validation to Measure Occupational Health Literacy Among Thai Informal Workers

  • Suthakorn, Weeraporn;Songkham, Wanpen;Tantranont, Kunlayanee;Srisuphan, Wichit;Sakarinkhul, Pokin;Dhatsuwan, Jakkapob
    • Safety and Health at Work
    • /
    • 제11권4호
    • /
    • pp.526-532
    • /
    • 2020
  • Background: The high incidence of work-related diseases and injuries among day-laborers and workers with no legal contracts (informal workers) has received the attention of the Thai authorities. Workers' low occupational health literacy (OHL) has been reasoned as one contributing factor. Absence of a valid tool has prevented assessment of informal workers' OHL. The aim of this study was to create a valid and reliable Occupational Health Literacy Scale within the context of Thai working culture (TOHLS-IF). Methods: This study used the mixed method approach to develop TOHLS-IF. Questions were generated using in-depth interviews and an extensive review of the literature. Experts' assessment confirmed the content validity of TOHLS-IF. The scales of its psychometric properties were assessed in a sample of 400 informal workers using cluster random sampling. Results: The final version of the TOHLS-IF comprises 38 items within 4 dimensions: Ability to Gain Access, Understanding, Evaluation, and Use of occupational health and safety information. Factor analysis identified items explaining 50.22% of the total variance. The final confirmatory analysis confirmed the model estimates were satisfactory for the construct. TOHLS-IF demonstrated a high internal consistency and satisfactory reliability (Cronbach's alpha = .98). Conclusion: The TOHLS-IF is a valid and reliable instrument to assess informal workers' OHL. The structural dimensions of this instrument are based on the concept of health literacy and Thai culture. Thai health professionals are encouraged to benefit from this instrument to assess their workers' OHL and apply findings as guidelines for effective occupational health and safety interventions.

이미지 감성분류를 위한 CNN과 K-means RGB Cluster 이-단계 학습 방안 (A Two-Stage Learning Method of CNN and K-means RGB Cluster for Sentiment Classification of Images)

  • 김정태;박은비;한기웅;이정현;이홍주
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.139-156
    • /
    • 2021
  • 이미지 분류에서 딥러닝 모형을 사용하는 가장 큰 이유는 이미지의 전체적인 정보에서 각 지역 특징을 추출하여 서로의 관계를 고려할 수 있기 때문이다. 하지만 이미지의 지역 특징이 없는 감정 이미지 데이터는 CNN 모델이 적합하지 않을 수 있다. 이러한 감정 이미지 분류의 어려움을 해결하기 위하여 매년 많은 연구자들이 감정 이미지에 적합한 CNN기반 아키텍처를 제시하고 있다. 색깔과 사람 감정간의 관계에 대한 연구들도 수행되었으며, 색깔에 따라 다른 감정이 유도된다는 결과들이 도출되었다. 딥러닝을 활용한 연구에서도 색깔정보를 활용하여 이미지 감성분류에 적용하는 연구들이 있어왔으며, 이미지만을 가지고 분류 모형을 학습한 경우보다 이미지의 색깔 정보를 추가로 활용한 경우가 이미지 감성 분류 정확도를 더 높일 수 있었다. 본 연구는 사람이 이미지의 감정을 분류하는 기준 중 많은 부분을 차지하는 색감을 이용하여 이미지 감성 분류 정확도를 향상시키는 방안을 제안한다. 이미지의 RGB 값에 K 평균 군집화 방안을 적용하여 이미지를 대표하는 색을 추출하여, 각 감성 클래스 별 해당 색깔이 나올 확률을 가중치 식으로 변형 후 CNN 모델의 최종 Layer에 적용하는 이-단계 학습방안을 구현하였다. 이미지 데이터는 6가지 감정으로 분류되는 Emotion6와 8가지 감정으로 분류되는 Artphoto를 사용하였다. 학습에 사용한 CNN 모델은 Densenet169, Mnasnet, Resnet101, Resnet152, Vgg19를 사용하였으며, 성능 평가는 5겹 교차검증으로 CNN 모델에 이-단계 학습 방안을 적용하여 전후 성과를 비교하였다. CNN 아키텍처만을 활용한 경우보다 색 속성에서 추출한 정보를 함께 사용하였을 때 더 좋은 분류 정확도를 보였다.

하이브리드 인공신경망 모형을 이용한 부도 유형 예측 (Bankruptcy Type Prediction Using A Hybrid Artificial Neural Networks Model)

  • 조남옥;김현정;신경식
    • 지능정보연구
    • /
    • 제21권3호
    • /
    • pp.79-99
    • /
    • 2015
  • 부도 예측은 회계와 재무 분야에서 꾸준히 연구되고 있는 분야이다. 초기에는 주로 다중판별분석(multiple discriminant analysis)와 로짓 분석(logit analysis)과 같은 통계적 방법을 이용하였으나, 1990년대 이후에는 경영 분야의 분류 문제를 위해 많은 연구자들이 인공신경망(back-propagation neural network), 사계기반추론(case-based reasoning), 서포트 벡터 머신(support vector machine) 등과 같은 인공지능을 통한 접근법을 이용하여 통계적 방법보다 분류 성과 측면에서 우수함을 입증해왔다. 기존의 기업의 부도에 관한 연구에서 많은 연구자들이 재무비율을 이용하여 부도 예측 모형을 구축하는 것에 초점을 맞추어왔다. 부도예측에 관한 연구가 꾸준히 진행되고 있는 반면, 부도의 세부적인 유형을 예측하여 제시하는 것에 대한 연구는 미흡한 실정이었다. 따라서 본 연구에서는 수익성, 안정성, 활동성 지표를 중심으로 국내 비외감 건설업 기업들의 부도 여부뿐만 아니라 부도의 세부적인 유형까지 예측 가능한 모형을 개발하고자 한다. 본 연구에서는 부도 유형을 예측하기 위해 두 개의 인공신경망 모형을 결합한 하이브리드 접근법을 제안하였다. 첫 번째 인공신경망 모형은 부도예측을 위한 역전파 인공신경망을 이용한 모형이며, 두 번째 인공신경망 모형은 부도 데이터를 몇 개의 유형으로 분류하는 자기조직화지도(self-organizing map)을 이용한 모형이다. 실험 결과를 통해 정의된 5개의 부도 유형인 심각한 부도(severe bankruptcy), 안정성 부족(lack of stability), 활동성 부족(lack of activity), 수익성 부족(lack of profitability), 회생 가능한 부도(recoverable bankruptcy)는 재무 비율에 따라 유형별로 상이한 특성을 갖는 것을 확인할 수 있었다. 본 연구 결과를 통해 신용 평가 분야의 연구자와 실무자들이 기업의 부도의 유형에 대한 유용한 정보를 얻을 것으로 기대한다.

다변량 기법을 이용한 혼합치열기 분석법 (Mixed dentition analysis using a multivariate approach)

  • 서승현;안홍석;이신재;임원희;김봉래
    • 대한치과교정학회지
    • /
    • 제39권2호
    • /
    • pp.112-119
    • /
    • 2009
  • 본 연구는 다변량 기법을 도입하여 치아 크기의 다양성을 고려하면서 정확성이 높은 혼합치 열기 분석법을 개발하기 위해 시행되었다. 견치 및 소구치 크기를 예측하는 데 이용된 변수는 상악 중절치, 상악 제1대구치, 하악 중절치, 하악 측절치 및 하악 제1대구치로서 총 5개 치아 크기 변수가 이용되었다. 우선 정상교합자 연구 표본 307명을 5개 치아 변수를 이용하여 k-means 군집 분석으로 치아 크기에 따라 나눈 후 판별식을 이용, 치아 크기가 큰 그룹과 작은 그룹으로 분류하였다. 이후 견치와 소구치 크기의 합을 예측하기 위하여 남녀별, 상하악별, 치아 크기 그룹별로 다중선형 분석을 이용하여 회귀식을 구했다. 검증 표본에는 504명의 부정교합자가 이용되었으며, 이들에 대하여 정상교합자로부터 도출된 판별식을 이용하여 2그룹으로 할당한 후 정상교합자로부터 도출된 회귀식을 이용하여 상악과 하악의 견치 및 소구치 크기 합을 예측하였다. 오차 분석 결과 정상교합자는 최대 0.71, 부정교합자 검증표본은 최대 0.82 mm의 residual standard deviation 값을 보였다. 부정교합 분류별, 치아 크기 패턴별로 예측 오차의 유의한 차이는 없었다. 1 mm 및 2 mm 이상의 예측 오차를 보인 빈도는 각각 17.3%와 1.8%였다. 본 연구 결과 도출된 혼합치열기 분석법은 기존의 연구들과 비교하여 그 정확성이 높은 것으로 고찰되었다. 다만, 임상 적용 시 복잡한 계산 과정으로 인하여 전산화 환경에서 더욱 유용할 것으로 생각된다.

감각통합중재를 위한 작업치료사 역량모델 개발 연구 (A Study on the Development of Sensory Integration Intervention Competency Model for Occupational Therapist)

  • 남궁영;김경미;김미선;이지영
    • 대한감각통합치료학회지
    • /
    • 제15권2호
    • /
    • pp.22-34
    • /
    • 2017
  • 목적 : 본 연구의 목적은 우수한 수준으로 감각통합중재를 제공하기 위한 작업치료사 역량모델을 개발하고 개발된 역량모델의 타당성을 검증하는데 있다. 연구방법 : 문헌고찰, 개방형 설문조사, 전문가 포커스 회의를 통해 역량군, 역량, 행동지표의 체계를 가진 감각통합중재를 위한 역량모델 초안을 작성하였고, 2차의 델파이조사와 전문가 자문을 받아 역량모델을 확정하였다. 결과 : 총 4개 역량군, 15개 역량, 60개 행동지표로 구성된 감각통합중재를 위한 작업치료사 역량모델을 개발하였다. '전문성 역량군'에는 5개의 역량(작업치료 일반 지식, 감각통합중재이론 지식, 평가 기술, 분석 기술, 중재 기술)과 31개의 행동지표가 포함되었다. '전문가 의식 역량군'에는 4개의 역량(전문성 고취, 교육, 윤리 의식, 정책적 관심)과 13개의 행동 지표가 포함되었다. '대인 관계 역량군'에는 2개의 역량(의사소통, 협력)과 6개의 행동지표가 포함되었다. 마지막으로 '개인적 특성 역량군'에는 4개의 역량(자기 확신, 자기 성찰, 자기 관리, 긍정적 태도)과 10개의 행동 지표가 포함되었다. 결론 : 본 연구는 작업치료의 한 영역인 감각통합중재를 위한 지식, 기술, 태도를 포함한 역량 모델을 개발하였다는데 의의가 있다. 연구 결과는 향후 대한감각통합치료학회의 역량기반교육과정 개발에 기초 자료로 활용될 수 있을 것이다.

사상체질분류검사지(四象體質分類檢査紙)(QSCC)II에 대(對)한 타당화(妥當化) 연구(硏究) -각(各) 체질집단(體質集團)의 군집별(群集別) Profile 분석(分析)을 중심(中心)으로- (The Validation Study of the Questionnaire for Sasang Constitution Classification (the 2nd edition revised in 1995) - In the field of profile analysis)

  • 이정찬;고병희;송일병
    • 사상체질의학회지
    • /
    • 제8권1호
    • /
    • pp.247-294
    • /
    • 1996
  • 본 논문은 사상채질분류검사지의 표준화 연구와 공동작업으로 행해진 연구로써 최근에 들어 다각도로 행해지고 있는 사상체질분류 객관화 연구의 한 방면이라고 하겠다. 본 논문의 주된 내용은 진단정확률의 확인을 통하여 새로 개발된 검사지의 타당도를 검증해 보고 프로파일 분석이라고 하는 통계분석상의 기법을 활용해서 설문지에 대한 적응도가 다소 떨어지는 집단들을 추출해내고 그들의 특성을 분석연구하자는 것이다. 연구에 사용된 검사지는 기본의 1992년판 검사지를 의학, 문학, 철학 및 심리화분야등 각 방면에서 폭넓은 검토를 거쳐 개정한 것이다. 본 연구의 대상이 되는 집단은 1995년 8월 7일부터 동년 9월 6일까지 경희의료원 동서종합건진센터 및 경희의료원 한방병원의 사상의학과에서 수진하여 전문의의 사상체질변증과정을 거친 외래환자들의 집단과 체질변증 과정이 없이 개방적으로 자료를 모집하되 연령별, 성별, 학력별로 나누어 고르게 분포하도록 한 일반인들의 집단으로 집단내 인원수는 각각 총 274명과 1092명이었다. 이들로부터 채집된 자료중 환자집단의 자료를 가지고 진단정확률을 조사하고, 일반인군 자료의 표준화에서 얻어진 규준(norms)을 환자군의 사상척도점수에 적용하여 T점수를 구하고 다변량군집분석을 시행하여 집단별 특성을 프로파일 그래프로 작성하여 파악해 보는 작업을 거쳐 다음과 같은 결론을 얻었다. 1. 예언집단과 실제 집단간의 비교로 나타나는 진단정확률은 기존의 QSCC에 비하여 대폭 향상된 70.08%로 나타나 검사지의 타당도가 입증되었다. 2. 각 체질집단의 전체 프로파일 특성비교에서 각 체질별로 해당척도에 대한 반응은 모든 척도에서 일정하게 상승되어 체질변증의 측면에서 긍정적인 양상을 보였다. 3. 자기표현의 정도를 중심으로 관찰해 본 전체 프로파일의 분석에서는 소양집단이 가장 뚜렷한 선명성을 보였고 소음집단이 가장 취약하였으며 태음집단은 이중적 속성을 나타냈다. 4. 각 체질별 세 군의 하위집단중에서 소위 이탈집단이라고 할 수 있는 부류의 집단은 나머지 두 집단과 프로파일의 특성에 있어서 확연히 구분되는 양상을 보였는 바 그 내용은 다음과 같다. 가. 소양인의 이탈집단은 소양집단의 일반적 속성과 달리 현저하게 소극적인 양상을 보였으며 소음척도에서 비교적 높은 반응을 보였다. 나. 태음인의 이탈집단은 점수분포가 매우 낮은 소극적 양상을 보였으며 태음집단의 특성인 태양-태음 동반상승과는 반대로 태양척도에서 점수가 급락하는 현상을 나타냈다. 다. 소음인의 이탈집단은 소양집단의 프로파일 형태와 유사한 특성을 보여 소음집단 특유의 소극적이고 표현에 취약한 특성이 대부분 희석된 것으로 나타났다. 이상의 결과로 보아 제작된 검사지의 타당도가 입증되었으며 본 연구의 과정에서 실시한 체질별 이탈집단의 프로파일 분석을 통해 몇가지 방향에서 그들의 특성을 파악할 수 있었다. 이 결과는 추후에 본 검사지의 개선에 하나의 자료로 이용될 수 있을 것으로 기대하며 검사지의 발전을 위해서는 이탈집단과 대조집단의 특성차이에 대한 좀 더 심층적인 연구가 지속되어져야 할 것으로 사료된다.

  • PDF

인구통계특성 기반 디지털 마케팅을 위한 클릭스트림 빅데이터 마이닝 (Clickstream Big Data Mining for Demographics based Digital Marketing)

  • 박지애;조윤호
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.143-163
    • /
    • 2016
  • 인구통계학적 정보는 디지털 마케팅의 핵심이라 할 수 있는 인터넷 사용자에 대한 타겟 마케팅 및 개인화된 광고를 위해 고려되는 가장 기초적이고 중요한 정보이다. 하지만 인터넷 사용자의 온라인 활동은 익명으로 행해지는 경우가 많기 때문에 인구통계특성 정보를 수집하는 것은 쉬운 일이 아니다. 정기적인 설문 조사를 통해 사용자들의 인구통계특성 정보를 수집할 수도 있지만 많은 비용이 들며 허위 기재 등과 같은 위험성이 존재한다. 특히, 모바일 환경에서는 대부분의 사용자들이 익명으로 활동하기 때문에 인구통계특성 정보를 수집하는 것은 더욱 더 어려워지고 있다. 반면, 인터넷 사용자의 온라인 활동을 기록한 클릭스트림 데이터는 해당 사용자의 인구통계학적 정보에 활용될 수 있다. 특히, 인터넷 사용자의 온라인 행위 특성 중 하나인 페이지뷰는 인구통계학적 정보 예측에 있어서 중요한 요인이 된다. 본 연구에서는 기존 선행 연구를 토대로 클릭스트림 데이터 분석을 통해 인터넷 사용자의 온라인 행위 특성을 추출하고 이를 해당 사용자의 인구통계학적 정보 예측에 사용한다. 또한, 1)의사결정나무를 이용한 변수 축소, 2)주성분분석을 활용한 차원축소, 3)군집분석을 활용한 변수축소의 방법을 제안하고 실험에 적용함으로써 많은 설명변수를 이용하여 예측 모델 생성 시 발생하는 차원의 저주와 과적합 문제를 해결하고 예측 모델의 정확도를 높이고자 하였다. 실험 결과, 범주의 수가 많은 다분형 종속변수에 대한 예측 모델은 모든 설명변수를 사용하여 예측 모델을 생성했을 때보다 본 연구에서 제안한 방법론들을 적용했을 때 예측 모델에 대한 정확도가 향상됨을 알 수 있었다. 본 연구는 클릭스트림 분석을 통해 추출된 인터넷 사용자의 온라인 행위는 해당 사용자의 인구통계학적 정보 예측에 활용 가능하며, 예측된 익명의 인터넷 사용자들에 대한 인구통계학적 정보를 디지털 마케팅에 활용 할 수 있다는데 의의가 있다. 또한, 제안 방법론들을 통해 어느 종속변수에 대해 어떤 방법론들이 예측 모델의 정확도를 개선하는지 확인하였다. 이는 추후 클릭스트림 분석을 활용하여 인구통계학적 정보를 예측할 때, 본 연구에서 제안한 방법론을 사용하여 보다 높은 정확도를 가지는 예측 모델을 생성 할 수 있다는데 의의가 있다.