• 제목/요약/키워드: k-평균군집방법

검색결과 192건 처리시간 0.027초

전이학습과 k-means clustering의 융합을 통한 콘크리트 결함 탐지 성능 향상에 대한 연구 (A study on the improvement of concrete defect detection performance through the convergence of transfer learning and k-means clustering)

  • 윤영근;오태근
    • 문화기술의 융합
    • /
    • 제9권2호
    • /
    • pp.561-568
    • /
    • 2023
  • 콘크리트 구조물은 대내외적 환경에 의해 다양한 결함이 발생한다. 결함이 있는 경우 콘크리트의 구조적 안전성에 문제가 있어 이를 효율적으로 파악하여 유지관리하는 것이 중요하다. 하지만, 최근 딥러닝 연구는 콘크리트의 균열에 초점이 맞추어져 있어, 박락과 오염 등에 대한 연구는 부족하다. 본 연구에서는 라벨링이 어려운 박락과 오염에 초점을 맞추어 언라벨 방법, 필터링 방법, 전이학습과 k-means cluster의 융합을 통한 4개의 모델을 개발하고 성능을 평가하였다. 분석결과, 융합모델이 결함을 가장 세밀하게 구분하였으며, 직접 라벨링을 하는 것보다 효율성을 증가시킬 수 있었다. 본 연구 결과가 향후 라벨링이 어려운 다양한 결함 유형에 대한 딥러닝 모델 개발에 기여할 수 있기를 기대한다.

계층적 X-means와 가중 F-measure를 통한 시뮬레이션 모델 검증 기법 (Validation Technique of Simulation Model using Weighted F-measure with Hierarchical X-means (WF-HX) Method)

  • 양대길;황보훈;천현재;이홍철
    • 한국산학기술학회논문지
    • /
    • 제13권2호
    • /
    • pp.562-574
    • /
    • 2012
  • 기존 대부분의 연구에서 사용하고 있는 시뮬레이션 검증 기법은 통계적 분석기법으로, 총 처리량이나 자원 이용률의 평균 및 분산을 통해 분석하여 왔다. 그러나 이러한 방식은 모델의 개별적인 요소들에 대한 신뢰성을 보장하기 어려웠다. 이를 해결하기 위해 제시된 방법이 가중 F-measure를 사용한 검증이다. 하지만 가중 F-measure는 Tact time 값 하나에 대해 하나의 클래스를 할당하기 때문에 수많은 Tact time 값들을 갖는 복잡한 시스템에 적용하기 어려운 문제를 가지고 있다. 한편, 가중치의 범위가 정해져 있지 않기 때문에 평가기준(Threshold)의 선정에 있어서 어느 정도의 수준이 만족할만한 수준인지 정하기가 어려웠다. 따라서 본 논문에서는 이러한 문제점을 개선하기 위해 군집분석을 적용한 가중 F-measure를 제시한다. 군집의 클래스화를 통해 클래스의 수를 현저히 줄일 수 있고 다양한 시스템으로의 적용 또한 가능해진다. 또한 객관성을 저하시키지 않는 범위 내에서 최소한의 가중치를 부여하는 방식으로 가중치의 범위를 지정하여 검증 방법을 향상시켰다. 이를 입증하기 위해 국내 'L사'의 LCD공정설비를 대상으로 시뮬레이션 모델링 및 환경을 구축하였고, 그 결과를 통해 타당성을 증명하였다.

레진전색제의 마모저항성에 대한 평가 (EVALUATION ON THE ABRASION RESISTANCE OF A SURFACE SEALANT)

  • 김수미;한세희;조영곤
    • Restorative Dentistry and Endodontics
    • /
    • 제32권3호
    • /
    • pp.180-190
    • /
    • 2007
  • 이 연구는 강화형 미세입자 복합레진인 Micronew에 Biscover 레진전색제를 적용한 후 칫솔마모시험을 시행하여 복합레진 표면의 조도와 현미경적 변화를 비교함으로써 레진전색제를 복합레진 표면에 재적용할 시기를 알아보고자 하였다. 분리 가능한 알루미늄 판과 복합레진을 이용하여 $8\times3\times2mm$ 크기의 복합레진 시편 200개를 제작하였다. 복합레진 시편의 양쪽표면을 Sof-Lex disc로 거친 입자에서 중간 입자까지 마무리한 후 실온의 증류수에 24시간 동안 보관하였다. 시편은 disc로 마무리만 시행한 F군 (n = 10)과 마무리 후 레진전색제인 Biscover를 적용한 B군 (n = 190)으로 분류하였다. B군은 다시 칫솔질을 가하지 않은 B-IM군 (n = 10)과 칫솔질을 가한 군 (n = 180, B-1군에서 B-18 군)으로 분류하였다. 칫솔질을 가한 군은 칫솔마모검사기의 수조에 페리오 치약과 증류수를 무게 비 50 : 50으로 혼합하여 부은 다음, 홈이 파진 알루미늄 블록에 각 군의 시편을 위치시키고 칫솔을 고정장치에 부착하여 전, 후 왕복운동을 가하여 칫솔질을 가하였다. 칫솔질은 B-1 군에서 B-18군 까지 각각 900회씩 증가시켜 16,200회 까지 시행하였다 표면조도측정기를 사용하여 각 군의 복합레진 표면의 평균 표면조도 값 (Ra)을 산출한 후 통계적으로 분석하였고, 주사전자현미경하에서 각 군의 대표적인 시편 1개를 관찰하여 다음과 같은 결과를 얻었다. 1. F군의 Ra는 $0.898{\pm}0.145{\mu}m$, B-IM군의 Ra는 $0.289{\pm}0.142{\mu}m$를 나타냈으며, B-1 군에서 B-18 군까지의 Ra는 점차적으로 증가하여 B-1 군에서 $0.299{\pm}0.48{\mu}m$, B-18 군에서 $0.642{\pm}0.313{\mu}m$까지 나타났다. 2. Ra 최종 군집중심은 군집 1 $(B-IM\simB-7)$에서 $0.361{\mu}m$, 군집 2 $(B-8\simB-14)$에서 $0.511{\mu}m$, 군집 3 $(B-15\simB-18)$에서 $0.624{\mu}m$를 나타내어 각 군집의 Ra 최종 군집중심 간에 통계학적으로 유의한 차이를 나타내었다. (F = 49.705, p = 0.000) 3. B-IM군의 Ra 증감율은 F 군에 비해 210.72%감소되었으며, B-8 군과 B-15군의 Ra 증감율은 B-IM군에 비해 각각 35.49%와 51.35% 증가되었다. 4. FE-SEM 관찰에서 B-IM 군은 매우 평활한 복합레진 표면을 나타내었고, B-8 군은 전체적으로 평활한 복합레진 표면을 보였지만 표면에 수직으로 아주 얕은 흠집을 나타내었다. B-15 군은 복합레진 표면의 중앙에서 B-8군보다 더 넓고 불규칙한 수직의 흠집을 나타내었고, B-18군은 복합레진 표면 전체에 넓은 흠집을 나타내었다.

Apache Spark를 활용한 대용량 데이터의 처리 (Processing large-scale data with Apache Spark)

  • 고세윤;원중호
    • 응용통계연구
    • /
    • 제29권6호
    • /
    • pp.1077-1094
    • /
    • 2016
  • 아파치 스파크는 빠르고 범용성이 뛰어난 클러스터 컴퓨팅 패키지로, 복구 가능한 분산 데이터셋이라는 새로운 추상화를 통해 데이터를 인메모리에 유지하면서도 결함 감내성을 얻을 수 있는 방법을 제공한다. 이러한 추상화는 하드디스크에 직접 데이터를 읽고 쓰는 방식으로 결함 감내성을 제공하는 기존의 대표적인 대용량 데이터 분석 기술인 맵 리듀스 프레임워크에 비해 상당한 속도 향상을 거두었다. 특히 로지스틱 회귀 분석이나 K-평균 군집화와 같은 반복적인 기계 학습 알고리즘이나 사용자가 실시간으로 데이터에 관한 질의를 하는 대화형 자료 분석에서 스파크는 매우 효율적인 성능을 보인다. 뿐만 아니라, 높은 범용성을 바탕으로 하여 기계 학습, 스트리밍 자료 처리, SQL, 그래프 자료 처리와 같은 다양한 고수준 라이브러리를 제공한다. 이 논문에서는 스파크의 개념과 프로그래밍 모형에 대해 소개하고, 이를 통해 몇 가지 통계 분석 알고리즘을 구현하는 방법에 대해 소개한다. 아울러, 스파크에서 제공하는 기계 학습 라이브러리인 MLlib과 R 언어 인터페이스인 SparkR에 대해 다룬다.

영산강 하구역 저서동물 군집구조의 10년 전후 변화 (Structure Change of Macrozoobenthic Community After 10 years in Youngsan River Estuarine Bay, Southwest Coast of Korea)

  • 임현식;서총현
    • 한국해양학회지:바다
    • /
    • 제16권4호
    • /
    • pp.254-267
    • /
    • 2011
  • 영산강 하구역 대형저서동물 군집구조의 10년 경과 후의 변동사항을 파악하기 위하여 임과 박(1998)이 1995년 조사한 정점과 동일한 40개 정점에서 2006년 대형저서동물 군집을 조사하였다. 1995년에 비해 2006년에는 출현종수와 평균 밀도가 현저히 감소하였고, 생체량은 약간 감소하였으나 유사한 값을 보였다. 출현종수 감소는 다모류에서 가장 크게 나타나 1995년의 67종이 2006년에는 48종으로 감소하였으나 점유율은 각각 48% 및 43%로서 유사하였다. 연체동물도 31종에서 22종으로 감소하였으나 점유율은 유사하였다. 갑각류와 극피동물 및 기타분류군의 출현종수는 큰 변화가 없는 것으로 나타났다. 출현밀도는 다모류에서는 큰 차이가 없었으나 연체동물 및 갑각류는 크게 감소된 것이 특징적이었다. 그 밖에 극피동물과 기타분류군은 밀도 차이가 거의 없는 것으로 나타났다. 1995년과 2006년 동시에 가장 우점했던 종은 이매패류인 Theora fragilis였으며, 두 번째로 우점한 종은 다모류인 Tharyx sp.로서 우점 순위는 10여년이 지난 뒤에도 변함이 없었다. 그러나 T. fragilis는 1995년에 평균 1,254 ind./$m^2$였으나, 2006년에는 235 ind./$m^2$로 급격히 감소하였다. 주 분포역은 영산강 하구둑에서부터 목포항에 이르는 지역으로 큰 변화가 없었으나 이들 정점에서의 밀도 감소는 현저하였다. 그 대신 다모류인 Tharyx sp.의 밀도가 증가하였으며 점유율도 증가함으로서 T. fragilis가 우점하던 해역이 Tharyx sp.가 우점한 해역으로 바뀐 것으로 나타났다. 또한 1995년에 우점종으로 출현하였던 다모류인 Poecilochaetus johnsoni와 이매패류인 Raetellops pulchella는 2006년에 밀도가 현저히 감소하였으며, 고하도 서측해역에 우점적으로 분포하던 표층퇴적물식자인 이매패류의 Yoldia johanni는 급격한 밀도 감소와 함께 분포역도 축소되었다. 종 다양도는 2006년에 평균 $1.95{\pm}0.42$로서 1995년 여름철의 $2.08{\pm}0.47$에 비해 약간 감소하였으며, Rarefaction 방법으로 비교한 결과에서도 동일한 양상을 나타내었다. 이러한 결과는 반폐쇄적인 하구역에서 나타나는 지속적인 유기물 축적과 퇴적, 그리고 하구역 준설 및 주변의 토목 공사와 같은 인위적인 영향이 우점종들의 분포와 밀도에 영향을 미쳤음을 시사하고 있으며 그 결과 전체적인 종 다양도 감소를 초래한 것으로 판단된다.

비교사적 군집화 알고리즘을 이용한 전산화 단층영상의 병소부위 결정에 관한 연구 (Determination of Tumor Boundaries on CT Images Using Unsupervised Clustering Algorithm)

  • 이경후;지영훈;이동한;류성렬;조철구;김미숙;유형준;권수일;전준철
    • Journal of Radiation Protection and Research
    • /
    • 제26권2호
    • /
    • pp.59-66
    • /
    • 2001
  • 정위적분할방사선치료(FSRT)는 병소경계에 대한 공간상위치와 형태를 정확히 결정하는 것이 큰 쟁점이다. 본 연구는 나선형 CT를 이용하여 4명의 뇌종양 환자와 팬톰(파라핀)으로부터 연속적인 횡축 단면상을 얻었다. K-mean 분류 알고리즘을 적용하여 CT영상의 초기정보값을 평균화소값으로 변화시켰다. 영상의 구성은 병소영역, 정상영역, 혼합영역, 바탕영역, 가음영영역의 5영역으로 분류하였다. 주된 관심은 혼합영역 내에서 정상영역과 혼합영역을 어떻게 분리하는 가였다. 5영역 평균화소값 중에서 정상영역과 병소영역에 상대적인 평균편차 분석법을 적용하여 2영역 평균편차 화소값 사이의 최대점을 구하였다. IDL 프로그램을 이용한 반자동윤곽법으로 혼합영역내의 최대점을 연결함으로서 GTV의 경계선을 그렸다. 균일한 팬톰의 관심영역 경계선은 ${\pm}1%$ 이내의 오차로 평가되었다. 환자 4명의 경우는 방사선 전문의들이 그린 병소영역과 K-mean 알고리즘과 상대적인 평균편차 분석법에 의해 자동적으로 묘사된 병소영역과 거의 일치하였다. 이러한 방법들을 사용하여 불분명한 정상영역과 병소영역의 경계선을 명확하게 나타낼 수 있었다. 그러므로 CT 영상이 MRI 영상과 비교하여 간헐적으로 병소윤곽을 보여주지 못할 경우 이 방법은 치료계획을 결정할 때 유용한 CT영상 자료로 활용될 수 있음을 확인하였다.

  • PDF

벡터오차수정모형과 다변량 GARCH 모형을 이용한 코스피200 선물의 헷지성과 분석 (Hedging effectiveness of KOSPI200 index futures through VECM-CC-GARCH model)

  • 권동안;이태욱
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권6호
    • /
    • pp.1449-1466
    • /
    • 2014
  • 본 논문에서는 기초자산의 선물을 이용하는 헷지 전략을 연구하였다. 최적헷지비율을 구하기 위한 전통적인 방법으로 회귀분석이 사용되고 있으나, 현물과 선물 사이에 존재하는 장기균형관계와 금융 시계열 자료의 분산에 존재하는 변동성 군집현상 등의 특징을 설명하지 못하는 한계가 있다. 이를 극복하기 위해 코스피200 지수와 선물 자료에 대해 평균모형으로 벡터오차수정모형을 적합하고, 분산모형으로 다변량 GARCH 모형을 적합하여 분산-공분산 행렬을 추정하고, 이를 통해 최적헷지비율을 구하는 방법을 연구하였다. 실증분석 결과에 의하면 시장이 안정적일 때에는 회귀분석을 사용해도 큰 차이가 없지만, 시장이 불안정해지고 변동성이 커지는 구간에서는 벡터오차수정모형과 다변량 GARCH 모형을 이용하는 경우에 헷지성과가 월등히 좋아지는 결과를 얻을 수 있었다.

한강 주요지천의 지역적 및 계절적 수질변화 (Spatial and Seasonal Water Quality Variations of Han River Tributries)

  • 이영준;박민지;손주연;박진락;김귀다;홍창수;구동회;이중근;노창완;신경용;유순주
    • 환경영향평가
    • /
    • 제26권6호
    • /
    • pp.418-430
    • /
    • 2017
  • 지표수의 수질은 음용수, 공업용수, 농업용수 등과 같이 다양한 용도로 이용하기 위해서 아주 중요하다. 다양한 수질변수들에 대한 정기적인 수질조사가 실시되고 있으며 정확하고 효과적인 분석 및 해석이 수반되어야 한다. 본 연구의 목적은 다변량 분석방법을 이용하여 지역적 및 계절적 수질변화를 평가하는데 있다. 2012년부터 2016까지 5년간 12개 조사지점에 대하여 유량(flow)과 수질항목(water temperature, pH, EC, DO, BOD, COD, SS, TN, TP 및 TOC)을 조사 분석하였다. 계절적 수질변화에서는 봄과 겨울의 BOD, TN, TP 및 TOC 평균농도가 여름 및 가을에 비하여 높게 조사되었다. 유량 및 SS의 평균농도가 다른 계절에 비하여 여름이 높았다. 상관분석에서 EC는 BOD(r=0.857), COD(r=0.854), TN(r=0.899) 및 TOC(r=0.910) 와 높은 상관성을 나타냈다. 주성분분석에서 요인 1은 TP, DO 및 pH을 포함하며 32.0%, 요인 2는 EC 및 TN을 포함하며 26.0%, 요인 3은 SS을 포함하며 18.0%의 기여율을 보였고, 요인 4는 유량을 포함하며 12.0%, 요인 5는 수온을 포함하며 10.0%를 보였다. 5개의 요인은 전체 수질변동 특성의 98.0%를 설명할 수 있었다. 안양천, 왕숙천, 중량천 및 탄천은 유기오염물질의 영향을 받는 것으로 조사되었다. 군집분석에서 조사지점에 대한 계절적 차이를 도출하였으며, 또한 군집분석 결과는 주성분분석 결과 해석을 더 잘 설명하게 되었다.

밀리미터파의 손동작 인식 알고리즘에 관한 연구 (Study on Hand Gestures Recognition Algorithm of Millimeter Wave)

  • 남명우;홍순관
    • 한국산학기술학회논문지
    • /
    • 제21권7호
    • /
    • pp.685-691
    • /
    • 2020
  • 본 논문에서는 77GHz를 사용하는 밀리미터파 레이더 센서의 반향 신호를 이용하여 손동작의 움직임을 추적한 후 얻어진 데이터로 0부터 9까지의 숫자들을 인식하는 알고리즘을 개발하였다. 손동작을 감지하여 레이더 센서로부터 얻어진 반향 신호들은 산란 단면적의 차이 등에 의해 불규칙한 점들의 군집형태를 보인다. 이들로부터 유효한 중심점을 얻기 위해 3차원 좌푯값들을 이용해 K-Means 알고리즘을 적용하였다. 그리고 얻어진 중심점들을 연결하여 숫자 형태의 이미지를 생성하였다. 얻어진 이미지와 스무딩 기법을 적용해 사람의 손글씨 형태와 유사하게 만든 이미지를 MNIST(Modified National Institute of Standards and Technology database)로 훈련된 CNN(Convolutional Neural Network) 모델에 입력하여 인식률을 비교하였다. 실험은 두 가지 방법으로 진행되었다. 먼저 스무딩 기법을 적용한 이미지와 적용하지 않은 이미지를 사용한 인식 실험에서는 각각 평균 77.0%와 81.0%의 인식률을 얻었다. 그리고 학습데이터를 확장(augmentation)한 CNN 모델의 실험에서는 스무딩 기법을 적용한 이미지와 적용하지 않은 이미지를 사용한 인식 실험에서 각각 평균 97.5%와 평균 99.0%의 인식률을 얻었다. 본 연구는 레이더 센서를 이용한 다양한 비접촉 인식기술에 응용이 가능할 것으로 판단된다.

K-Means Clustering 알고리즘과 헤도닉 모형을 활용한 서울시 연립·다세대 군집분류 방법에 관한 연구 (A Study on the Clustering Method of Row and Multiplex Housing in Seoul Using K-Means Clustering Algorithm and Hedonic Model)

  • 권순재;김성현;탁온식;정현희
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.95-118
    • /
    • 2017
  • 최근 도심을 중심으로 연립 다세대의 거래가 활성화되고 직방, 다방등과 같은 플랫폼 서비스가 성장하고 있다. 연립 다세대는 수요 변화에 따른 시장 규모 확대와 함께 정보 비대칭으로 인해 사회적 문제가 발생 되는 등 부동산 정보의 사각지대이다. 또한, 서울특별시 또는 한국감정원에서 사용하는 5개 또는 25개의 권역 구분은 행정구역 내부를 중심으로 설정되었으며, 기존의 부동산 연구에서 사용되어 왔다. 이는 도시계획에 의한 권역구분이기 때문에 부동산 연구를 위한 권역 구분이 아니다. 이에 본 연구에서는 기존 연구를 토대로 향후 주택가 격추정에 있어 서울특별시의 공간구조를 재설정할 필요가 있다고 보았다. 이에 본 연구에서는 연립 다세대 실거래가 데이터를 기초로 하여 헤도닉 모형에 적용하였으며, 이를 K-Means Clustering 알고리즘을 사용해 서울특별시의 공간구조를 다시 군집하였다. 본 연구에서는 2014년 1월부터 2016년 12월까지 3년간 국토교통부의 서울시 연립 다세대 실거래가 데이터와 2016년 공시지가를 활용하였다. 실거래가 데이터에서 본 연구에서는 지하거래 제거, 면적당 가격 표준화 및 5이상 -5이하의 실거래 사례 제거와 같이 데이터 제거를 통한 데이터 전처리 작업을 수행하였다. 데이터전처리 후 고정된 초기값 설정으로 결정된 중심점이 매번 같은 결과로 나오게 K-means Clustering을 수행한 후 군집 별로 헤도닉 모형을 활용한 회귀분석을 하였으며, 코사인 유사도를 계산하여 유사성 분석을 진행하였다. 이에 본 연구의 결과는 모형 적합도가 평균 75% 이상으로, 헤도닉 모형에 사용된 변수는 유의미하였다. 즉, 기존 서울을 행정구역 25개 또는 5개의 권역으로 나뉘어 실거래가지수 등 부동산 가격 관련 통계지표를 작성하던 방식을 속성의 영향력이 유사한 영역을 묶어 16개의 구역으로 나누었다. 따라서 본 연구에서는 K-Means Clustering 알고리즘에 실거래가 데이터로 헤도닉 모형을 활용하여 연립 다세대 실거래가를 기반으로 한 군집분류방법을 도출하였다. 또한, 학문적 실무적 시사점을 제시하였고, 본 연구의 한계점과 향후 연구 방향에 대해 제시하였다.