• 제목/요약/키워드: 자기조직화 지도

검색결과 183건 처리시간 0.023초

그래프 컷을 이용한 학습된 자기 조직화 맵의 자동 군집화 (Automatic Clustering on Trained Self-organizing Feature Maps via Graph Cuts)

  • 박안진;정기철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권9호
    • /
    • pp.572-587
    • /
    • 2008
  • SOFM(Self-organizing Feature Map)은 고차원의 데이타를 군집화(clustering)하거나 시각화(visualization)하기 위해 많이 사용되고 있는 비교사 학습 신경망(unsupervised neural network)의 한 종류이며, 컴퓨터비전이나 패턴인식 분야에서 다양하게 활용되고 있다. 최근 SOFM이 실제 응용분야에 다양하게 활용되고 좋은 결과를 보이고 있지만, 학습된 SOFM의 뉴론(neuron)을 다시 군집화해야 하는 후처리가 필요하며, 대부분의 경우 수동으로 이루어지고 있다. 후처리를 자동으로 하기 위해 k-means와 같은 기존의 군집화 알고리즘을 많이 이용하지만, 이 방법은 특히 다양한 모양의 클래스를 가진 고차원의 데이타에서 만족스럽지 못한 결과를 보인다. 다양한 모양의 클래스에서 좋은 성능을 보이기 위해, 본 논문에서는 그래프 컷(graph cut)을 이용하여 학습된 SOFM을 자동으로 군집화하는 방법을 제안한다. 그래프 컷을 이용할 때 터미널(terminal)이라는 두 개의 추가적인 정점(vertex)이 필요하며, 터미널과 각 정점 사이의 가중치는 대부분 사용자에 의해 입력받은 사전정보를 기반으로 설정된다. 제안된 방법은 SOFM의 거리 매트릭스(distance matrix)를 기반으로 한 모드 탐색(mode-seeking)과 모드의 군집화를 통하여 자동으로 사전정보를 설정하며, 학습된 SOFM의 군집화를 자동으로 수행한다. 실험에서 효율성을 검증하기 위해 제안된 방법을 텍스처 분할(texture segmentation)에 적용하였다. 실험 결과에서 제안된 방법은 기존의 군집화 알고리즘을 이용한 방법보다 높은 정확도를 보였으며, 이는 그래프기반의 군집화를 통해 다양한 모양의 클러스터를 처리할 수 있기 때문이다.

SOFM 신경회로망을 이용한 한국어 음소 인식 (Korean Phoneme Recognition Using Self-Organizing Feature Map)

  • 전용구;양진우;김순협
    • 한국음향학회지
    • /
    • 제14권2호
    • /
    • pp.101-112
    • /
    • 1995
  • 본 논문에서는 패턴 매칭 방법에 근거하여 인식 단위가 음소인 음소 기반 인식 시스템을 구성하였다. 선택한 신경망 구조는 생물학적 신경망인 코호넨(T. Kohonen)의 SOFM(Self-Organizing Feature Map)으로 패턴 매칭 과정 중 클러스터러(clusterer)로 사용하였다. SOFM 신경망은 신호 공간에 대해서 최적의 국소(局所) 해부적 사상(local topographical mapping)에 의한 자기 조직화 과정을 수행하며, 그 결과 인식 문제에 있어서 상당히 높은 정확도를 나타낸다. 따라서 SOFM 신경망은 음소 인식에도 효과적으로 응용될 수 있다. 또한 음소 인식 시스템의 성능 향상을 위해 K-means클러스터링 알고리즘이 결합된 학습 알고리즘을 제안하였다. 제안된 음소 인식 시스템의 성능을 평가하기 위해 먼저, 인식 대상음소는 모음군 17개, 자음의 경우 파열음9개, 마찰음 3개, 파찰음 3개, 유음 및 비음 4개, 음소의 성질이 다른 종성 7개의 음소군으로 모두 43개의 음소를 대상으로 실험하였으며, 각 음소군에 대한 특징 지도를 구성하여 레이블러(labeler)의 기능을 수행하게 하였다. 화자 종속 인식 실험 결과 $87.2\%$의 인식률을 보였으며 제안한 학습법의 빠른 수렴성과 인식률 향상을 확인하였다.

  • PDF

클래스 불균형 문제를 해결하기 위한 개선된 집중 샘플링 (Improved Focused Sampling for Class Imbalance Problem)

  • 김만선;양형정;김수형;챠위핑
    • 정보처리학회논문지B
    • /
    • 제14B권4호
    • /
    • pp.287-294
    • /
    • 2007
  • 실세계의 문제에서 많은 기계학습의 알고리즘들은 데이터의 클래스 불균형 문제에 어려움을 겪는다. 이러한 클래스 불균형 문제를 해결하기 위하여 데이터의 비율을 변경하거나 좀 더 나은 샘플링 전략으로 극복하려는 연구들이 제안되었다. 그러나 데이터의 비율을 변경하는 연구에서는 전체 데이터 분포의 특성을 고려하지 못하고, 샘플링 전략을 제안하는 연구에서는 여러 가지 제한 조건을 고려해야만 한다. 본 논문에서는 위의 두가지 방법의 장점을 모두 포함하는 개선된 집중 샘플링 방법을 제안한다. 제안된 방법에서는 클래스 불균형 문제를 해결하기 위해 학습에 유용한 데이터들을 샘플링하는데 스코어링에 기반한 데이터 분할 방법을 이용한다. 즉, 입력 데이터들에 대해 SOM(Self Organizing Map)의 학습 결과로 얻은 BMU(Best Matching Unit)와의 거리를 계산하고, 이 거리론 스코어라 한다. 측정된 스코어는 오름차순으로 정렬되며, 이 과정에서 입력 데이터의 분포가 재 표현되고, 재 표현된 분포는 전체 데이터의 특성을 대표하게 된다. 그 결과로 얻은 데이터들 중에서 유용하지 못한 데이터들에 대해 제거하는 과정을 수행하여 새로운 학습 데이터 셋을 얻는다. 새로운 학습 데이터 생성 과정에서는 재 표현된 분포의 결과를 두 구간(upper, lower)으로 분할하는데, 두 추간 사이의 데이터들은 유용하지 못한 패턴들로 간주되어 학습에 이용되지 않는다. 본 논문에서 제안한 방법은 클래스 불균형의 비율 감수 훈련 데이터의 크기 감소, 과적합의 방지 등 몇 가지 장점을 보인다. 제안한 방법으로 샘플링된 데이터에 kNN 을 적용하여, 분류 실험한 결과 심한 불균형이 있는 ecoli 데이터의 분류 성능이 최대 2.27배 향상되었다.

음성특징의 거리 개념에 기반한 한국어 모음 음성의 시각화 (Speech Visualization of Korean Vowels Based on the Distances Among Acoustic Features)

  • 복거철
    • 한국정보전자통신기술학회논문지
    • /
    • 제12권5호
    • /
    • pp.512-520
    • /
    • 2019
  • 음성을 시각적으로 표현하는 것은 외국어를 습득하는 과정의 학습자나 음성을 직접 들을 수 없는 청각장애자에게 매우 유용하며 기존에 다수의 연구가 이루어졌다. 그러나 기존의 연구들은 발음의 특징을 단지 컬러로 표현한다든가 입모양을 3차원 그래픽으로 표현하거나 입과 구강의 변화하는 형태를 애니메이션으로 보여 주는 방식에 머물러 있다. 따라서 이런 방식을 사용하는 학습자들은 자신의 발음이 표준 발음과 얼마나 멀리 떨어져 있는지 알 수가 없고 더 나아가서 학습 중에 스스로 교정을 해 나가는 시스템을 개발하기가 기술적으로 어려운 단점이 있다. 이를 극복하기 위해 본 논문에서는 음성 간의 상대적 거리를 토대로 음성을 시각화하는 모델을 제시하고, 이를 한국어 모음에 적용하여 모음의 음성적 특징을 이용한 시각화의 구체적인 구현 방법을 제시한다. 음성데이터에서 F1, F2, F3의 세 개의 포먼트를 구하고 이들 특징벡터를 코호넨 자기조직화맵 알고리즘으로 2차원 화면에 사상하여 각 음성을 화면 위의 각 점에 대응하여 표현하였다. 제안하는 시스템의 실제적인 구현은 인터넷에 공개된 음성처리 공개소프트웨어를 사용하고 한국인 교사의 표준 발음과 한국어를 배우고 있는 외국인 유학생의 음성을 이용하여 음성특징의 상호간 거리를 구하였으며, 사용자 인터페이스는 자바스크립트를 이용하여 구현하였다.

미디어 레퍼토리를 이용한 스마트폰 애플리케이션 이용 패턴 유형 분석 (Mobile App Analytics using Media Repertoire Approach)

  • 권성은;장서인;황보현우
    • 한국전자거래학회지
    • /
    • 제26권4호
    • /
    • pp.133-154
    • /
    • 2021
  • 현대인에게 가장 보편적이고 융합적인 미디어인 스마트 폰은 애플리케이션이라는 비히클을 갖는 뉴미디어이다. 이 연구는 미디어 사용자들은 어떻게 레퍼토리를 구성하여 미디어를 이용하고 있는지를 파악하고자 2019년 11월, 4주 동안의 개인별 모바일 이용행동 로그 데이터를 이용하여 모바일 애플리케이션 카테고리별 미디어 이용량을 중심으로 군집 분석을 실시하고, 최종적으로 8개의 모바일 미디어 레퍼토리 유형별 집단을 분류하였다. 8개의 각 미디어 레퍼토리 그룹은 애플리케이션 카테고리별 절대적 이용량과 타 그룹 대비 상대적 이용량에서 차이를 보였으며, 데모그라픽적 분포에서도 집단간 차이를 보였다. 이 연구는 모바일 미디어 레퍼토리를 규명해 냈다는 학문적 기여뿐만 아니라 기존의 k-means clustering에 의존적이었던 군집 분석을 SOM(Sefl-Organized Map)을 이용하여 프로토벡터를 추출하고 이 프로토벡터를 이용하여 k-means clustering을 실시하는 이단계 접근법(two-step approach)을 시도함으로써, 기존 k-means clustering이 갖고 있는 '이상치(outlier)'나 '결측치'에 민감했던 한계점을 극복하고 더 나은 성능의 분석 결과를 도출하고 있음을 보여준다는 점에서 방법론적으로도 의미를 갖는다. 또한 모바일 미디어 이용 행동의 유형 분류 연구는 전자거래 서비스를 이용하는 고객을 유형분류하고, 각 고객 유형에 맞는 고객 관리 서비스를 집행해야 하는 실무진이 고객 행동 로그 데이터를 기반으로 고객의 구조를 파악하고 각 고객 집단에 적합한 서비스 또는 마케팅 의사결정을 차별적으로 집행해야 하는 전자거래 커뮤니티에 실무적 가이드를 제공한다는 점에서도 의미를 갖고 있다.

투자자별 거래정보와 머신러닝을 활용한 투자전략의 성과 (Performance of Investment Strategy using Investor-specific Transaction Information and Machine Learning)

  • 김경목;김선웅;최흥식
    • 지능정보연구
    • /
    • 제27권1호
    • /
    • pp.65-82
    • /
    • 2021
  • 주식시장에 참여하는 투자자들은 크게 외국인투자자, 기관투자자, 그리고 개인투자자로 구분된다. 외국인투자자 같은 전문투자자 집단은 개인투자자 집단과 비교하여 정보력과 자금력에서 우위를 보이고 있으며, 그 결과 시장 참여자들 사이에는 외국인투자자들이 좋은 투자 성과를 보이는 것으로 알려져 있다. 외국인 투자자들은 근래에는 인공지능을 이용한 투자를 많이 하고 있다. 본 연구의 목적은 투자자별 거래량 정보와 머신러닝을 결합하는 투자전략을 제안하고, 실제 주가와 투자자별 거래량 데이터를 이용하여 제안 모형의 포트폴리오 투자 성과를 분석하는 것이다. 일별 투자자별 매수 수량과 매도 수량 정보는 한국거래소에서 공개하고 있는 자료를 활용하였으며, 여기에 인공신경망을 결합하여 최적의 포트폴리오 전략을 도출하고자 하였다. 본 연구에서는 자기 조직화 지도 모형 인공신경망을 이용하여 투자자별 거래량 데이터를 그룹화하고 그룹화한 데이터를 변환하여 오류역전파 모형을 학습하였다. 학습 후 검증 데이터 예측결과로 매월 포트폴리오 구성을 하도록 개발하였다. 성과 분석을 위해 포트폴리오의 벤치마크를 지정하였고 시장 수익률 비교를 위해 KOSPI200, KOSPI 지수 수익률도 구하였다. 포트폴리오의 동일배분 수익률, 복리 수익률, 연평균 수익률, MDD, 표준편차, 샤프지수, 벤치마크로 지정한 시가총액 상위 10종목의 Buy and Hold 수익률 등을 사용하여 성과 분석을 진행하였다. 분석 결과 포트폴리오가 벤치마크 대비 2배 수익률을 올렸으며 시장 수익률보다 좋은 성과를 보였다. MDD와 표준편차는 포트폴리오와 벤치마크가 비슷한 결과로 성과 대비 비교한다면 포트폴리오가 좋은 성과라고 할 수 있다. 샤프지수도 포트폴리오가 벤치마크와 시장 결과보다 좋은 성과를 내었다. 이를 통해 머신러닝과 투자자별 거래정보 분석을 활용한 포트폴리오 구성 프로그램 개발의 방향을 제시하였고 실제 주식 투자를 위한 프로그램 개발에 활용할 수 있음을 보였다.

근거리 원격탐사 기법을 이용한 총일차생산량 추정 및 순생태계 CO2 교환량 배분의 정확도 평가에 관하여 (On Using Near-surface Remote Sensing Observation for Evaluation Gross Primary Productivity and Net Ecosystem CO2 Partitioning)

  • 박주한;강민석;조성식;손승원;김종호;김수진;임종환;강민구;심교문
    • 한국농림기상학회지
    • /
    • 제23권4호
    • /
    • pp.251-267
    • /
    • 2021
  • 원격 탐사 기반의 식생지수들은 광합성을 조절하는 식물생리적 특성과 경험적 상관관계를 보이며, 여러공간 규모에서의 총일차생산량(GPP) 추정에 활용되고 있다. 하지만 시간 해상도가 높아질수록 식생지수를 이용한 GPP 추정의 불확실성이 커지는 한계가 존재한다. 또한 식생지수 관련 분석에 주로 사용되는 에디공분산법을 이용하여 추정한 GPP 역시 실제 측정한 순생태계교환량(NEE)을 GPP와 생태계 호흡(RE)으로 배분하는 데 사용하는 방법에 따라 추정값이 달라지는 불확실성이 존재한다. 본 연구에서는 플럭스 타워가 설치된 네 곳의 농림생태계를 대상으로 근지표에서 관측한 식생의 분광 특성을 이용한 다양한 식생지수를 계산하였고, 이를 다양한 시간 해상도에서 GPP 추정에 적용가능한 지를 분석하였다. 동시에 이를 이용하여 NEE 배분 방법의 불확실성을 평가하였다. 비교에 사용한 정규식생지수, 개량식생지수, 적외반사식생지수(NIRv)에 비해 적외반사식생지수와 광합성유효광(PAR)을 결합한 NIRvP이 식생 및 지형 조건에 의한 공간 이질성으로 인해 관측지에 따라 약간의 차이가 나타났지만, 농경지와 산림에서 모두 30분과 일 단위 시간 해상도에서 GPP와 높은 상관성(r2 = 0.63, 0.68)을 보였다. 또한 기존 KoFlux 표준 NEE 배분방법에 비해 기계학습 기반의 NEE 배분 방법을 적용할 경우, 산림에서 30분 단위의 GPP와 NIRvP 사이의 상관성이 향상되었지만, 일 단위에는 그 차이가 크지 않았다. 하지만 광조건 이외에 다른 요인에 의해 광합성이 제한되는 경우 NIRvP와 GPP 간의 상관성이 떨어져 NIRvP를 이용해 실제 배분 결과를 직접 평가하긴 어려웠으며, 주로 광 조건에 의해 광합성이 제한되는 흐린 날의 경우 NEE 배분 정확도를 평가할 수 있는 가능성이 존재하였다. 그러나 높은 시간해상도의 Vis 기반의 GPP 추정이 의미를 가지려면, VIs와 GPP간의 경험적 관계를 넘어서는 시스템 사고 및 자기-조직화와 관련된 복잡계 기반의 분석 방법이 요구된다.

철도 유휴부지 활용방안: 군집분석을 활용한 태양광발전 입지 제안 (Utilizing the Idle Railway Sites: A Proposal for the Location of Solar Power Plants Using Cluster Analysis)

  • 강은경;양선욱;권지윤;양성병
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.79-105
    • /
    • 2023
  • 지구온난화와 기후변화 등의 유례없는 기상이변으로 전 세계 곳곳이 극심한 몸살을 앓고 있으며, 경제적 손실 또한 눈덩이처럼 불어나고 있다. 이러한 문제를 해결하기 위해 2016년 '파리기후변화협정(The Paris Agreement)'이 체결되어 지구의 평균온도 상승을 1.5℃ 아래로 유지하기 위한 정부간 협의체가 결성되었으며, 우리나라도 2050년 탄소중립을 선언함으로써 기후재앙을 막기 위한 노력을 진행하고 있다. 특히, 온실가스 배출로 인한 기온상승은 수출 의존도가 높은 우리나라 경제는 물론 환경과 사회 전반에 부정적인 영향을 미칠 것으로 예상된다. 또한, 교통수단의 다변화가 가속화되면서 수단선택의 변화도 크게 증가하고 있는 가운데 저성장 시대의 개발 패러다임이 도시재생으로 변화함에 따라, 노선의 수요 감소, 선형 개량, 도심 철도의 외곽 이설 등에 영향을 받아 증가하고 있는 철도 유휴부지 활용에 대한 관심이 높아지고 있다. 한편, 철도 유휴부지를 활용한 태양광발전은 '재생에너지 3020'의 태양광발전 목표를 일부 달성하면서도, 입지를 둘러싼 환경훼손과 주민 수용성 문제에서 자유로워질 수 있는 장점에도 불구하고, 설비실태나 설비계획에 있어 미진한 상황이다. 이에, 본 연구에서는 국가철도공단과 재생에너지클라우드플랫폼에서 제공하는 데이터를 활용하여 태양광발전 설비 설치가 가능한 적합 유휴지를 발굴 및 분석하는 알고리즘을 개발하고, 사용자가 원하는 조건을 고려한 잠재적인 적합 지역을 탐색 및 도출함으로써, 개발 초기 설비나 확충 등에 소요되는 막대한 비용을 절약할 수 있는 방안을 마련하고자 하였다. 본 연구는 다양한 군집분석을 활용하여 철도 유휴부지에 태양광발전 설치입지를 도출할 수 있는 최적의 알고리즘을 개발하고, 면적, 설치용량, 발전량, 예상수익 등이 모두 높은 '태양광발전 설치 적극권장 지역' 202곳을 도출하였다. 이를 바탕으로 경제와 환경을 동시에 고려한 관점에서 의사결정자의 합리적인 판단을 도울 수 있을 것으로 기대한다.

사례기반 추론기법과 인공신경망을 이용한 서비스 수요예측 프레임워크 (A Hybrid Forecasting Framework based on Case-based Reasoning and Artificial Neural Network)

  • 황유섭
    • 지능정보연구
    • /
    • 제18권4호
    • /
    • pp.43-57
    • /
    • 2012
  • 제조업에 있어서 판매 후 서비스 건수와 내용 등은 향후 서비스 제공을 위한 자원배분의 효율성 증진과 서비스 품질 향상을 위해서도 매우 중요한 정보이다. 따라서 기업들은 향후 발생하는 판매 후 서비스에 대해 정확히 예측하고 그에 따라 적절히 대처하는 능력을 확보할 필요성이 제조업을 중심으로 증가하고 있다. 그러나 실제로 이들 기업들이 활용하고 있는 서비스 수요예측 방법들은 전통적인 통계적인 예측기법이거나, 시뮬레이션을 기반한 기법들이다. 예를 들면, 전통적인 통계적인 예측기법으로는 회귀분석(regression analysis)의 경우, 다양한 제품모델에 대한 판매 후 서비스 발생 패턴이 선형적인 관계가 매우 적음에도 불구하고 선형으로 가정하여 추정한다는 점과 적정한 회귀식을 가정하여야 되며, 이러한 가정이 실제 경영환경에서는 매우 어렵다는 점 등이 기존의 예측기법들의 한계점으로 지적되고 있다. 본 연구에서는 디지털 TV 모델을 생산 판매 하는 A사의 사례연구를 통하여 최근 인공지능연구에서 각광을 받고 있는 사례기반추론(case-based reasoning; CBR) 기법을 활용한 서비스 수요예측 프레임워크를 제안하고자 한다. 또한, 사례기반추론에서 핵심적인 역할 중 하나인 유사 사례추출 방법에 있어서 가장 일반적인 nearest-neighbor 방법 이외의 유사 사례추출 방법을 제안하고자 한다. 특히, 본 연구에서 제안하는 유사 사례추출 방법은 인공신경망(artificial neural network)을 활용한 자기조직화지도(Self-Organizing Maps : SOM) 군집화 기법을 활용한 유사 사례추출 방식으로 이를 활용한 서비스 수요예측 프레임워크에 구현하고, 실제 기업의 판매 후 서비스 데이터를 활용하여 본 연구에서 제안하는 서비스 수요 예측 프레임워크의 유효성을 실증적으로 검증하고자 한다.

부착돌말영양지수(TDI)를 활용한 습지환경 평가 (Wetland Habitat Assessement Utilizing TDI(Trophic Diatom Index))

  • 김성기;최종윤
    • 한국환경생태학회지
    • /
    • 제33권5호
    • /
    • pp.525-538
    • /
    • 2019
  • 낙동강에 위치한 신규조성 습지의 현황 파악 및 관리 방안 마련을 위한 기초연구의 일환으로 부착규조류의 서식현황과 종다양성을 분석하고 부착돌말영양지수(TDI, Trophic Diatom Index)의 적용가능성을 평가하였다. 조사 기간 동안, 부착규조류는 총 38과 173종이 출현하였으며, 봄과 가을에 각각 156종, 154종으로 비슷한 종수를 나타냈다. 자기조직화지도(SOM)를 활용한 분석 결과, 부착규조류의 분포는 각 습지의 영양염류의 농도와 강우 등의 환경요인에 따라 영향 받는 것으로 나타났다. 클러스터 1의 경우, 대부분 가을시기이며, 총인과 총질소 등의 영양염류의 농도와 부착규조류의 종수 및 풍부도가 낮음에도 불구하고, 부착돌말영양지수가 높은 지점들로 구성되었다. 이와 반대로, 클러스터 4는 봄시기의 지점들이며, 총질소가 높음에도 불구하고 부착돌말영양지수가 낮은 특징을 보였다. 신규조성 습지 대부분이 유입 유출구 기능이 원활하지 않은 점을 감안하면, 여름철에 증가된 유량은 가을철에 영양염류 값을 감소시키며, 탁도 증가로 인해 빛의 유입이 원활하지 않아 부착규조류의 종수와 풍부도가 낮아진다. 이와 반대로, 봄철에는 낮은 수위로 인해 부착규조류가 부착할 수 있는 기질표면이 부족하며, 호오탁성 종이 정착 및 발달하기에 이른 시기이기 때문에 부착돌말영양지수 값이 낮게 측정된다. 다양한 기존 연구에서, 부착돌말영양지수를 서식환경 및 수질 평가지표로 활용하고 있으나, 본 습지는 흐름이 적고 정체수역에 가깝기 때문에 대부분 영양염류 농도가 높아 부착돌말영양지수의 평가지표 가치성은 낮은 것으로 판단된다. 여름강우나 유입 유출 조절부의 기능이 부착규조류의 종다양성과 분포에 영향을 미치는 점을 종합적으로 감안한 지속적이고 주기적인 추가 조사가 필요하다.