• 제목/요약/키워드: Self organizing map

검색결과 424건 처리시간 0.024초

자기조직화 지도와 매트릭스분석을 이용한 특허분석시스템의 공백기술 예측 (Forecasting Vacant Technology of Patent Analysis System using Self Organizing Map and Matrix Analysis)

  • 전성해;박상성;신영근;장동식;정호석
    • 한국콘텐츠학회논문지
    • /
    • 제10권2호
    • /
    • pp.462-480
    • /
    • 2010
  • 특허분석은 전 세계적으로 축적된 특허 데이터베이스로부터 기업의 연구개발 전략에 필요한 지식을 추출하는 것이다. 현재까지 특허출원 결과를 분석하여 해당기술에 대한 기술동향과 전개과정을 파악하여 향후 개발될 기술에 대한 방향정립을 위하여 특허분석은 필요한 결과를 제공한다. 본 논문에서는 특허분석과 관련된 방법 및 시스템에 대한 기술 분류를 수행하고 관련된 국내특허와 미국특허, 그리고 IEEE 논문을 조사하고 분석한다. 특허분석시스템은 기술 분야의 특성상 특허출원뿐만 아니라 연구결과의 논문발표도 활발히 이루어지고 있다. 본 연구에서 선정된 검색어를 통하여 최종적으로 검색된 결과를 이용하여 기술 분류에 따른 분석을 실시한다. 유효한 전체 특허와 논문을 대상으로 특허분석시스템에 필요한 공백기술을 찾아내기 위하여 매트릭스분석을 수행한다. 현재까지 등록된 특허분석시스템에 대한 기술발전 동향을 파악하고 앞으로 필요한 특허분석시스템 관련 기술발전 방향도 제시한다. 통계적 검정과 자기조직화 지도를 이용하여 유효 특허와 논문을 정량적으로 분석하여 국내특허, 미국특허, 그리고 논문 내에서 상대적으로 개발이 취약한 기술을 찾아내고 이에 대한 개발의 필요성도 함께 제시한다.

국내 주요 강 생태계 내 동물플랑크톤의 탄소, 질소, 인 비율 해석 (Carbon, Nitrogen and Phosphorous Ratios of Zooplankton in the Major River Ecosystems)

  • 김현우;라긍환;정광석;김동균;황순진;이재용;김범철
    • 생태와환경
    • /
    • 제46권4호
    • /
    • pp.581-587
    • /
    • 2013
  • 국내 주요 강 생태계 (한강, 금강, 영산강, 섬진강)에서 지난 2004년부터 2008년까지 총 동물플랑크톤의 탄소(C), 질소(N) 및 인(P) 함량에 대해 평가하였다. 동물플랑크톤의 건중량 당 C, N P-함량은 강 시스템별로 변화가 뚜렷하였다. 조사지점별 평균 C, N, 그리고 P-함량의 범위는 $70{\sim}620mgC\;mg^{-1}$ D.W., $7.1{\sim}85.5{\mu}gN\;mg^{-1}$ D.W. 그리고 $2.5{\sim}7.4{\mu}gP\;mg^{-1}$ D.W.인 것으로 파악되었다. 평균 탄소: 질소: 인 비율은 지점별 상이한 차이를 보였으며 전 지점의 평균은 200 : 29 : 1인 것으로 파악되었다. 전 조사지점에서의 동물플랑크톤 군집의 탄소: 인 그리고 질소: 인 비율의 범위는 각 각 38에서 392 : 1과 4에서 65 : 1이었다. 자가조직화지도(SOM)을 활용한 평면상 지점들의 배치 양상과 화학양론 자료들 간의 주요그룹 분석 결과 크게 세 클러스터로 구분되었다. 클러스터링 결과 동물플랑크톤의 C, N, P-함량은 공간적 이질성에 의해 영향을 받았으며, 화학량론 자료는 강 생태계의 환경 특성 해석에 활용성이 높은 것으로 사료되었다.

BIS 자료를 이용한 중장기 버스 통행시간 예측 (Long-term Prediction of Bus Travel Time Using Bus Information System Data)

  • 이주영;구은모;김형주;장기태
    • 대한교통학회지
    • /
    • 제35권4호
    • /
    • pp.348-359
    • /
    • 2017
  • 최근 국내에서는 대도시권의 교통혼잡 완화를 위하여 다양한 대중교통 활성화 정책을 시행중에 있다. 특히 대도시권역에서는 버스정보시스템이 도입되어 버스의 현재위치, 도착예정시간 등에 대한 정보를 제공하고 있다. 하지만 복잡한 도시부를 지나는 버스들의 경우 반복적인 교통혼잡과 버스몰림으로 인하여 정확한 통행시간 정보제공 시 정확도를 확보하는데 어려움이 있다. 기존 버스 통행시간 연구는 링크별 소통정보 제공방식으로 인하여 버스 이용자의 경로 통행시간 정보 제공 시 어려움이 있고, 데이터 기반의 단기 통행방식으로 중장기 정보 제공이 어렵다는 한계가 있다. 이에 본 연구에서는 경로기반의 중장기 버스통행시간 예측 방법론에 대한 연구를 실시한다. 이를 위하여 2015년 버스통행정보로 학습데이터, 2016년 자료로 검증데이터를 구성하였다. 학습데이터를 이용하여 버스통행정보를 분석하여 버스통행시간에 영향을 미치는 요인들을 출발시각, 요일, 그리고 기상요인 등으로 분류하고, 이들의 특성 값을 자기조직화지도를 활용하여 비슷한 통행 패턴을 가지는 군집으로 분류하였다. 도출된 군집들을 바탕으로 맑음과 우천시에 대한 요일/출발시각 별 버스통행시간 참조 테이블을 구성하였다. 검증데이터를 이용하여 본 연구에서 도출한 버스통행시간의 정확도를 검증하였다. 본 연구의 중장기 예측 알고리즘을 활용하여 기존의 직관적이고 경험적인 접근법의 한계를 극복할 수 있으며, 예측의 정확도 개선을 통한 버스이용자 만족도 향상 및 탄력적인 대중교통 정책 수립이 가능할 것으로 판단된다.

클래스 불균형 문제를 해결하기 위한 개선된 집중 샘플링 (Improved Focused Sampling for Class Imbalance Problem)

  • 김만선;양형정;김수형;챠위핑
    • 정보처리학회논문지B
    • /
    • 제14B권4호
    • /
    • pp.287-294
    • /
    • 2007
  • 실세계의 문제에서 많은 기계학습의 알고리즘들은 데이터의 클래스 불균형 문제에 어려움을 겪는다. 이러한 클래스 불균형 문제를 해결하기 위하여 데이터의 비율을 변경하거나 좀 더 나은 샘플링 전략으로 극복하려는 연구들이 제안되었다. 그러나 데이터의 비율을 변경하는 연구에서는 전체 데이터 분포의 특성을 고려하지 못하고, 샘플링 전략을 제안하는 연구에서는 여러 가지 제한 조건을 고려해야만 한다. 본 논문에서는 위의 두가지 방법의 장점을 모두 포함하는 개선된 집중 샘플링 방법을 제안한다. 제안된 방법에서는 클래스 불균형 문제를 해결하기 위해 학습에 유용한 데이터들을 샘플링하는데 스코어링에 기반한 데이터 분할 방법을 이용한다. 즉, 입력 데이터들에 대해 SOM(Self Organizing Map)의 학습 결과로 얻은 BMU(Best Matching Unit)와의 거리를 계산하고, 이 거리론 스코어라 한다. 측정된 스코어는 오름차순으로 정렬되며, 이 과정에서 입력 데이터의 분포가 재 표현되고, 재 표현된 분포는 전체 데이터의 특성을 대표하게 된다. 그 결과로 얻은 데이터들 중에서 유용하지 못한 데이터들에 대해 제거하는 과정을 수행하여 새로운 학습 데이터 셋을 얻는다. 새로운 학습 데이터 생성 과정에서는 재 표현된 분포의 결과를 두 구간(upper, lower)으로 분할하는데, 두 추간 사이의 데이터들은 유용하지 못한 패턴들로 간주되어 학습에 이용되지 않는다. 본 논문에서 제안한 방법은 클래스 불균형의 비율 감수 훈련 데이터의 크기 감소, 과적합의 방지 등 몇 가지 장점을 보인다. 제안한 방법으로 샘플링된 데이터에 kNN 을 적용하여, 분류 실험한 결과 심한 불균형이 있는 ecoli 데이터의 분류 성능이 최대 2.27배 향상되었다.

Binary Harmony Search 알고리즘을 이용한 Unsupervised Nonlinear Classifier 구현 (Implementation of Unsupervised Nonlinear Classifier with Binary Harmony Search Algorithm)

  • 이태주;박승민;고광은;성원기;심귀보
    • 한국지능시스템학회논문지
    • /
    • 제23권4호
    • /
    • pp.354-359
    • /
    • 2013
  • 본 논문을 통해서 우리는 최적화 알고리즘인 binary harmony search (BHS) 알고리즘을 이용하여 unsupervised nonlinear classifier를 구현하는 방안을 제시하였다. 패턴인식을 위한 기계학습이나 뇌파 신호의 분석 과정과 같이 벡터로 표현되는 특징들을 분류하는데 있어 다양한 알고리즘들이 제시되었다. 교사 학습기반의 분류 방식으로는 support vector machine과 같은 기법이 사용되어왔고, 비교사 학습 방법을 통한 분류 기법으로는 fuzzy c-mean (FCM)과 같은 알고리즘들이 사용되어 왔다. 그러나 기존에 사용해 왔던 분류 방법들은 비선형 데이터 분류에 적용하기 힘들거나 교사 학습을 적용하기 위해서 사전정보를 필요로 하는 문제점이 있다. 본 논문에서는 경험적 접근을 통해 공간상에 분포된 벡터 사이의 기하학적 거리를 최소로 만드는 벡터 집합을 선택하고 이를 하나의 클래스로 간주하는 방법을 적용한 분류법을 제시하였다. 비교 대상으로 FCM과 artificial neural network (ANN) 기반의 self-organizing map (SOM)을 제시하였다. 시뮬레이션에는 KEEL machine learing dataset을 사용하였고 그 결과, 제안된 방식이 기존 알고리즘에 비해 더 나은 우수성을 지니고 있음을 확인하였다.

SOM을 이용한 전남 호소의 식물플랑크톤 군집과 수질 관계 분석 (Relationship between Phytoplankton Community and Water Quality in Lakes in Jeonnam using SOM)

  • 조현진;나정은;정명화;이학영
    • 생태와환경
    • /
    • 제50권1호
    • /
    • pp.148-156
    • /
    • 2017
  • 전라남도에 위치한 12개의 호소에서 식물플랑크톤 군집변화 양상 및 환경요인과 시공간적 특징의 상관관계를 알아보기 위하여 2014년 3월부터 11월까지 총 4차례에 걸쳐 조사를 시행하였다. 전체 조사기간 동안 출현한 식물플랑크톤은 총 297종으로, 규조류 98종, 녹조류 148종, 남조류 23종, 그 외 와편모조류를 포함한 기타조류 28종으로 확인되었고, 조사시기별 출현종은 3월 116종, 6월 163종, 8월 162종, 11월 169종으로 1차 조사를 제외한 대부분의 시기에 다소 높은 출현종수를 보였다. 조사기간 동안 확인된 식물플랑크톤의 개체수는 $124{\sim}59,148cells\;mL^{-1}$의 범위를 나타냈고, 조사시기별 평균 출현개체수는 3월 $3,443cells\;mL^{-1}$, 6월 $4,055cells\;mL^{-1}$, 8월 $11,763cells\;mL^{-1}$, 11월 $4,614cells\;mL^{-1}$로 봄철에서 여름철로 계절이 진행되면서 증가한 후 가을철로 접어들면서 다시 감소하는 경향을 보였는데 이는 남조류의 개체수 변화에 따른 결과로 확인되었다. 식물플랑크톤 군집과 이화학적 요인을 이용한 SOM 분석 결과 $9{\times}6$ 격자에서 최적화되었고, 5개의 그룹으로 분류되었다. SOM 분석을 통한 식물플랑크톤의 군집과 연관이 있는 이화학적 요인은 수온, SS, DO, BOD, TP, Chl-a로 확인되었고 pH, TN, $NH_3-N$, $NO_3-N$, $PO_4-P$, 전기전도도 등은 관련성이 낮은 것으로 나타났다. 식물플랑크톤 군집과 이화학적 요인 간의 Pearson's correlation coefficient를 산출한 결과 식물플랑크톤의 군집은 대체로 수온, DO, SS, TP, 전기전도도, Chl-a와 통계적 유의성을 보였고, pH, TN, $NH_3-N$, $NO_3-N$, $PO_4-P$ 등과는 유의성이 낮은 것으로 확인되었다. 결론적으로 전라남도 내 주요 호소에서의 식물플랑크톤 군집의 분포는 주로 수온, SS, DO, BOD, Chl-a와 관계가 있는 것으로 확인되었고 pH, TN, $NH_3-N$, $NO_3-N$, $PO_4-P$와의 관련성은 낮은 것으로 확인되었다.

홍수범람도 불확실성 해석을 위한 인공위성사진의 활용 (The Use of Satellite Image for Uncertainty Analysis in Flood Inundation Mapping)

  • 정영훈;류광현;이충성;이승오
    • 대한토목학회논문집
    • /
    • 제33권2호
    • /
    • pp.549-557
    • /
    • 2013
  • 정밀한 홍수 범람도는 홍수의 공간적 특성에 대한 정보를 의사 결정자나 설계자들에게 전달할 수 있다. 수리모형을 이용하여 홍수 범람도를 구축하는 과정에서 확실하게 정의되거나 측정되지 않은 조도계수와 수위유량관계식으로부터 얻은 유량은 불확실성을 일으키는 핵심 요인들이다. 또한, 홍수 범람도에 대한 불확실성 해석을 위해서는 관측 자료가 필요한데, 홍수 범람의 관측 자료는 인공위성영상을 이용하여 확보할 수가 있다. 따라서 본 연구의 목적은 수리모형과 인공위성자료를 이용하여 조도계수와 유량이 홍수범람도 제작에서 일으키는 불확실성을 정량적으로 산정하는 것이다. 미국 Illinois주 Metropolis시 주위의 Ohio 강에 대하여 HEC-RAS과 지형분석을 이용하여 홍수 범람를 모의하고 ISODATA(Iterative Self-Organizing Data Analysis)분류 방법으로 Landsat 5TM 위성 영상으로부터 수체를 추출하였다. 추출된 수체는 GLUE(Generalized Likelihood Uncertainty Estimation)에서 우도측정(F-통계량)을 계산하는데 관측 자료로 이용되었다. GLUE는 누적확률 5 %와 95 %에 각각 해당하는 74.59 $km^2$와 151.95 $km^2$의 홍수범람면적을 산정했다. 홍수 범람도 구축과정에서 발생하는 불확실성을 정량적으로 산정하는 것은 효율적인 홍수방어 계획을 실현화하는데 중요한 역할을 할 거라 사료된다.

토사터널의 쉴드 TBM 데이터 시계열 분석을 통한 막장 전방 예측 연구 (A ground condition prediction ahead of tunnel face utilizing time series analysis of shield TBM data in soil tunnel)

  • 정지희;김병규;정희영;김해만;이인모
    • 한국터널지하공간학회 논문집
    • /
    • 제21권2호
    • /
    • pp.227-242
    • /
    • 2019
  • 토압식(Earth Pressure-Balanced, EPB) 쉴드 TBM 기계데이터 분석을 통해 토사터널의 특징이 반영된 막장 전방 예측 방법을 제안하였다. 기존에 암반과 토사가 혼합된 복합 지반의 예측에 적용하였던 시계열 분석 모델을 토사터널에 적용가능하도록 수정하였다. 또한 수정된 모델을 사용하여, 토사 종류에 따라 쏘일 컨디셔닝 재료를 선택하는 것이 타당한지 연구하였다. 이를 위해 Self-Organizing Map (SOM) 군집화(clustering) 분석을 수행하였다. 그 결과 무엇보다도 지반타입이 #200체 통과량 35% 기준으로 분류되어야 한다는 것을 확인하였다. 또한 TBM 기계데이터 분석을 통해 수정된 모델이 지반 타입을 예측하는데 사용될 수 있음을 확인하였다. 수정된 기준에 따라 지반 타입을 분류하고 시계열 분석을 수행하면, 10막장 전방 지반에 대해서 98%의 높은 예측 정확도를 보였으며, 이를 통해 수정된 방법의 우수성이 입증되었다. 특히 지반 타입 변화 구간에 대한 예측 정확도도 약 93%로, 10막장 전방에서 지반 타입 변화 여부를 미리 확인할 수 있게 되었다.

해수면 높이와 해수면 온도 자료를 이용한 동아시아 해역의 패턴 분석 (Pattern Analysis in East Asian Coasts by using Sea Level Anomaly and Sea Surface Temperature Data)

  • 황도현;정민지;김나경;박미소;김보람;윤홍주
    • 한국전자통신학회논문지
    • /
    • 제16권3호
    • /
    • pp.525-532
    • /
    • 2021
  • 해양에서는 여러 원인들이 복합적으로 작용하여 하나의 원인에 의한 효과를 분리하기 쉽지 않은데, 자기 조직화 지도는 군집 결과에 다른 인자를 추가하여 분석이 가능하다. 따라서 본 연구에서는 해수면 높이 자료로 군집된 결과를 해수면 온도에 적용시켜 분석해보았다. 해수면 높이 자료는 총 6개의 노드로 군집되었다. 해수면 온도와 해수면 높이의 차이에는 1개월 시간 지연이 있어 군집된 결과에 1개월 전 해수면 온도 자료를 적용시켰다. 해수면 온도가 다양하게 분포하였던 140 ~ 150°E의 평균 해수면 온도를 비교해본 결과 노드 1, 3, 5의 경우 해수면 높이 자료에서 뚜렷하게 구분되는 사행하는 모양의 해수면 온도 분포를 찾을 수 있었으나, 노드 2, 4, 6의 경우 해수면 온도 분포는 완만하게 나타났다. 본 연구에서는 해수면 높이 자료로 군집된 결과에 해수면 온도 자료를 적용해보았지만, 추후 바람이나 지형류 자료를 적용시켜 비교해볼 필요가 있다고 판단된다.

RGB 항공 영상을 이용한 하천 합류부 전단층 추출법 (Identification of shear layer at river confluence using (RGB) aerial imagery)

  • 노효섭;박용성
    • 한국수자원학회논문집
    • /
    • 제54권8호
    • /
    • pp.553-566
    • /
    • 2021
  • 하천 합류부는 두 개의 수체가 만나 전단층을 이루고 전단층을 따라 강한 혼합양상을 보이는 특징이 있다. 자연하천에서 합류하는 대비되는 두 하천의 색은 전단층을 따라 구분될 수 있는데, 이는 위성 또는 무인항공체를 이용해 촬영된 항공영상을 통해 쉽게 관측할 수 있다. 본 연구에서는 취득 비용이 저렴한 RGB 항공 영상을 이용해 합류부에서 발생하는 전단층을 추출하고 전단층 주변의 기하학적 특성을 정량적으로 산정하는 방법을 제시한다. 본 방법은 네 단계로 구분된다. 첫 번째로, 합류부 흐름에서 전단층 추출을 위해 가우시안 혼합 모형을 바탕으로 한 영상 분할을 수행하여 본류와 지류가 포함된 픽셀을 추출해낸다. 다음으로 추출된 하천 수역에 자기조직화지도를 적용해 하천의유선을 1차원 곡선으로 단순화한다. 추출된 수체 영역과 1차원 곡선들을 이용해 본류와 지류의 수역을 이미지상 직교좌표계에서 곡선좌표계로 투영한 뒤, 마지막으로 전단층의 기하학적 특성을 산정한다. 결과적으로 개발된 전단층 추출법을 경상남도의 낙동강과 남강의 합류부가 촬영된 위성 영상에 적용하여 자연하천 합류부의 기하학적 특성인 합류각, 합류하는 두 하천의 상하류 하천 폭, 전단층의 길이, 그리고 전단층의 최대 두께를 각각 정량적으로 추출하는 데에 성공하였다.