• 제목/요약/키워드: 결합 알고리즘

검색결과 1,717건 처리시간 0.031초

대용량 데이터 처리를 위한 하이브리드형 클러스터링 기법 (A Hybrid Clustering Technique for Processing Large Data)

  • 김만선;이상용
    • 정보처리학회논문지B
    • /
    • 제10B권1호
    • /
    • pp.33-40
    • /
    • 2003
  • 데이터 마이닝은 지식발견 과정에서 중요한 역할을 수행하며, 여러 데이터 마이닝의 알고리즘들은 특정의 목적을 위하여 선택될 수 있다. 대부분의 전통적인 계층적 클러스터링 방법은 적은 양의 데이터 집합을 처리하는데 적합하여 제한된 리소스와 부족한 효율성으로 인하여 대용량의 데이터 집합을 다루기가 곤란하다. 본 연구에서는 대용량의 데이터에 적용되어 알려지지 않은 패턴을 발견할 수 있는 하이브리드형 신경망 클러스터링 기법의 PPC(Pre-Post Clustrering) 기법을 제안한다. PPC 기법은 인공지능적 방법인 자기조직화지도(SOM)와 통계적 방법인 계층적 클러스터링을 결합하여 두 과정에서는 군집의 내부적 특징을 나타내는 응집거리와 군집간의 외부적 거리를 나타내는 인접거리에 따라 유사도를 측정한다. 최종적으로 PPC 기법은 측정된 유사도를 이용하여 대용량 데이터 집합을 군집화한다. PPC 기법은 UCI Repository 데이터를 이용하여 실험해 본 결과, 다른 클러스터링 기법들 보다 우수한 응집도를 보였다.

비선형 다중스케일 필터링을 사용한 비디오 객체 분할에 관한 연구 (A Study on Video Object Segmentation using Nonlinear Multiscale Filtering)

  • 이웅희;김태희;이규동;정동석
    • 한국통신학회논문지
    • /
    • 제28권10C호
    • /
    • pp.1023-1032
    • /
    • 2003
  • MPEG-4와 같은 객체 기반 부호화는 멀티미디어 응용을 위한 다양한 내용 기반 기능들을 제공한다. 압축 효율의 향상과 더불어 이러한 기능들이 지원되도록 하기 위해서는 비디오 데이터의 각 프레임은 비디오 객체로 분할되어야 한다. 본 논문에서는 비선형 다중스케일 필터링과 시공간 정보를 사용한 효과적인 비디오 객체 분할 기법을 제안한다. 제안된 방법은 안정화된 역 확산 방정식(Stabilized Inverse Diffusion Equation : SIDE)에 기반한 비선형 다중스케일 필터링을 사용하여 공간적 분할을 수행한다. 또한 구해진 초기 분할된 영역들은 인접 영역 그래프 (Region Adjacency Graph : RAG)를 사용하여 병합된다. 본 논문에서는 통계적 유의성 검사(Statistical significance test)와 시변 메모리(Time-variant memory)를 시간적 분할 방법으로 사용하며 구해진 공간적 분할과 시간적 분할을 결합하여 최종 객체 영역을 효과적으로 분할한다. 본 논문에서 제안된 공간적 분할 방법은 기존의 형태학적 Watershed 알고리즘에 비해 잡음에 강인한 분할 특성을 나타내었으며 기존의 A. Neri의 방법과 비교하였을 때, 최종 분할된 객체 영역의 정확도 비율이 Akiyo는 43%, Claire는 29% 정도 향상됨을 확인할 수 있었다.

불연속 분포를 이용한 다지점 강수모의발생 기법 개발 (A Development of Multi-site Rainfall Simulation Model Using Piecewise Generalize Pareto Distribution)

  • 소병진;권현한
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2012년도 학술발표회
    • /
    • pp.123-123
    • /
    • 2012
  • 일강수량은 수공구조물 설계 및 수자원계획을 수립하기 위한 입력 자료로 이용된다. 일반적으로 수자원계획은 장기적인 목적을 가지고 수행되어지며, 장기간의 일강수량 자료를 필요로 한다. 하지만 장기간의 일강수량 자료의 획득의 어려움으로 단기간의 일강수량자료를 이용하여 모의한 장기간 강수자료를 이용하게 된다. 이처럼 수자원계획의 수립에 있어서 일강수량 모의기법의 성능은 수자원계획의 신뢰성 및 결과에 큰 영향을 준다. 일강수량 모의기법은 국내외적으로 매우 활발하게 이루어지고 있으며, 수자원계획 및 수공구조물 설계 외에도 매우 다양한 목적으로 활용되어 지고 있다. 일강수량을 모의기법 중 강수계열의 단기간의 기억(memory)을 활용한 Markov Chain 모형이 가장 일반적이지만, 기존 Markov Chain 모형을 통한 일강수량 모의는 극치강수량을 재현하기 어렵다는 문제점이 있다. 또한, 일강수량 모의 기법의 목적인 수자원계획 및 수공구조물 설계 등의 입력자료로 활용되어지기 위해서는 모의 결과가 유역내 지점별 공간 상관성을 재현함으로써 모형의 우수성과 자료결과의 신뢰성을 확보할 수 있어야 하겠다. 이러한 점에서 본 연구에서는 내삽에서 우수한 재현능력을 갖는 핵 밀도함수와 극치강수량 재현에 유리한 GPD분포의 특징을 함께 고려할 수 있는 불연속 Kernel-Pareto Distribution 기반에 공간상관성 재현 알고리즘을 결합한 일강수량모의기법을 개발하였다. 한강유역의 18개 강수지점에 대해서 기존 Gamma분포를 사용한 Markov Chain 모형과 본 연구에서 제안한 방법을 적용하여 모형을 평가해 보고자 한다. Gamma 분포기반 Markov Chain 모형의 경우 일강수량 모의 시 1차모멘트인 평균과 2-3차 모멘트 모두 효과적으로 재현하지 못하는 문제점이 나타났다. 그러나 본 연구에서 적용한 다지점 불연속 Kernel-Pareto 분포 모형은 강수계열의 평균적인 특성뿐만 아니라 표준편차 및 왜곡도의 경우에도 관측치의 통계특성을 매우 효과적으로 재현하며, 100년빈도 강수량 모의결과 기존 모의모형의 문제점을 보완할 수 있는 개선된 결과를 보여주었다. 본 연구에서 제시한 방법론은 유역내의 공간상관성을 재현하며, 평균 및 중간값 등 낮은 차수의 모멘트 등 일강수량 분포특성을 더욱 효과적으로 모의할 수 장점을 확인하였다.

  • PDF

연관 태그의 군집화를 위한 클러스터링 기법 비교 연구 (A Comparative Study on Clustering Methods for Grouping Related Tags)

  • 한승희
    • 한국문헌정보학회지
    • /
    • 제43권3호
    • /
    • pp.399-416
    • /
    • 2009
  • 본 연구에서는 태그 공간에서 정보의 효율적 탐색을 위해 이용자에게 제공될 수 있는 연관 태그 클러스터의 생성을 위해 다양한 유사계수와 클러스터링 기법을 적용한 후 그 결과를 평가하고 비교 분석함으로써 연관 태그의 클러스터링에 가장 적합한 클러스터링 알고리즘을 확인하고자 하였다. Delicious에서 임의의 태그 10개를 대상으로 각각 300개의 문서에서 추출한 연관 태그를 대상으로 태그쌍 간의 연관성을 측정한 후 계층적 기법과 비계층적 기법을 적용하여 생성된 클러스터를 대상으로 클러스터 적합도를 측정한 결과, 일반적으로 용어 클러스터링에서 널리 활용되는 것으로 알려진 워드 기법이 코사인 유사계수와 결합했을 때 거의 모든 실험 대상에 대해 유사한 경향을 보이면서 가장 우수한 성능을 나타내는 것으로 나타났다. 연관 태그 클러스터는 정보관리 측면에서 유사한 합목적성을 갖는 태그끼리 군집을 이루면서 용어의 중의성을 해소함으로써 태그 공간에서의 이용자의 정보 탐색에 유용하게 활용될 것이다.

협업개발 환경에서의 효율적 동시성 제어를 위한 P2P기반 충돌해결 기법 (P2P Based Collision Solving Technique for Effective Concurrency Control in a Collaborative Development Environment)

  • 박현수;김대엽;윤청
    • 정보처리학회논문지D
    • /
    • 제16D권4호
    • /
    • pp.571-582
    • /
    • 2009
  • 본 논문은 구성원들 사이의 자원공유를 원천적으로 봉쇄하는 일반적 협업개발 지원도구의 한계를 극복하고, 조직의 여러 사용자들에게 자원 공유의 기회를 제공함과 동시에 자원공유에서 발생하는 버전관리와 충돌문제를 해결하기 위한 방법을 제시한다. 개발된 소프트웨어 협업개발 지원도구는 전통적인 낙관적 기법을 적용하되 충돌해결에 드는 비용과 노력의 절감을 위한 개선된 알고리즘을 사용한다. 시스템의 구조는 전통적인 Client/Server 방식에 개인간 정보교환을 지원하는 P2P(peer-to-peer) 방식이 결합된 형태로 이루어져 있으며, 공개 소프트웨어인 CVS(Concurrent Version System)를 기반으로 구현되었다. 이를 바탕으로 대표적인 기존 협업개발 지원도구들과의 유용성 비교를 통해 기능적 효율성을 확인하였다.

U-마켓에서의 매장 추천방법 (A Store Recommendation Procedure in Ubiquitous Market)

  • 김재경;채경희;김민용
    • 지능정보연구
    • /
    • 제13권4호
    • /
    • pp.45-63
    • /
    • 2007
  • 유비쿼터스 환경에 기반한 시장, 즉 U-마켓에서는 고객이 제품을 구매함과 동시에 고객의 정보가 u-마켓 서버시스템에 저장되어 인터넷 쇼핑몰과 같이 다양한 분석과 활용이 가능하게 되었다. 물리적인 공간과 가상 공간이 결합된 유비쿼터스 기반의 시장 환경에서는 고객이 오프라인에서 다양한 매장을 방문하면서 쇼핑을 하게 되는데, 이때 여러 매장에 동일한 제품이 동시에 존재할 수 있으므로 매장의 위치, 매장 분위기, 제품의 품질이나 가격 등에 대한 고객의 선호도를 반영하여 고객 개개인에게 적절한 매장을 추천해야 할 필요성이 제기된다. 본 논문에서는 유비쿼터스 환경에 기반한 시장에서 고객의 쇼핑 상황을 고려하여 고객의 선호를 반영할 수 있는 매장 추천방법을 제안한다. 제안한 매장 추천방법은 협업 필터링과, Apriori 알고리즘을 기반으로 구성되어 있다. 온라인 쇼핑몰과는 다르게 U-마켓에서는 고객 개개인의 구매목록과 고객의 선호도를 반영한 매장 추천이 필요하며, 본 논문에서 제안하고 있는 매장 추천방법은 고객의 쇼핑경험을 극대화 하고 쇼핑 효율성을 제고시킬 뿐 아니라 장기적인 관점에서 매출증대를 통해 U-마켓 활성화에 기여할 수 있을 것으로 기대한다.

  • PDF

복합고장을 가지는 농형유도전동기의 모델링과 웨이블릿 분해를 이용한 고장진단 (Fault Modeling and Diagnosis using Wavelet Decomposition in Squirrel-Cage Induction Motor Under Mixed Fault Condition)

  • 김연태;배현;박진수;김성신
    • 한국지능시스템학회논문지
    • /
    • 제16권6호
    • /
    • pp.691-697
    • /
    • 2006
  • 유도전동기는 산업시스템에 있어서 필수적인 요소이기 때문에 유지 관리, 모니터링 시스템, 고장 진단 등의 다양한 분야에서 많은 연구가 행해지고 있다. 유도전동기의 운전 중 하나의 고장이 발생한 경우 이것은 전동기의 다른 부분에 영향을 미치거나 또 다른 고장을 유발시키는 원인이 된다. 따라서 개별적인 고장뿐만 아니라 결합된 형태의 고장을 검출하고 진단하는 것은 유용한 방법이다. 본 논문에서는 전압불평형 고장과 회전자바 고장이 발생한 경우, 흐리고 두 고장이 동시에 복합적으로 발생한 경우를 모델링하고 이에 대해 고장을 웨이블릿 분해를 이용하여 진단하였다. 제안된 고장 검출 및 진단 알고리즘은 농형유도전동기의 고정자 전류를 이용하였으며 매트랩 시뮬링크를 사용하여 시뮬레이션 하였다.

Hybrid 시계열 모델을 활용한 스마트 공장 내 수요예측 알고리즘 개발 (Development of Demand Forecasting Algorithm in Smart Factory using Hybrid-Time Series Models)

  • 김명수;정종필
    • 한국인터넷방송통신학회논문지
    • /
    • 제19권5호
    • /
    • pp.187-194
    • /
    • 2019
  • 시장의 급속한 변화와 개별 수요자 요구의 다양화로 인하여 전통적인 예측 방식은 기업의 요구사항을 충족시키기 어렵다. 다변화하는 생산 환경에서의 올바른 수요예측은 원활한 수율관리를 위한 중요한 요소이다. 현재 산업에서 보편적으로 사용되는 기존의 많은 예측 모델은 조금씩 기능에 제한이 있다. 제안된 모델은 각 모델이 개별적으로 더 잘 수행하는 부분을 고려하여 이러한 한계를 극복하도록 설계 되었다. 본 논문에서는 동적 프로세스 분석에 적합한 Grey Relational 분석을 통한 변수 추출을 하고, ARIMA 예측값을 통하여 산출되는 과거 수요 데이터의 특징을 포함하는 통계적으로 예측된 데이터를 생성한다. 이후, LSTM 모델과 결합하여 신경망모델이 가지는 특성인 유연성, 장기적인 의존성 문제를 피하도록 구성되어진 구조를 통하여 수요예측에 영향을 주는 많은 요인들을 특징을 반영하여 수요예측을 산출할 수 있다.

지역적 $x-^{2}$-테스트를 이용한 장면전환검출 기법 (Scene Change Detection Using Local $x-^{2}-Test$)

  • 김영례;이양원
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권3호
    • /
    • pp.193-201
    • /
    • 2006
  • 본 논문에서는 급진적 장면전환부터 점진적 장면전환까지 모두 검출할 수 있는 방법을 제안한다. 이 방법은 지역적 $X^{2}$-테스트로서 기존의 컬러 히스토그램과 $X^{2}$-테스트를 결합한 방법이다. 본 논문을 위하여 기존의 히스토그램 기반 알고리즘과 비교하여 좋은 성능을 보여주는 $X^{2}$-테스트를 변형하였고. 컬러 값의 세분화 작업에 따른 검출효과를 높이기 위하여 명암도 등급에 따른 가중치를 적용한 지역적 $X^{2}$-테스트를 이용하였다. 이 방법은 복잡하고 다양한 시세계의 영상 변화를 가장 일반적이고 표준화된 방법으로 분석하고 분할하며 표현할 수 있는 방법이다. 기존의 $X^{2}$-테스트와 제안된 지역적 $X^{2}$-테스트 방법의 비교는 실험을 통해 입증되었다.

  • PDF

Error Correction for Korean Speech Recognition using a LSTM-based Sequence-to-Sequence Model

  • Jin, Hye-won;Lee, A-Hyeon;Chae, Ye-Jin;Park, Su-Hyun;Kang, Yu-Jin;Lee, Soowon
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권10호
    • /
    • pp.1-7
    • /
    • 2021
  • 현재 대부분의 음성인식 오류 교정에 관한 연구는 영어를 기준으로 연구되어 한국어 음성인식에 대한 연구는 미비한 실정이다. 하지만 영어 음성인식에 비해 한국어 음성인식은 한국어의 언어적인 특성으로 인해 된소리, 연음 등의 발음이 있어, 비교적 많은 오류를 보이므로 한국어 음성인식에 대한 연구가 필요하다. 또한, 기존의 한국어 음성인식 연구는 주로 편집 거리 알고리즘과 음절 복원 규칙을 사용하기 때문에, 된소리와 연음의 오류 유형을 교정하기 어렵다. 본 연구에서는 된소리, 연음 등 발음으로 인한 한국어 음성인식 오류를 교정하기 위하여 LSTM을 기반으로 한 인공 신경망 모델 Sequence-to-Sequence와 Bahdanau Attention을 결합하는 문맥 기반 음성인식 후처리 모델을 제안한다. 실험 결과, 해당 모델을 사용함으로써 음성인식 성능은 된소리의 경우 64%에서 77%, 연음의 경우 74%에서 90%, 평균 69%에서 84%로 인식률이 향상되었다. 이를 바탕으로 음성인식을 기반으로 한 실제 응용 프로그램에도 본 연구에서 제안한 모델을 적용할 수 있다고 사료된다.