• 제목/요약/키워드: 집합연산문제

검색결과 58건 처리시간 0.029초

시계열 서브시퀀스 매칭을 위한 최적의 다중 인덱스 구성 방안 (Optimal Construction of Multiple Indexes for Time-Series Subsequence Matching)

  • 임승환;김상욱;박희진
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권2호
    • /
    • pp.201-213
    • /
    • 2006
  • 일정 기간 동안 객체의 변화한 값들을 기록한 것을 그 객체에 대한 시계열 데이타 시퀀스라고 부르며, 이들의 집합을 시계열 데이타베이스라고 한다. 서브시퀀스 매칭은 주어진 질의 시퀀스와 변화의 추세가 유사한 서브시퀀스들을 시계열 데이타베이스로부터 검색하는 연산이다. 본 논문에서는 서브시퀀스 매칭의 성능을 극대화하기 위한 방안을 제시한다. 먼저, 윈도우 크기 효과로 인한 서브시퀀스 매칭의 심각한 성능 저하 현상을 정량적으로 관찰하여, 하나의 윈도우 크기를 대상으로 만든 단 하나의 인덱스만을 이용하는 것은 실제 응용에서 만족할만한 성능을 제공할 수 없다는 것을 규명하였다 또한, 이러한 문제로 인해 다양한 윈도우 크기들을 기반으로 다수의 인덱스들을 구성하여 서브시퀀스 매칭을 수행하는 인덱스 보간법의 응용이 필요함을 보였다. 인덱스 보간법을 응용하여 서브시퀀스 매칭을 수행하기 위해서는 먼저 다수의 인덱스들을 위한 윈도우 크기들을 결정해야 한다. 본 연구에서는 물리적 데이타베이스 설계 방식을 이용하여 이러한 최적의 다수의 윈도우 크기들을 선정하는 문제를 해결하였다. 이를 위하여 시계열 데이터 베이스에서 수행될 예정인 질의 시퀀스들의 집합과 인덱스 구성의 기반이 되는 윈도우들의 크기의 집합이 주어질 때, 전체 서브시퀀스 매칭들을 수행하는 데에 소요되는 비용을 예측할 수 있는 공식을 산출하였다. 또한, 이 비용 공식을 이용하여 전체 서브시퀀스 매칭들의 성능을 극대화 할 수 있는 최적의 윈도우 크기들을 결정하는 알고리즘을 제안하였으며, 이 알고리즘의 최적성과 효율성을 이론적으로 규명하였다. 끝으로, 실제 주식 데이타와 대량의 합성 데이타를 이용한 실험 결과, 제안된 기법은 기존의 단순한 기법과 비교하여 1.5배에서 7.8배 성능이 향상됨을 보였다.

생태계 모방 알고리즘 기반 특징 선택 방법의 성능 개선 방안 (Performance Improvement of Feature Selection Methods based on Bio-Inspired Algorithms)

  • 윤철민;양지훈
    • 정보처리학회논문지B
    • /
    • 제15B권4호
    • /
    • pp.331-340
    • /
    • 2008
  • 특징 선택은 기계 학습에서 분류의 성능을 높이기 위해 사용되는 방법이다. 여러 방법들이 개발되고 사용되어 오고 있으나, 전체 데이터에서 최적화된 특징 부분집합을 구성하는 문제는 여전히 어려운 문제로 남아있다. 생태계 모방 알고리즘은 생물체들의 행동 원리 등을 기반으로하여 만들어진 진화적 알고리즘으로, 최적화된 해를 찾는 문제에서 매우 유용하게 사용되는 방법이다. 특징 선택 문제에서도 생태계 모방 알고리즘을 이용한 해결방법들이 제시되어 오고 있으며, 이에 본 논문에서는 생태계 모방 알고리즘을 이용한 특징 선택 방법을 개선하는 방안을 제시한다. 이를 위해 잘 알려진 생태계 모방 알고리즘인 유전자 알고리즘(GA)과 파티클 집단 최적화 알고리즘(PSO)을 이용하여 데이터에서 가장분류 성능이 우수한 특징 부분집합을 만들어 내도록 하고, 최종적으로 개별 특징의 사전 중요도를 설정하여 생태계 모방 알고리즘을 개선하는 방법을 제안하였다. 이를 위해 개별 특징의 우수도를 구할 수 있는 mRMR이라는 방법을 이용하였다. 이렇게 설정한 사전 중요도를 이용하여 GA와 PSO의 진화 연산을 수정하였다. 데이터를 이용한 실험을 통하여 제안한 방법들의 성능을 검증하였다. GA와 PSO를 이용한 특징 선택 방법은 그 분류 정확도에 있어서 뛰어난 성능을 보여주었다. 그리고 최종적으로 제시한 사전 중요도를 이용해 개선된 방법은 그 진화 속도와 분류 정확도 면에서 기존의 GA와 PSO 방법보다 더 나아진 성능을 보여주는 것을 확인하였다.

감정어휘 평가사전과 의미마디 연산을 이용한 영화평 등급화 시스템 (Grading System of Movie Review through the Use of An Appraisal Dictionary and Computation of Semantic Segments)

  • 고민수;신효필
    • 인지과학
    • /
    • 제21권4호
    • /
    • pp.669-696
    • /
    • 2010
  • 본 논문은 한 문서의 전체 의미는 각 부분의미의 합성이라는 관점에서 미리 반자동으로 구축된 감정어휘 평가사전을 기반으로 한 시스템을 제안한다. 인간의 의사 결정 과정과 유사한 방식으로 의사 결정 과정을 모델링하려는 노력으로써 본 ARSSA 시스템은 개별 리뷰의 의미값 연산과 자료 분류를 통해 감정 표현이 나타난 영화평 리뷰의 자동 등급화에 대한 연구를 수행한다. 이는 {'평점' : '리뷰'} 이항구조로 이루어진 현재의 평점 부여 형식에서 발생하는 두 변항의 불연속성 문제를 해결해보려는 목적을 가진다. 이는 어휘 의미 합성 과정에서 반영된 추상적 의미들의 합성 함수를 통해 실현될 수 있다. 시스템의 성능 실험에서 네이버 무비에서 확보한 1000개의 리뷰에 대한 10-fold 교차 검증 실험이 수행되었다. 이 실험은 기존에 부여된 평점과 비교하여 감정어휘 평가사전을 이용하였을 때 85%의 F1 Score를 보였다.

  • PDF

효율적인 노드 삽입을 이용한 순서화된 병렬 트리-탐색 기반 저복잡도 연판정 다중 안테나 검출 알고리즘 (Low-Complexity Soft-MIMO Detection Algorithm Based on Ordered Parallel Tree-Search Using Efficient Node Insertion)

  • 김길환;박장용;김재석
    • 한국통신학회논문지
    • /
    • 제37A권10호
    • /
    • pp.841-849
    • /
    • 2012
  • 본 논문은 max-log 근사화 하에서 연판정 최대 우도 (soft-output maximum-likelihood, soft-ML) 성능을 달성하기 위한 저복잡도 연판정 다중 안테나 (soft-output multiple-input multiple-output, soft-MIMO) 검출 알고리즘을 제안한다. 제안된 알고리즘은 병렬 트리-탐색 (parallel tree-search, PTS)을 기반으로 하며, 정렬 순서를 변경한 정렬된 QR 분해 (sorted-QR decomposition, SQRD)를 채널 순서화를 위해 적용한다. 비트별 로그-우도비 (log-likelihood ratio, LLR)를 계산하는 과정에서 발생할 수 있는 공집합 문제 (empty-set problem)는 탐색 레벨별로 추가적인 노드들을 삽입함으로써 해결한다. 제안된 노드 삽입 기법에서는 선택된 노드와 반대 비트 값을 가지면서 가장 가까운 노드만 삽입되기 때문에, 연산 복잡도 측면에서 상당히 효율적이다. 제안된 알고리즘의 연산 복잡도는 기존 알고리즘 대비 약 37-74% 수준이며, $4{\times}4$ 시스템에 대한 시뮬레이션 결과, 제안된 알고리즘은 soft-ML와 비교하여 0.1 dB 미만의 성능 저하를 보였다.

GPU를 이용한 대량 삼각형 교차 알고리즘 (Robust GPU-based intersection algorithm for a large triangle set)

  • 경민호;곽종근;최정주
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제17권3호
    • /
    • pp.9-19
    • /
    • 2011
  • 삼각형간의 교차 계산은 많은 3 차원 기하 문제들을 해결하는데 있어서 기본적으로 요구되는 연산 과정이다. 본 논문에서는 대량의 삼각형 집합 안에서의 교차 계산을 효율적이며 강인하게 처리할 수 있는 GPU 알고리즘을 제안한다. 이 알고리즘은 k-d 트리의 구성, 삼각형쌍 생성, 정확한 교차 계산을 모두 GPU에서 처리한다. 여기서 사용되는 k-d 트리에서는 분할 과정 중에 삼각형들의 복사가 많이 발생한다. 이렇게 복사된 삼각형들로 인하여 중복된 삼각형쌍들이 많이 생성되는데, 이러한 중복 삼각형쌍들을 효율적으로 제거하기 위하여 분할 인덱스를 도입하였다. 분할 인덱스는 간단한 논리곱 연산만으로 중복 여부를 효과적으로 판단할 수 있다. 수치적 강인성을 높이기 위하여는 부동소숫점 필터링을 통해 불안전한 삼각형쌍들을 분리하고, CLP(controlled linear perturbation)를 이용하여 CPU쓰레드에서 처리하도록 하였다. 제안한 알고리즘은 기존의 민코스키합 알고리즘의 합삼각형 교차계산에 적용하여 효율성과 강인성을 입증하였다.

A hybrid genetic algorithm for the optimal transporter management plan in a shipyard

  • Jun-Ho Park;Yung-Keun Kwon
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권12호
    • /
    • pp.49-56
    • /
    • 2023
  • 본 연구에서는 트랜스포터의 할당 및 운행 순서를 최적화하기 위한 유전 알고리즘을 제안한다. 유전 알고리즘의 해는 리스트의 집합으로 표현되는데 각 리스트는 해당 트랜스포터가 작업할 순서를 나타낸다. 또한 성능 향상을 위해 효과적인 지역 탐색 연산을 결합한 혼합형 유전 알고리즘의 형태로 구현하였다. 지역 탐색 연산은 작업량이 적은 트랜스포터에서 작업의 블록을 꺼내어 다른 트랜스포터의 작업 목록에 삽입함으로써 트랜스포터 운용 대수의 감소를 유도한다. 제안하는 알고리즘의 효용성을 평가하기 위해 실제 조선소와 유사한 규모의 시뮬레이션 환경을 통해 Multi-Start 및 순수 유전알고리즘과 비교하였다. 가장 큰 규모의 문제에 대해 그들에 비해 트랜스 포터 수는 각각 40% 및 34%, 총작업 소요 시간은 27% 및 17% 감소시켰다.

가변논리소자에 의한 논리함수의 실현에 관한 연구 (A Study on the Realiation of Logical function by flexible Logical Cells)

  • 임재탁
    • 대한전자공학회논문지
    • /
    • 제11권4호
    • /
    • pp.1.1-11
    • /
    • 1974
  • 변경의 Parameter를 제어 함으로써 임의의 조합논리함수를 이차원가변논리회로로 실현하는 일반적이고 조직적인 방법을 개발하였다. n변수-n출력 조합논리회로의 진리치표를 상태할당에 의해서 상태가의 변환으로 포착하여 이를 다치일변수 영리수수의 실현문제로 취급하였다. 이 다위일변수 함수집합이 정규결합연산에 환하여 반군을 이룬다는 사실에 착안하여 3개의 기저함수를 정의하고 이 기저함수에 의하여 임의의 다치일변수함수를 생성하는 기저함수렬의 조직적 구성법을 구하였다. 기저함수를 실현하는 기본회로를 단위회로의 일차원 배열로 구성하고 오직 하나의 기본회로만으로 3개의 기저함수외에도 몇개의 기저함수의 계열과 또 기저함수의 역함수를 실현하도록 하였다. 이 기본회로를 이차원으르 배열하고 변경의 parameter만을 적절히 설정 함으로써 임의의 조합논리회로를 실현하는 알고리즘을 구성하였다.

  • PDF

센서네트워크 데이터베이스를 위한 새로운 조인 연산자 정의* (A New Join Operator Definition for Sensor Network Databases)

  • 이승재;김창화;김상경
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.75-78
    • /
    • 2007
  • 최근 센서네트워크에서 수집되는 방대한 양의 데이터를 효율적으로 처리하기 위하여 관계형 데이터베이스를 이용한 센서네트워크가 활발히 연구되고 있다. 센서네트워크에서는 제한된 에너지를 사용한다는 점, 스트림 데이터를 처리할 수 있어야 한다는 점 등에서 기존 데이터베이스와는 다른 연구가 필요하다. 정확히 일치하는 키 값에 대하여만 조인이 발생하는 조인연산 또한 센서네트워크에서 사용하기 위해서는 새로운 정의가 필요하다. 온도센서와 습도센서가 일정영역에 무작위로 뿌려져 있는 센서네트워크를 가정해 보자. 데이터베이스 관점에서는 온도릴레이션과 습도릴레이션이 존재하게 된다. 이때 위치에 따른 온도와 습도의 상관관계를 얻기 위하여 좌표를 키 값으로 하여 릴레이션을 조인하면 결과는 공집합이거나 아주 적은 수의 튜플만 얻게 되어 사용자가 원하는 결과를 얻을 수 없다. 그 이유는 동일한 좌표를 가지는 서로 다른 종류의 센서쌍이 존재할 확률이 매우 적기 때문이다. 본 논문에서는 이러한 문제를 해결하기 위하여 새로운 범위조인연산자를 제안한다. 이 범위조인연산자를 센서네트워크에 적용하면 좀 더 효율적인 데이터관리가 가능하고 데이터베이스에서 응용계층에 표준화된 인터페이스를 제공할 수 있다.

  • PDF

효율적인 그레이팅 배치를 위한 유전 알고리즘의 적용 (An Application of Genetic Algorithm for Efficient Grating Allocation)

  • 이정규;조대호
    • 한국시뮬레이션학회논문지
    • /
    • 제15권4호
    • /
    • pp.137-142
    • /
    • 2006
  • 현대의 산업공정에서 CAD(Computer-Aided Design)는 설계 및 생산에 관련된 다양한 분야에서 빠져서는 안 될 중요한 분야로 자리매김 하였다. 그러나 생산 설계의 복잡도가 증가 할수록, 그와 관련된 다양한 공학 기술들이 필요로 하게 되었다. 이 논문에서는 CAD기반의 그레이팅 설계 자동화 시스템에서 분할을 고려하는 배치에 대하여 다룬다. 그레이팅 설계 디자인에서 생산 비용 절감의 핵심은 분할을 최소로 하는 디자인을 설계하는 것이다. 이를 해결하기 위하여 그레이팅 분할 배치 문제에 유전 알고리즘을 적용하여 근사 해를 탐색한다. 각 제약 조건들에 우선순위를 두어 적합도를 측정하고, 분할 섹션들을 해 집합으로 구성하여 교배와 선택 연산을 수행함으로써 해를 구하고 시뮬레이션을 통해서 제안된 방법의 효율성을 평가한다.

  • PDF

데이타와 질의의 이원성을 이용한 데이타스트림에서의 연속질의 처리 (Continuous Query Processing in Data Streams Using Duality of Data and Queries)

  • 임효상;이재길;이민재;황규영
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권3호
    • /
    • pp.310-326
    • /
    • 2006
  • 본 논문은 데이타스트림 환경에서 연속질의를 효율적으로 처리하는 방법을 다룬다. 먼저, 기존의 질의 처리 방법을 데이타 엘리먼트와 질의 중에서 어느 것을 먼저 선택하고 수행을 시작하느냐에 따라서, 서로 이원적인 두 가지 방법인 데이타-이니셔티브(data-initiative)와 질의-이니셔티브(query-initiative)로 분류한다. 이러한 분류는 기존의 질의 처리 연구에서 데이타와 질의를 서로 다르게(asymmetrically) 취급하였다는 것에 기인한다. 기존의 연속질의 처리에서는 이원적인 질의 처리 방법 중에서 데이타-이니셔티브 방법만이 사용되었기 때문에, 질의-이니셔티브 방법에서 얻을 수 있는 성능 상의 이점이 간과되었다. 이러한 문제를 해결하기 위해, 데이타와 질의를 동등하게(symmetrically) 볼 수 있다는 점에 착안한다. 본 논문에서는 데이타와 질의의 이원성 모델(Duality Model of Data and Queries)을 제안하고 이 모델에 기반하여 연속질의 처리 문제를 다차원 공간에서의 공간조인 문제로 변환하는 새로운 관점을 제시한다. 그리고, 공간조인 기반 연속질의 처리 알고리즘인 Spatial Join CQ를 제안한다. Spatial Join CQ는 다차원 공간상에 영역으로 표현된 데이타 엘리먼트들의 집합과 질의들의 집합으로부터 서로 겹치는 쌍을 찾음으로써 연속질의를 처리한다. 제안하는 알고리즘은 대칭적인(symmetric) 연산인 공간조인으로 겹치는 영역들을 찾아냄으로써 서로 이원적인 두 가지 질의 처리 방법의 효과를 동시에 얻는다. 성능 평가 결과, 제시하는 알고리즘은 기존의 방법에 비해서 단순 선택 연속질의는 최대 36배, 슬라이딩 윈도우 조인 연속질의는 최대 7배의 성능 향상을 보였다.