• 제목/요약/키워드: 집합연산문제

검색결과 58건 처리시간 0.027초

대용량 컴뮤트 타임 임베딩을 위한 연산 속도 개선 방식 제안 (Proposing the Methods for Accelerating Computational Time of Large-Scale Commute Time Embedding)

  • 한희일
    • 전자공학회논문지
    • /
    • 제52권2호
    • /
    • pp.162-170
    • /
    • 2015
  • 컴뮤트 타임 임베딩을 구현하려면 그래프 라플라시안 행렬의 고유값과 고유벡터를 구하여야 하는데, $o(n^3)$의 계산량이 요구되어 대용량 데이터에는 적용하기 어려운 문제가 있다. 이를 줄이기 위하여 표본화 과정을 통하여 크기가 줄어든 그래프 라플라시안 행렬에서 구한 다음, 원래의 고유값과 고유벡터를 근사화시키는 Nystr${\ddot{o}}$m 기법을 주로 채택한다. 이 과정에서 많은 오차가 발생하는데, 이를 개선하기 위하여 본 논문에서는 그래프 라플라시안 대신에 가중치 행렬을 표본화하고 이로부터 구한 고유값과 고유벡터를 그래프 라플라시안의 고유값과 고유벡터로 변환하는 기법을 이용하여 대용량 데이터로 구성된 스펙트럴 그래프를 근사적으로 컴뮤트 타임 임베딩하는 기법을 제안한다. 하지만, 이 방식도 스펙트럼 분해를 계산하여야 하므로 데이터의 크기가 증가하면 적용하기 어려운 문제가 발생한다. 이의 대안으로, 스펙트럼 분해를 계산하지 않고도 데이터 집합의 크기에 영향을 받지 않으면서 컴뮤트 타임을 근사적으로 계산하는 방식을 구현하고 이들의 특성을 실험적으로 분석한다.

Muskingum 홍수추적을 위한 자가적응형 메타 휴리스틱 알고리즘의 적용 (Application of Self-Adaptive Meta-Heuristic Optimization Algorithm for Muskingum Flood Routing)

  • 이의훈
    • 한국산학기술학회논문지
    • /
    • 제21권7호
    • /
    • pp.29-37
    • /
    • 2020
  • 과거 자연현상에서 발생하는 복잡한 비선형성에 따른 문제를 해결하기 위해 메타 휴리스틱 최적화 알고리즘들이 개발되었고 개발된 알고리즘의 적용성을 검토하기 위해 다양한 연구들이 진행되었다. Self-adaptive vision correction algorithm (SAVCA)는 수학 문제에서는 우수한 성능을 보여주었지만 복잡한 공학 문제들에 적용되지 않았을 뿐만 아니라 SAVCA의 적용과정에 대한 검토가 필요하다. SAVCA의 공학 문제에 대한 적용 및 적용과정에 대한 검토를 위해 최근 개발되어 우수한 성능을 보여주었던 advanced nonlinear Muskingum flood routing model (ANLMM-L)에 적용하였다. 먼저 SAVCA에 의해 초기 해집합을 생성한 후 ANLMM-L을 통해 적합도를 산출하였다. 국지탐색 및 전역탐색에 의해 선택된 새로운 값을 SAVCA에 넣고 새로운 해를 생성한 후 다시 ANLMM-L을 적용하여 적합도를 계산하였다. 새로운 해와 기존 해집합의 결과를 비교하여 개량하는 방법을 통해 마지막 연산이 진행되었다. 관측 유출량과 계산된 유출량과의 오차를 계산하기 위해 sum of squares (SSQ)가 사용되었으며 적용한 결과는 기존 방법들과 비교하였다. Muskingum 홍수추적에서 우수한 성능을 보여준 SAVCA는 다양한 공학 문제들에 적용되어 우수한 성능을 보여줄 것으로 예상된다.

ANSI C 컴파일러에서 중간코드의 검증과 분석을 위한 역컴파일러의 개발 (Development of a Decompiler for Verification and Analysis of an Intermediate Code in ANSI C Compiler)

  • 김영근;권혁주;이양선
    • 한국멀티미디어학회논문지
    • /
    • 제10권3호
    • /
    • pp.411-419
    • /
    • 2007
  • EVM(Embedded Virtual Machine)은 모바일 디바이스, 셋톱박스, 디지털 TV에 탑재되어 하드웨어에 독립적으로 수행되는 스택기반 가상기계이며, SIL(Standard Intermediate Language)은 EVM의 중간언어로 객체지향 언어와 순차적인 언어를 위한 연산 코드 집합을 갖고 있다. 기존에는 C 프로그램을 실행하기위해 플랫폼에 의존적인 목적코드로 변환하여 실행하였다. 이런 문제를 해결하기 위해 본 연구팀은 EVM을 개발하면서 목적기계의 코드가 아닌 플랫폼에 독립적인 스택기반의 SIL 코드를 생성하는 ANSI C 컴파일러를 개발하였다. 본 논문에서는 ANSI C 컴파일러가 생성한 SIL 코드를 3-주소 코드 형태의 재 표현된 ANSI C 프로그램으로 변환하는 SIL-to-C 역컴파일러(Decompiler) 시스템을 설계하고 구현하였다. 이와 같은 작업은 ANSI C 컴파일러가 생성한 SIL 코드가 올바른지를 확인할 수 있는 검증 방법을 제시하며, 소프트웨어 오작동 및 버전 호환이 이루어지지 않을 때 소프트웨어의 구조를 변경하고 수정하여 성능을 개선하는 작업을 용이하게 한다.

  • PDF

맵리듀스를 이용한 그리드 기반 인덱스 생성 및 k-NN 조인 질의 처리 알고리즘 (Grid-based Index Generation and k-nearest-neighbor Join Query-processing Algorithm using MapReduce)

  • 장미영;장재우
    • 정보과학회 논문지
    • /
    • 제42권11호
    • /
    • pp.1303-1313
    • /
    • 2015
  • 맵리듀스는 대용량 데이터 처리를 위한 시스템 안정성과 유용성을 제공한다. 맵리듀스 기반 k-최근접점 조인 질의처리 알고리즘은 두 데이터 집합 R과 S를 기반으로 R의 모든 레코드에 대해 S의 데이터 중 가장 인접한 k개의 레코드를 탐색하는 알고리즘으로써, 대용량 데이터 분석을 위한 중요한 질의 처리 알고리즘이다. 그러나 기존 k-최근접점 조인 질의처리 알고리즘은 높은 인덱스 구축비용 문제로 인해 대용량 데이터 처리에 적합하지 않은 문제점을 지닌다. 따라서, 본 논문에서는 그리드 기반 인덱스 생성 및 k-최근접점 질의 처리 알고리즘을 제안한다. 제안하는 기법은 질의 셀로부터 인접한 데이터만을 찾아 맵리듀스 테스크에 전송함으로써 데이터 전송 및 k-최근접점 연산 오버헤드를 줄인다. 성능평가를 통해, 제안하는 기법이 정확 매칭 질의를 제공하는 동시에 기존 기법에 비해 질의 처리 시간 측면에서 최대 7배의 성능을 개선함을 보인다.

이동객체 위치 일반화를 이용한 시공간 이동 패턴 탐사 (Spatiotemporal Moving Pattern Discovery using Location Generalization of Moving Objects)

  • 이준욱;남광우
    • 정보처리학회논문지D
    • /
    • 제10D권7호
    • /
    • pp.1103-1114
    • /
    • 2003
  • 현재의 이동객체를 기반으로 하는 다양한 시공간 응용환경에서의 서비스 지원 시스템 개발을 위하여 중요한 문제 중의 하나는 방대한 이동객체의 위치 이동 데이터로부터의 의미 있는 지식인 시공간 이동 패턴을 탐사하는 것이다. 이를 위하여 시간적 위상관계, 공간적 위상관계 그리고 시공간적 위상관계에 대한 접근이 지식 탐사를 위하여 고려되어야 한다. 이 논문에서는 효율적인 시공간 이동 패턴 탐사 기법인 MPMine 알고리즘을 제안하였다. 제안한 기법은 시간 제약조건과 공간 제약조건 등을 함께 괴려하며 또한 공간 위상 연산인 contain()을 이용한 공간 개념화를 수행할 수 있다. 제안한 기법은 기존의 일반적인 시간 패턴 탐사 기법과 달리 이동객체 데이터 집합으로부터 위치 및 일반화를 통하여 탐색 공간을 줄일 수 있어 효율적으로 유용한 이동 패턴을 탐사할 수 있다.

유사 가버 특징에 기반한 텍스쳐 분류 (Texture Classification Based on Gabor-like Feature)

  • 손지훈;김성영
    • 한국정보전자통신기술학회논문지
    • /
    • 제10권2호
    • /
    • pp.147-153
    • /
    • 2017
  • 텍스쳐를 효과적으로 표현하는 것은 컴퓨터 비전 분야에서 매우 중요한 과정이다. 효과적인 텍스쳐 표현을 통해 텍스쳐 분류나 텍스쳐 분할 등의 처리 성능을 향상시킬 수 있다. 가버 필터는 텍스쳐 표현을 위해 오랫동안 사용된 다해상도 스케일 기반의 방법이다. 가버 필터는 텍스쳐 분류나 분할에 높은 성능을 제공한다. 그러나 처리 과정의 연산량으로 인해 처리 시간이 매우 많이 소요되어 실제 응용에서는 사용하기 어려운 문제가 있다. 본 논문에서는 가버 필터와 유사하게 다해상도 스케일 기반으로 텍스쳐를 표현할 수 있는 새로운 특징 표현 방법을 제안한다. 제안한 방법은 주파수 공간에서 방향과 스케일을 기반으로 다해상도 스케일 기반으로 텍스쳐를 표현한다. 2가지 실험 영상 집합에 대해 분류 실험을 수행하여 제안한 특징의 유용성을 확인하였다. 가버 필터와 유사한 분류 성능을 제공하면서 처리 속도는 가버 필터의 5%이하로 줄일 수 있는 것을 확인하였다.

이동 시퀀스의 빈발도를 이용한 최적 이동 패턴 탐사 기법 (A Method for Optimal Moving Pattern Mining using Frequency of Moving Sequence)

  • 이연식;고현
    • 정보처리학회논문지D
    • /
    • 제16D권1호
    • /
    • pp.113-122
    • /
    • 2009
  • 기존의 패턴 탐사 기법들은 제한된 시간 및 공간영역에서 발생하는 다양한 이동 패턴들 중 단순히 사용자 요구에 적합할 것으로 추정되는 불특정한 빈발 이동 패턴만을 탐사하기 때문에 특정지점들 간의 최적 이동 경로나 정해진 시간 내의 스케줄링 경로 탐색과 같은 복합적인 시간 및 공간 제약 조건을 갖는 최적 이동 패턴을 탐사하는 문제에는 적용하기 어렵다. 이에 본 논문에서는 방대한 이동 객체의 이력 데이터 집합으로부터 복합적인 시간 및 공간 제약을 갖는 최적 이동 패턴을 탐사하는 문제를 보이고, 적용 가능한 위치 기반 서비스로서 최적 이동 경로에 해당하는 패턴을 탐색하기 위한 새로운 패턴 탐사 기법인 STOMP-F를 제안한다. 제안된 기법은 특정한 지점들 사이를 이동한 객체의 패턴들 중 객체가 가장 빈번하게 이동한 경로를 탐색하여 최적 경로로 결정하는 패턴 빈발도를 이용한 탐색 방법으로, 최적 이동 패턴 탐사 과정의 이동 시퀀스 생성 단계에서 객체의 위치 값과 공간영역 간의 위상 관계를 고려하여 이동 객체의 위치 속성에 대한 최하위 수준에서의 공간 일반화를 통해 보다 효율적으로 패턴 탐사를 수행할 수 있다. 제안 방법을 Dijkstra 알고리즘과 $A^*$ 알고리즘을 대상으로 실험 평가한 결과 $A^*$ 알고리즘의 휴리스틱 가중치에 따라 차이는 있으나 연산 처리 시간을 기준으로 타 알고리즘들 보다 효과적임을 알 수 있다.

PPFP(Push and Pop Frequent Pattern Mining): 빅데이터 패턴 분석을 위한 새로운 빈발 패턴 마이닝 방법 (PPFP(Push and Pop Frequent Pattern Mining): A Novel Frequent Pattern Mining Method for Bigdata Frequent Pattern Mining)

  • 이정훈;민연아
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권12호
    • /
    • pp.623-634
    • /
    • 2016
  • 현존하는 빈발 패턴 마이닝 방법은 대부분 시간 효율성을 목표로 하고, 물리적 메모리 사용에 매우 의존적이다. 하지만 빅데이터 시대가 도래함에 따라 실제 세상의 데이터베이스는 급속도로 증가하고 있으며, 그에 따라 기존의 방법으로 현실적인 거대한 양의 데이터를 마이닝하기에 물리적 메모리 공간이 부족한 실정이다. 이러한 문제를 해결하기 위해, 빈발 패턴 마이닝의 메모리 의존성을 줄이기 위한 보조저장장치 기반의 연구들이 진행되었으나, 메모리 기반의 방법들에 비해 처리 시간이 너무 많이 소비된다는 한계가 있었다. 따라서 확장성을 가지며, 기존의 디스크 기반의 방법들에 비해 시간효율성을 높인 새로운 빈발 패턴 마이닝이 필요하게 되었다. 본 논문에서는 빅데이터로부터 빈도 아이템 집합들을 마이닝하기 위해 메모리와 디스크를 함께 사용하는 스택 기반의 새로운 접근법인 PPFP 알고리즘을 제안하였다. PPFP는 빈발 패턴 마이닝 접근법 중 가장 인기 있고 효율적인 접근법 중 하나인 FP-growth를 기반으로 하고 있다. PPFP 마이닝 방법은 다음과 같이 두 단계로 진행된다. (1) IFP-tree 구축: FP-tree를 생성한 후, 새로운 인덱스 번호 부여 방법으로 FP-tree의 각 노드에 인덱스 번호를 부여하고, 이 인덱스 번호가 부여된 FP-tree(IFP-tree)를 테이블로 변환하여(IFP-table) 디스크에 저장한다. (2) PPFP 알고리즘을 이용한 빈발 패턴 마이닝: 스택 기반의 PUSH-POP 방식으로 패턴을 확장시켜 나가며 빈발 패턴을 마이닝한다. 이러한 방식을 통해 메모리 기반의 방법에 비해 반복적으로 많은 시간이 소모되는 연산에 매우 적은 양의 메모리를 활용하여 확장성과 함께 시간효율성 또한 향상시킬 수 있었다. 그리고 기존의 연구 방법들과 비교 실험을 통해 새로운 알고리즘의 성능을 증명하였다.