• 제목/요약/키워드: greedy 선택방법

검색결과 35건 처리시간 0.029초

클래스 영역을 보존하는 초월 사각형에 의한 프로토타입 선택 알고리즘 (Hyper-Rectangle Based Prototype Selection Algorithm Preserving Class Regions)

  • 백병현;어성율;황두성
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권3호
    • /
    • pp.83-90
    • /
    • 2020
  • 프로토타입 선택은 훈련 데이터로부터 클래스 영역을 대표하는 최소 데이터를 선택하여 낮은 학습 시간 및 저장 공간을 보장하는 장점을 제공한다. 본 논문은 모든 분류 알고리즘에 적용할 수 있는 초월 사각형을 이용한 새로운 훈련 데이터의 생성 방법을 설계한다. 초월 사각형 영역은 서로 다른 클래스 데이터를 포함하지 않으며 클래스 공간을 분할한다. 선택된 초월 사각형 내 데이터의 중간값은 프로토타입이 되어 새로운 훈련 데이터를 구성하고, 초월 사각형의 크기는 클래스 영역의 데이터 분포를 반영하여 조절된다. 전체 훈련 데이터를 대표하는 최소의 프로토타입 집합 선택을 위해 집합 덮개 최적화 알고리즘을 설계했다. 제안하는 방법에서는 탐욕 알고리즘과 곱셈 연산을 포함하지 않은 거리 계산식을 이용하여 집합 덮개 최적화 알고리즘의 다항 시간을 요구하는 시간 복잡도 문제를 해결한다. 실험에서는 분류 성능의 비교를 위해 최근접 이웃 규칙과 의사 결정 트리 알고리즘을 이용하며 제안하는 방법이 초월 구를 이용한 프로토타입 선택 방법보다 우수하다.

클래스 영역의 다차원 구 생성에 의한 프로토타입 기반 분류 (Prototype based Classification by Generating Multidimensional Spheres per Class Area)

  • 심세용;황두성
    • 한국컴퓨터정보학회논문지
    • /
    • 제20권2호
    • /
    • pp.21-28
    • /
    • 2015
  • 본 논문에서는 최근접 이웃 규칙을 이용한 프로토타입 선택 기반 분류 학습을 제안하였다. 각 훈련 데이터가 대표하는 클래스 영역을 구(sphere)로 분할하는데 최근접 이웃 규칙을 적용시키며, 구의 내부는 동일 클래스 데이터들만 포함하도록 한다. 프로토타입은 구의 중심점이며 프로토타입의 반지름은 가장 인접한 다른 클래스 데이터와 가장 먼 동일 클래스 데이터의 중간 거리 값으로 결정한다. 그리고 전체 훈련 데이터를 대표하는 최소의 프로토타입 집합을 선택하기 위해 집합 덮개 최적화를 이용하여 프로토타입 선택 문제를 변형시켰다. 제안하는 프로토타입 선택 방법은 클래스 별 적용이 가능한 그리디 알고리즘으로 설계되었다. 제안하는 방법은 계산 복잡도가 높지 않으며, 대규모 훈련 데이터에 대한 병렬처리의 가능성이 높다. 프로토타입 기반 분류 학습은 선택된 프로토타입 집합을 새로운 훈련 데이터 집합으로 사용하고 최근접 이웃 규칙을 적용하여 테스트 데이터의 클래스를 예측한다. 실험에서 제안하는 프로토타입 기반 분류기는 최근접 이웃 학습, 베이지안 분류 학습과 다른 프로토타입 분류기에 비해 일반화 성능이 우수하였다.

시계열 데이타 클러스터링에서 푸리에 진폭 기반의 프라이버시 보호 (Privacy-Preserving Clustering on Time-Series Data Using Fourier Magnitudes)

  • 김혜숙;문양세
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제35권6호
    • /
    • pp.481-494
    • /
    • 2008
  • 본 논문에서는 시계열 데이타 클러스터링에서 DFT 진폭 기반의 프라이버시 보호 기법을 제안한다. 기존의 프라이버시 보호 연구인 DFT 계수 기법은 원본과 유사한 데이타가 복원될 수 있어 프라이버시 보호 측면에서 큰 문제점이 있다. 반면에, 제안한 DFT 진폭 기법은 DFT 변환 후에 위상을 제외한 진폭만을 사용함으로써 원본 데이타를 복원하기 매우 어려운 특징을 가진다. 본 논문에서는 우선 기존의 DFT 계수 기법이 복원이 용이한 함수이고, 제안한 DFT 진폭 기법이 복원이 어려운 함수임을 체계적으로 설명한다. 다음으로, 클러스터링 정확도를 대신하고 진폭을 선택하기 위한 척도로서 거리-순서 보존정도의 개념을 제안한다. 거리-순서 보존 정도는 객체들의 상대적 순서가 클러스터링 보호 함수의 적용전후에 얼마나 보존되는지의 척도를 나타낸다. 본 논문에서는 이러한 거리-순서 보존 정도의 개념을 사용하여 DFT 진폭 기법에서 진폭을 선택하는 탐욕적 전략들을 제시한다. 즉, 제안한 탐욕적 전략은 거리-순서 보존 정도를 극대화하는 방향으로 DFT 진폭을 선택하여, 궁극적으로 클러스터링 정확도를 높이고자 하는 방법이다. 마지막으로 실험을 통해 제안한 거리-순서 보존 정도가 클러스터링 정확도를 대신할 수 있는 척도임을 보인다. 또한, 제안한 DFT 진폭 기법의 탐욕적 전략들이 기존의 DFT 계수 기법에 비해 정확도가 크게 떨어지지 않음을 확인한다. 이 같은 결과를 달 때, 제안한 DFT 진폭 기법은 DFT 계수 기법에 비해 프라이버시 보호 정도를 크게 개선했을 뿐 아니라 비교적 정확한 클러스터링 정확도를 보이는 우수한 연구 결과라 사료된다.

무선 센서 네트워크에서 무선 반경을 고려한 에너지 효율적인 페이스 라우팅 프로토콜 (Energy-Efficient Face Routing Protocol Considering Radio Range in Wireless Sensor Networks)

  • 조현종;김상대;김천용;김상하;황치정
    • 한국통신학회논문지
    • /
    • 제40권6호
    • /
    • pp.1058-1069
    • /
    • 2015
  • 무선 센서 네트워크에서 위치 기반 라우팅은 위치 정보를 이용하여 데이터 메시지를 전달하기에 효과적인 방법으로 알려져 있다. 위치 기반 라우팅에서 대표적인 그리디 포워딩이 불가능할 경우, 페이스 라우팅이 복구 수단으로 쓰이고 있다. 페이스 라우팅은 교차된 연결들을 제거한 평면 그래프를 바탕으로 구성되며 이는 가장 가까운 이웃 노드들의 연결을 제외한 나머지 연결들은 모두 제거됨을 의미한다. 하지만 페이스 라우팅은 무선 반경을 고려하지 않아 한 홉 범위 안에서 멀리 갈 수 있는 링크들이 존재하더라도 평면 그래프의 규칙에 의해 짧은 링크들을 선택한다. 이것은 밀집된 지역에서 페이스 라우팅을 쓰일 경우 에너지 효율성을 저하시킨다. 본 논문에서는 평면 그래프에서 제거된 링크들을 찾고 이용할 수 있는 프로토콜을 제안한다. 본 프로토콜은 작은 크기의 컨트롤 메시지와 함께 무선 반경에서 제거된 링크를 찾는다. 시뮬레이션을 통해 제안 방안이 이전 페이스 라우팅 프로토콜보다 에너지 효율성이 높음을 보인다.

EDP들의 참조 테이블을 이용한 실용적 인 경로 설정 및 파장 할당 알고리즘 (A Practical RWA Algorithm-based on Lookup Table for Edge Disjoint Paths)

  • 김명희;방영철;정민영;이태진;추현승
    • 한국정보과학회논문지:정보통신
    • /
    • 제31권2호
    • /
    • pp.123-130
    • /
    • 2004
  • 경로 설정 및 파장 할당(Routing and Wavelength Assignment) 문제는 파장 할당 전송 기법(Wavelength Division Multiplexing)을 기반으로 하는 광 네트워크에서 중요한 분야이다. 경로 설정 및 파장 할당 문제는 선형 프로그램(Linear Programming)과 그래프 컬러링(Graph Coloring)의 조합으로 해결되거나, 경로 선택에 기반 한 그래프 알고리즘에 의해서 해결된다. 이와 같은 방법은 복잡하며 휴리스틱 알고리즘(heuristic algorithm)이 요구된다. 본 논문에서는 각각의 연결 요구에 대한 최대한의 EDPs(Edge Disjoint Paths)를 구함으로써 경로 설정 및 파장 할당 문제를 효율적으로 해결하는 새로운 방법을 제안한다. 이렇게 구한 EDPs는 참조 테이블에 저장되고 가중치 매트릭스의 갱신에 사용된다. 각 연결 요구에 대한 경로는 순서대로 가중치 매트릭스를 참조하여 결정한다. 본 논문에서 제안하는 알고리즘이 현재 실질적으로 효율적이라 알려진 BGA for EDP(Bounded Greedy Approach for EDP)보다 약 50%의 수행 시간 내에 같거나 작은 파장 수를 사용하여 연결 요구를 만족시켜주고 있음을 시뮬레이션을 통해서 확인할 수 있다.

멀티캐스트 라우팅 문제 해결을 위한 엘리트 개미 시스템 (Elite Ant System for Solving Multicast Routing Problem)

  • 이승관
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권3호
    • /
    • pp.147-152
    • /
    • 2008
  • 개미 시스템(Ant System)은 조합 최적화 문제를 해결하기 위한 메타 휴리스틱 탐색 방법으로, 그리디 탐색뿐만 아니라 긍정적 피드백을 사용한 모집단에 근거한 접근법으로 순회 판매원 문제를 풀기 위해 처음으로 제안되었다. 본 논문에서는 이러한 개미 시스템을 이용한 멀티캐스트 라우팅 방법을 제안한다. 멀티캐스트 라우팅은 하나의 송신자에서 다수의 수신자로 데이터를 전송하는 것으로 스타이너 트리(Steiner Tree)를 구성해 문제를 해결할 수 있다. 하지만, 멀티캐스트 라우팅 문제는 모든 노드를 방문하는 순회 판매원 문제와 접근법이 다르므로, 순회 판매원 문제를 해결하기 위한 개미 시스템의 전략을 수정한 엘리트 에이전트에 의한 개미 멀티캐스트 라우팅 모델을 제안한다. 이 모델은 이웃노드를 선택할 경우 해당 에지와 선택될 다음노드의 전체 비용까지 모두 고려해 이웃노드를 선택한다. 또한, 엘리트 에이전트에 의해 선택된 에지에 대해서는 추가 페로몬 갱신을 수행한다. 이러한 전략을 통해 제안한 모델의 성능을 평가한다.

  • PDF

유전 알고리즘을 이용한 Maximal Covering 문제의 해결 (A Genetic Algorithm for the Maximal Covering Problem)

  • 박태진;이용환;류광렬
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2002년도 추계정기학술대회
    • /
    • pp.502-509
    • /
    • 2002
  • Maximal Covering 문제(MCP)란 행렬 상에서 n개의 열(column) 중 p개를 선택하여 m개의 행(row)중 최대한 많은 행을 cover하는 문제로 정의된다. 본 논문에서는 MCP를 유전 알고리즘(Genetic Algorithm)으로 해결하기 위해 문제에 적합하게 설계된 교차 연산자(crossover operator)와 비발현 유전인잔(unexpressed gene)를 가진 새로운 염색체 구조를 제시한다. 해결하고자 하는 대상 MCP의 규모가 매우 큰 경우 전통적인 임의교차(random crossover) 방법으로는 좋은 결과를 얻기가 힘들다. 따라서 본 연구에서는 그리디 교차(greedy crossover) 방법을 제시하여 문제를 해결한다. 그러나 이러한 그리디 교차를 사용하더라도 조기 수렴 등의 문제로 인해 타부 탐색 등의 이웃해 탐색 방법에 비해 그리 좋은 결과를 얻기가 힘들다. 본 논문은 이러한 조기 수렴 문제를 해결하고 다른 이웃에 탐색 방법보다 더 좋은 결과를 얻기 위해 비발현 유전인자(unexpressed gene)를 가진 염색체를 도입하여 해결함을 특징으로 한다. 비발현 유전인자는 교차 과정에서 자식 염색체의 유전인자로 전달되지 않은 정보 중 나중에라도 유용할 가능성이 보이는 정보를 보존하는 역할을 하여 조기 수렴 문제를 해결하는데 도움을 주어 보다 나은 결과를 얻을 수 있게 해준다. 대규모 MCP를 해결하는 실험에서 새로운 비발현 유전인자를 적용한 유전 알고리즘이 기존의 유전 알고리즘뿐만 아니라 다른 탐색 기법에 비해 더욱 좋은 성능을 보여줌을 확인하였다.

  • PDF

데이터 스트림 환경에서의 조인 연속 질의의 그리디 질의 최적화 성능 분석 (Greedy Query Optimization Performance Analysis for Join Continuous Query over Data Streams)

  • 박홍규;이원석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 추계학술발표대회
    • /
    • pp.361-364
    • /
    • 2006
  • 최근에 제한된 데이터 셋보다 센서 데이터 처리, 웹 서버 로그나 전화 기록과 같은 다양한 트랜잭션 로그 분석 등과 관련된 데이터 스트림 처리에 더 많은 관심이 집중되고 있으며, 특히 데이터 스트림의 질의 처리에 대한 관심이 증가하고 있다. 본 논문에서는 질의 중에서 2 개 이상의 스트림을 조인하는 조인 연속 질의를 처리하는 방법과 성능에 대해서 연구한다. 각 조인의 비용을 스트림의 입력 속도와 조인 선택도를 이용한 조인 비용 모델로 정의하고 그리디 알고리즘을 이용하여 최적화하는 기법을 제안하고 실험을 통해 다양한 스트림 환경에서 최적화 알고리즘이 어떤 성능을 보이는 지를 알아본다.

  • PDF

최대 EDP를 이용한 경로설정 및 경로 충돌 그래프를 이용한 파장할당 문제 해결 방안 (Routing with Maximum Edge Disjoint Paths and Wavelength Assignment with Path Conflict Graph)

  • 김덕헌;정민영;이태진;추현승
    • 한국통신학회논문지
    • /
    • 제30권7B호
    • /
    • pp.417-426
    • /
    • 2005
  • 경로설정 및 파장할당(RWA: Routing and Wavelength Assignment) 문제는 파장 분할 다중화 기술에 기반한 차세대 광 인터넷 백본망에서 주목되는 기술중의 하나이다. 이러한 광 인터넷 망에서 연결요구에 대해 최적의 경로를 선택하여 선택된 경로에 효율적으로 파장을 할당하는 RWA문제는 매우 중요하다. 본 논문에서는 경로 충돌 그래프 개념과 송신노드-수신노드 간의 MAX_EDP(Maximum Edge Disjoint Paths: 최대 링크 비 중복 경로) 알고리즘을 이용한 효율적인 알고리즘을 제안한다. 또한, 이에 대한 모의실험을 통해 제안한 방법과 기존의 BGAforEDP 알고리즘과의 성능분석을 통해 효율성을 검증한다. 모의 실험결과 제안된 방식이 기존의 방식보다 고정된 네트워크 토폴로지(NSFNET)에서는 최대 20$\%$, 랜덤 토폴로지에서는 최대 32$\%$정도의 성능향상을 보인다.

트리플 데이터베이스 단축 경로 이득 함수와 구성 인자 실험 분석 (Empirical Analysis on the Shortcut Benefit Function and its Factors for Triple Database)

  • 강승석;심준호
    • 한국전자거래학회지
    • /
    • 제19권1호
    • /
    • pp.131-143
    • /
    • 2014
  • 3-컬럼의 트리플 테이블로 구성되는 트리플 데이터베이스의 질의 처리는 고비용이 드는데, 단축 경로는 그 비용을 감소시키는 방법으로 알려졌다. 어떠한 단축 경로를 선택 구성할지는 주요한 문제이며, 질의 빈도를 기반으로 단축 경로 이득을 계산하는 방식이 주로 사용된다. 하지만 이러한 방식은 트리플 데이터의 추가 혹은 변경을 적절히 반영하지 못한다. 본 논문에서는 질의 처리 시간 단축 측면뿐 아니라 경로 구축 및 유지 비용도 고려하는 이득 모델을 다룬다. 이득 모델은 이득 함수로 설계되어 단축 경로 선택 기법에 적용된다. 이득 함수 구성 인자가 미치는 영향을 실세계 트리플 데이터를 사용해 실험 분석한다.