• 제목/요약/키워드: cardinality

검색결과 155건 처리시간 0.022초

An Impact of Addressing Schemes on Routing Scalability

  • Ma, Huaiyuan;Helvik, Bjarne E.;Wittner, Otto J.
    • Journal of Communications and Networks
    • /
    • 제13권6호
    • /
    • pp.602-611
    • /
    • 2011
  • The inter-domain routing scalability issue is a major challenge facing the Internet. Recent wide deployments of multihoming and traffic engineering urge for solutions to this issue. So far, tunnel-based proposals and compact routing schemes have been suggested. An implicit assumption in the routing community is that structured address labels are crucial for routing scalability. This paper first systematically examines the properties of identifiers and address labels and their functional differences. It develops a simple Internet routing model and shows that a binary relation T defined on the address label set A determines the cardinality of the compact label set L. Furthermore, it is shown that routing schemes based on flat address labels are not scalable. This implies that routing scalability and routing stability are inherently related and must be considered together when a routing scheme is evaluated. Furthermore, a metric is defined to measure the efficiency of the address label coding. Simulations show that given a 3000-autonomous system (AS) topology, the required length of address labels in compact routing schemes is only 9.12 bits while the required length is 10.64 bits for the Internet protocol (IP) upper bound case. Simulations also show that the ${\alpha}$ values of the compact routing and IP routing schemes are 0.80 and 0.95, respectively, for a 3000-AS topology. This indicates that a compact routing scheme with necessary routing stability is desirable. It is also seen that using provider allocated IP addresses in multihomed stub ASs does not significantly reduce the global routing size of an IP routing system.

저장 공간이 제약된 환경에서 계층적 비트맵 인덱스 생성에 관한 연구 (Building Hierarchical Bitmap Indices in Space Constrained Environments)

  • 김종욱
    • 디지털콘텐츠학회 논문지
    • /
    • 제16권1호
    • /
    • pp.33-41
    • /
    • 2015
  • 비트맵 인덱스는 낮은 카디널리티를 갖는 컬럼에 대한 OLAP 질의의 수행 속도에 있어서 매우 우수한 성능을 보이고 있기 때문에, 데이터 웨어하우스에서 많이 사용하고 있는 인덱스 기법 중에 하나이다. 일반적으로 데이터 웨어하우스에 기반을 둔 많은 응용 프로그램들은 컬럼 값들이 계층 구조를 형성하는 경우가 많이 있다. 만일, 컬럼 값들이 계층적으로 표현될 수 있는 경우 일반적인 비트맵 인덱스 보다 계층적 비트맵 인덱스를 이용하는 것이 질의 처리 수행 속도에 있어서 더 높은 성능을 보인다고 알려지고 있다. 그러나 계층적 비트맵 인덱스의 경우 사용하는 계층 구조의 크기가 큰 경우 저장 공간 오버헤드가 발생할 수 있다는 문제점을 가지고 있다. 그러므로 본 논문에서는 저장 공간이 제약된 환경에서 컬럼 값들이 거대 계층 구조를 형성하고 있을 때, 질의 워크로드에 기반하여 계층적 비트맵 인덱스를 효과적으로 생성하기 위한 방법을 제안한다. 특히, 본 논문에서는 주어진 계층 구조를 두 개의 배타적 역영으로 나누는 Cut 선택 방법 제안함으로써, 계층적 비트맵 인덱스의 저장 공간 오버헤드 문제를 해결한다.

효율적인 각 기반 공간 분할 병렬 스카이라인 질의 처리를 위한 데이터 샘플링 기반 프루닝 기법 (A Sampling based Pruning Approach for Efficient Angular Space Partitioning based Skyline Query Processing)

  • 최우성;민종현;정재화;정순영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2016년도 춘계학술발표대회
    • /
    • pp.55-58
    • /
    • 2016
  • 스카이라인 질의란 다수의 선택지 중 '선호될 만한(preferable)' 선택지를 요청하는 질의이다. 사용자가 검토해야하는 선택지의 수를 대폭 감소시키는 스카이라인 질의는 데이터가 폭증하는 빅데이터 환경에서 매우 유용하게 활용된다. 이러한 배경에서 대용량 데이터에 대한 스카이라인 질의를 분산 병렬 처리하는 기법이 각광을 받고 있으며, 특히 맵리듀스(MapReduce) 기반의 분산 병렬 처리 기법 연구가 활발히 진행 중이다. 맵리듀스 기반 알고리즘의 병렬성 제고를 위해서는 부하 불균등 문제 중복 계산 문제 과다한 네트워크 비용 발생 문제를 해소해야 한다. 최근 각 기반 공간분할 기법을 사용하여 부하 불균등 문제와 중복 계산 문제를 해소하는 맵리듀스 기반 스카이라인 질의 처리 기법이 제안되었으나 해당 기법은 네트워크 비용 관점에서 최적화되어있지 않다. 본 논문에서는 부하 불균등 문제와 중복 계산 문제를 해소하면서도 프루닝을 통해 네트워크 비용 절감 시킬 수 있는 새로운 맵리듀스 기반 병렬 스카이라인 질의 처리 기법인 MR-SEAP(MapReduce sample Skyline object Equality Angular Partitioning)을 제안한다. MR-SEAP에서는 데이터를 샘플링하여 샘플 스카이라인 객체를 추출한 뒤 해당 객체들을 균등 분배하는 각도를 기준으로 공간을 분할하여 스카이라인 질의를 병렬 계산하되, 샘플 스카이라인을 이용하여 다수의 객체를 사전에 프루닝함으로써 네트워크 비용을 절감한다. 본 논문에서는 다양한 데이터 수량(cardinality) 및 분포(distribution)에 따른 제안 기법의 성능을 실험 평가함으로써 제안 기법의 우수성을 검증한다.

온톨로지를 이용한 웹문서의 시맨틱 검색 (Semantic search of web documents using ontology)

  • 오성균;김병곤
    • 디지털콘텐츠학회 논문지
    • /
    • 제15권5호
    • /
    • pp.603-612
    • /
    • 2014
  • 사용자들에게 좀 더 정확하고 편리한 검색결과를 제공하기 위하여 정보의 구조적인 특징 등을 사용하는 시맨틱 검색의 개념이 널리 연구되고 있다. 이를 위하여, 최근의 정보검색분야와 데이터구축 분야의 연구에서는 데이터의 구조적인 표현과 검색 메카니즘을 구현하기 위하여 온톨로지를 강조하고 있다. 본 연구에서는 웹 환경에서의 검색 정확도와 만족도를 향상시키기 위하여 온톨로지를 이용한 시맨틱 검색 방법을 제안한다. 온톨로지와 KB(KnowledgeBase)를 이용하여 검색 대상을 키워드간의 관계를 유추한 사실(fact)과 관계키워드들을 지니는 웹문서들로 크게 나누고 이들을 서로 유기적으로 검색을 진행하는 시맨틱 검색 질의 처리기법을 제안하였다. 또한 결과에 대한 사용자의 검색 만족도를 높이기 위하여 결과 문서와 사실에 대한 랭킹 방법을 제안하였다. 실험을 통하여 주어진 식의 값을 달리하여 랭킹을 올바로 구현하는 요소로 키워드의 빈도와 온톨로지상의 클래스 레벨이 영향을 미치는 것을 확인 할 수 있었고, 이를 통하여 적합한 형태의 계수 값을 제시하였다.

MkCP (Maximum k-Club Problem)를 위한 휴리스틱 기반 알고리즘 (A Heuristic-Based Algorithm for Maximum k-Club Problem)

  • 김소정;김찬수;한근희
    • 디지털융복합연구
    • /
    • 제19권10호
    • /
    • pp.403-410
    • /
    • 2021
  • k-club은 소셜 네트워크 분석에서 다양한 형태의 소셜 그룹을 설명하기 위해 제안된 그래프 모델 중 하나로, 단순 그래프에서 부분 정점 집합 S 에 의한 유도 부분그래프(Induced subgraph)의 지름이 k보다 작거나 같은 경우 S 를 k-club이라 한다. 본 논문에서는 유전알고리즘을 이용하여 그래프에서 크기가 최대인 k-club을 찾는 문제인 MkCP(Maximum k-Club Problem)을 계산하는 HGA+DROP 알고리즘을 제안한다. 본 알고리즘은 k-club을 위한 휴리스틱 알고리즘 k-CLIQUE & DROP을 변형하고 휴리스틱 유전 알고리즘(HGA)을 사용해 한 번의 수행으로 복수개의 k-club을 구하였다. 기존 알고리즘의 결과와 비교하기 위해 DIMACS 그래프들에 대하여 k가 2, 3, 4 그리고 5일 때 MkCP를 계산하였다.

불완전한 데이터를 위한 딥러닝 모델 (Deep Learning Model for Incomplete Data)

  • 이종찬
    • 한국융합학회논문지
    • /
    • 제10권2호
    • /
    • pp.1-6
    • /
    • 2019
  • 제안 모델은 소실 데이터를 포함하는 불완전한 데이터에서 정보의 손실을 최소화할 수 있도록 개발되었다. 이를 위한 과정은 우선 데이터 확장기법을 이용하여 손실 정보를 보상하도록 학습 데이터를 변환한다. 이 변환 과정에서 데이터의 속성값은 원-핫 인코딩으로 이진 또는 확률값으로 채워진다. 다음 이 변환 데이터는 딥러닝 모델에 입력되는데, 이때 각 속성의 카디너리티에 따라 엔트리 수가 일정하지 않게 된다. 그리고 각 속성의 엔트리 값들을 각각의 입력 노드에 할당하고 학습을 진행한다. 이점이 기존 학습 모델과의 차이점으로, 임의의 속성값이 입력층에서 여러 개의 노드로 분산되는 특이한 구조를 가진다. 제안 모델의 학습 성능을 평가하기 위해, 소실 데이터를 대상으로 다양한 실험을 수행하여 성능 면에서 우수함을 보인다. 제안 모델은 유비쿼터스 환경에서 손실을 최소화하기 위한 알고리즘으로 유용하게 사용될 것으로 본다.

최대독립집합 문제의 최소차수 정점 우선 선택 알고리즘 (First Selection Algorithm of Minimum Degree Vertex for Maximum Independent Set Problem)

  • 이상운
    • 한국인터넷방송통신학회논문지
    • /
    • 제19권3호
    • /
    • pp.193-199
    • /
    • 2019
  • 본 논문은 지금까지 NP-완전인 난제로 알려진 최대 독립집합(MIS) 문제를 선형시간 복잡도로 해결한 알고리즘을 제안하였다. 제안된 알고리즘은 "MIS 집합의 모든 정점들은 상호간에 연결되지 않는다"는 기본 성질을 적용하여 n개의 정점으로 구성된 그래프에서 최소 차수 ${\delta}(G)$ 정점 ${\nu}$를 선택하고 부속 간선을 제거하였을 때 차수가 변하지 않는 정점들을 차수 오름차순으로 계속적으로 선택하는 단순한 방법을 적용하였다. 제안된 알고리즘을 22개 그래프에 적용한 결과, 시각적으로 그래프를 보면서도 MIS를 쉽게 찾을 수 있는 장점을 갖고 있으며, 알고리즘은 항상 MIS 집합의 원소 개수인 ${\alpha}(G)$회를 수행하여 알고리즘 복잡도는 O(n)으로 선형 알고리즘이다. 결국, 제안된 MIS 알고리즘은 MIS의 최적 해를 도출하는 일반적인 알고리즘으로 적용할 수 있을 것이다.

Early-abort 전략을 이용한 타원곡선 생성 알고리즘에 사용되는 SEA 알고리즘 연구 (On the SEA algorithm used in finding secure elliptic curves with an early-abort strategy)

  • 정배은;류희수
    • 정보보호학회논문지
    • /
    • 제12권5호
    • /
    • pp.75-85
    • /
    • 2002
  • 타원곡선 암호 사용에 있어 암호학적으로 안전한 타원곡선의 선택이 안전한 암호 스킴 구성에 있어서 대단히 중요하다. 현재까지 알려진 공격에 대하여 타원곡선의 안전성 결정 요소 가운데 하나가 타원곡선 그룹의 위수이다. 따라서, 타원곡선의 랜덤 커브 생성에 있어 위수 계산은 필수적이다. characteristic이 2인 경우, 효율적인 랜덤 커브 생성 알고리즘은 early-abort 전략을 사용한 알고리즘으로 SEA 알고리즘을 abort 단계에 사용하고, 위수 계산에 Satoh 알고리즘을 사용한 방법이다$^[1]$. [1]에서 abort 단계에서 사용하는 SEA 알고리즘을 변형하여 사용하였다고 기술되어있는데, 구체적인 방법이 제시되지는 않았다. 우리는 이 논문에서, abort 하게 되는 경우에 대하여 관련된 파라미터들을 살펴봄으로써, abort 단계에 소요되는 시간을 효율적으로 줄이는 SEA 알고리즘 변형 방법을 제안하고, 이의 근거로 실험한 결과를 제시하고자 한다.

부분집합 합 문제의 일반화된 감산 알고리즘 (A Generalized Subtractive Algorithm for Subset Sum Problem)

  • 이상운
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권2호
    • /
    • pp.9-14
    • /
    • 2022
  • 본 논문은 부분집합 합 문제의 해를 수행 복잡도 O(nlogn)으로 얻는 알고리즘을 제안하였다. SSP는 집합 S의 원소가 초증가수열과 랜덤수열로 구성된 경우로 구분된다. 초증가수열 SSP의 해를 구하는 알고리즘은 수행 복잡도 O(nlogn)의 가산 알고리즘 (Additive Algorithm)이 제안되었다. 그러나 랜덤수열 SSP의 해를 구하는 알고리즘은 2n-1의 가능한 모든 경우수를 확인하는 Brute-Force 방법으로 수행 복잡도는 O(n2n)만이 알려져 있다. 결국, SSP는 NP-완전 (NP-Complete) 문제로 알려져 있다. 본 논문은 초증가수열과 랜덤수열 SSP에 대해 수행 복잡도 O(nlogn)으로 해를 구하는 감산 알고리즘 을 제안하였다. 기존 개념은 목표 값 t보다 작은 값으로 구성된 부분집합 S에 대해 부분집합의 합에서 목표값을 뺀 값을 잉여량 (Residual, r)으로 하여 잉여량 보다 작은 값들 중 최대 값을 S에서 제거하는 방법을 적용하였다. 제안된 알고리즘을 다양한 초증가수열과 랜덤수열 SSP에 적용한 결과 S의 원소 개수보다 적은 수행 횟수로 해를 빠르게 얻는데 성공하였다. 결국, 제안된 알고리즘은 SSP의 해를 얻는 일반적인 알고리즘으로 적용할 수 있을 것이다.

A Self-Supervised Detector Scheduler for Efficient Tracking-by-Detection Mechanism

  • Park, Dae-Hyeon;Lee, Seong-Ho;Bae, Seung-Hwan
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권10호
    • /
    • pp.19-28
    • /
    • 2022
  • 본 논문에서는 실시간 고성능 다중 객체 추적을 수행하기 위해 최적의 TBD (Tracking-by-detection) 메커니즘을 결정할 수 있는 Detector Scheduler를 제안한다. Detector Scheduler는 서로 다른 프레임 간의 특징량 차이를 측정하는 것으로 검출기 실행 여부를 결정하여 전체 추적 속도를 향상한다. 하지만, Detector Scheduler의 학습에 필요한 GT (Ground Truth) 생성이 어렵기 때문에 Detector Scheduler를 추적 결과만을 통해 학습 가능한 자가 학습 방법을 제안한다. 제안된 자가 학습 방법은 프레임 간의 객체 카디널리티와 객체 외형 특징량의 비유사도가 커질 때 검출기를 실행할 수 있도록 의사 레이블을 생성하고 제안된 손실함수를 통해 Detector Scheduler를 학습한다.