• 제목/요약/키워드: 성능데이터

검색결과 14,759건 처리시간 0.044초

유전자 알고리즘을 이용한 분산 데이터베이스 할당 방법론 (An Allocation Methodology on Distributed Databases Using the Genetic Algorithmsplications)

  • 박성진;박화규;손주찬;박상봉;백두권
    • 정보기술과데이타베이스저널
    • /
    • 제5권1호
    • /
    • pp.1-12
    • /
    • 1998
  • 분산 환경에서 데이터의 할당(allocation)는 중요한 설계 이슈이다. 데이터의 할당은 분산 데이터에 대한 비용(cost) 감소, 성능(performance) 및 가용성(availability) 향상 등의 이점을 극대화할 수 있도록 최적화되어야 한다. 기존 연구들의 대부분은 트랜잭션의 수행 비용을 최소화하는 방향으로만 최적화된 데이터 할당 결과를 제시하고 있다. 즉, 비용, 성능 및 가용성을 모두 함께 고려하는 연구는 아직까지 제시된 결과가 없으며 이는 복잡한 모델에 대한 적절한 최적화 기법이 없기 때문이다. 본 연구에서는 분산 데이터의 이점들인 비용, 성능 및 가용성 등의 다중측면을 동시에 고려함으로써 데이터 할당에 대한 파레토 최적해를 제공하는 DAMMA (Data Allocation Methodology considering Multiple Aspects) 방법론을 제안하였다. DAMMA 방법론은 데이터 분할 과정을 통하여 생성된 최적의 단편들을 분산 시스템의 운용 비용, 수행 성능, 가용성 등의 요소를 고려하여 각 물리적 사이트에 중복 할당하는 파레토 최적해들을 생성해낼 수 있는 설계 방법론이다.

  • PDF

시계열 데이터에 대한 클러스터링 성능 분석: Wavelet과 Autoencoder 비교 (Clustering Performance Analysis for Time Series Data: Wavelet vs. Autoencoder)

  • 황우성;임효상
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 추계학술발표대회
    • /
    • pp.585-588
    • /
    • 2018
  • 시계열 데이터의 특징을 추출하여 분석하는 과정에서 시게열 데이터가 가지는 고차원성은 차원의 저주(Course of Dimensionality)로 인해 데이터내의 유효한 정보를 찾는데 어려움을 만든다. 이러한 문제를 해결하기 위해 차원 축소 기법(dimensionality reduction)이 널리 사용되고 있지만, 축소 과정에서 발생하는 정보의 희석으로 인하여 시계열 데이터에 대한 군집화(clustering)등을 수행하는데 있어서 성능의 변화를 가져온다. 본 논문은 이러한 현상을 관찰하기 위해 이산 웨이블릿 변환(Discrete Wavelet Transform:DWT)과 오토 인코더(AutoEncoder)를 차원 축소 기법으로 활용하여 시계열 데이터의 차원을 압축 한 뒤, 압축된 데이터를 K-평균(K-means) 알고리즘에 적용하여 군집화의 효율성을 비교하였다. 성능 비교 결과, DWT는 압축된 차원수 그리고 오토인코더는 시계열 데이터에 대한 충분한 학습이 각각 보장된다면 좋은 군집화 성능을 보이는 것을 확인하였다.

Data Locality를 활용한 VR환경에서의 대용량 데이터 가시화 시스템의 성능 개선 (Performance Enhancement of A Massive Scientific Data Visualization System on Virtual Reality Environment by Using Data Locality)

  • 이세훈;김민아;이중연;허영주
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.284-287
    • /
    • 2012
  • GLOVE(GLObal Virtual reality visualization Environment for scientific simulation)는 컴퓨팅 자원의 성능 향상으로 데이터 양이 급속히 증가한 응용 과학과 전산 시뮬레이션 분야의 대용량 과학 데이터를 효율적으로 가시화하여 분석하기 위한 도구이다. GLOVE의 데이터 관리자인 GDM(GLOVE Data Manager)은 대용량 데이터의 분산 병렬 가시화를 위해 분산 공유 메모리를 제공하는 GA(Global Array)를 이용해 테라 바이트 단위의 데이터를 실시간으로 처리한다. 그러나 대용량 과학 데이터를 가시화 하는 과정에서 기존의 Data Locality를 고려하지 않은 데이터 접근 방식으로 인한 성능 저하를 확인했다. 본 논문은 기존 GLOVE에서 발견한 성능 저하 현상을 밝히고, 이에 대한 해결 방법을 제시한다.

강건한 질의응답 모델을 위한 데이터셋 증강 기법 (Adversarial Examples for Robust Reading Comprehension)

  • 장한솔;전창욱;최주영;심묘섭;김현;민경구
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.41-46
    • /
    • 2021
  • 기계 독해는 문단과 질문이 주어질 때에 정답을 맞추는 자연어처리의 연구분야다. 최근 기계 독해 모델이 사람보다 높은 성능을 보여주고 있지만, 문단과 질의가 크게 변하지 않더라도 예상과 다른 결과를 만들어 성능에 영향을 주기도 한다. 본 논문에서는 문단과 질문 두 가지 관점에서 적대적 예시 데이터를 사용하여 보다 강건한 질의응답 모델을 훈련하는 방식을 제안한다. 트랜스포머 인코더 모델을 활용하였으며, 데이터를 생성하기 위해서 KorQuAD 1.0 데이터셋에 적대적 예시를 추가하여 실험을 진행하였다. 적대적 예시를 이용한 데이터로 실험한 결과, 기존 모델보다 1% 가량 높은 성능을 보였다. 또한 질의의 적대적 예시 데이터를 활용하였을 때, 기존 KorQuAD 1.0 데이터에 대한 성능 향상을 확인하였다.

  • PDF

수중 데이터 통신을 위한 변조방식의 성능 비교 (The Performance Comparison of Digital Modulations for Underwater Data Communication)

  • 손근영;노용주;윤종락
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 하계학술발표대회 논문집 제19권 1호
    • /
    • pp.429-432
    • /
    • 2000
  • 수중에서 AUV신호나 화상데이터의 정확한 고속 전송 등을 위해 수중 데이터 통신에 대한 많은 연구가 진행되어 왔다. 수중 데이터 통신에서 잔향과 배경 잡음 등의 해양 환경 특성을 극복하는 것은 신뢰성 있는 통신 환경을 이룩하는데 중요하다. 특히 해면과 해저로 이루어진 천해 환경에서 해면과 해저 반사파에 의한 영향은 수중 데이터 통신의 성능을 좌우하는 중요한 요소 중의 하나로 알려져 있다. 이러한 환경적 영향을 최소화하여 높은 성능의 통신 환경을 제공하기 위해 다중경로의 영향을 적게 받는 변조방식을 선택하는 것이다. 수중 데이터 통신에서 일반적으로 사용되는 변조방식은 FSK, PSK, DPSK 등이 있다. 본 연구에서는 해면$\cdot$해저로 이루어진 해양 통신 채널에서 세 가지 변조방식의 성능을 수치모의실험을 통하여 비교$\cdot$분석하였다. 수치모의실험에서 해면 해저로 이루어진 천해의 해양 통신 채널은 음원 영상법을 적용하여 구성하였으며 각 변조방식의 성능은 BER(Bit Error Ratio)로 나타내었다.

  • PDF

모멘트와 바이어스 학습법에 의한 학습 성능 (Learning performance of by the momentum and the bias learning method)

  • 김은미;이배호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.431-434
    • /
    • 2005
  • 근원데이터나, 이원데이터를 이용한 문제를 해결하기 위해서는 많은 경우에 완전 해를 갖는 문제로 변형시키기 위해 정규화할 필요성이 있다. 본 논문에서는 이러한 정규화 인수를 찾는 문제를 기존의 GCV, L-Curve, 그리고 이원데이터를 RBF 신경회로망에 적용시킨 커널 학습법에 대한 각각의 성능을 비교실험을 통해 고찰한다. 이때 커널을 이용한 학습법의 성능을 향상하기 위해, 전체학습과 성능의 제한적 비례관계라는 설정아래, 각각의 학습에 따라 능동적으로 변화하는 동적모멘텀의 도입을 제안한다. 끝으로 제안된 동적모멘텀이 분류문제의 표준인 Iris 데이터, Singular 시스템의 대표적 모델인 가우시안 데이터, 그리고 마지막으로 1차원 이미지 복구문제인 Shaw데이터를 이용한 각각의 실험에서 분류문제와 회계문제 양쪽 모두에 있어 기존의 GCV, L-Curve와 동등하거나 우수한 성능이 있음을 보인다.

  • PDF

이질적 분산시스템을 위한 XML 기반 성능데이터 관리 (XML-Based Performance Dat a Management for Heterogeneous Distributed System)

  • 김영희;이금석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (3)
    • /
    • pp.70-72
    • /
    • 2001
  • 분산 시스템의 규모가 점점 커지고 이기종 환경이 증가함에 따른 시스템 관리가 더욱 어려워지고 있다. 물리적으로 원거리에 위치한 자원들의 상태를 감독하고 시스템 운용을 위해 많은 인력과 시간을 낭비하는 문제점 또한 대두되고 있다. 이러한 분산 시스템의 부수적인 문제를 해결하기 위한 분산 시스템 관리의 효율적인 운영을 위해서 각 분산 시스템의 일관된 성능 데이터 관리 방안이 필요하다. 이기종의 시스템들을 관리할 경우 각 시스템들의 성능 데이터들이 상이한 형식을 가지고 있기 때문에 플랫폼에 독립적이지가 못하다. 그러므로 시스템의 성능을 나타내는 데이터를 정형적인 형식을 정해서 표면, 관리하는 것이 필요하다. 본 논문에서는 XML과 XML 스키마를 사용해서 이질적인 시스템간의 성능 데이터에 대한 일관된 형식을 제공하고 플랫폼에 독립적인 관리 방안을 제안한다.

  • PDF

작은 데이터에 대한 베이지안망 분류기(BNC)의 베이지안 모델 평균화(BMA) 성능 평가 (Evaluation of Bayesian Model Averaging (BMA) of Bayesian Network Classifiers (BNCs) on Small Datasets)

  • 황규백;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.22-24
    • /
    • 2003
  • 작은 데이터에서 베이지안망 분류기(Bayesian network classifier, BNC)를 학습할 때, 과대적합(overfitting)으로 인한 일반화 성능의 저하가 초래된다 이런 경우, 베이지안 모델 평균화(Bayesian model averaging, BMA)는 모델 자체에 대한 불확실성을 분석 과정에서 고려함으로써, 성능 저하를 피할 수 있는 수단을 제공한다. 본 논문에서는 BNC의 BMA의 작은 데이터에 대한 성능을 평가 및 분석한다. 특히, 노드의 순서에 대한 평균화의 효과가 연구된다. 인공데이터에 대한 실험 결과, 노드의 순서가 BNC의 BMA의 분류 성능에 미치는 영향은 지대하며, 이는 데이터의 크기가 극히 작은 경우의 성능 저하에 직접적인 원인이 된다.

  • PDF

디스크 배열에서 작은쓰기 문제 해결을 위한 압축 패리티 로깅 기법 (Compressed Parity Logging for Overcoming the small Write Problem in Redundant Disk Arrays)

  • 김근혜;김성수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (3)
    • /
    • pp.12-14
    • /
    • 1998
  • 본 논문은 RAID5가 갖는 쓰기 문제를 극복하기 위하여 지금까지의 연구 중에서 가장 우수한 성능을 나타내는 패리티 로깅 기법의 단점을 개선한 새로운 패리티 로깅 기법을 제안한다. 제안된 기법은 패리티 로깅기법에서 가장 큰 오버헤드인 패리티 로그의 크기를 줄이기 위하여 로그 데이터를 압축하는 방법을 사용한다. 로그 데이터의 압축은 로그 데이터의 저장에 필요한 비휘발성 버퍼의 크기와 로그 데이터 접근시간을 감소시켜 전체적인 성능을 향상시킬수 있다. 시뮬레이션을 통한 성능분석 결과에서 제안된 기법은 기존의 패리티 로깅 기법에 비하여 디스크 접근시간에서 우수한 성능을 나타냄을 보인다.

  • PDF

데이터 액세스 확률의 제곱근 법칙을 이용한 상호 관련 데이터 할당 기법 (An Interdependent Data Allocation Scheme Using Square Root Rule of Data Access Probability)

  • 권혁민
    • 한국인터넷방송통신학회논문지
    • /
    • 제15권5호
    • /
    • pp.75-84
    • /
    • 2015
  • 데이터 할당 기술은 데이터 방송 시스템의 성능을 향상시키기 위해서 필수적이다. 본 논문은 질의 프로파일과 질의 요청 확률이 주어진 환경에서 다중 데이터 질의를 처리하기 위하여 방송채널에 데이터를 할당하는 주제를 연구하여 IDAS(Interdependent Dta Allocation Scheme)로 명명된 새로운 데이터 할당 기법을 제안한다. 제안된 기법은 각 데이터의 방송빈도를 자신의 상대적 액세스 확률의 제곱근 값에 비례하게 설정하는 전략을 채택한다. IDAS 기법은 요청 확률이 높은 질의들을 빠르게 처리할 수 있고 적절한 수준의 질의 데이터 인접성을 보일 수 있기 때문에 질의 응답 시간의 성능을 향상시킬 수 있다. 제안된 기법의 성능 평가를 위해 시뮬레이션이 수행되었다. 실험 결과에 따르면, 평균 응답시간의 성능에서 IDAS는 다른 기법보다 우수한 성능을 보인다.