• 제목/요약/키워드: 대규모 망 성능 평가

검색결과 36건 처리시간 0.032초

정질적 기준을 이용한 다층신경망 기반 화자증명 시스템의 등록속도 단축방법 (Improving Speaker Enrolling Speed for Speaker Verification Systems Based on Multilayer Perceptrons by Using a Qualitative Background Speaker Selection)

  • 이태승;황병원
    • 한국음향학회지
    • /
    • 제22권5호
    • /
    • pp.360-366
    • /
    • 2003
  • 다층신경망 (multilayer perceptron)이 다른 패턴인식 방법에 비해 여러 가지 이점을 제공하지만 다층신경망에 기반한 화자증명 시스템은 낮은 증명오류를 달성하기 위한 대규모 배경화자로 인한 느린 등록속도의 문제를 안는다. 이 문제를 해결하기 위해 QnDCS(quantitative discriminative cohort speakers) 방법에서 화자군집 방법을 다층신경망 기반화자증명 시스템에 도입하여 화자등록에 필요한 배경화자의 수를 줄이려는 시도가 있었다. QnDCS 방법이 목적을 어느 정도 달성하긴 했지만 등록속도의 향상률이 만족할만한 수준이지 못했다. 본 논문에서는 보다 높은 등록속도 향상률을 달성하기 위한 방법으로서, 선택되는 배경화자의 수를 더욱 낮추는 정질에 기반한 기준을 도입한 QlDCS (qualitative discriminative cohort speakers) 방법을 제안한다. 두 방법에 대한 성능평가를 위해 다층신경망과 지속음에 기반한 화자증명 시스템과 음성 데이터베이스를 사용한 실험을 실시한다 그 결과 제안한 방법이 QlDCS에 비해 온라인 방식의 EBP (error backpropagation)에 대한 학습속도 향상률 면에서 2배 이상 더 짧은 시간 내에 화자를 등록하는 것으로 나타나 보다 높은 효율을 지녔음을 증명한다.

패턴분류를 위한 통계적 RBF 모델 (Statistical Radial Basis Function Model for Pattern Classification)

  • 최준혁;임기욱;이정현
    • 전자공학회논문지CI
    • /
    • 제41권1호
    • /
    • pp.1-8
    • /
    • 2004
  • 인터넷의 발달과 데이터베이스의 구축이 보편화됨에 따라 막대한 양의 데이터 속에서 의사 결정에 필요한 지식을 찾아내는 작업은 결코 쉬운 일이 아니다 본 논문에서는 대규모 데이터의 효율적인 분석을 위하여 지식의 탐사 이전에 데이터에 대한 축소 작업을 수행하기 위한 효과적인 차원 축소 전략에 의한 패턴분류 기법을 제안한다. 이를 위해 본 논문에서는 통계적학습 모형인 Support Vector Machine의 VC-dimension에 기반한 RBF 신경망 모형을 제안한다. 기존의 RBF 신경망 모형은 주로 퍼셉트론 모형의 전처리 작업만을 수행하지만 제안하는 신경망 모형은 VD-dimension과 연계한 독자적으로 데이터를 분석할 수 있는 능력을 갖춘 모형을 구축하고 이를 바탕으로 개체들을 정확한 레이블로 분류한다. 기계 학습 데이터를 이용하여 본 논문에서 제안하는 모형의 성능을 비교 평가한 결과 기존의 여러 분류 알고리즘에 비해 우수한 성능을 보임이 실험을 통해 확인되었다.

심층 신경망을 활용한 진료 기록 문헌에서의 종단형 개체명 및 관계 추출 비교 연구 - 파이프라인 모델과 결합 모델을 중심으로 - (A Comparative Research on End-to-End Clinical Entity and Relation Extraction using Deep Neural Networks: Pipeline vs. Joint Models)

  • 최성필
    • 한국문헌정보학회지
    • /
    • 제57권1호
    • /
    • pp.93-114
    • /
    • 2023
  • 정보추출은 문헌 내에 존재하는 개체명을 인식함과 동시에 이들 간의 의미적 관계까지도 식별하여 최종적으로 문헌 내에 포함된 의미적 트리플을 자동으로 추출하여 활용할 수 있으므로 문헌에 대한 심층적인 분석과 이해에 많은 도움을 줄 수 있다. 그러나 지금까지 대부분의 정보추출에 대한 연구는 개체명 인식과 관계추출이 개별 연구로 각각 분리되어 진행되었으며, 그 결과 입력 문헌에 대한 정보추출의 최종 출력인 의미적 트리플 추출 성능에 대한 객관적이고 정확한 평가가 제대로 이루어지지 않았다. 이에 본 논문에서는 진료 기록 문헌에 나타나는 개체명과 그들 간의 관계를 트리플 형태로 직접 추출할 수 있는 종단형 정보추출의 2가지 모델인 파이프라인 및 결합형 모델을 구축하는 구체적인 방법론을 제시하고 성능 비교 실험을 진행하였다. 우선 파이프라인 모델은 양방향 GRU-CRFs를 활용한 개체명 인식 모듈과 다중 인코딩 기반 관계추출 모듈로 구현되었고, 결합형 모델을 위해서는 다중 헤드 레이블링 기반의 양방향 GRU-CRFs이 적용되었다. 두 가지 시스템을 바탕으로 진료기록 문헌 내의 개체명과 관계를 모두 태깅하여 구축된 i2b2/VA 2010 데이터셋을 활용한 비교 실험에서 파이프라인 모델의 성능이 5.5%(F-measure) 더 높게 나타났다. 추가적으로, 대규모 신경망 언어모델과 수작업으로 구축된 자질 정보를 활용한 최고 수준의 기존 시스템과의 비교 실험을 통해, 본 논문에서 구현한 종단형 모델의 객관적인 성능 수준을 파악할 수 있었다.

MANET에서 응용 서비스 데이터 유형에 따른 요구기반 라우팅 프로토콜의 성능비교 (A Performance Comparison of On-Demand Routing Protocols for Application Services in MANET)

  • 장준영;이길섭;이승종
    • 정보처리학회논문지C
    • /
    • 제11C권7호
    • /
    • pp.871-878
    • /
    • 2004
  • 최근 MANET은 다양한 분야에서 관심의 대상이 되고 있다. 본 논문에서는 DSR, AODV, TORA 등과 같은 요구 기반 라우팅 프로토콜을 대상으로 응용 서비스, 대역폭, 데이터 전송률 사이의 관계를 분석하여 제시하고자 한다. 응용 서비스 데이터는 센서 데이터, 문자 데이터, 음성 데이터, 영상 데이터로 분류하였다. 실험은 OPNET을 사용하여 약 20개의 노드로 구성된 Ad-hoc 네트워크를 설계하여 실시하였다. 실험의 평가척도는 패킥 전송 성공률, 평균 종단 지연 미 라우팅 로드의 3가지로 하였으며, 실험 결과로서 응용 서비스 데이터 유형에 따라 최적의 요구 기반 라우팅 알고리즘의 선정과 이를 지원하기 위한 무선 통신 특성에 대한 재원을 얻을 수 있었다. 실험 결과를 종합해 보면 요구 기반 라우팅 프로토콜중 TORA가 가장 우수한 성능을 보였다. 본 실험의 연구 결과는 대규모 무선 네트워크를 위한 Ad-hoc 라우팅 프로토콜 개발시 기초자료로 활용될 것으로 기대한다.

미래인터넷 OpenFlow 테스트베드 구축을 위한 NetFPGA기반 캡슐레이터 구현 및 성능평가 (NetFPGA based capsulator Implementation and its performance evaluation for Future Internet OpenFlow Testbed)

  • 최윤철;민석홍;김병철;이재용;김대영
    • 대한전자공학회논문지TC
    • /
    • 제47권7호
    • /
    • pp.118-127
    • /
    • 2010
  • 패킷 기반의 TCP/IP 프로토콜 기반으로 구축된 인터넷 환경은 30년 넘게 사용되어 왔으나, 향후 통신환경의 급격한 변화와 다양한 사용자 요구사항의 증대로 인해 프로토콜 확장의 제약으로 인한 근본적인 문제점을 나타나게 될 것이다. 이를 해결하기 위해 Clean Slate 설계 방법에 기반을 둔 미래인터넷 연구가 진행되고 있고, 이를 실험하고 검증하기 위한 대규모 테스트베드 구축이 이루어질 것이다. 이를 위한 오픈 플로우 스위치 기술은 기존에 포설된 네트워크 장비를 활용하면서, 인터넷 트래픽에 영향을 주지 않고 독립적인 프로토콜을 시험할 수 있도록 하는 새로운 기술로 제안되었다. 국내에서도 테스트베드 구축의 한 방법으로 NetFPGA기반 오픈 플로우 스위치를 활용한 망구성이 연구되고 있으며 이러한 구조에서 인터넷망을 통한 오픈플로우 스위치 간 연결이 이루어지기 위해서는 오픈 플로우 스위치 간 논리적인 터널링이 제공되어야 한다. 이에 대한 해결책으로 본 논문에서는 NetFPGA 기반의 캡슐레이터를 구현하여 국내연구망인 KOREN에 구현된 여러 오픈 플로우 사이트 간에 MAC in IP 터널링이 이루어 질 수 있도록 하였고 이의 성능을 측정하였다. 측정 결과 기존 소프트웨어 기반의 캡슐레이터에 비해 성능이 향상되었음을 확인하였고, 미래인터넷 기술을 실험할 수 있는 테스트 베드로 활용할 수 있음을 보였다.

머신러닝을 이용한 광역 금속 광상 배태 잠재성 평가 인자 분석 (Analysis of Regional Potential Mapping Factors of Metal Deposits using Machine Learning)

  • 박계순
    • 지구물리와물리탐사
    • /
    • 제23권3호
    • /
    • pp.149-156
    • /
    • 2020
  • 복잡하고 다양한 광상 생성 과정과 부존 위치의 심부화로 인하여 광물자원 탐사의 효율을 높일 수 있는 예측탐사의 필요성이 점차 높아지고 있다. 최근의 머신러닝 기법의 활용성 증가와 광역 지질 데이터베이스의 구축 상황을 고려하면, 예측탐사의 기반인 광상 배태 가능성 평가 기술의 신뢰도는 점차 높아질 것으로 예상된다. 이번 연구에서는 심층신경망을 이용하여 화성암과 단층 및 자력탐사 정보의 광화 인자로의 활용 가능성을 확인하였다. 지질 정보의 수치화 기법으로 단층, 화성암, 자력 정보를 입력 자료로 구성하여 0.9 이상의 정확도를 가지며 예측 값이 안정적으로 수렴하는 금속 광상 예측 모델을 구축할 수 있었다. 이 기술은 추후 정밀한 지질 조사 결과와 물리탐사 정보가 확보된다면, 광화대 규모에서의 예측 탐사에도 활용할 수 있을 것으로 기대된다. 또한, 이 연구를 통해 지하의 화성암 정보를 제공하는 자력자료를 활용할 경우 지표의 화성암 정보를 보완하여 보다 높은 성능의 모델을 구축할 수 있는 것으로 확인되었다. 즉, 단순히 많은 자료를 융합하는 것 보다는 광체 성인과의 지질학적 상관관계를 고려하여 입력 자료를 구성하는 것이 보다 중요하다.

Word2Vec과 가속화 계층적 밀집도 기반 클러스터링을 활용한 효율적 봇넷 탐지 기법 (An Efficient BotNet Detection Scheme Exploiting Word2Vec and Accelerated Hierarchical Density-based Clustering)

  • 이태일;김관현;이지현;이수철
    • 인터넷정보학회논문지
    • /
    • 제20권6호
    • /
    • pp.11-20
    • /
    • 2019
  • 수많은 기업체, 기관, 개인 사용자가 대규모 DDos(Distributed Denial of Service)공격에 의한 피해에 노출되고 있다. DDoS 공격은 좀비PC라 불리는 수많은 컴퓨터들과 계층적 지령구조를 좀비PC들을 제어하는 네트워크인 봇넷을 통하여 수행된다. 통상의 악성코드 탐지 소프트웨어나 백신은 멀웨어를 탐지하기 위해서 사전에 심층 분석을 통한 멀웨어 시그니처를 밝혀야 하며, 이를 탐지 소프트웨어나 백신에 업데이트하여야 한다. 이 과정은 방대한 시간과 비용이 소모된다. 본고에서는 인공신경망 모델을 이용하여 주기적인 시그니처 사전 업데이트가 필요 없는 봇넷 탐지기법을 제안한다. 제안하는 인공신경망 모델은 Word2Vec과 가속화 계층적 밀집도 기반 클러스터링을 활용한다. 제안기법의 봇넷 탐지성능은 CTU-13 데이터셋을 이용하여 평가하였다. 성능평가 결과, 분류 정확도 99.9%로 기존 방법에 비해 우수한 멀웨어 탐지율을 보인다.

IoT 스트리밍 센서 데이터에 기반한 실시간 PM10 농도 예측 LSTM 모델 (Real-time PM10 Concentration Prediction LSTM Model based on IoT Streaming Sensor data)

  • 김삼근;오택일
    • 한국산학기술학회논문지
    • /
    • 제19권11호
    • /
    • pp.310-318
    • /
    • 2018
  • 최근 사물인터넷(IoT)의 등장으로 인터넷에 연결된 다양한 기기들에 의해 대규모의 데이터가 생성됨에 따라 빅데이터 분석의 중요성이 증가하고 있다. 특히 실시간으로 생성되는 대규모의 IoT 스트리밍 센서 데이터를 분석하여 새로운 의미 있는 미래 예측을 통해 다양한 서비스를 제공하는 것이 필요하게 되었다. 본 논문은 AWS를 활용하여 IoT 센서로부터 생성되는 스트리밍 데이터에 기반하여 실시간 실내 PM10 농도 예측 LSTM 모델을 제안한다. 또한 제안 모델에 따른 실시간 실내 PM10 농도 예측 서비스를 구축한다. 논문에 사용된 데이터는 PM10 IoT 센서로부터 24시간 동안 수집된 스트리밍 데이터이다. 이를 LSTM의 입력 데이터로 사용하기 위해 PM10 시계열 데이터로부터 30개의 연속된 값으로 이루어진 시퀀스 데이터로 변환한다. LSTM 모델은 바로 인접한 공간으로 이동해 가는 슬라이딩 윈도우 프로세스를 통하여 학습한다. 또한 모델의 성능 개선을 위해 24시간마다 수집한 스트리밍 데이터에 대해 점진적 학습 방법을 적용한다. 제안한 LSTM 모델의 성능을 평가하기 위해 선형회귀 모델 및 순환형 신경망(RNN) 모델과 비교한다. 실험 결과는 제안한 LSTM 예측 모델이 선형 회귀보다 700%, RNN 모델보다는 140% 성능 개선이 있음을 보여주었다.

리피터 노드를 이용한 Scalable CC-NUMA 시스템 (Scalable CC-NUMA System using Repeater Node)

  • 경진미;장성태
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제29권9호
    • /
    • pp.503-513
    • /
    • 2002
  • CC-NUMA구조에서는 원격 메모리에 대한 접근이 불가피한 구조적인 특성 때문에 상호 연결망이 성능을 좌우하는 큰 변수로 작용한다. 기존에 사용되는 버스는 대역폭의 한계와 물리적 확장성 때문에 대규모의 시스템에는 적합하지 않다. 이를 대체하는 고속의 지점간 링크를 도입한 이중 링 구조는 이러한 버스의 한계를 극복하고는 있지만 많은 노드를 거쳐야 하는 문제로 인해 응답 지연 시간이 증가하는 단점을 안고 있다. 본 논문에서는 요청과 응답 패킷의 지연 시간을 줄이는 방안으로 리피터 노드를 이용한 다중 링을 제안한다. 제안된 시스템은 링과 링 사이의 구조가 대칭형을 이루고 있어 요청을 내보내는 링을 제외한 다른 링의 hop수는 똑같은 수치를 갖고 있으며, 이중 링에 비해 최대의 hop수와 최소의 hop수의 차가 적고 평균 hop수 또한 적어 좋은 성능을 보인다. 본 논문에서는 또한 이러한 구조를 유지하기 위한 리피터 노드의 구조를 제안하며 리피터 노드의 구조와 노드의 확장에 따른 다양한 성능을 확률 구동 시뮬레이터를 사용하여 평가를 수행한다.

전이학습 기반 다중 컨볼류션 신경망 레이어의 활성화 특징과 주성분 분석을 이용한 이미지 분류 방법 (Transfer Learning using Multiple ConvNet Layers Activation Features with Principal Component Analysis for Image Classification)

  • 바트후 ?바자브;주마벡 알리하노브;팡양;고승현;조근식
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.205-225
    • /
    • 2018
  • Convolutional Neural Network (ConvNet)은 시각적 특징의 계층 구조를 분석하고 학습할 수 있는 대표적인 심층 신경망이다. 첫 번째 신경망 모델인 Neocognitron은 80 년대에 처음 소개되었다. 당시 신경망은 대규모 데이터 집합과 계산 능력이 부족하여 학계와 산업계에서 널리 사용되지 않았다. 그러나 2012년 Krizhevsky는 ImageNet ILSVRC (Large Scale Visual Recognition Challenge) 에서 심층 신경망을 사용하여 시각적 인식 문제를 획기적으로 해결하였고 그로 인해 신경망에 대한 사람들의 관심을 다시 불러 일으켰다. 이미지넷 첼린지에서 제공하는 다양한 이미지 데이터와 병렬 컴퓨팅 하드웨어 (GPU)의 발전이 Krizhevsky의 승리의 주요 요인이었다. 그러므로 최근의 딥 컨볼루션 신경망의 성공을 병렬계산을 위한 GPU의 출현과 더불어 ImageNet과 같은 대규모 이미지 데이터의 가용성으로 정의 할 수 있다. 그러나 이러한 요소는 많은 도메인에서 병목 현상이 될 수 있다. 대부분의 도메인에서 ConvNet을 교육하기 위해 대규모 데이터를 수집하려면 많은 노력이 필요하다. 대규모 데이터를 보유하고 있어도 처음부터 ConvNet을 교육하려면 많은 자원과 시간이 소요된다. 이와 같은 문제점은 전이 학습을 사용하면 해결할 수 있다. 전이 학습은 지식을 원본 도메인에서 새 도메인으로 전이하는 방법이다. 전이학습에는 주요한 두 가지 케이스가 있다. 첫 번째는 고정된 특징점 추출기로서의 ConvNet이고, 두번째는 새 데이터에서 ConvNet을 fine-tuning 하는 것이다. 첫 번째 경우, 사전 훈련 된 ConvNet (예: ImageNet)을 사용하여 ConvNet을 통해 이미지의 피드포워드 활성화를 계산하고 특정 레이어에서 활성화 특징점을 추출한다. 두 번째 경우에는 새 데이터에서 ConvNet 분류기를 교체하고 재교육을 한 후에 사전 훈련된 네트워크의 가중치를 백프로퍼게이션으로 fine-tuning 한다. 이 논문에서는 고정된 특징점 추출기를 여러 개의 ConvNet 레이어를 사용하는 것에 중점을 두었다. 그러나 여러 ConvNet 레이어에서 직접 추출된 차원적 복잡성을 가진 특징점을 적용하는 것은 여전히 어려운 문제이다. 우리는 여러 ConvNet 레이어에서 추출한 특징점이 이미지의 다른 특성을 처리한다는 것을 발견했다. 즉, 여러 ConvNet 레이어의 최적의 조합을 찾으면 더 나은 특징점을 얻을 수 있다. 위의 발견을 토대로 이 논문에서는 단일 ConvNet 계층의 특징점 대신에 전이 학습을 위해 여러 ConvNet 계층의 특징점을 사용하도록 제안한다. 본 논문에서 제안하는 방법은 크게 세단계로 이루어져 있다. 먼저 이미지 데이터셋의 이미지를 ConvNet의 입력으로 넣으면 해당 이미지가 사전 훈련된 AlexNet으로 피드포워드 되고 3개의 fully-connected 레이어의 활성화 틀징점이 추출된다. 둘째, 3개의 ConvNet 레이어의 활성화 특징점을 연결하여 여러 개의 ConvNet 레이어의 특징점을 얻는다. 레이어의 활성화 특징점을 연결을 하는 이유는 더 많은 이미지 정보를 얻기 위해서이다. 동일한 이미지를 사용한 3개의 fully-connected 레이어의 특징점이 연결되면 결과 이미지의 특징점의 차원은 4096 + 4096 + 1000이 된다. 그러나 여러 ConvNet 레이어에서 추출 된 특징점은 동일한 ConvNet에서 추출되므로 특징점이 중복되거나 노이즈를 갖는다. 따라서 세 번째 단계로 PCA (Principal Component Analysis)를 사용하여 교육 단계 전에 주요 특징점을 선택한다. 뚜렷한 특징이 얻어지면, 분류기는 이미지를 보다 정확하게 분류 할 수 있고, 전이 학습의 성능을 향상시킬 수 있다. 제안된 방법을 평가하기 위해 특징점 선택 및 차원축소를 위해 PCA를 사용하여 여러 ConvNet 레이어의 특징점과 단일 ConvNet 레이어의 특징점을 비교하고 3개의 표준 데이터 (Caltech-256, VOC07 및 SUN397)로 실험을 수행했다. 실험결과 제안된 방법은 Caltech-256 데이터의 FC7 레이어로 73.9 %의 정확도를 얻었을 때와 비교하여 75.6 %의 정확도를 보였고 VOC07 데이터의 FC8 레이어로 얻은 69.2 %의 정확도와 비교하여 73.1 %의 정확도를 보였으며 SUN397 데이터의 FC7 레이어로 48.7%의 정확도를 얻었을 때와 비교하여 52.2%의 정확도를 보였다. 본 논문에 제안된 방법은 Caltech-256, VOC07 및 SUN397 데이터에서 각각 기존에 제안된 방법과 비교하여 2.8 %, 2.1 % 및 3.1 %의 성능 향상을 보였다.