• 제목/요약/키워드: 데이터 속도

검색결과 5,666건 처리시간 0.033초

데이터 불균형 해결을 위한 Under-Sampling 기반 앙상블 SVMs (EUS SVMs: Ensemble of Under-Sampled SVMs for Data Imbalance Problems)

  • 강필성;조성준
    • 한국경영과학회:학술대회논문집
    • /
    • 대한산업공학회/한국경영과학회 2006년도 춘계공동학술대회 논문집
    • /
    • pp.291-298
    • /
    • 2006
  • 패턴인식 문제에서 한 범주에 속한 데이터의 수가 다른 범주에 속한 데이터의 수보다 극히 많거나 적으면 데이터 불균형이 발생했다고 한다. Support Vector Machine(SVM)은 다른 기계 학습 알고리즘들과 마찬가지로 학습에 사용되는 데이터의 범주간 비율이 거의 비슷하다는 가정 하에서 학습을 하고 예측 결과를 도출하게 된다. 그러나 실제 문제에서는 데이터의 불균형이 발생하는 경우가 매우 빈번하며, 이러한 경우에는 모델의 성능이 매우 저하되는 문제점이 발생한다. 본 논문에서는 실제로 데이터 불균형이 SVM의 분류 결과에 어떠한 영향을 미치는지를 2차원 인공 데이터를 통하여 알아본다. 그리고 이러한 데이터 불균형을 해소하기 위하여 Under-Sampling 기반 앙상블 SVM을 제안하였다. 제안된 방법을 두 가지 인공 데이터에 적용하여 본 결과, 제안된 방법은 데이터 불균형을 해소하기 위해 사용되는 기존의 방법들에 비하여 소수 범주에 속하는 데이터의 수가 매우 적고 데이터의 불균형이 매우 심한 경우에도 높은 성능과 안정성을 갖는 효과적인 방법이라는 것이 입증되었다.

  • PDF

고속도로에서 GPS데이터를 이용한 연비 향상 방안 (A Fuel Economy Improvement Method using GPS data in Highway)

  • 최성철;이원호;문병구;김영일;한영민
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2011년도 춘계학술논문집 2부
    • /
    • pp.537-539
    • /
    • 2011
  • 최근의 차량 연비는 엔진, 파워트레인 등 차량의 구성품들을 성능 개선하여 많이 향상 되었으나 연비 측정은 현재도 주어진 모드(LA-4, FTP-75 등)에서 컴퓨터 모의시험 및 다이나모에서 수행한다. 본 논문에서는 차량에 미리 장착된 지리정보데이터와 현재 주행하면서 수신되는 GPS 데이터를 이용하여 약 213Km 영동고속도로를 주행하면서 실제 도로의 연비 향상 방안을 도출한다. 지리정보데이터와 주행하면서 수신한 GPS 데이터 중에서 거리와 고도 데이터를 추출하여 각 구간의 경사도, 주행저항을 계산, 연비향상 알고리즘에 따른 속도 프로파일을 영동고속도로 전 구간에 대해서 완성하고 이 속도 프로파일로 컴퓨터를 이용한 AVL사의 CRUISE 프로그램으로 모의 주행하여 연비를 산출하고 연비 향상 방안을 제안한다.

  • PDF

택시 데이터를 이용한 구간 내 교통량과 차량 속도 간의 상관관계 분석 (Correlation Analysis between Traffic and Speed on the road using Taxi Data)

  • 김호용;정한민
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 추계학술대회
    • /
    • pp.586-589
    • /
    • 2018
  • 도로 교통 시스템에 빅데이터 기술이 융합되면서 운전자와 보행자에게 편리하고 도움이 되는 새로운 서비스들이 생겨나고 있다. 다양한 교통 데이터를 수집하고 분석함으로써 교통 시스템에서 흔히 발생할 수 있는 정체 현상 또는 교통량 등을 예측하는 모델이 개발되고 있다. 본 논문에서는 대구시에서 수집한 택시 경로 데이터를 이용하여 대구시의 지도 위에 해당 데이터를 시각화한다. 그 다음으로 대구 시 내의 도로 구간을 설정하고, 택시 데이터의 위치와 속도 데이터, 그리고 도로 구간 정보를 이용하여 해당 구간의 교통량과 구간에서의 차량 평균 속도를 구한다. 이 결과를 이용하여 특정 도로 구간에 대한 교통 시스템 문제 파악에 도움을 주고자 한다.

  • PDF

예측을 이용한 효율적인 K-Means 알고리즘 (An Efficient K-means Clustering Algorithm using Prediction)

  • 지태창;이현진;이일병
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.3-4
    • /
    • 2008
  • 본 논문에서 k-means 군집화 알고리즘을 효율적으로 적용하는 방법을 제안했다. 제안하는 알고리즘의 특징을 속도 향상을 위해 예측 데이터를 이용한 것이다. 군집화 알고리즘의 각 단계에서 군집을 변경할 데이터만 최인접 군집을 계산함으로써 계산 시간을 줄일 수 있었다. 제안하는 알고리즘의 성능 비교를 위해서 KMHybrid 와 비교했다. 제안하는 알고리즘은 데이터의 차원이 큰 경우에 KMHybrid 보다 높은 속도 향상을 보였다.

로컬 프레임 속도 변경에 의한 데이터 증강을 이용한 트랜스포머 기반 음성 인식 성능 향상 (Improving transformer-based speech recognition performance using data augmentation by local frame rate changes)

  • 임성수;강병옥;권오욱
    • 한국음향학회지
    • /
    • 제41권2호
    • /
    • pp.122-129
    • /
    • 2022
  • 본 논문은 프레임 속도를 국부적으로 조절하는 데이터 증강을 이용하여 트랜스포머 기반 음성 인식기의 성능을 개선하는 방법을 제안한다. 먼저, 원래의 음성데이터에서 증강할 부분의 시작 시간과 길이를 랜덤으로 선택한다. 그 다음, 선택된 부분의 프레임 속도는 선형보간법을 이용하여 새로운 프레임 속도로 변경된다. 월스트리트 저널 및 LibriSpeech 음성데이터를 이용한 실험결과, 수렴 시간은 베이스라인보다 오래 걸리지만, 인식 정확도는 대부분의 경우에 향상됨을 보여주었다. 성능을 더욱 향상시키기 위하여 변경 부분의 길이 및 속도 등 다양한 매개변수를 최적화하였다. 제안 방법은 월스트리트 저널 및 LibriSpeech 음성 데이터에서 베이스라인과 비교하여 각각 11.8 % 및 14.9 %의 상대적 성능 향상을 보여주는 것으로 나타났다.

이기종 IoT 장치간의 데이터 전송 속도 차이로 인한 데이터 손실 방지 기법 (The prevent method of data loss due to differences in bit rate between heterogeneous IoT devices)

  • 서형윤;박정규
    • 한국정보통신학회논문지
    • /
    • 제23권7호
    • /
    • pp.829-836
    • /
    • 2019
  • IoT 장치들은 네트워크 구성에 많이 사용되고 있고, 증가하고 있다. 데이터는 필요에 따라서 이기종의 IoT 장치를 통하여 전송된다. 본 논문에서는 Bluetooth 5를 이용하여 내부 네트워크를 구성하고, LoRa(Long Range)를 통하여 데이터 전송할 때 발생하는 전송 데이터 손실을 방지하기 위한 기법을 제안한다. Bluetooth 5가 LoRa의 데이터 전송 속도에 비해 빠르므로 LoRa를 통하여 데이터를 전송할 때 데이터 손실 문제가 발생한다. 본 논문에서 제안하는 전송 데이터 손실 방지 기법은 Bluetooth 5와 LoRa 뿐 아니라 이기종의 IoT 장치의 데이터 전송 속도 차이로 인해 발생하는 데이터 손실을 방지할 수 있을 것으로 기대한다. 또한 본 논문에서는 제안하는 데이터 손실 방지 기법을 적용하여 시뮬레이션 결과를 보인다. 2가지 방법으로 시뮬레이션 했을 때 전송 성능과 저장에 필요한 메모리 양 을 보인다.

퍼지값을 갖는 데이터에 대한 퍼지 클러스터링 (Fuzzy Clustering for Fuzzy Data1)

  • 이건명
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.27-29
    • /
    • 1998
  • 클러스터링은 데이터의 특성 추출, 데이터의 압축 등을 목적으로 동일 클러스터에 속하는 데이터간에는 유사성이 크도록 하면서 다른 클러스터에 속하는 데이터간에는 유사성이 작도록 데이터를 군집화하는 것이다. 일상에서 발생하는 많은 데이터에는 관측 오류, 불확실성, 주관적인 판정 등으로 인해서 데이터의 속성값이 정확한 값으로 주어지지 않은 경우가 있다. 본 논문에서는 분명한 값뿐만 아니라 퍼지값도 포함한 데이터들에 대해서 퍼지 클러스터링하는 방법을 제안한다.

  • PDF

TCP/IP 소켓통신에서 대용량 스트링 데이터의 전송 속도를 높이기 위한 송수신 모델 설계 및 구현 (A design and implementation of transmit/receive model to speed up the transmission of large string-data sets in TCP/IP socket communication)

  • 강동조;박현주
    • 한국정보통신학회논문지
    • /
    • 제17권4호
    • /
    • pp.885-892
    • /
    • 2013
  • TCP/IP소켓 통신을 활용하여 데이터를 송수신하는 송수신 모델에서 데이터의 크기가 작고 데이터 전송 요청이 빈번하지 않을 경우 서버와 클라이언트 간 통신 속도의 중요성은 부각되지 않지만 오늘날 대용량 데이터에 대한 전송 요청과 빈번한 데이터 전송 요청에서 송수신 모델의 통신 속도에 대한 중요성이 부각되고 있다. 본 논문은 대용량의 데이터를 전송하는 서버의 전송 구조와 데이터를 수신하는 클라이언트의 수신 구조를 변경하여 멀티 코어(이하 CMP : ChipMulti Processor) 환경에서 데이터 전송 속도에 대한 성능향상을 기대할 수 있는 보다 효율적인 TCP/IP 송수신 모델을 제안한다.

데이터 전송속도 이론 및 측정 기반의 LTE-Advanced와 IEEE802.16m의 비교 분석 (Comparison and Analysis of LTE-Advanced and IEEE802.16m Based on Data Transmission Speed Theory and Measurement)

  • 유황준;가민경;김봉현;조동욱;김종욱
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2011년도 추계학술논문집 1부
    • /
    • pp.231-234
    • /
    • 2011
  • 현재 상용화 중인 4세대 이동통신의 사용자가 급증하고 있다. 현재 4세대 이동통신 국내 가입자는 천만 명이 넘어섰으며, 4세대 이동통신에 어느 기술이 사용이 되고 데이터 전송속도가 얼마나 빠른지 알고 사용하는 사람은 많지 않다. 따라서 본 논문에서는 4세대 이동통신에 사용되고 있는 3GPP계열의 LTE-Advanced와 와이맥스 계열의 IEEE802.16m의 데이터 전송속도 기반의 이론적인 속도값과 현재 상용화된 4세대 이동통신의 데이터 전송속도의 실제 측정값을 비교, 분석하여 상호간의 특징적 차이를 분석하는 연구를 수행하였다.

  • PDF

시공간적 영향력을 반영한 딥러닝 기반의 통행속도 예측 모형 개발 (Development of Traffic Speed Prediction Model Reflecting Spatio-temporal Impact based on Deep Neural Network)

  • 김영찬;김준원;한여희;김종준;황제웅
    • 한국ITS학회 논문지
    • /
    • 제19권1호
    • /
    • pp.1-16
    • /
    • 2020
  • 4차 산업혁명 시대가 도래함에 따라 빅데이터를 활용하는 딥러닝에 대한 관심이 높아졌으며 다양한 분야에서 딥러닝을 이용한 연구가 활발하게 진행되고 있다. 교통 분야에서도 교통빅데이터를 많이 활용하는 만큼 딥러닝을 연구에 이용한다면 많은 이점이 있을 것이다. 본 연구에서는 통행속도를 예측하기 위하여 딥러닝 기법인 LSTM을 이용한 단기 통행속도 예측 모형을 구축하였다. 예측에 활용한 데이터인 통행속도 데이터가 시계열 데이터인 것을 고려하여 시계열 예측에 적합한 LSTM 모델을 선택하였다. 통행속도를 보다 정확하게 예측하기 위하여 시간적, 공간적 영향을 모두 반영하는 모형을 구축하였으며, 모형은 1시간 이후를 예측하는 단기 예측모형이다. 분석데이터는 서울시 교통정보센터에서 수집한 5분 단위 통행속도를 활용하였고 분석구간은 교통이 혼잡한 강남대로 일부구간으로 선정하여 연구를 수행하였다.