• 제목/요약/키워드: 이상치 데이터 감소

검색결과 41건 처리시간 0.032초

Deep SVDD를 활용한 전동킥보드 사고 원인 분석 모델 설계 (Design of Accident Cause Analysis Model for Electric Scooters Using Deep SVDD)

  • 차예원;방진숙
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.1228-1229
    • /
    • 2023
  • 현대 도시 모빌리티의 중요한 구성 요소로 자리 잡은 전동킥보드는 편리한 이동 수단으로 인기를 얻고 있으나, 이에 따른 안전사고 증가로 운전자와 보행자의 안전이 심각하게 위협받고 있다. 본 논문에서는 전동킥보드 운전 중에 발생한 사고의 원인을 객관적으로 분석하고, 사고가 운전자의 부주의로 인한 것인지를 판별하며, 이로 인한 배상 책임을 정확하게 결정하기 위한 모델을 제안한다. 운전 중 수집된 센서 데이터를 활용하여 Deep SVDD (Deep Support Vector Data Description) 모델을 구축하고, 이상치 탐지를 통해 운전 패턴을 분류하며 운전자의 부주의로 인한 사고를 파악한다. 이를 통해, 정확하고 공정한 배상 책임 판단을 지원하며, 도시 모빌리티 분야에서 안전사고 감소에 기여할 것으로 기대된다.

LSTM-AutoEncoder를 활용한 선박 메인엔진의 이상 탐지 및 라벨링 (Outlier Detection and Labeling of Ship Main Engine using LSTM-AutoEncoder)

  • 김도희;한영재;김혜미;강성필;김기훈;배혜림
    • 한국빅데이터학회지
    • /
    • 제7권1호
    • /
    • pp.125-137
    • /
    • 2022
  • 운송 산업은 우리나라의 3면이 바다로 둘러싸여 있는 지리적 요건과 자원 소비량의 대부분을 수입에 의존하는 자원 빈곤 문제로 인해 중요한 산업 중 하나이다. 그 중에서도 해운업의 비중은 운송 산업의 대부분을 차지할 정도로 크며, 해운업에서의 유지보수는 선박의 운영 효율성 개선 및 비용 감소에 있어서도 중요하다. 그러나 현재 선박이 유지보수를 위해 일정기간 주기로 검사가 시행되고, 이에 따라 시간과 비용이 발생하며 원인규명도 제대로 되지 않고 있다. 따라서 본 연구에서는 제안 방법론인 LSTM-AutoEncoder를 활용해 실제 선박 운항 데이터에 대해 시점을 고려하여 선박 고장의 원인이 될 수 있는 이상 탐지를 수행한다. 또한 클러스터링을 통해 군집화를 수행하고 이상치에 대해 요인별로 그룹화를 통해 선박 메인엔진 고장의 잠재 원인을 규명한다. 이는 선박의 다양한 정보에 대해 보다 빠르게 모니터링이 가능하고, 이상 정도를 식별할 수 있다. 또한 현재 선박의 고장 감시시스템에 있어서도 구체화된 경보 점 설정과 고장 진단 체계를 갖추고, 유지보수시점을 찾는 데 도움을 줄 수 있을 것이다.

맞춤 접두 필터링을 이용한 효율적인 유사도 조인 (Efficient Similarity Joins by Adaptive Prefix Filtering)

  • 박종수
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권4호
    • /
    • pp.267-272
    • /
    • 2013
  • 데이터 정제나 복사 탐지와 같은 많은 응용들을 가진 중요한 연산인 유사도 조인은 도전적인 주제로 데이터집합에서 주어진 한계치 이상의 유사도를 가지는 모든 쌍의 레코드들을 찾는 것이다. 우리는 빠른 유사도 조인을 위해 후보 쌍들의 생성 시에 접두 필터링 원리를 강한 제약 조건으로 사용하는 새 알고리즘을 제안한다. 그 원리에 의해 한정된 접두 토큰들내에서 탐색 레코드의 현재 접두 토큰이 인덱싱 레코드의 접두 토큰을 공유할 때에만 후보 쌍이 생성된다. 이 생성 방법은 두 레코드들 사이에 공통부분의 상한 값을 계산할 필요가 없어서 실행시간을 감소시킨다. 실제 데이터 집합에 적용된 실험 결과는 제안된 알고리즘이 이전의 접두 필터링 방법의 알고리즘들에 비해 상당히 우수함을 보여준다.

추적데이터를 이용한 무궁화위성 1, 2호기 추력기 성능추정 (THRUSTER PERFORMANCE ESTIMATI0N OF KOREASAT F1 & F2)

  • 박봉규;박응식;문성철
    • Journal of Astronomy and Space Sciences
    • /
    • 제18권2호
    • /
    • pp.137-144
    • /
    • 2001
  • 1995년에 발사된 무궁화위성 1, 2호기 REA 추력기에 대한 성능을 지상국에서 측정된 추적데이터를 이용하여 추정하였다 추정에 사용된 추적데이터는 1999년 말에서 2000년 초에 측정된 값들을 사용하였다. 추정을 위해 사용된 기법은 일반적으로 널리 알려진 최소자승추정 법(Least Square Estimation)방법이며 궤도추정과 병행해서 추력기의 작동에 의해 발생하는 기동속도변화를 추정하도록 구성하였다 추력기 성능 추정 결과 무궁화위성 1호기 REA의 경우에 계획치 대 획득속도변화의 비율이 온펄스 모드의 경우 64%로서 상당히 많은 성능감소가 있었음을 알 수 있었으며 무궁화위성 2호의 경우는 5년 이상의 임무를 수행했음에도 불구하고 100%에 이르는 상당히 양호한 성능을 유지하고 있음을 밝힐 수 있었다

  • PDF

수중음향통신에서 Peak Detector를 갖는 시간동기회복에 관한 연구 (A Study on the Timing Recovery using Peak Detector in Underwater Acoustic Communication)

  • 한민수;김기만
    • 한국항해항만학회지
    • /
    • 제36권5호
    • /
    • pp.371-378
    • /
    • 2012
  • 본 논문에서는 OQPSK(Offset Quadrature Phase Shift Keying) 변복조를 사용하는 수중음향통신에서 시간동기회복을 위해 기존의 Gardner TED(Timing Error Detector)에 Parabolic Peak Interpolation 을 사용하는 Peak Detector를 첨가하여 위상 수렴속도를 상승시켜 송신 데이터양의 감소를 도모하였다. Parabolic Peak Interpolation을 이용하여 지속적으로 국소 최대 또는 최소의 근사치로 이동한 후 Gardner TED를 적용하기 때문에 시간동기화 안정화를 속도를 빨리함으로써 Preamble 구간의 데이터양을 절반으로 줄일 수 있고 또한 Preamble 구간에서도 위상 수렴을 하지 못하는 임계치에서 제안한 방법을 시뮬레이션한 결과 임계점에서 BER(Bit Error Rate)이 약 23%정도 성능이 개선되는 것을 확인할 수 있었다. 또한 실제 동해에서 수집한 데이터를 사용하여 기존의 Gardner TED만 사용하는 방법과 성능 비교 결과 송수신기 사이의 거리가 3 km 이었을 때 제안한 방법을 적용한 경우 기존의 방법에 비해 Converge speed가 1.4배 이상 상승하는 것을 확인할 수 있었고, BER측면에서도 약 20%정도 상승하는 것을 확인할 수 있었다.

균형-교환방법을 적용한 경제급전문제 최적화 알고리즘 (Optimization Algorithm for Economic Load Dispatch Problem Using Balance and Swap Method)

  • 이상운
    • 한국인터넷방송통신학회논문지
    • /
    • 제15권2호
    • /
    • pp.255-262
    • /
    • 2015
  • 경제급전 최적화 문제를 해결하는 결정론적인 알고리즘에 존재하지 않아 지금까지는 비결정론적인 휴리스틱 알고리즘들이 제안되고 있다. 본 논문은 균형과 교환 방법을 도입하여 경제급전의 최적화 문제를 풀 수 있는 알고리즘을 제안하였다. 제안된 알고리즘은 초기치에 대해 성인걸음수와 아기걸음 수별로 발전량을 감소시켜 ${\Sigma}P_i=P_d$로 균형을 맞추고, 이 때 최소 발전비용을 가진 방법을 선택한다. 다음으로 선택된 방법에 대해 성인걸음-아기걸음 교환과 거인걸음 교환 방법으로 최적화한 값을 구하여 최소값 방법을 선택한다. 마지막으로 선택된 방법에 대해 $P_i{\pm}{\beta}$, (${\beta}=0.1,0.01,0.001,0.0001$)의 교환을 수행하였다. 경제급전 문제의 시험사례로 빈번히 활용되고 있는 3개 데이터에 대해 제안된 알고리즘을 적용한 결과 2개 데이터에서는 성능을 향상시켰으며, 1개 데이터는 기존의 최적해와 동일한 결과를 얻었다. 제안된 알고리즘은 항상 동일한 결과를 얻을 수 있고, 모든 데이터에 적합하므로 경제급전 최적화 알고리즘으로 실제 적용이 가능하다.

우리나라 가뭄특성과 기상인자간의 저빈도 특성 분석 (Characterization of low frequency between Droughts and Meteorological factor in Korea)

  • 소병진;권현한
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2012년도 학술발표회
    • /
    • pp.418-418
    • /
    • 2012
  • 현재 전 세계적으로 온실가스 농도 증가로 호우나 가뭄, 대설 등 지역에 따라 서로 상반되는 변화를 가져올 수 있다고 경고되고 있으며, 우리나라에서도 남해안지역과 경기북부지역에서 호우빈도가 증가하는 반면, 충정도 내륙지역과 경상북도에서는 호우빈도가 감소하고 5일 누적 강수량 또한 감소하여, 해당지역에서 가뭄이 발생할 경우 심화될 가능성이 높아진다고 보고된 바 있다. 기후변화 시나리오에 분석결과에서도 우리나라의 경우 평균적으로 강우일수는 작아지며, 강우강도는 커지는 결과들이 도출되었다. 이러한 결과들은 가뭄의 발생가능성이 높아지고 있음을 보여주고 있다. 본 연구에서는 우리나라에서 발생된 가뭄의 특성을 분석하고 가뭄의 특성과 기상인자간의 관계를 Quantile regression 분석을 통해 살펴보고자 한다. 가뭄의 특성과 기상인자(엘니뇨, 강수량 등)의 관계에 있어서 기상인자들의 평균을 이용하는 일반적인 회귀분석은 전체 데이터의 영향에 따른 가뭄특성인자와의 관계를 보여준다. 하지만 강수량과 가뭄과의 관계에서와 같이 강수량의 극값보다는 적은 강수량 혹은 무강우일수가 가뭄과 밀접한 관련을 보여준다. 이러한 점에서 이상치들에 영향을 배재할 수 있는 Quantile regression을 사용하여 Quantile에 따른 기상인자와 가뭄특성과의 관계를 규명하고 평가해 보고자 한다. 본 연구에서 적용한 Quantile Regression 기법은 회귀계수의 추정에 있어서 회귀인자의 신뢰성을 아래와 같은 Quantile-회귀계수 그래프를 통해 분석할 수 있으며, 로버스트 통계량의 특징인 분산이 적은 안정적인 추정량을 확보할 수 있는 장점을 갖는다. 아래식은 Quantile regression의 회귀계수 추정식을 나타낸다. $$arg\;in\;{n\\\;p(y_i-f(x_i,\;z_i,\;{\cdots}))\\ =1}$$ 여기서, $y_i$는 가뭄특성값을 $x_i$, $z_i$, $\cdots$는 기상인자를 나타낸다. $$p(y-q)={{\beta}(y-q)\;y{\geq_-}q \\ (1-{\beta})(q-y)\;y<q}$$ ${\beta}$는 quantile을 나타내며 0< ${\beta}$ <1범위를 갖는다.

  • PDF

부도예측 개선을 위한 하이브리드 언더샘플링 접근법 (A Hybrid Under-sampling Approach for Better Bankruptcy Prediction)

  • 김태훈;안현철
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.173-190
    • /
    • 2015
  • 부도는 막대한 사회적, 경제적 손실을 야기할 수 있으므로, 미리 부도여부를 정확하게 예측하여 선제 대응하는 것은 경영분야에서 대단히 중요한 의사결정문제 중 하나이다. 이에 지능정보시스템 분야에서도 그간 기업의 재무 데이터에 기반해 부도예측을 개선하기 위한 노력을 기울여왔는데, 안타깝게도 기존의 연구들은 대부분 분류모형의 성능 개선을 통해 예측 정확도를 개선하는 것에만 주로 초점을 맞추어 다른 요소들을 충분히 고려하지 못했다는 한계가 있다. 이러한 배경에서 본 연구는 부도예측 모형의 정확도를 개선하기 위한 방편으로 새로운 데이터 전처리 방법, 그 중에서도 효과적인 표본추출 방법을 제안하고자 한다. 일반적으로 부도예측을 위해 사용되는 데이터들은 극심한 데이터 불균형 문제에 노출되어 있는데, 본 연구에서는 k-reverse nearest neighbor(k-RNN)와 one-class support vector machine(OCSVM) 방법을 결합한 하이브리드 언더샘플링(hybrid under-sampling) 접근법을 통해 이같은 데이터 불균형 문제를 해결하고자 하였다. 본 연구에서 제안한 접근법에서 k-RNN은 이상치를 효과적으로 제거할 수 있으며, OCSVM은 다수를 구성하는 등급의 데이터로부터 정보량이 풍부한 표본만 효과적으로 선택할 수 있는 수단으로 활용될 수 있다. 제안된 기법의 성능을 검증하기 위해, 본 연구에서는 국내 한 은행의 비외감기업 부도예측모형 구축에 제안 기법을 적용해 본 뒤, 일반적으로 많이 사용되는 랜덤샘플링(random sampling)과 제안 기법의 성능을 비교해 보았다. 그 결과, 로지스틱 회귀분석, 판별분석, 의사결정나무, SVM 등 대다수의 분류모형에 있어 분류 정확도가 개선됨을 확인할 수 있었으며, 모든 분류모형에 있어 부정 오류, 즉 부실기업을 정상으로 예측하는 오류율이 크게 감소함을 확인할 수 있었다.

UWB 신호의 Ep/No 추정 알고리즘 (An Algorithm for Estimating Ep/No of UWB Signals)

  • 임성빈
    • 한국통신학회논문지
    • /
    • 제29권9C호
    • /
    • pp.1316-1322
    • /
    • 2004
  • 최근 고속의 데이터 전송이 가능하며 전송율과 신호대잡음비를 선형적으로 절충할 수 있는 UWB (ultra wide-band) 무선통신 기술이 근거리 무선 통신망 분야에서 관심이 고조되고 있다. UWB 무선통신 기술의 장점을 활용하고 UWB 시스템과 공존하는 시스템에 대한 간섭을 최소화하기 위해서는 수신 단에서의 신호대잡응비를 알아 야 한다. 본 논문에서는 UWB 신호에 대하여 수신단의 상관기의 출력만을 이용하여 펄스에너지대잡음비 Ep/No 를 추정하는 알고리즘을 제안하고 이 알고리즘의 성능을 모의실험을 통하여 평가하였다 모의실험 결과에 의하면 추정치의 평균값은 신호의 실제 Ep/No에 대하여 표준편차는 최대 1.l3dB 이내 이며 실제 값과 추정치간의 오차가 $\pm$3dB 이상 발생한 경우는 블록 크기가 500이며 Ep/No 가 2dB 경우에서만 발생하고 나머지 경우에서는 발생 하지 않았다 전반적으로 신호의 실제 Ep/No 가 증가할수록 정밀도가 증가하고 사용된 데이터 블록의 크기가 증가 할수록 추정 성능도 비례하여 개선되는 것으로 나타났다. 제안된 알고리즘의 특징은 추정 과정에서 추가척언 특정 형태의 훈련용 신호를 전송하지 않기 때문에 유효 데이터 전송률을 감소시키지 않는다는 점이다.

발전정지와 교환방법을 적용한 실시간급전문제 최적화 알고리즘 (Optimization Algorithm for Real-time Load Dispatch Problem Using Shut-off and Swap Method)

  • 이상운
    • 한국인터넷방송통신학회논문지
    • /
    • 제17권4호
    • /
    • pp.219-224
    • /
    • 2017
  • 경제급전 최적화 문제를 해결하는 결정론적인 알고리즘에 존재하지 않아 지금까지는 비결정론적인 휴리스틱 알고리즘들이 제안되고 있다. 이와 더불어 실시간 급전문제에 대한 연구는 거의 없는 실정이다. 본 논문은 발전정지 개념을 도입하여 실시간 급전의 최적화 문제를 풀 수 있는 알고리즘을 제안하였다. 제안된 알고리즘은 단위 발전량당 최대 비용이 소요되는 발전기는 발전을 중지시키는 기준을 적용하였다. 본 논문에서 제안한 발전정지 기준은 발전비용함수에서 밸브효과에 따른 비선형 절대치 함수를 제외한 2차 함수만을 대상으로 하였다. 경제급전 문제의 시험사례로 빈번히 활용되고 있는 데이터에 대해 제안된 알고리즘을 적용한 결과 기존 알고리즘들의 해를 크게 감소시킬 수 있었다.