• 제목/요약/키워드: 시퀀스 데이터

검색결과 410건 처리시간 0.024초

어텐션 기반 엔드투엔드 음성인식 시각화 분석 (Visual analysis of attention-based end-to-end speech recognition)

  • 임성민;구자현;김회린
    • 말소리와 음성과학
    • /
    • 제11권1호
    • /
    • pp.41-49
    • /
    • 2019
  • 전통적인 음성인식 모델은 주로 음향 모델과 언어 모델을 사용하여 구현된다. 이때 음향 모델을 학습시키기 위해서는 음성 데이터에 대한 정답 텍스트뿐만 아니라 음성인식에 사용되는 단어의 발음사전과 프레임 단위의 음소 정답 데이터가 필요하다. 이 때문에 모델을 훈련하기 위해서는 먼저 프레임 단위의 정답을 생성하는 등의 여러 과정이 필요하다. 그리고 음향 모델과 별도의 텍스트 데이터로 훈련한 언어 모델을 적용하여야 한다. 이러한 불편함을 해결하기 위하여 최근에는 하나의 통합 신경망 모델로 이루어진 종단간(end-to-end) 음성인식 모델이 연구되고 있다. 이 모델은 훈련에 여러 과정이 필요없고 모델의 구조를 이해하기 쉽다는 장점이 있다. 하지만 인식이 내부적으로 어떤 과정을 거쳐 이루어지는지 알기 어렵다는 문제가 있다. 본 논문에서는 어텐션 기반 종단간 모델을 시각화 분석하여 내부적인 작동 원리를 이해하고자 하였다. 이를 위하여 BLSTM-HMM 하이브리드 음성인식 모델의 음향 모델과 종단간 음성인식 모델의 인코더를 비교하고, 신경망 레이어 별로 어떠한 차이가 있는지 분석하기 위해 t-SNE를 사용하여 시각화하였다. 그 결과로 음향모델과 종단간 모델 인코더의 차이점을 알 수 있었다. 또한 종단간 음성인식 모델의 디코더의 역할을 언어모델 관점에서 분석하고, 종단간 모델 디코더의 개선이 성능 향상을 위해 필수적임을 알 수 있었다.

밝기 변화를 고려한 효율적인 장면전환 검출 알고리즘 (An Efficient Scene Change Detection Algorithm Considering Brightness Variation)

  • 김상현
    • 융합신호처리학회논문지
    • /
    • 제6권2호
    • /
    • pp.74-81
    • /
    • 2005
  • 디지털 미디어 데이터의 증가에 따라 디지털 미디어를 효과적으로 관리하고 사용하기 위하여 다양한 비디오 색인 및 비디오 시퀀스 정합을 위한 장면전환 검출 알고리즘이 제안되었다. 본 논문에서는 급격한 밝기 변화를 가지는 비디오 시퀀스에 대해서 효율적인 비디오 장면전환 검출 알고리즘을 제안한다. 급격한 밝기 변화를 고려한 비디오 색인의 정확도를 향상시키고 계산량을 줄이기 위해 제안한 알고리즘은 칼라 특성뿐만 아니라 에지 특성도 함께 사용하였으며 기존의 알고리즘에 비해 현저한 성능 향상을 보였다. 제안한 알고리즘은 먼저 칼라 히스토그램을 사용하여 후보 샷경계 지점을 추출하고 에지 정합과 밝기 보상을 이용하여 후보점들이 샷경계인지 밝기 변화인지를 결정한다. 장면내의 밝기 변화가 작은 경우 에지 정합과 밝기 보상은 샷경계에서만 일어난다. 실험 결과 제안한 방법은 기존의 방법에 비해 비슷한 계산량으로 현저히 향상된 성능과 효율을 보였다.

  • PDF

무선통신 시스템에 적용 가능한 직교 훈련신호 (An Available Orthogonal Training Signal in Wireless Communication System)

  • 이형우;조형래;김기만;손윤준
    • 한국ITS학회 논문지
    • /
    • 제14권5호
    • /
    • pp.30-37
    • /
    • 2015
  • MIMO(Multiple Input Multiple Output) 시스템을 사용하여 주파수 선택적 페이딩 환경에서 동작하는 차세대 무선 통신 시스템의 데이터 전송 속도를 향상시키기 위한 연구가 현재 활발히 진행 중이다. 여러 개의 송신 안테나에서 송신된 시호들이 혼합되어 각 수신 안테나에 수신되는데 이렇게 혼합된 신호를 분리하기 위해서 직교 특성을 갖는 훈련신호가 필요하며, 이 훈련신호를 사용하여 신호의 동기화 및 채널 추정을 수행할 수 있어야 한다. 본 논문에서는 MIMO 통신 시스템에 사용 가능한 시퀀스들을 소개하고, 관심 영역에 대하여 우수한 자기 상관 특성을 갖는 변형된 WeCAN(weighted cyclic algorithm new) 시퀀스를 제안한다. 모의실험을 통해 각 훈련신호의 자기 상관도를 비교하였으며, 또한 도플러 주파수 변화와 다중경로 전달 페이딩 환경에서의 상관 특성을 비교하였다.

Windows 프로그램 도용 탐지를 위한 기능 단위 동적 API 버스마크 (A Functional Unit Dynamic API Birthmark for Windows Programs Code Theft Detection)

  • 최석우;조우영;한태숙
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권9호
    • /
    • pp.767-776
    • /
    • 2009
  • 소프트웨어 버스마크란 코드 도용 탐지를 위해 프로그램 자체에서 추출된 프로그램의 특징이다. 동적 API 버스마크는 실행 시간 API 호출 시퀀스로부터 추출된다. Tamada가 제안한 Windows 프로그램을 위한 동적 API 버스마크는 프로그램 실행 시작 부분의 API 시퀀스만을 추출하여 프로그램의 중요한 특성을 반영하지 못하였다. 이 논문에서는 프로그램의 핵심 기능을 실행할 때의 API 시퀀스에서 추출한 기능 단위 동적 API 버스마크를 제안한다. 기능 단위 동적 API 버스마크를 이용해 코드 도용을 탐지하기 위해서 먼저 두 프로그램을 실행하여 버스마크를 추출한다. 두 프로그램의 유사도는 프로그램에서 추출한 버스마크를 준전체 정렬 방식을 이용하여 비교하여 측정한다. 버스마크의 신뢰성을 평가하기 위하여 같은 기능을 가진 프로그램들을 대상으로 실험하였다. 강인성을 평가하기 위하여 동일한 소스 코드를 다양한 컴파일 방법으로 만들어 실험하였다. 실험 결과 본 논문에서 제안하는 기능 단위 동적 API 버스마크가 기존의 버스마크에서 탐지할 수 없었던 모듈 단위 도용을 탐지할 수 있음을 보였다.

깊은 신경망 기반 대용량 텍스트 데이터 분류 기술 (Large-Scale Text Classification with Deep Neural Networks)

  • 조휘열;김진화;김경민;장정호;엄재홍;장병탁
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권5호
    • /
    • pp.322-327
    • /
    • 2017
  • 문서 분류 문제는 오랜 기간 동안 자연어 처리 분야에서 연구되어 왔다. 우리는 기존 컨볼루션 신경망을 이용했던 연구에서 나아가, 순환 신경망에 기반을 둔 문서 분류를 수행하였고 그 결과를 종합하여 제시하려 한다. 컨볼루션 신경망은 단층 컨볼루션 신경망을 사용했으며, 순환 신경망은 가장 성능이 좋다고 알려져 있는 장기-단기 기억 신경망과 회로형 순환 유닛을 활용하였다. 실험 결과, 분류 정확도는 Multinomial Naïve Bayesian Classifier < SVM < LSTM < CNN < GRU의 순서로 나타났다. 따라서 텍스트 문서 분류 문제는 시퀀스를 고려하는 것 보다는 문서의 feature를 추출하여 분류하는 문제에 가깝다는 것을 확인할 수 있었다. 그리고 GRU가 LSTM보다 문서의 feature 추출에 더 적합하다는 것을 알 수 있었으며 적절한 feature와 시퀀스 정보를 함께 활용할 때 가장 성능이 잘 나온다는 것을 확인할 수 있었다.

저궤도 위성의 안전성 향상을 위한 위성체 및 지상의 자율 운영 방안 (On-board and Ground Autonomous Operation Methods of a Low Earth Orbit Satellite for the Safety Enhancement)

  • 양승은
    • 한국위성정보통신학회논문지
    • /
    • 제11권3호
    • /
    • pp.51-57
    • /
    • 2016
  • 우주 비행체의 건강상태를 확인하기 위해서는 매우 많은 종류의 텔레메트리 데이터를 확인해야 하므로 시간이 크게 소요 된다. 그러나 저궤도 위성의 경우 지상국과 교신할 수 있는 횟수 및 시간이 제한적이기 때문에 짧은 시간에 정확히 위성의 상태를 파악하는 것이 중요하다. 또한 운영 중 방사현상 및 급격한 온도 변화 등 극한의 우주 환경에 노출되어 있기 때문에 교신중이 아닐 때에도 위성 자체의 탑재 고장관리 방안이 마련되어 있어야 한다. 본 논문에서는 저궤도 위성의 안전성 향상을 위해 지상 및 위성 자체에서의 자율 운영 방안에 대해 다루도록 한다. 위성 상태확인 소요 시간 단축을 위해 각종 위성 이벤트를 오류와 구분하여 기록한 후 지상으로 전달하면 지상에서는 위성에서 발생하는 문제를 명시적으로 인지하여 즉각적인 조치가 이루어지도록 한다. 또한 각 이벤트의 연관 텔레메트리를 정의하고 지속적으로 발생하는 이벤트 시퀀스를 이용하여 특정 이벤트 발생 시 지상에서 취해야 할 동작을 추천 혹은 자동 수행하는 시스템을 제안한다. 탑재 자율 고장관리 기법으로는 중요 파라미터 선정 후 검사해야 할 주기, 모드 및 문턱값을 지정하여 해당 범위를 벗어날 경우 사전에 지정 된 명령 시퀀스를 수행 하는 방안을 제시한다.

Trie 구조를 이용한 비디오 인덱스 생성 및 검색 (Video Index Generation and Search using Trie Structure)

  • 현기호;김정엽;박상현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권7_8호
    • /
    • pp.610-617
    • /
    • 2003
  • 비디오 데이타베이스에서 유사도 정합은 비디오 클러스터링과 비디오 라이브러리 등과 같은 많은 새로운 응용분야에서 중요성이 증가하고 있다. 대용량 데이타베이스에서 효과적인 접근을 제공하기 위하여 다양한 공간과 시간에 대한 특징치를 이용한 비디오 인덱싱 분야의 많은 연구노력이 있어왔다. 그러나 대부분의 기존 방법들은 순차적인 정합방법 또는 메모리 기반의 역 파일 기법 등에 의존하므로 대용량 데이타베이스에는 적합하지 않다. 이러한 문제를 해결하기 위하여 본 논문에서는 효과적이고 스케일 조정가능한 인덱싱 기법을 제안하기 위하여, 문자열 정합을 위해 제안된 trio를 인덱스 구조로 이용하였다. 인덱스 구성을 위하여 윈도우 순서 휴리스틱을 이용하여 각 프레임을 기호 시퀀스로 변환하고, 기호 시퀀스의 집합으로부터 디스크 상주 trio를 구성하였다 질의 처리를 위하여 trio 상에서 깊이-우선 검색과 시간 축분할을 실시하였으며, 제안한 방법의 성능을 검증하기 위하여 실제와 합성 데이터 집합에 대한 실험을 수행하였다. 제안한 방법은 지속적으로 순차적 스캔 방법보다 우수한 성능을 보였고, 성능이득은 대용량 비디오 데이타베이스에서도 유지되었다.

N-Gram 증강 나이브 베이스를 이용한 정확한 침입 탐지 (Accurate Intrusion Detection using n-Gram Augmented Naive Bayes)

  • 강대기
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 추계종합학술대회 B
    • /
    • pp.285-288
    • /
    • 2008
  • 기계 학습을 응용한 많은 침입 탐지 시스템들은 n-그램 접근 방법을 주로 쓰고 있다. 그러나, n-그램 접근 방법은 주어진 시퀀스에서 획득한 n-그램들이 서로 겹치는 문제들을 가지고 있다. 본 연구에서는 이러한 문제들을 해결하기 위해, n-그램 증강 나이브 베이스 (n-gram augmented naive Bayes) 알고리즘을 침입 시퀀스의 분류에 적용하였다. 제안된 시스템의 성능을 평가하기 위해 n-그램 특징들을 사용하는 일반 나이브 베이스 (naive Bayes) 알고리즘과 서포트 벡터 머신 (support vector machines) 알고리즘과 본 연구에서 제안한 n-그램 증강 나이브 베이스 알고리즘을 비교하였다. 뉴 멕시코 대학의 벤치마크 데이터에 적용해 본 결과에 따르면, n-그램 증강 방법이, n-그램이 나이브 베이스에 직접 적용되는 경우(예: n-그램 특징을 사용하는 일반 나이브 베이스), 생기는 독립성 가정에 대한 위배 문제도 해결하면서, 동시에 n-그램 특징을 사용하는 일반 나이브 베이스보다 더 정확하며, n-그램 특징을 사용하는 SVM과 필적할만한 수준의 침입 탐지기를 생성해 내었다.

  • PDF

수명주기가 짧은 상품들에 대한 시퀀스 기반 개인화 서비스 (A sequence-based personalized service for the short life cycle products)

  • 최주철
    • 디지털융복합연구
    • /
    • 제15권12호
    • /
    • pp.293-301
    • /
    • 2017
  • 대부분의 신상품들은 시장에서 급격히 사라질 뿐만 아니라 기존 상품들의 매출감소를 불러온다. 이처럼 수명주기가 짧은 상품으로 인해 소매상들은 과다한 재고를 보유하게 될 뿐만 아니라 소비자들은 자신들의 선호를 맞는 제품들을 발견하는데 어려움을 겪는다. 이런 문제를 해결에 하는데 있어서 추천 시스템은 좋은 해결방법이 될 수 있다. 그러나 대부분의 추천 시스템들은 소비자의 고정된 선호를 이용하기 때문에 변화하는 소비자의 선호를 반영하지 못하는 문제가 있다. 이러한 문제를 해결하기 위하여 본 연구에서는 시간에 따라 변화하는 소비자의 선호를 반영한 추천 방법론을 제안하였다. 제안한 방법론은 소비자의 동적 선호 프로파일 작성, 네이버 형성, 추천 리스트 작성의 3 단계로 구성되어 있으며, 모바일 이미지 거래 데이터를 이용하여 제안된 방법론의 유용성을 검증하였다. 시험결과 제시된 방법론의 추천 정확도가 전통적인 협업필터링의 정확도 보다 높았다. 이러한 결과를 통해, 본 연구에서 제한한 방법론이 짧은 수명주기를 가진 제품을 추천하는데 효과적이라는 결론을 내릴 수 있다. 따라서 향후 제안된 방법론을 현업에 적용하여 실제적 유용성을 검증할 필요가 있다.

위치 기반 서비스를 위한 이동 객체의 시간 패턴 탐사 기법 (Temporal Pattern Mining of Moving Objects for Location based Services)

  • 이준욱;백옥현;류근호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권5호
    • /
    • pp.335-346
    • /
    • 2002
  • 위치 기반 서비스는 이동중인 사용자에게 위치와 관련된 정보를 제공한다. 최소한의 자원으로 사용자에게 유용한 정보를 개인화하여 제공하는 것은 위치 기반 서비스가 가져야 할 필수적인 기능이다. 이 기능은 데이타 마이닝을 통해 실현될 수 있다. 하지만 기존의 데이터 마이닝 연구는 시간 및 공간 속성을 동시에 고려하고 있지 않다. 따라서 시간에 따라 공간 위치 속성이 변경되는 특성을 갖는 위치 기반 서비스의 대상에는 적절하지 않다. 이 논문에서는 시간 및 공간 속성을 가지는 이동 객체의 위치 데이타로부터 유용한 시간 패턴을 탐사하기 위한 새로운 데이타 마이닝 기법을 제안하였다. 평면 상에서 좌표로 표현되는 이동 객체의 위치 정보를 일반화하기 위하여 contains와 같은 공간 연산을 사용하였다. 또한 이동 패턴 탐사 시 실제 유효한 시퀀스를 만들기 위해 객체의 위치 사이에 시간 제약조건을 적용하였다. 이렇게 생성된 이동 객체 위치의 시퀀스로부터 빈발 이동 시퀀스를 구하여 시간 패턴을 생성하였다. 제안한 기법은 기존과는 다른 시, 공간적 접근을 취함으로써 시간과 공간 의미가 중요시되는 위치 기반 서비스에 적합한 새로운 유형의 지식을 제공할 수 있다.