• 제목/요약/키워드: 성도 길이 정규화

검색결과 39건 처리시간 0.028초

정규화 변환을 지원하는 스트리밍 시계열 매칭 알고리즘 (An Efficient Algorithm for Streaming Time-Series Matching that Supports Normalization Transform)

  • 노웅기;문양세;김영국
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권6호
    • /
    • pp.600-619
    • /
    • 2006
  • 최근에 센서 및 모바일 장비들의 발전으로 인하여 이러한 장비들로부터 생성된 대량의 데이터 스트림(data stream)의 처리가 중요한 연구 과제가 되고 있다. 데이타 스트림 중에서 연속되는 시점에 얻어진 실수 값들의 스트림을 스트리밍 시계열(streaming time-series)이라 한다. 스트리밍 시계열에 대한 유사성 매칭은 여러 가지 고유 특성에 의하여 기존의 시계열 데이타와는 다르게 처리되어야 한다. 본 논문에서는 정규화 변환(normalization transform)을 지원하는 스트리밍 시계열 매칭 문제를 해결하기 위한 효율적인 알고리즘을 제안한다. 기존에는 스트리밍 시계열을 아무런 변환 없이 비교하였으나, 본 논문에서는 정규화 변환된 스트리밍 시계열을 비교한다. 정규화 변환은 절대적인 값은 달라도 유사한 변동 경향을 가지는 시계열 데이타를 찾기 위하여 유용하다. 본 논문의 공헌은 다음과 같다. (1) 기존의 정규화 변환을 지원하는 서브시퀀스 매칭 알고리즘[4]에서 제시된 정리(theorem)를 이용하여 정규화 변환을 지원하는 스트리밍 시계열 매칭 문제를 풀기 위한 간단한 알고리즘을 제안한다. (2) 검색 성능을 향상시키기 위하여 간단한 알고리즘을 $k\;({\geq}\;1)$ 개의 인덱스를 이용하는 알고리즘으로 확장한다. (3) 주어진 k에 대하여, 확장된 알고리즘의 검색 성능을 최대화하기 위해 k 개의 인덱스를 생성할 최적의 윈도우 길이를 선택하기 위한 근사 방법(approximation)을 제시한다. (4) 스트리밍 시계열의 연속성(continuity) 개념[8]에 기반하여, 현재 시점 $t_0$에서의 스트리밍 서브시퀀스에 대한 검색과 동시에 미래 시점 $(t_0+m-1)\;(m\geq1)$까지의 검색 결과를 한번의 인덱스 검색으로 구할 수 있도록 재차 확장한 알고리즘을 제안한다. (5) 일련의 실험을 통하여 본 논문에서 제안된 알고리즘들 간의 성능을 비교하고, k 및 m 값의 변화에 따라 제안된 알고리즘들의 검색 성능 변화를 보인다. 본 논문에서 제시한 정규화 변환 스트리밍 시계열 매칭 문제에 대한 연구는 이전에 수행된 적이 없으므로 순차 검색(sequential scan) 알고리즘과 성능을 비교한다. 실험결과, 제안된 알고리즘은 순차 검색에 비하여 최대 13.2배까지 성능이 향상되었으며, 인덱스의 개수 k가 증가함에 따라 검색 성능도 함께 증가하였다.

LTE 상향 링크 시스템에서 송신기의 전력 과도 현상에 의해 발생하는 ICI를 제거하기 위한 적응적 멀티 탭 등화 기법 (Adaptive Multi-Tap Equalization for Removing ICI Caused by Transmitter Power Transient in LTE Uplink System)

  • 채혁진;조일남;김동구
    • 한국전자파학회논문지
    • /
    • 제20권8호
    • /
    • pp.701-713
    • /
    • 2009
  • 본 논문은 LTE 상향 링크 전송에서 물리적 채널간의 전력 과도 현상으로 인한 인접 부 반송파 간섭으로 반송파간의 직교성이 손상되어 수신 신호에 성능감쇄를 초래하는 문제점을 개선하기 위한 기법을 연구하였다. 전력과도 현상에 의해 발생하는 인접 부 반송파 간섭은 도플러 효과에 의해 발생하는 인접 부 반송파 간섭과는 다른 형태로 채널의 전후에서 전력 변화의 각 주기마다 발생한다. 인접 부 반송파 간섭이 발생하는 원인은 채널간의 전력 차이, 전력 과도 구간의 길이, 다중경로 채널 지연 스프레드 그리고 부 반송파의 수에 의해서 발생한다. 본 논문에서는 위에 언급한 4가지 원인으로 인해 발생하는 인접 부 반송파 간섭을 개선하기 위한, 각 채널별 다중 탭 등화기의 탭 수를 결정하는 새로운 기법을 제시하였다. 이 기법은 정규화된 간섭(normalized interference) 즉, 정규화된 부 반송파간의 간섭이 정규화된 잡음(normalized noise)보다 클 때 다중 탭 등화기의 탭 수를 결정하는 기법이다. 모의 실험 결과에서, 수신 신호의 SNR에 따라 적응적으로 탭 수가 조절되고 비트 오류율(BER)의 성능이 향상 됨을 보였고 또한 제안한 기법의 복잡도가 전통적인(classical) 방법의 복잡도 보다 88 % 줄어듦을 보였다.

다항시행접근 단순 베이지안 문서분류기의 개선 (Improving Multinomial Naive Bayes Text Classifier)

  • 김상범;임해창
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권3_4호
    • /
    • pp.259-267
    • /
    • 2003
  • 단순 베이지언 분류모형은 구현이 간단하고 효율적이기 때문에 실용적으로 사용하기에 적합하다. 그러나 이 분류모형은 많은 기계학습 도메인에서 우수한 성능을 보임에도 불구하고 문서분류에 적용되었을 경우에는 그 성능이 매우 낮은 것으로 알려져왔다. 본 논문에서는 단순 베이지언 분류모형중 가장 성능이 우수한 것으로 알려진 다항 시행접근 단순 베이지언 분류모형을 개선하는 세가지 방법을 제안한다. 첫 번째는 범주에 대한 단어의 확률추정방법을 문서모델에 기반하여 개선하는 것이고, 두 번째는 문서의 길이에 따라 범주와의 관련성이 선형적으로 증가하는 것을 억제하기 위해 길이에 대한 정규화를 수행하는 것이며, 마지막으로 범주판정에 중요한 역할을 하는 단어들의 영향력을 높여주기 위하여 상호정보가중 단순 베이지언 분류방법을 사용하는 것이다. 제안하는 방법들은 문서분류기의 성능 평가를 위한 벤치마크 문서집합인 Reuters21578과 20Newsgroup에서 기존의 방범에 비해 상당한 성능향상을 가져옴을 알 수 있었다.

함수적 종속성을 반영향 XML 문서의 관계형 스키마 매핑 기법 (A Mapping Technique of XML Documents into Relational Schema based on the functional dependencies)

  • 조정길
    • 인터넷정보학회논문지
    • /
    • 제8권2호
    • /
    • pp.95-103
    • /
    • 2007
  • 많은 기법들이 XML을 릴레이션으로 매핑(mopping) 하기 위해 제안되었다. 그러나 대부분의 기법들은 XML 데이터의 의미(semantic)들을 고려하지 않았다. 이러한 의미들은 스키마를 설계하는 과정에 저장, 질의 최적화, 변경 이상 등을 체크하는 데에 매우 중요하다. 특히 함수적 종속성은 데이터베이스 이론의 중요한 부분이고, BCNF에서 관계형 테이블을 정규화하기 위한 기초를 형성한다. 이 논문은 XML 스키마 기반의 XML을 매핑하여 릴레이션으로 저장하기 위하여 함수적 종속성을 반영한 기법을 제공한다. 내용, 구조와 함께 함수적 종속성에 의해 기술된 제약조건들은 동시에 유지되며, 저장 중복성을 줄일 수 있다.

  • PDF

이미지 시퀀스 데이터베이스에서의 유사성 기반 서브시퀀스 검색 (Similarity-Based Subsequence Search in Image Sequence Databases)

  • 김인범;박상현
    • 정보처리학회논문지D
    • /
    • 제10D권3호
    • /
    • pp.501-512
    • /
    • 2003
  • 본 논문은 다차원 타임 워핑 거리 함수를 이용하여 유사한 이미지 서브시퀀스를 신속하게 검색할 수 있는 색인 방법을 제안한다. 타임 워핑 거리는 시퀀스들의 길이가 다르거나 샘플링 비율이 다른 많은 응용에서 Lp 거리보다 더욱 적합하다. 우리가 제안한 색인 방법은 디스크 기반의 접미어 트리를 색인 구조체로 채택하고, 유사하지 않은 서브시퀀스를 잘못된 누락 없이 잘 여과하기 위해 하한 거리 함수를 사용한다. 이 방법은 특정 차원의 상대적 가중치를 손쉽게 부여하기 위해 정규화를 적용하고 색인 트리를 압축하기 위해 이산화 과정을 수행한다. 메디컬 이미지와 합성 이미지 시퀀스를 대상으로 한 실험은 본 논문에서 제안한 방법이 naive한 방법보다 우수한 성능을 보이고 대용량의 이미지 시퀸스 데이터베이스로의 확장이 용이함을 입증한다.

n-gram/2L: 공간 및 시간 효율적인 2단계 n-gram 역색인 구조 (n-Gram/2L: A Space and Time Efficient Two-Level n-Gram Inverted Index Structure)

  • 김민수;황규영;이재길;이민재
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권1호
    • /
    • pp.12-31
    • /
    • 2006
  • n-gram 기반 역색인 구조는 언어 중립적이고 에러 허용적인 장점들로 인해 일부 아시아권 언어에 대한 정보 검색이나 단백질과 DNA의 sequence의 근사 문자열 매칭에 유용하게 사용되고 있다. 그러나, n-gram 기반의 역색인 구조는 색인의 크기가 크고 질의 처리 시간이 오래 걸린다는 단점들을 가지고 있다. 이에 본 논문에서는 n-gram 기반 역색인의 장점을 그대로 유지하면서 색인의 크기를 줄이고 질의 처리 성능을 향상시킨 2단계 n-gram 역색인(간단히 n-gram/2L 역색인이라 부른다)을 제안한다. n-gram/2L 역색인은 n-gram 기반 역색인에 존재하던 위치 정보의 중복을 제거한다. 이를 위해 문서로부터 길이 m의 m-subsequence들을 추출하고, 그 m-subsequence들로부터 n-gram을 추출하여 2단계로 역색인을 구성한다. 이러한 2단계 구성 방법은 이론적으로 의미 있는 다치 종속성이 존재하는 릴레이션을 정규화하여 중복을 제거하는 것과 동일하며, 이를 본문에서 정형적으로 증명한다. n-gram/2L 역색인은 데이타의 크기가 커질 수록 n-gram 역색인에 비해 색인 크기가 줄어들며 질의 처리 성능이 향상되고, 질의 문자열의 길이가 길어져도 질의 처리 시간이 거의 증가하지 않는 좋은 특성을 가진다. 1GByte 크기의 데이타에 대한 실험을 통하여, n-gram/2L 역색인은 n-gram 기반 역색인에 비해 최대 1.9${\~}$2.7배 더 작은 크기를 가지면서, 동시에 질의 처리 성능은 3${\~}$18 범위의 길이를 가지는 질의들에 대해 최대 13.1배 향상됨을 보였다.

단축압축 하에서 대리석의 균열전파 및 결합 (Crack Propagation and Coalescence in Yeosan Marble under Uniaxial Compression)

  • 박남수;전석원
    • 터널과지하공간
    • /
    • 제11권3호
    • /
    • pp.217-224
    • /
    • 2001
  • 암석은 지질학적 생성과정으로 인해 많은 역학적 결함을 포함하고 있으며 이러한 결함 사이에는 암석 브릿지가 존재하게 된다. 이러한 암석 브릿지에서의 균열의 전파 및 결합(coalescence)과정은 사면, 기초, 터널 등의 안정성에 영향을 미치게 된다. 본 연구에서는 단축압축 하에서 균열의 형상변화에 따른 암석 브릿지에서의 균열의 개시, 전파 및 결합거동 변화에 대해 알아보았다. 여산 대리석을 재료로 120$\times$60$\times$25 mm크기의 시료에 균열각도 $\alpha$, 브릿지각도 $\beta$, 균열길이 2c, 브릿지길이 2b를 변화시키면서 2개의 인공균열을 제작하였다. 하중을 가하면서 날개형 균열개시응력, 날개형 균열 전파각도, 균열결합 응력을 측정하였으며 균열결합 유형을 정리하였다. 또한, 정규화된 최대강도(normalized peak strength)를 구하여 Ashby & Hallam 모형 (1986)의 이론해와 비교, 분석 하였다.

  • PDF

정규압밀 점토 지반에서 매입말뚝의 수평거동에 관한 모형 실험 연구 (Model Testing on the Behavior of Laterally Loaded Pile in NC Clay Soils)

  • 김병탁;이상웅;김영수
    • 한국지반공학회지:지반
    • /
    • 제14권5호
    • /
    • pp.39-52
    • /
    • 1998
  • 본 논문은 정규압밀된 점성토 지반에서 강관 매입 말뚝의 수평 거동에 영향을 미치는 여러인자들 중에서 말뚝의 근입길이, 지반조건(건조단위 중량 $\gamma_4$), 말뚝 두부의 구속조건의 영향에 관하여 모형실험을 수행하였으며, 이러한 영향을 정량화 할 수 있는 경첩식을 그 결과들로부터 얻었다. 모형실험에 사용한 지반은 3종류의 정규압밀 점토이다. 2종류의 말뚝 근입길이와 말뚝 두부의 고정 자유조건의 모형실험결과들에 의하여 수평하중-변위 관계는 $\gamma_d/\gamma_{dmax}$=0.84 이하에서 완전 탄소성체의 거동형상을 보일 것으로 나타났으며, 각 실험에서 최대 수평하중(Q--) 이후의 수평하중 감소는 상당한 시간 의존성을 보였다. 본 연구에서는 수평 하중-변위관계(logo-logy/D)와 최대 휨 모멘트-변위관계($loaM_{max}$.-.-logy/D)에서 각각 구한 항복 수평하중(Qy)과 항복 최대 휭 모멘트(My)가 직선적인 관계로 밝혀졌다. Relaxation에 의한 수평하 중은 모형실험 결과들로부터 시간을 변수로 한 지수 함수식으로 회귀분석 하였다. 수평 극한하중과 항복하중에 대한 지반조건의 영향은 $\gamma_4$$/\gamma_{dmax}$의 변수로 한 지수함수식으로 모델화 하였으며, Broms와 Budhu et at.에 의한 결과와의 비교에서 예측결과가 26-78%정도 과대평가 되었다. 수평하중-변위 관계에 대한 말뚝 두부의 고정조건 영향에서 $Q_{mxed}/Q_{free}$-y/D의 관계는 상당히 비선형적으로 나타났으며, yiD를 변수로 한 지수함수식으로 모델화하였다.

  • PDF

기둥-말뚝의 상호작용을 고려한 단일 현장타설말뚝의 철근비 분석 (Analysis of Steel Reinforcement Ratio for Bent Pile Structures Considering Column-Pile Interaction)

  • 김재영;정상섬;김장호
    • 콘크리트학회논문집
    • /
    • 제26권2호
    • /
    • pp.181-188
    • /
    • 2014
  • 이 연구에서는 기존의 가상고정점 모델을 통한 단일 현장타설말뚝 설계를 보완하고자, 등가 지반면 스프링 모델을 바탕으로 한 기둥과 말뚝의 상호작용을 고려한 해석법을 제시하였으며, 이를 토대로 주요 영향인자에 따라 말뚝의 최소철근비 적용성을 분석하였다. 나아가, 기둥과 말뚝 조건을 고려하여 말뚝에 철근비별 적용 가능한 한계깊이를 제안하였다. 이 연구 결과, 기둥-말뚝의 상호작용을 고려한 해석은 가상고정점 모델 해석에서 전체 모델링 해석으로 넘어가는 중간단계의 비교적 정확하고 경제적인 설계법임을 알 수 있었으며, 이 해석법을 통해 최소철근비 적용성을 평가한 결과, 말뚝의 최대 휨모멘트는 말뚝재료의 균열모멘트 이내에서 모두 발생하는 것으로 나타나 말뚝에는 최소철근비(0.4%)를 적용하여도 만족하는 것을 알 수 있었다. 이를 토대로, 현장사례를 통해 철근비별 적용 가능한 한계깊이($L_{As=x%}$)를 제안하였으며, 정규화된 철근비별 적용 가능한 한계깊이 ($L_{As=x%}/L_P$)는 정규화된 말뚝길이($L_P/D_P$)에 따라 선형적으로 감소하여 일정한 값에서 수렴함을 알 수 있었다.

내용기반 음악정보 검색을 위한 선율의 시계열 데이터 변환을 이용한 주제선율색인 구성 (Construction of Theme Melody Index by Transforming Melody to Time-series Data for Content-based Music Information Retrieval)

  • 하진석;구경이;박재현;김유성
    • 정보처리학회논문지D
    • /
    • 제10D권3호
    • /
    • pp.547-558
    • /
    • 2003
  • 음악은 서로 다른 높이와 길이를 갖는 음표들을 주어진 박자 안에서 리듬성을 갖도록 나열한 패턴이기 때문에 음악의 선율정보는 시간의 흐름에 따라 정보 값을 갖는 시계열 데이터로 변환할 수 있다 따라서 본 연구에서는 음악의 특성을 유지하도록 선율정보를 정규화와 보정과정을 거쳐 시계열 데이터로 변환하고 유클리드 거리함수를 이용하여 선율정보간의 유사도를 계산하며, 유사성을 갖는 선율들을 클러스터링하여 각 클러스터의 대표성을 갖는 선율을 주제선율로서 추출한다. 그리고 추출된 주제선율로 다차원색인 기법인 M-tree를 이용하여 주제선율색인을 구성한다. 사용자 질의에 대한 검색과정에서도 색인 구성단계와 같은 과정으로 사용자 질의를 시계열 데이터로 변환하여 검색을 한다. 또한, 본 연구에서는 주제선율색인을 이용하여 내용기반 음악 검색을 실시하는 프로토타입 시스템을 개발하여 제안된 주제선율색인 구성기법의 실효성을 시험하였다. 실험결과에 따르면, 주제선율색인을 이용하면 원하는 음악 정보를 적은 공간을 사용하여 빠르고 정확하게 검색할 수 있음을 알 수 있다.