• 제목/요약/키워드: 정규화 변환

검색결과 300건 처리시간 0.026초

시계열 데이터베이스에서 단일 색인을 사용한 정규화 변환 지원 서브시퀀스 매칭 (A Single Index Approach for Subsequence Matching that Supports Normalization Transform in Time-Series Databases)

  • 문양세;김진호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.157-159
    • /
    • 2005
  • 본 논문에서는 단일 색인을 사용하는 정규화 변환 지원 서브시퀀스 매칭 방법을 제안한다. 기존의 정규화 변환 지원 서브시퀀스 매칭 방법은 질의 시퀀스 길이가 커질수록 성능이 저하되고, 이를 해결하기 위하여 여러개의 색인을 사용하는 방법을 취하였다. 본 논문에서는 하나의 색인을 사용하면서도 다양한 길이의 정규화 변환 지원 서브시퀀스 매칭을 수행하는 효율적인 방법을 제시한다. 이를 위하여, 본 논문에서는 정규화 변환의 정의를 확장하여 일반화 정규화 변환 개념을 제시한다. 또한, 이러한 일반화 정규화 변환 개념을 기존 서브시퀀스 매칭 방법들에 적용하는 방안에 대한 이론적 근거를 각각의 정리로서 제시하고 증명하였다. 그리고, 이들 방안을 구현하기 위한 색인 구성 알고리즘 및 서브시퀀스 매칭 알고리즘을 각각 제시하였다. 본 논문에서 제안한 정규화 변환 지원 서브시퀀스 매칭은 다른 변환을 지원하는 서브시퀀스 매칭으로 일반화 될 수 있는 우수한 연구결과라 사료된다.

  • PDF

시계열 데이터베이스에서 단일 색인을 사용한 정규화 변환 지원 서브시퀀스 매칭 (A Single Index Approach for Subsequence Matching that Supports Normalization Transform in Time-Series Databases)

  • 문양세;김진호;노웅기
    • 정보처리학회논문지D
    • /
    • 제13D권4호
    • /
    • pp.513-524
    • /
    • 2006
  • 정규화 변환은 시계열 시퀀스를 구성하는 엔트리들의 전체적인 패턴을 분석하는데 매우 유용하다. 본 논문에서는 단일 색인을 사용한 정규화 변환 지원 서브시퀀스 매칭 방법을 제안한다. 기존의 정규화 변환 지원 서브시퀀스 매칭 방법은 다양한 길이의 질의 시퀀스를 지원하기 위하여 여러 개의 색인을 생성해야 하고, 이에 따라 색인 저장 공간의 오버헤드와 색인 관리의 오버헤드가 발생한다. 본 논문에서는 하나의 색인을 사용하면서도 다양한 길이의 질의 시퀀스에 대한 정규화 변환을 지원하는 효율적인 서브시퀀스 매칭 방법을 제안한다. 이를 위하여, 우선 정규화 변환을 일반화한 포함-정규화 변환(inclusion-normalization transform) 개념을 제시한다. 포함 정규화 변환이란 색인에 저장할 윈도우에 대해서 해당 윈도우를 포함하는 서브시퀀스의 평균과 표준편차로 정규화하는 것으로서, 기본적인 정규화 변환을 윈도우 및 서브시퀀스 개념을 사용하여 확장한 것이다. 다음으로, 포함-정규화 변환을 기존 서브시퀀스 매칭 연구에 적용하기 위한 이론적 근거를 정리로서 제시하고 증명한다. 그리고, 이 방안을 구현하기 위한 색인 구성 알고리즘 및 서브시퀀스 매칭 알고리즘을 각각 제시한다. 실제 주식 데이터에 대한 실험 결과, 제안한 방법은 기존 방법에 비해 최대 $2.5{\sim}2.8$배까지 성능을 향상 시킨 것으로 나타났다. 본 논문에서 제안한 정규화 변환 지원 서브시퀀스 매칭은 정규화 변환 이외의 다른 변환을 지원하는 서브시퀀스 매칭으로 일반화 될 수 있다. 따라서, 제안한 방법은 정규화 변환을 포함하는 많은 다른 종류의 변환을 지원하는 서브시퀀스 매칭에 폭넓게 적용될 수 있는 좋은 연구결과라 사료된다.

변환법에 의한 설계홍수량의 유도(II) -비년초과치계열을 중심으로- (Derivation of Design Flood by Transformation Method(II) - On the non-annual exceedance series-)

  • 이순혁;맹승진
    • 한국농공학회지
    • /
    • 제37권5호
    • /
    • pp.111-118
    • /
    • 1995
  • 첨두유량이 연속적으로 발생하므로 인하여 수리구조물의 파괴에 영향을 끼치는 설계홍수량의 추정을 위해 본 연구에서는 제I보에 이어 2차적으로 부분 기간 계열인 금강, 영산강 및 섬진강 수계 6개 유역의 비년 초과치를 중심으로 하여 변환법인 SMEMAX법, 멱변화(Power Transformation) 및 2단계 멱변환(Two Step Power Transformation, TSPT)법에 의해 빈도분포의 정규화를 시도하고 이들에 대한 정규화 효율성의 비교분석과 설계홍수량 유도를 위한 변환법별 적합도 검정을 수행하였다. 왜곡분포의 정규화 시도는 제I보의 결과와 마찬가지로 SMAMAX 및 Power변환법에서는 빈도분포의 정규화가 미흡하였으나 2단계 멱변환법에서는 빈도분포의 만족한 정규화를 기할 수 있었다. 또한 3개 변환법에 의해 유도된 설계홍수량의 비교 분석에서는 3개 방법 모두 재현기간 20년 이내의 설계홍수량이 거의 유사한 결과를 나타내었으며 Kolmogorov-Smirnov Test에 의한 3개 변환법별 적합도검정 결과 2단계 멱변환법이 적정 변환법으로 인정되었다.

  • PDF

사이트 기반의 URL 정규화 평가 (Evaluating Site-based URL Normalization)

  • 정효숙;김성진;이상호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.28-30
    • /
    • 2005
  • URL 정규화는 다양하게 표현된 동일 URL들을 하나의 통일된(cannonical) 형태의 URL로 변환하는 과정이다. 동일문서에 대한 중복된 URL 표현은 URL 정규화를 통하여 제거된다. 표준 정규화는 잘못된 긍정(동일하지 않는 URL들을 동일 문자열로 변환)이 없도록 개발되었다. 그러나 표준 정규화는 많은 잘못된 부정이 발생하게 되므로, 잘못된 긍정을 일부 허용하면서 잘못된 부정을 현격히 줄일 수 있는 확장 정규화가 제기되고 연구되어 왔다. 본 논문에서는 동일 사이트 내의 URL들에 대한 확장 정규화의 적용 결과가 유사한 정도를 보임으로써, 한 사이트 내의 URL에 대한 임의의 확장 정규화 결과 정보가 동일 사이트 내의 다른 URL들의 정규화에 효과적으로 사용될 수 있음을 보인다. 이를 위하여, 한 사이트의 확장 정규화 결과 동일성 척도와 사이트 기반의 확장 정규화 평가 척도를 제안한다. 20,000만개의 실제 국내 웹 사이트에서 추출된 25만개의 URL에 대해 6가지 확장 정규화가 평가된다.

  • PDF

변환법에 의한 설계홍수량의 유도(I) - 연최고치계열을 중심으로- (Derivation of Design Flood by Transformation -On the annual maximum series-)

  • 이순혁;맹승진
    • 한국농공학회지
    • /
    • 제36권4호
    • /
    • pp.64-72
    • /
    • 1994
  • 설계홍수량의 유도를 위해 일차적으로 극치계열인 금강, 영산강 및 석진강 수개 3개 유역의 연최고치계열을 중심으로 하여 SMEMAX법, 역변환(Power Transformation) 및 2단계역변환(Two step Power Transformation, TSPT)법에 의해 척도분포의 정규화를 위한 변환법의 효율성 검정과 설계홍수량의 유도 및 비교분석을 수행한 결과 SMEMAX 법과 Power 변환법에서는 정규분포화를 왜곡도계수의 영으로의 접근 시도는 가능하나 소설도, 3으로의 조건을 충족시킬 수 없었던 반면 2단계역변환법에서는 소설도, 3에 매우 근접된 결과를 가져오므로서 척도분포의 정규화를 기할 수 있었고 각각의 변환법에 유도된 설계홍수량간의 비교분석에서는 SMEMAX 및 Power 변환법에 비해 2단계역변환방법에 의한 설계 홍수량이 재현기간 10년 이상 실측치에 보다 접근된 좋은 결과를 나타내었다.

  • PDF

정규화 용어빈도가중치에 의한 자동문서분류 (Automatic Text Categorization by using Normalized Term Frequency Weighting)

  • 김수진;김민수;백장선;박혁로
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.510-512
    • /
    • 2003
  • 본 논문에서는 문서의 자동 분류를 위한 용어 빈도 가중치 계산 방법으로 Box-Cox변환기법을 응용한 정규화 용어빈도 가중치를 정의하고, 이를 문서 분류에 적응하였다. 여기서 Box-Cox 변환기법이란 자료를 정규분포화 할 때 적용하는 통계적인 변환방법으로서, 본 논문에서는 이를 응용하여 새로운 용어빈도가중치 계산법을 제안한다. 문서에서 등장한 용어 빈도는 너무 많거나 적게 등장할 경우, 중요도가 떨어지게 되는데, 이는 용어의 중요도가 빈도에 따른 정규분포로 모델링 될 수 있다는 것을 의미한다. 또한 정규화 가중치 계산방법은 기존의 용어빈도 가중치 공식과 비교할 때, 용어마다 계산방법이 달라져, 로그나 루트와 같은 고정된 가중치 방법보다는 좀더 일반적인 방법이라 할 수 있다. 신문기사 8000건을 대상으로 4개의 그룹으로 나누어 실험 한 결과, 정규화 용어빈도가중치 계산방법이 모두 우위의 분류 정확도롤 가져, 본 논문에서 제안한 방법이 타당함을 알 수 있다.

  • PDF

블록 DCT와 영상 정규화를 이용한 회전, 크기, 이동 변환에 견디는 강인한 로고 삽입방법 (A RST Resistant Logo Embedding Technique Using Block DCT and Image Normalization)

  • 최윤희;최태선
    • 정보보호학회논문지
    • /
    • 제15권5호
    • /
    • pp.93-103
    • /
    • 2005
  • 본 논문에서는 멀티미디어 저작권 보호를 위한 회전, 크기, 이동 (RST: Rotation, Scale, Translation) 변환 공격에 견디는 강인한 로고 삽입 방법을 제안한다. 기하학적인 처리는 영상의 화질을 많이 훼손하지 않으면서 워터마크의 탐지 과정을 매우 복잡하고 어렵게 한다. 정규화된 영상 (Normalized image)에 워터마크를 삽입하는 방법은 영상의 정규화 과정에서 보간에 의해 평탄화 (Smoothing effect) 현상이 발생하는 단점이 있다. 이것은 워터마크를 정규화된 영상에 직접 삽입하는 대신, 영상 정규화를 변환 파라미터를 계산하는데 사용함으로써 해결할 수 있다. RST 변환에 대응하기 위한 기존의 방법은 주로 전체 영상에 대해 DFT 변환을 수행한다. 그러나 이 방법은 전체 영상에 변환을 취함으로써 효과적인 마스킹 방법의 적용이 어려운 단점이 있다. 따라서 본 논문에서는 $8\times8$ 블록 DCT (Discrete Cosine Transform)를 채용하고 $8\times8$ 블록 DCT 계수의 공간-주파수 국부화 특성을 이용한 마스킹 방법을 사용한다. 실험결과, 제안된 방법이 영상 압축과 기하학적 처리를 포함한 다양한 공격에 강인한 특성을 보였다.

부가 잡음 환경에서의 음성인식을 위한 비선형 변환을 이용한 캡스트럼 정규화 기법 (Cepstral Normalization using Non-Linear Transform for Speech Recognition in Additive Noise Environments)

  • 석용호
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.115-118
    • /
    • 1998
  • 본 연구에서는 입력 음성 특징 파라메터를 선형 및 비선형 변환함으로써 음성 특징의 1 차, 2 차 및 고차 통계치를 정규화하였다. 이러한 정규화 기법을 통해서 부가잡음 환경에서의 음성인식 성능향상을 얻을 수 있었다.

  • PDF

한국어 수사어절의 유형 분류 및 정규화 (Classification and Normalization of Korean Numerals)

  • 강승식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.187-189
    • /
    • 1999
  • 여러 가지 형태로 표현되는 수사어절을 아라비아 숫자로 구성된 표준형으로 변환하기 위하여 수사어절을 인식하는 알고리즘과 수사어절을 표준형으로 변환하는 수사어절 정규화 알고리즘을 제안한다. 띄어쓴 수사어절은 전처리 단계에서 수사어절 인식 알고리즘을 이용하여 한 어절로 결합한다.

  • PDF

회전 변환에 강인한 주파수 영역 로고 삽입 워터마크 방법 (A Rotation Resistant Logo Embedding Watermark on Frequency Domain)

  • 이인정;이형;민준영
    • 한국정보기술응용학회:학술대회논문집
    • /
    • 한국정보기술응용학회 2006년도 춘계학술대회
    • /
    • pp.730-736
    • /
    • 2006
  • 본 논문에서는 멀티미디어 저작권 보호를 위한 회전(Rotation) 변환 공격에 견디는 강인한 로고 삽입 방법을 제안한다. 기하학적인 처리는 영상의 화질을 많이 훼손하지 않으면서 워터마크 탈지 과정을 매우 복잡하고 어렵게 한다. 정규화 된 영상 (Normalized Image)에 워터마크를 삽입하는 방법은 영상의 정규화 과정에서 보간에 의해 평탄화 (Smoothing effect) 현상이 발생하는 단점이 있다. 이것은 워터마크를 정규화 된 영상에 직접 삽입하는 대신, 영상 정규화를 변환 파라미터를 계산하는데 사용함으로써 해결할 수 있다. 회전 변환에 대응하기 위한 기존의 방법은 주로 전체 영상에 대해 DFT 변환을 수행한다. 그러나 이 방법은 전체 영상에 변환을 취함으로써 효과적인 마스킹 방법의 적용이 어려운 단점이 있다. 따라서 본 논문에서는 DCT를 채용하고 계수의 공간-주파수 특성을 이용한 마스킹 방법을 사용한다. 실험결과. 제안된 방법이 회진변환 공격에 강인한 특성을 보였다.

  • PDF