• 제목/요약/키워드: 데이터 정규화

검색결과 472건 처리시간 0.032초

정규화 지속시간 회귀트리를 기반으로 한 음운지속시가 모델화 (A Modelling of segmental Duration based on Regression Tree of the Normalized Duration)

  • 정지혜
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 2호
    • /
    • pp.278-281
    • /
    • 1998
  • 본 논문에서는 자연음성으로부터 통계적인 방법으로 일반적인 음성합성 규칙을 생성하기 위해, 남녀 각각 1명이 200문장에 대해 발성한 문음성 데이터를 음운 세그먼트, 음운 라벨링, 음운별 품사 태깅, 문법 정보 태깅하여 음성 데이터베이스를 구축하였다. 이 음성 데이터베이스로부터 휴지지속시간을 분석하여 긴 휴지와 짧은 휴지로 분류하였고, 이러한 휴지가 어느 경우에 나타나는가를 조사하였다. 음운지속시간을 보다 정교하게 예측하기 위하여, 각 음운의 고유 지속시간의 영향을 배제시킨 정규화 지속시간에 대해 2가지 class(장, 단)의 휴지시간을 고려한 회귀트리로 음운지속시간을 모델화하였다. 제안된 모델의 평가 결과 예측치와 관측치 간의 다중 상관 계수는 남성은 0.82, 여성은 0.84 정도로 평가되었다.

  • PDF

코드 내부 정보의 정규화 기반 효율적인 코드 정적 분석 및 가시화 (Effective code static analysis and visualization based on Normalization of internal code information)

  • 박찬솔;전병국;김영철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.85-87
    • /
    • 2022
  • 고품질 코드를 위한 정적 분석은 아직도 매우 필요한 영역이며, 또한 코드의 가시화는 개발자들에게 코드의 복잡한 모듈에 대한 가이드에 필요하다. 기존의 코드 가시화는 정적 분석의 코드 내부 정보들을 DB 테이블화 및 품질 지표(CK Metrics, Coupling, # function Calls, Bed smell) 질의어화, 그리고 추출된 정보를 가시화하는 것에만 초점을 두었다. 문제는 코드 내부 정보(Class, method, parameters, etc) 테이블들에 대한 join 연산 시 엄청난 시간과 리소스가 소모된다. 이 문제를 해결하기 위해, 우리는 테이블 설계의 정규화를 제안한다. 또한 필요한 품질 지표의 질의를 통해 코드 내부 정보 추출하여 데이터 및 제어 복잡 모듈을 식별하여 refactoring 를 가이드 한다. 앞으로는 이 부분의 AI learning 을 통해 bad/good program 을 식별을 기대한다.

딥러닝 기반 네트워크 침입탐지를 위한 데이터 전처리 방안 연구 (A Study of Data Preprocessing for Network Intrusion Detection based on Deep Learning)

  • 정기문
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2018년도 제58차 하계학술대회논문집 26권2호
    • /
    • pp.165-166
    • /
    • 2018
  • 최근 딥러닝 기술이 발전함에 따라 이를 네트워크 침입탐지 분야에 적용하려는 연구가 활발히 이루어지고 있으며 이에 따라 대용량 네트워크 데이터에 대한 처리 방법이 주목받고 있다. 본 논문에서는 네트워크 데이터를 이미지화하는 전처리 방법을 제안한다. 네트워크 데이터를 세션단위로 처리하여 손실율을 줄이면서 딥러닝 알고리즘에 바로 적용할 수 있도록 정규화된 이미지로 변환하는 방법이다. 이를 통해 딥러닝 기술을 적용한 네트워크 정보보안 분야의 연구 활성화를 기대할 수 있다.

  • PDF

신경망을 이용한 정상·비정상 얼굴유형 탐지 연구 (A Research on Anomaly type of face detection using Neural Network)

  • 김운영;원일용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.623-624
    • /
    • 2009
  • 본 논문에서는 신경망의 오류 역전파(Backpropagation) 학습 알고리즘을 이용한 얼굴의 정상 비정상을 인식하는 보안 시스템을 제안하였다. 제안된 시스템은 정지영상 및 동영상에서 입력된 얼굴영상을 전처리 단계에서 얼굴영역을 검출하여 $160{\times}160$ 크기의 고정 크기로 확대 및 축소 작업을 거친다. Mosaic 처리와 LaplacianEdge 처리를 거쳐 $40{\times}40$ 크기로 이진화한 정규화 데이터를 Gravity-Center 처리를 한다. 오류 역전파 학습 알고리즘으로 얼굴의 특징을 학습한 후 각종 정상 및 비정상 얼굴 데이터를 이용하여 인식률을 실험 하였다. 실험데이터는 이 분야의 공인 자료인 LFW Face Database[7] 데이터를 사용하였으며, 실험결과는 제안된 방법이 문제 해결에 적합한 접근임을 보여준다.

기계학습 기반 다중 레이블 분류를 이용한 실시간 전략 게임에서의 상대 행동 예측 (Opponent Move Prediction of a Real-time Strategy Game Using a Multi-label Classification Based on Machine Learning)

  • 신승수;조동희;김용혁
    • 한국융합학회논문지
    • /
    • 제11권10호
    • /
    • pp.45-51
    • /
    • 2020
  • 최근 많은 게임이 사용자의 게임 플레이와 관련된 데이터를 제공하고 있고, 이에 기계학습 기법을 결합하여 상대의 행동을 예측하는 연구들이 있다. 본 연구는 실시간 전략 게임(클래시로얄)의 경기 데이터와 기계학습 기반의 다중 레이블 분류를 사용하여 상대 플레이어의 행동을 예측한다. 초기 실험은 이진 형태의 카드 특성과 카드 배치 좌표 그리고 정규화된 시간 정보를 입력받아 카드 타입, 카드 배치 좌표를 랜덤포레스트와 다층 퍼셉트론을 이용하여 예측한다. 이후, 순차적으로 3 가지 전처리 방식을 사용하여 실험을 진행했다. 먼저 입력 데이터의 특성 정보 일부를 변환시켜 예측했다. 다음으로 입력 데이터를 연속된 카드 입력 방식까지 고려한 중첩 형태로 변환 시켜 예측했다. 마지막으로 모든 이전 단계의 데이터들을 정규화된 시간 기준에 따라 초반, 후반으로 분할하여 예측했다. 그 결과 가장 개선을 보인 전처리 방식은 중첩 형태의 데이터를 초반으로 분할하였을 경우로 카드 타입이 약 2.6%, 카드 배치 좌표가 약 1.8% 개선을 보였다.

시간의 단위별 처리를 이용한 자동화된 한국어 시간 표현 인식 및 정규화 시스템 (Automatic Recognition and Normalization System of Korean Time Expression using the individual time units)

  • 선충녕;강상우;서정연
    • 인지과학
    • /
    • 제21권4호
    • /
    • pp.447-458
    • /
    • 2010
  • 시간 정보는 문서나 문장 등에서 매우 중요한 정보로 사용되기 때문에 다양한 종류의 데이터에서 시간 정보의 인식은 매우 중요하다. 시간 정보는 일정한 형태를 가진 것으로 간주되지만 실제 사용되는 시간 표현은 매우 다양하고 복잡하며 정보의 일부가 빈번하게 생략되는 경우가 발생한다. 본 연구에서는 시간 표현의 추출뿐만 아니라 추출된 표현을 정규화된 표준 형식으로 변환하는 범용 시간 표현 추출 및 변환 시스템을 제안한다. 다양한 시간 표현의 추출과 변환에 필요한 노력을 줄이고 새로운 데이터에 대한 확장성을 보장하기 위해 기본 시간 단위를 정의하였다. 추출단계에서는 기본 시간 단위의 조합으로 구성된 사전을 사용하여 가능한 시간 표현들을 추출한다. 정규화 변환 단계에서는 인접 추출 정보와 기준 시간 등을 사용하여 생략된 기본 시간 단위 정보를 복원하고 최종적으로 모든 기본 시간 정보들은 통합되어 정규화된 표준 형식으로 변환된다. 제안한 시스템은 모바일 기기 등의 잡음 환경에서 강인한 성능을 보장하며 영역이나 언어에 대해 독립적이므로 많은 영역에서 응용이 가능하다. 본 연구는 실험에서 다량의 오류가 포함된 SMS 데이터에서 시간 표현 추출 정확도 93.8%, 시간 표현 변환 정확율 93.2%을 보임으로써 오류에 강인하면서도 높은 성능을 유지함을 증명하였다.

  • PDF

다중캐리어 해상 MANET을 위한 정규화된 전송특성에 의한 경로배정방식 (A Routing Scheme by Normalized Transmission Characteristics (NTCR) for Multi-Carrier MANETs at Sea)

  • 손주영
    • Journal of Advanced Marine Engineering and Technology
    • /
    • 제35권8호
    • /
    • pp.1092-1097
    • /
    • 2011
  • 해상에서 데이터통신은 전통적으로 위성과 RF로 이루어진다. 그러나 전송률과 비용의 제약으로 새로운 통신체계를 필요로 한다. 최근 육상의 광대역 캐리어를 해상에서 활용하고자하는 노력이 경주되고 있다. 이 논문에서는 자율망 기반의 해상통신망 모델에서 다양한 육상의 캐리어를 해상에 적용한 경로배정방식을 새롭게 제안한다. 그것은 응용과 캐리어의 전송특성의 정규화된 값에 의한 최적 캐리어를 찾은 후 그 캐리어에 의한 최적경로를 선택하는(NTCR) 방식으로 기존의 최다승방식(MWR)과 성능을 비교하였다.

개념적 설계를 배제한 관계형 데이터베이스 스키마의 설계 (A Design Methodology of Relational Database Schema Without the Conceptual Design Step)

  • 엄윤섭
    • 한국정보통신학회논문지
    • /
    • 제9권2호
    • /
    • pp.445-453
    • /
    • 2005
  • 관계형 데이터베이스의 설계 과정은 요구사항 분석, ER 모델을 이용한 개념적 설계, 논리적 설계, 그리고 물리적 설계 과정으로 구성된다. 논리적 설계과정은 ER 다이어그램으로 구성된 개념적 스키마를 관계형 스키마로 전환하여 정규화시키는 과정으로 이루어진다. 이런 기존의 설계 과정에서 요구사항의 분석 후 개념적 스키마를 도출하는 개념적 설계 과정이 명확치 않음으로 인해서, 실제 데이터베이스 설계현장에서 적용하기 어려운 점이 있다. 본 논문에서는 작업과정이 모호한 개념적 설계를 제거함으로 보다 체계적으로 데이터베이스 스키마를 설계할 수 있는 방법을 제안한다. 구조적 설계 방법을 이용하여 자료 흐름도를 작성하고, 자료흐름도의 자료저장소에 파악된 애트리뷰트를 이용하여 관계합성으로 관계형 스키마를 도출한다. 관계형 스키마를 정규화하고, 정규화된 테이블로부터 데이터의 의미를 파악하여 테이블 관계도를 작성함으로써 최종 논리적 스키마를 결정한다.

Trainable TTS System을 위한 음운 지속시간 모델링 (An Analysis on the Phoneme Duration Modeling For the Trainable TTS System)

  • 서지인;이양희
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2001년도 추계학술발표대회 논문집 제20권 2호
    • /
    • pp.109-112
    • /
    • 2001
  • 본 논문에서는 한국어 Trainable TTS System의 자연스러운 음성 합성을 위해 400문장(어절수 : 6,220, 음운수: 총43,701: 자음 23,899,모음: 19,802)에 대하여 단일 남성화자가 발성한 문 음성 데이터를 음운레벨세그먼트, 음운 라벨링 ,어절간의 띄어쓰기 ,어절에 대한 음운별 품사가 태깅된 문 음성 코퍼스를 사용하여 음운 환경과 품사에 의하여 음운의 지속시간이 어떻게 변화하는가에 대하여 통계적으로 분석하였다. 그리고 음운 지속시간을 보다 정교하게 예측하기 위하여, 각 음운에 대한 고유 지속시간의 영향이 배제된 정규화 음운지속시간에 대한 회귀트리를 이용하여 정규화 지속시간에 영향을 미치는 특징요소들 간의 관계를 통계적인 방법으로 분석하였다. 그 결과 문법적인 특징요소를 나타내는 요소들간에 서로 상관이 높게 나타나는 것을 알 수 있었다 그리고 이러한 경우 유사한 특징 요소들간에 상관이 1에 가까울 정도로 상관이 높은 요소들의 경우 예측지수가 낮은 요소들을 제거하여도 지속시간변화에 영향을 미치지 못하는 것으로 나타났다. 그 결과 문법적 성질이 유사한 특징 요소들을 회귀트리를 통해 모델링할 경우에 요소들간의 상관정도를 분석하여 최소한의 특징요소들을 선택 할 수 있는 방법을 제시하였다 그리고 이를 토대로 한 정규화 회귀트리의 모델링이 지속시간 회귀트리 모델링보다 우수함을 입증하였다.

  • PDF

Scalogram과 Switchable 정규화 기반 합성곱 신경망을 활용한 베이링 결함 탐지 (Scalogram and Switchable Normalization CNN(SN-CNN) Based Bearing Falut Detection)

  • ;김윤수;석종원
    • 전기전자학회논문지
    • /
    • 제26권2호
    • /
    • pp.319-328
    • /
    • 2022
  • 베어링은 기계가 작동할때 중요한 역할을 한다. 때문에, 베어링에 결함이 발생하면 기계전체의 치명적인 결함을 발생시킨다. 그러므로 베어링 결함은 조기에 발견되어야한다. 본 논문에서는 연속 웨이블릿 변환과 Switchable 정규화를 기반으로 한 합성곱 신경망(SN-CNN)을 이용한 방법을 베어링 결함 감지 모델에 대해 설명한다. 모델의 정확도는 Case Western Reserve University(CWRU) 베어링 데이터 집합을 사용하여 측정되었다. 또한 배치 정규화(BN, Batch Normalization)[1] 방법과 스펙트로그램 이미지가 모델 성능의 비교를 위해 사용되었다.