• 제목/요약/키워드: 추출 함수

검색결과 1,120건 처리시간 0.046초

불균형의 대용량 범주형 자료에 대한 분할-과대추출 정복 서포트 벡터 머신 (A divide-oversampling and conquer algorithm based support vector machine for massive and highly imbalanced data)

  • 방성완;김재오
    • 응용통계연구
    • /
    • 제35권2호
    • /
    • pp.177-188
    • /
    • 2022
  • 일반적으로 support vector machine (SVM)은 높은 수준의 분류 정확도를 제공함으로써 다양한 분야의 분류분석에서 널리 사용되고 있다. 그러나 SVM은 최적화 계산식이 이차계획법(quadratic programming)으로 공식화되어 많은 계산 비용이 필요하므로 대용량 자료의 분류분석에는 그 사용이 제한된다. 또한 불균형 자료(imbalanced data)의 분류분석에서는 다수집단에 편향된 분류함수를 추정함으로써 대부분의 자료를 다수집단으로 분류하여 소수집단의 분류 정확도를 현저히 감소시키게 된다. 이러한 문제점들을 해결하기 위하여 본 논문에서는 다수집단을 분할(divide)하고, 소수집단을 과대추출(oversampling)하여 여러 분류함수들을 추정하고 이들을 통합(conquer)하는 DOC-SVM 분류기법을 제안한다. 제안한 DOC-SVM은 분할정복 알고리즘을 다수집단에 적용하여 SVM의 계산 효율을 향상시키고, 과대추출 알고리즘을 소수집단에 적용하여 SVM 분류함수의 편향을 줄이게 된다. 본 논문에서는 모의실험과 실제자료 분석을 통해 제안한 DOC-SVM의 효율적인 성능과 활용 가능성을 확인하였다.

인터넷 화상 전화용 음성 코텍을 위한 MPEG4-CELP 부호화기의 구현 (Implementation of MPEG4-CELP Vocoder for Speech Codec of Internet Video Phone)

  • 김병수;김동형;강경옥;홍진우;정재호
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.119-122
    • /
    • 2000
  • 인터넷이 일상생활에 다양하게 활용되면서 인터넷 채널을 통한 정보의 형태는 문자와 이미지 외에 음성, 오디오 신호 및 동영상 부분까지 확대되고 있다. 본 논문에서는 MPEG4-CELP를 인터넷 화상 통신의 음성 코덱용으로 사용하기 위한 최적화 기법 및 알고리듬의 개선을, DSP칩이 내장된 보드가 아닌 인터넷의 터미널로 사용되고 있는 펜티엄 프로세서를 장착한 PC에 초점을 맞추어 수행하였다. MPEG4-CELP VM C소스를 분석 및 프로파일(Profile)한 결과를 토대로 패라미터 추출을 위해 많은 연산을 수행하는 부호화기에 대해서 CPU상에 부하를 많이 주는 함수들을 제 1차 최적화 대상 함수들로 선정하고, CPU에 부하를 많이 주지는 않으나 호출되는 회수가 많은 함수를 2차 최적화 대상 함수로 선정해, C소스 레벨의 소프트웨어 파이프 라이닝(Software Pipelinging) 기법들을 적용하여 최적화를 수행하였다. 또한 1차 최적화 대상 함수의 경우에는 소프트웨어 파이프라이닝의 적용과 함께 연산량 감소를 위한 알고리듬 변형까지 수행하였다. 위의 과정을 거쳐 최적화 된 MPEG4-CELP는 펜티엄Ⅲ 450㎒ PC에서 음성을 부호화 하는데 원 VM소스에 비해 약 2배정도의 시간이 단축되는 것을 확인하였다.

  • PDF

가우시안 기저함수를 이용한 늦은 시간 및 광대역 전자기응답 추출 (Late Time and Wideband Electromagnetic Signal Extraction Using Gaussian Basis Function)

  • 이제훈;류병주;고진환
    • 한국통신학회논문지
    • /
    • 제39A권3호
    • /
    • pp.140-148
    • /
    • 2014
  • 본 논문은 전자기파 신호 계산에 있어 하이브리드 방식의 기저 함수로써 Gaussian 함수를 제안하고자 한다. 하이브리드 방식은 전반부 시간 및 낮은 주파수 데이터를 이용하여 후반부 시간 및 높은 주파수 데이터를 구하는 방식이다. 시간을 이용한 MOT, 주파수를 이용한 MOM 방식의 장점만을 가져오기 때문에 전자기 분석 데이터를 구하기 위한 시간이 감소되며 오차가 적다는 장점이 있다. 이를 위해서는 기저 함수를 필요로 하며 Hermite, Laguerre를 기저 함수로 사용한 기존의 방법과의 비교를 통해 제안된 방법의 성능을 확인하였다.

프라이버시를 보존하는 군집화 (Privacy Preserving Clustering)

  • 유현진;김민호;라마크리쉬나
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 추계학술발표논문집(상)
    • /
    • pp.473-476
    • /
    • 2004
  • 본 논문에서는 프라이버시를 침해 하지 않는 데이터 마이닝에 대해 다룬다. 방대한 데이터에서 유용한 정보를 추출하는 데이터 마이닝분야에서 데이터로부터 프라이버시 보존의 중요성이 부각되고 있다. 그래서 프라이버시의 침해를 막기 위한 방법으로 실제 데이터를 사용하지 않고 잡음이 들어간 데이터를 사용한다. 그리고 프라이버시를 침해하지 않기 위해 잡음이 들어간 데이터로부터 데이터의 확률 밀도 함수(PDF)만을 복원한다. 이렇게 복원된 확률 밀도 함수만을 이용하여 데이터 마이닝기술, 예를 들면 분류화에 곧바로 적용함으로써 프라이버시를 보존하는 것이다. 하지만 분류화에 사용되는 데이터의 1차원적인 확률 밀도 함수만 가지고는 군집화에 사용하기가 부적절하다. 따라서 본 논문에서는 군집화를 하기 위해 잡음이 들어간 데이터로부터 결합 확률 밀도 함수(Joint PDF)를 복원하고, 복원된 결합 확률 밀도 함수만 가지고 군집화를 할 수 있는 방법을 다룬다.

  • PDF

프로그램 변환 및 클래스추출기법의 설계 (Program Transformation and Design of Class Extraction Technique)

  • 진영배
    • 한국컴퓨터정보학회논문지
    • /
    • 제3권3호
    • /
    • pp.63-71
    • /
    • 1998
  • 원시 코드로부터 이 언어들을 충분히 다시 표현할 수 있는 공통의 언어 즉 메타 언어를 설계하여 역공학 시스템의 내부 표현으로 사용하였다. 이것을 입력으로 하여 변수와함수 사이의 관계에 기반한 유사도 공식을 사용하여 가장 적절한 클래스를 추출하고, 추출된 클래스의 가시성을 자동적으로 분류한다.

  • PDF

웨이블릿 변환에 기초한 오디오 워터마킹 (Audio Watermarking based on the Wavelet Transform)

  • 강환일;정철균
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 춘계학술발표논문집 (상)
    • /
    • pp.421-424
    • /
    • 2001
  • 본 연구는 디지털 오디오데이터에 워터마크를 삽입하고 추출하는 알고리즘을 제시한다. 삽입방법은 3단계의 웨이브릿 변환을 행한 후 가장 낮은 주파수대역으로부터 2번째 주파수 대역에 워터마크를 삽입하는데 그 워터마크는 키에 의한 의사난수를 이용한다. 추출시는 상관함수(correlation function)을 이용하여 추출한다. 잡음에 대한 필터 특성 또한 보인다.

  • PDF

푸리에 변환법을 이용한 3차원 위상측정에서의 필터 효과 (Frequency filtering effect on Fourier Transform 3-D Profilometry)

  • 박준식;나성웅;박승규;백성훈;이용주
    • 한국광학회:학술대회논문집
    • /
    • 한국광학회 2003년도 하계학술발표회
    • /
    • pp.296-297
    • /
    • 2003
  • 본 연구에서는 푸리에 변환법에 의한 위상정보 추출 기술을 개발하고, 주파수 영역에서의 창함수 필터에 따른 위상추출 특성을 분석하였다. 푸리에 변환법은 위상이동법과는 달리 정현파 패턴이 투영된 하나의 영상만을 이용하여 3차원 형상정보를 추출할 수 있는 장점이 있다. 획득된 영상은 오일러 공식으로부터 다음과 같이 표현할 수 있다. (중략)

  • PDF

중국 연변 조양하 유역의 국부경사와 배수면적의 관계를 이용한 토사유실 우심지역 추출 (Identification of vulnerable region susceptible to soil losses by using the relationship between local slope and drainage area in Choyang creek basin, Yanbian China)

  • 김주철;최봉학;정관수
    • 한국수자원학회논문집
    • /
    • 제51권3호
    • /
    • pp.235-246
    • /
    • 2018
  • 본 연구의 주목적은 조양하 유역의 유출응집구조와 에너지소비 양상을 멱함수 법칙분포의 틀 내에서 해석하고 이를 기반으로 토사유실에 민감한 우심지역을 추출하기 위한 방법론을 제시해 보고자 하는 것이다. 이를 위하여 GIS를 기반으로 대상유역 내 지점별 배수면적과 함께 소류력 및 수류력을 정의하는 지형학적 인자를 추출하여 해당 인자들에 대한 여누가 분포의 도해적 해석과 함께 멱함수 법칙분포의 적합을 수행하였으며 소류력과 수류력의 규모별 특성권역을 기반으로 토양우실 우심지역을 추출하여 보았다. 소류력를 기반으로 한 토사유실 우심지역의 경우 수류력을 기반으로 한 결과에 비하여 우심지역의 범위가 매우 좁게 평가되고 있음을 시각적으로 확인할 수 있었다. 이러한 결과는 소류력이 멱함수 법칙분포를 따르지 않는 규모종속성 지형학적 인자이기 때문인 것으로 판단된다. 이에 따라 해당 지형학적 인자는 멱함수 법칙분포의 틀 내에서 자연유역의 에너지 규모를 적절하게 반영하지 못하는 것으로 사료되며 본 연구에서 수류력을 기반으로 제시한 지형학적 인자가 토사유실의 평가를 위해 보다 합리적인 것으로 판단된다. 토사유실 우심지역을 도시해 본 결과 국부경사에 종속적인 사면활동 활성구간에서 발생한 토사가 국부경사와 배수면적에 종속적인 지표유동 활성구간을 통하여 계곡으로 이동하는 경로를 시각적으로 확인할 수 있어 본 연구에서 제시한 방법론의 타당성을 판단할 수 있었다.

퍼지신경망과 비중복면적 분산 측정법을 이용한 최소의 특징입력 및 퍼지규칙의 추출 (Extracting Minimized Feature Input And Fuzzy Rules Using A Fuzzy Neural Network And Non-Overlap Area Distribution Measurement Method)

  • 임준식
    • 한국지능시스템학회논문지
    • /
    • 제15권5호
    • /
    • pp.599-604
    • /
    • 2005
  • 본 논문은 가중 퍼지소속함수 기반 신경망(Neural Network with Weighted Fuzzy Membership Functions, NEWFM)을 이용하여 위스콘신 유방암(Wisconsin breast cancer)의 진단을 수행하는 퍼지규칙을 추출하고, 비중복면적 분산 측정법을 사용하여 특징입력수를 최소로하는 방안을 제안하고 있다. NEWFM 구조의 중간 부분인 하이퍼박스(hyperbox)들은n 개의 대, 중, 소로 구성된 가중 퍼지소속함수 집합으로 구성되며, 학습 후 각 집합의 대, 중, 소로 구성된 가중 퍼지소속함수는 퍼지집합의 경계합(bounded sum)을 사용하여 다시 하나의 가중 퍼지소속함수로 합성(BSWFM) 된다. n 개의 특징입력(feature input)은 학습된 모든 하이퍼박스에 연결되어 예측 작업을 수행한다. 여기에 비중복면적 분산 측정법을 적용하여 중요도가 낮은 특징입력을 제거하면서 최소의 m 개 특징입력만을 사용한 하이퍼박스로 단순화시킨다. 이러한 방법으로 위스콘신 유방암의 9개의 특징입력 중 4개를 사용하여 NEWFM으로 추출된 2개의 퍼지규칙은 99.71%의 예측 인식율을 가지며 이는 퍼지규칙의 수와 인식율에 있어 현재 발표된 논문의 결과보다 우수함을 보여준다.

서로 다른 버전의 동일 오픈소스 함수 간 효율적인 유사도 분석 기법 (Efficient Similarity Analysis Methods for Same Open Source Functions in Different Versions)

  • 김영철;조은선
    • 정보과학회 논문지
    • /
    • 제44권10호
    • /
    • pp.1019-1025
    • /
    • 2017
  • 바이너리 유사도 분석은 취약점 분석, 악성코드 분석, 표절 탐지 등에서 사용되고 있는데, 분석대상 함수가 알려진 안전한 함수와 동일하다는 것을 증명해주면 바이너리 코드의 악성행위 분석, 취약점 분석 등의 효율성을 높이는 데에 도움이 될 수 있다. 하지만 기존에는 동일 함수의 서로 다른 버전에 대한 유사도 분석에 대해서 별도로 이루어진 연구가 거의 없었다. 본 논문에서는 바이너리로부터 추출 가능한 함수 정보들을 바탕으로 다양한 방법을 통해 함수 단위의 유사도를 분석하고 적은 시간으로 효율적으로 분석할 수 있는 방안을 모색한다. 특히 OpenSSL 라이브러리의 서로 다른 버전을 대상으로 분석을 수행하여 버전이 다른 경우에도 유사한 함수를 탐지하는 것을 확인한다.