• 제목/요약/키워드: 특징변환

검색결과 1,728건 처리시간 0.029초

H.264 변환을 위한 DCT 도메인에서의 Intra 프레임 변환 기법 (Intra Frame transcoding Scheme based on DCT-domain for H.264 Transcoding)

  • 강진미;이주경;정기동
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (3)
    • /
    • pp.460-462
    • /
    • 2004
  • 최신의 동영상 압축 표준인 H.264[1]는 기존의 동영상 압축 표준에 비해 압축 성능이 매우 높으며 4$\times$4 DCT(Discrete Cosine Transform)를 수행하는 특징이 있다. H.264 표준에서는 압축 효율을 높이기 위해 Intra 프레임 내의 이웃한 픽셀칸의 연관성을 이용한 프레임 내 창조(Intra Prediction)를 수행한다. 그러므로 기존의 동영상 압축 데이터를 H.264로 변환하기 위해서는 intra 프레임의 프레임 내 창조와 8$\times$8 DCT 블록의 4$\times$4 정수형 DCT 블록으로의 변환을 필수적으로 수행해야 한다. 또한, Intra 프레임은 GOP 내의 다른 프레임의 창조 대상이 되므로 변환 시 화질의 최적화가 필수적이다[2]. 본 논문에서는 Intra 프레임의 변환 시 화질의 최적화를 위해 DCT 도메인 상에서 프레임 내 창조를 수행하는 기법을 제안한다. 제안된 기법은 추가적인 계산없이 DCT 변환으로 인한 오류를 줄여 변환된 intra 프레임의 화질을 개선할 수 있다.

  • PDF

시맨틱 웹 서비스 조합을 위한 계획 영역 지식 변환기 (A Planning Domain Knowledge Converter for Semantic Web Service Composition)

  • 김현식;이상연;김인철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.133-135
    • /
    • 2006
  • 최근 들어 자동화된 시맨틱 웹 서비스 조합을 위해 인공지능 계획 기법을 이용하려는 연구가 활발하다. 하지만 이러한 계획 기법이 효과적으로 적용되기 위해서는 먼저 시맨틱 웹 서비스의 명세와 온톨로지들을 계획기에서 이용 가능한 계획 영역 지식 형태로 변환하여야 한다. 본 논문에서는 OWL-S로 기술된 웹 서비스 명세와 OWL로 정의된 온톨로지를 표준 계획영역지식 표현언어인 PDDL로 변환하는 변환기의 설계와 구현에 대해 설명한다. 이 변환기의 특징은 기존의 OWLS2PDDL와는 달리 KIF 기반의 전제조건과 효과에 대한 변환 기능을 추가로 제공하며, 웹 서비스의 입출력 데이터에 대한 명세변환도 보다 실용적으로 간소화하였다. 또한, 이 변환기는 계획을 위한 영역모델과 이 영역모델에 기초한 다양한 문제모델들을 별도로 분리하여 생성하며, 이 두 모델 모두에 온톨로지가 적용될 수 있도록 허용한다.

  • PDF

Mask R-CNN 과 zi2zi 모델을 활용하여 탐지된 객체의 스타일을 변환시키는 신경망 모델 (Neural network model for detected object style transformation using Mask R-CNN and zi2zi)

  • 조인수;최동빈;박용범
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.562-565
    • /
    • 2021
  • 스타일 변환 모델은 이미지 전체나 이미지 내에서 사용자가 지정한 영역을 대상으로 스타일을 변환시킨다. 이런 방식은 이미지 내의 다수의 객체에 대해 스타일 변환을 시행할 때 일일이 영역을 지정해 줘야 한다는 불편함과 결과물의 전체 해상도가 떨어진다는 한계를 가지고 있다. 본 논문에서는 이런 한계들을 극복하기 위해 객체탐지 모델과 스타일변환 모델을 연동한 객체스타일변환모델을 제안하고 모델 간 연동방법에 대해 자세히 서술한다. 객체탐지모델인 Mask R-CNN 을 통해 필요한 객체를 탐지하고 탐지한 객체의 특징맵들을 스타일변환 모델인 zi2zi 의 입력 값으로 전달하여 이미지 내의 필요한 객체들만 스타일변환이 이루어지도록 모델이 동작한다. 이러한 모델은 기존에 있는 두 모델을 재사용함으로써 모델을 처음부터 새로 설계할 필요가 없다는 장점이 있으며, 공개된 다양한 모델들을 서로 융합하여 사용할 수 있는 방법을 제시하는데 도움을 줄 것이다.

웨이블렛 변환을 이용한 전력시스템 고장전류의 판별 (Faults Current Discrimination of Power System Using Wavelet Transform)

  • 이준탁;정종원
    • 조명전기설비학회논문지
    • /
    • 제21권3호
    • /
    • pp.75-81
    • /
    • 2007
  • Wavelet 변환은 신호를 분석하고 해석하는데 효과적인 수학적 도구로 알려져 여러 응용분야에서 다양한 연구가 진행되고 있다. Wavelet 변환은 Fourier 변환과 유사한 측면도 있으나, Fourier 변환과는 달리 다양한 Wavelet 모함수를 사용함으로써 해석 속도가 빠르고, 시간-주파수 영역에서 국재화가 가능하다는 특징을 가지고 있을뿐만 아니라 고주파 성분에 대해선 시간 분해능이 높고, 저주파 성분에 대해선 주파수 분해능이 좋다는 장점을 가지고 있으므로, 전력계통의 다양한 고장 전류의 판별에 적극 이용할 수 있을 것으로 생각된다. 본 논문에서는 고장 전류의 특성을 해석하는데 용이한 복소형의 Morlet Wavelet 모함수를 사용하여 전력계통의 고장기록장치로부터 얻어지는 선로의 전류 데이터를 Wavelet 변환하였고, 이로부터 다양한 고장 모드를 판별할 수 있었다. 실험 결과 Wavelet 변환을 이용하여 선로의 고장 모드를 판별하는 것이 기존의 고속 Fourier 변환을 이용하는 것보다 특징점 고찰에 더욱 유용하다는 것을 확인할 수 있었다.

Contourlet 변환 및 PCA에 의한 얼굴인식 (Face Recognition using Contourlet Transform and PCA)

  • 송창규;권석영;전명근
    • 한국지능시스템학회논문지
    • /
    • 제17권3호
    • /
    • pp.403-409
    • /
    • 2007
  • 컨투어렛 변환은 2차원의 웨이블렛 변환을 확장한 개념으로 다중스케일과 방향성필터뱅크를 이용한다. 이러한 컨투어렛 변환은 웨이블렛 변환의 특징인 다중스케일과 시간-주파수의 지역적 특성뿐만 아니라 방향성분에 대해서도 풍부한 정보를 얻을 수 있는 장점을 가지고 있다 본 논문에서는 컨투어렛 변환과 주성분분석기법을 이용하는 융합기법에 의한 얼굴인식 시스템을 제안한다. 제안된 방법은 먼저 컨투어렛 변환에 의해 얼굴영상을 방향성 부대역 영상으로 분할한 후, 주성분분석기법을 이용하여 방향성분별로 분할된 각각의 부영상에 대하여 특징벡터를 산출한다. 그리고 최종 단계에서는 각각의 대역별로 산출된 매칭도를 효과적으로 융합할 수 있는 융합기법을 이용하여 얼굴인식을 수행한다. 제안된 방법의 타당성을 보이기 위해 ORL 얼굴영상과 CBNU 얼굴영상을 대상으로 실험한 결과 기존 방법인 PCA나 웨이블렛 변환을 이용한 방법에 비해 향상된 인식 성능을 보임을 확인할 수 있었다.

공간주파수를 이용한 장면영상에서 텍스트 검출 (Text Detection in Scene Images using spatial frequency)

  • Sin, Bong-Kee;Kim, Seon-Kyu
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권1_2호
    • /
    • pp.31-39
    • /
    • 2003
  • 장면 영상 속의 분사 영역에는 다른 부분과는 구분되는 특징적인 공간주파수가 있다. 이 특징은 직관적이며 또한 유용한 정보로서의 가치가 있다. 본 논문에서는 장면 영상에서 수평 텍스트를 찾는 방법을 제안한다. 수직 및 수평 방향으로 걸친 edge 픽셀의 빈도수와 푸리에 변환에 의한 기본 주파수의 두 가지 특징을 이용한 방법이다. 두 가지 특징을 독립적으로 활용하여 그 결과를 결합하거나 연속하여 적용하여 원하는 결과를 얻을 수 있다. 이와 같은 특징은 대체로 언어 또는 문자에 무관함을 확인하였다. 이에 추가하여 Hough 변환을 이용한 장면 속의 사각형을 탐색하였다. 여러 사람들에게 유용한 정보는 보통 강한 색상대비로 눈에 잘 띄는 색깔의 사각형 안에 씌어있는 경우가 보통이므로 사자형의 탐색함으로써 보다 효과적으로 문자를 탐색할 수 있다.

간질 분류를 위한 NEWFM 기반의 특징입력 및 퍼지규칙 추출 (Extracting Input Features and Fuzzy Rules for Classifying Epilepsy Based on NEWFM)

  • 이상홍;임준식
    • 인터넷정보학회논문지
    • /
    • 제10권5호
    • /
    • pp.127-133
    • /
    • 2009
  • 본 논문은 가중 퍼지소속함수 기반 신경망(Neural Network with Weighted Fuzzy Membership Functions, NEWFM)을 이용하여 간질 증세를 가진 사람과 건강한 사람의 뇌파(electroencephalogram, EEG)로부터 정상 파형과 간질(epilepsy) 파형을 분류하는 방안을 제시하고 있다. NEWFM에서 사용할 특징입력을 추출하기 위해서 첫 번째 단계에서는 웨이블릿 변환(wavelet transform, WT)을 이용하였다. 두 번째 단계에서는 첫 번째 단계에서 생성한 웨이블릿 계수들을 주파수 분포와 주파수 변동량을 이용하여 24개의 특징입력을 추출하였다. NEWFM은 이들 24개의 특징입력을 이용하여 정상 파형과 간질 파형을 분류하였을 때 98%의 분류성능을 나타내었다.

  • PDF

웨이브렛 변환을 이용한 ECG신호의 잡음제거와 특징점 검출 (Noise Reduction and Characteristic Points Detectoin of ECG Signal using Wavelet Transforms)

  • 장두봉;이상민;신태민;이건기
    • 한국정보통신학회논문지
    • /
    • 제2권1호
    • /
    • pp.11-17
    • /
    • 1998
  • ECG신호가 임상적으로 환자의 심장활동에 관련된 여러 정보를 의사에게 제공한다는 점에서 ECG 신호의 검출은 중요한 환자 진단방법의 하나이다. 특히 QRS복합파형, P파, T파 등의 위치와 각파 간의 간격에 의미있는 정보가 담겨져 있어 의공학 분야에서 ECG신호의 특징점 검출에 관련된 여러 연구들이 있어 왔다. 기존의 ECG신호의 특징점 검출 방법은 정상파형의 경우에는 만족할 만한 성능을 보여 주는데 반해 잡음이 혼입된 ECG신호로부터 정상 ECG신호를 분리해 내는데 있어 성능의 한계를 가진다. 본 논문에서는 최근 공학분야에서 그 활용 영역이 확대되고 있는 웨이브렛 변환 기법을 ECG신호의 특징점 검출과 잡음제거에 적용하여, 잡음이 혼입된 ECG신호의 특징점 검출과 정상 파형 복원을 수행하였다.

  • PDF

일반화 대칭변환을 이용한 스테레오스코픽 영상 매칭점 검색 (Stereoscopic matching using the generalized symmetry transform)

  • 기명석;김규헌
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (상)
    • /
    • pp.755-758
    • /
    • 2002
  • 스테레오스코픽 영상은 스테레오스코픽 카메라를 이용하여 좌 영상(left image)과 우 영상(right image)을 동시에 획득하는 것으로 사람의 눈으로 보는 것과 같은 입체감을 얻을 수 있는 것을 특징으로 한다. 스테레오스코픽 영상에서 객체의 깊이값을 구하기 위해서는 영상의 정합점을 찾는 것이 중요한데, 본 논문에서는 일반화 대칭변환(generalized symmetry transform) 알고리즘을 적용하여 스테레오스코픽(stereoscopic) 영상의 정합점(correspond points)을 찾는 방법을 제안한다. 본 논문에서 제안하는 방법은 먼저 좌 영상과 우 영상에 대해 에지(edge), 코너 검출 방법을 통해 특징점(feature point)을 검출하고 각 특징점들을 중심으로 사각 영역을 설정하고 이 범위내의 에지들이 갖는 대칭도(symmetry magnitude)를 특징점의 위치에 누적 시킨다. 좌영상의 대칭도를 구한 결과를 우 영상의 에지들의 대칭도와 비교를 수행해 임계치(threshold) 이하의 값을 가진 점들을 정합 후보로 선택한다. 이 정합 후보들을 영역내의 반지름 단위의 대칭도 비교를 통해 더욱 세분화된 비교를 수행하고 만약 이와 같은 과정을 통해서도 정합점을 찾지 못한다면 정합 후보들에 대해 칼라 정합도를 측정하여 최종적으로 정합점을 검출한다. 제안한 알고리즘을 이용한다면 특징점만을 이용하여 검색을 수행했을 때보다 더욱 정확한 정합점을 구할 수 있다.

  • PDF

성격유형별 문체 특성 기반 맞춤형 광고 메시지 자동생성 연구 (Automatic Generation of Custom Advertisement Messages based on Literacy Styles of Classified Personality Types)

  • 성지민;최윤종;곽도연;김한샘
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.431-436
    • /
    • 2022
  • 이 연구는 MBTI의 심리 기능지표 조합인 ST, SF, NT, NF의 유형별 특징을 반영한 마케팅 문체 프레임워크를 정의하고 모델 학습을 통해 성격유형별 맞춤화 된 광고 메시지로 생성하는 것을 목적으로 한다. 활용되는 광고 메시지 자동 생성 기술은 BART 모델에 성격유형을 Prefix로 포함한 광고문을 학습시켜 성격유형에 따라 맞춤형 광고 메시지를 생성하는 방식이다. 학습된 모델은 Prefix 조작만으로 MBTI 성격유형별 문체 특징을 갖춘 광고 메시지로 변환되는 것을 실험을 통해 확인할 수 있었다. 본 연구는 성격유형의 특징을 문체 프레임워크로써 정의하고 이에 기반한 모델 학습을 통해 성격유형별 특징을 반영한 광고 메시지를 재현해 낼 수 있다는 점에서 의의가 있다. 또한 성격유형과 연관 feature를 함께 학습하여 유형별 문체 특징과 소구점을 포함한 광고 메시지를 생성했다는 기술적 가치가 있다. 이 연구 결과를 기반으로 차후 타겟 고객층의 성격유형과 광고 도메인을 고려한 효과적인 광고 콘텐츠를 생성해 내는 모델을 개발하여 타겟 마케팅 분야는 물론이고 지역별 또는 언어별 문체 간 차이를 구조화하거나 재현해야 하는 문제에서 기반이 되는 연구로 활용될 수 있을 것으로 기대된다.

  • PDF