• 제목/요약/키워드: Shape coding

검색결과 113건 처리시간 0.02초

정지 영상에서 PSBS법을 사용한 ROI 영상 코딩의 응용에 관한 연구 (A study on a ROI image coding application to still image using PSBS method)

  • 김동훈;고광철;정제명
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅳ
    • /
    • pp.2319-2322
    • /
    • 2003
  • We propose ROI(region of interest) image coding application to still image using PSBS(partial significant bitplane shift)method combined with human face region detecting system. PSBS is an encoding algorithm for ROI image coding in JPEG2000, and takes advantages of both generic scaling based method and maximum shift method defined in JPEG2000. The Powerful advantages of PSBS are able to adjusting image quality in ROI and background flexibly, and support arbitrarily shaped ROI coding without coding the shape. In this letter, we show how to compress an image for human face region using PSBS method combined with human face region detecting system, and propose its application.

  • PDF

스펙트럼 보상된 고음질 합성용 피치 변경법 (On a Pitch Alteration Method Compensated with the Spectrum for High Quality Speech Synthesis)

  • 문효정
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1995년도 제12회 음성통신 및 신호처리 워크샵 논문집 (SCAS 12권 1호)
    • /
    • pp.123-126
    • /
    • 1995
  • The waveform coding are concerned with simply preserving the wave shape of speech signal through a redundancy reduction process. In the case of speech synthesis, the wave form coding with high quality are mainly used to the synthesis by analysis. However, because the parameters of this coding are not classified as either excitation and vocal tract parameters, it is difficult to applying the waveform coding to the synthesis by rule. In this paper, we proposed a new pitch alteration method that can change the pitch period in waveform coding by using scaling the time-axis and compensating the spectrum. This is a time-frequency domain method that is preserved in the phase components of the waveform and that has a little spectrum distortion with 2.5% and less for 50% pitch change.

  • PDF

비트량-왜곡을 고려한 효율적인 다각형 근사화 기법 (An Efficient Polygonal Approximation Method in the Rate-Distorion Sense)

  • 윤병주;고윤호;김성대
    • 대한전자공학회논문지SP
    • /
    • 제40권1호
    • /
    • pp.114-123
    • /
    • 2003
  • 본 논문에서는 영상 객체 (object) 의 모양 정보를 효율적으로 부호화 하는 기법을 제안한다. 다각 근사화 기법은 손실 부호화 기법으로써 객체의 모양을 근사화 하는데 가장 널리 사용되고 있다. 제안된 기법은 최대 허용 오차를 만족하면서 정점을 선택할 때 기존의 순환 정점 선택 (IRM: iterated refinement method) 이나 순차적 정점 선택 (PVS: progressive vertex selection) 보다 적은 수의 정점을 선택함으로써 비트량을 줄인다. 기존의 순차적인 정점 선택 기법을 기반으로 하여 새로운 정점 선택 조건을 제안하여 비트량-왜곡면에서 우수한 성능을 가지는 부호화기를 구현하였다. 실험 결과에서 제안된 기법이 기존의 정점 선택 기법들에 비해 우수한 성능을 나타냄을 알 수 있다.

객체지향 영상압축에 있어서 윤곽선에 대한 새로운 변환 부호화 (A new transform coding for contours in object-based image compression)

  • 민병석;정제창;최병욱
    • 한국통신학회논문지
    • /
    • 제23권4호
    • /
    • pp.1087-1099
    • /
    • 1998
  • 내용 기반 부호화에서는 장면내의 객체를 독립된 단위로 부호화를 수행하므로, 객체의 모양, 질감, 움직임등의 정보가 중요한 부호화 대상이 된다. 특히, 객체의 모양정보를 나타내는 윤곽선은 전체 정보량의 큰 부분을 차지하면서 주관적 화질에 커다란 영향을 끼치므로 부호화시 심각한 왜곡이 발생하지 않도록 해야한다. 본 논문에서는 윤곽선 부호화를 위해 윤곽선 다각근사화와 이때 발생하는 오차신호를 보상하기 위해 이를 변환 부호화하는 방법을 제안한다. 제안하는 방법에서는, 윤곽선의 다각 근사화시 발생하는 윤곽선의 단편들이 완만한 곡선의 형태를 갖고 오차신호의 양 끝점이 0이라는 특징을 고려해서, 르장드르 다항식에 기반한 새로운 기저를 설계해서 오차신호를 변환한다. 제안한 방법은, 원, 타원 등의 합성영상에 적용했을 경우 이산 여현 변환, 이산 정현 변환 등에 비해 변환부호화 이득면에서 전반적으로 우수한 결과를 얻었고, 자연영상에 적용했을 경우에도 이산 여현보다 우수한 결과를 얻었으며, 이산 정현변환과 대등한 결과를 얻었다.

  • PDF

켑스트럼 분석에 의한 파형부호화의 피치변경에 관한 연구 (On a Pitch Change of the Waveform Coding by the Cepstrum Analysis of Speech Waveforms)

  • 배명진;이미숙
    • 한국음향학회지
    • /
    • 제11권4호
    • /
    • pp.14-21
    • /
    • 1992
  • 음성신호의 합성기법들 중에서 파형부호화법은 음질이 우수하기 때문에 분석에 의한 합성법으로 많이 사용되고 있다. 그렇지만 음원과 성도의 특성을 분리하지 않고 파형의 잉여분만을 제거한 후에 파형자체를 저장하기 때문에 규칙에 의한 합성기법으로 사용하기에는 어려움이 많다. 본 논문에서는 파형부호화법 중에서 선형 PCM부호화법으로 저장된 음성파형에 대해 피치주기를 조절할 수 있는 켑스트럼 분석법을 제안하여 파형자체의 음원을 분리하지 않고 피치주기를 변경시킬 수 있는 새로운 피치 변경법을 제안하였다. 따라서 음질이 우수한 파형부호화 합성법으로 규칙에 의한 합성을 수행할 수 있다.

  • PDF

기준선 기반 이진 형상 부호화기 (Baseline based Binary Shape Coder)

  • 이시화;조대성;조유신;손세훈;장의선;신재섭;서양석
    • 방송공학회논문지
    • /
    • 제2권2호
    • /
    • pp.114-124
    • /
    • 1997
  • 이진 영상 부호화는 종래의 영상 처리에 객체 기반 처리 기능을 제공한다. 이진 영상 부호화를 위하여 본 논문에서는 기준선을 기반으로 하는 새로운 이진 영상 부호화 방식을 제안한다. 종래 이진 부호화기와 달리 본 방식은 객체의 외곽선을 추적하면서2차원의 영상 데이터를 1차원으로 변환하여 이를 부호화한다. 추출되는 데이터는 기준선의 시작점과 거리값 리스트 그리고 변환값 리스트이다. 무손실 부호화에서 이들은 모두 부호화되나 손실 부호화에서는 가변 샘플링을 통하여 구간별로 비슷한 손실정도를 갖도록 조정이 되어 선택된 거리값들 만이 부호화 된다. 또한 프레임간의 움직임 보상에서도 거리값과 변환값을 이용하여 빠른 처리 속도를 갖도록 하였다. 실험결과 현재 MPEG-4 잠정표준안에 채택되어 있는 CAE방식에 비하여 객관적 평가에서는 정지영상부호화(intra 모드)에서는 앞서며, 동영상부호화(inter 모드)에서는 떨어지고 있다. 그러나 주관적인 평가에서는 두 경우 모두 좋은 것으로 평가받고 있다.

  • PDF

케이블 돔 시스템의 형상 최적화 (Shape Optimization of the Cable Dome System)

  • 조남철;최승열;한상을
    • 한국전산구조공학회:학술대회논문집
    • /
    • 한국전산구조공학회 2004년도 봄 학술발표회 논문집
    • /
    • pp.151-160
    • /
    • 2004
  • Genetic algorithm is the theory of grafting the principle of survival of the fittest in genetics on to the computer algorithm and it is used to solve the optimization problems, especially the shape and size optimization of the structure in Architectural problems. In the size optimization problem discrete variables are used, but series variables have to be used in the shape optimization problem because of the incongruenty. The purpose of this study is to obtain the optimum shape of cable domes by using the real coding genetic algorithm. Generally, the structural performance of the cable domes is influenced very sensitively by pre-stress, geometry and length of the mast because of its flexible characteristic. So, it is very important to decide the optimum shape to get maximum stiffness of cable domes. We use the model to verify the usefulness of this algorithm for shape optimization and analyze the roof system of Seoul Olympic Gymnastic Arena as analytical model of a practical structures. It is confirmed lastly that the optimum shape domes have more stiffness than initial shape ones.

  • PDF

청각장애아동과 건청아동의 성도면적 추정 성능 (Performance of Vocal Tract Area Estimation from Deaf and Normal Children's Speech)

  • 김세환;김남;권오욱
    • 대한음성학회지:말소리
    • /
    • 제56호
    • /
    • pp.159-172
    • /
    • 2005
  • This paper analyzes the vocal tract area estimation algorithm used as a part of a speech analysis program to help deaf children correct their pronunciations by comparing their vocal tract shape with normal children's. Assuming that a vocal tract is a concatenation of cylinder tubes with a different cross section, we compute the relative vocal tract area of each tube using the reflection coefficients obtained from linear predictive coding. Then, we obtain the absolute vocal tract area by computing the height of lip opening with a formula modified for children's speech. Using the speech data for five Korean vowels (/a/, /e/, /i/, /o/, and /u/), we investigate the effects of the sampling frequency, frame size, and model order on the estimated vocal tract shape. We compare the vocal tract shapes obtained from deaf and normal children's speech.

  • PDF

DPCM 음성 부호화기의 부정합현상에 관한 연구 (On the Mismatch Phenomena in DPCM Coding of Speech)

  • 유득수;조동호;은종관
    • 대한전자공학회논문지
    • /
    • 제23권5호
    • /
    • pp.597-604
    • /
    • 1986
  • This paper describes various mismatch phenomena in differential pulse code modulation (DPCM) coding, such as the mismatch effects of probability density functin(pdf), signal variance, and correlation. At a high transmission rate(i.e., above 32 kbits/s), the performance of DPCM can be improved by matching the pdf shape between the input signal and the quantizer. However, the same gain cannot be obtained at a lower transmission rate. Also, it is shown that the gamma quantizer is realtively robust to the variation of pdf shaper and signal variance. Moreover, as the transmission rate increases, the performance of DPCM for the input signal with large variance is worse than that of DPCM for the signal with small variance due to the increase of overload noise. According to our simuladiton results, the mismatch effects of pdf shape and variance appear to yield more degradatin than that of correlation in a DPCM system.

  • PDF

ON CODING AND UNIT-TEST PROCESS MANAGEMENT FOR SOFTWARE DEVELOPMENT OF LARGE-SCALE

  • Kino Yasunobu
    • 한국품질경영학회:학술대회논문집
    • /
    • 한국품질경영학회 1998년도 The 12th Asia Quality Management Symposium* Total Quality Management for Restoring Competitiveness
    • /
    • pp.233-238
    • /
    • 1998
  • To manage a phase of coding and unit-test, project managers have used to pay attention to a number of completed programs. And the manager makes a graph of progress. Usually, this graph of progress has S shape and doesn't linearly depend on the workload. So the degree of progress seems to be behind. In actual, many projects tend to be behind the schedule. Because of this reason, it is difficult to judge whether the project is behind or not in the early stage. In this paper, We propose the 'four-division model' to solve this difficulty.

  • PDF