• 제목/요약/키워드: stylization

검색결과 28건 처리시간 0.02초

최소 자승오차 방식을 이용한 세그먼트 피치패턴의 정형화 (A New Stylization Method using Least-Square Error Minimization on Segmental Pitch Contour)

  • 이정철
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.107-110
    • /
    • 1994
  • In this paper, we describe the features of the fundamental frequency contour of Korean read speech, and propose a new stylization method to characterize the Fø pattern of segments. Our algorithm consists of three stylization processes : the segment level, the syllable level, and the sord level. For stylization of Fø contour in the segment level , we applied least square error minimization method to determine Fø values at initial, medial, and final position in a segment. In the syllable level, we determine the stylized Fø pattern of a syllable using the mean Fø value of each word and style information for each word, syllable and segment, we reconstruct Fø contour of sentences. The simulation results show that the error is less than 10% of the actual Fø contour for each sentence. In perception test, there is little difference between the synthesized speech with the original difference between the synthesized speech with the original Fø contour and the synthesized speech with the stylized Fø contour.

  • PDF

이차원 영상의 라인 드로잉 (Line Drawings from 2D Images)

  • 손민정;이승용
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제34권12호
    • /
    • pp.665-682
    • /
    • 2007
  • 라인 드로잉은 적은 표현으로 물체에 대찬 많은 정보를 줄 수 있다는 점 때문에 비사실적 렌더링 분야에서 중요시되고 있다. 하지만 라인 드로잉에 대한 연구는 이차원 영상에 비해 물체에 대한 정보가 충분한 삼차원 모델을 대상으로 주로 이루어졌다. 본 논문에서는 이차원 영상을 라인 드로잉 형태로 표현하는 효과적인 방법을 제시한다. 이를 위한 알고리즘은 크게 필터링, 선 연결, 스타일화 세 단계로 나뉜다. 필터링 단계에서는 영상의 어느 부분에 선이 그려질지를 우도 함수를 이용하여 예상한다. 선 연결 단계에서 필터링 결과를 클러스터링 및 그래프 검색을 이용하여 연결, 라인 스트로크들을 찾아낸다. 마지막 스타일화 단계에서는 찾아낸 라인 스트로크들을 곡선 근사, 텍스쳐 매핑 등을 이용하여 여러 비사실적 렌더링 형태로 표현한다. 이러한 방법을 이용하여 실제 이차원 영상에서 라인 스트로크를 얻고, 디테일 제어를 적용하여 여러 가지 원하는 스타일의 라인 드로잉을 만들 수 있다.

MSER을 이용한 다중 스케일 영상 분할과 응용 (Multi-scale Image Segmentation Using MSER and its Application)

  • 이진선;오일석
    • 한국콘텐츠학회논문지
    • /
    • 제14권3호
    • /
    • pp.11-21
    • /
    • 2014
  • 다중 스케일 영상 분할은 영상 스타일링과 의료진단과 같은 여러 응용에서 매우 중요하다. 이 논문은 다중 스케일 구조를 확보하며 안정적이고 효율적인 MSER에 기반을 둔 새로운 알고리즘을 제안한다. 이 알고리즘은 영상에서 MSER를 수집한 후, 이것들을 특정한 순서대로 영상에 다시 그려 넣음으로써 영상을 분할한다. 영상 경계를 평활화하고 잡음을 제거하기 위한 계층적 모폴로지 연산을 제안한다. 알고리즘의 다중 스케일 특성을 보이기 위해, 여러 종류의 상세 단계 제어의 효과를 영상 스타일링에 적용한다. 제안한 기법은 이러한 효과를 시간이 많이 걸리는 다중 가우시언 평활화없이 수행한다. 분할 품질과 계산 시간 측면에서 민쉬프트-기반 Edison 시스템과 비교 결과를 제시한다.

영어의 억양 유형화를 이용한 발화 속도와 남녀 화자에 따른 음향 분석 (An acoustical analysis of speech of different speaking rates and genders using intonation curve stylization of English)

  • 이서배
    • 말소리와 음성과학
    • /
    • 제6권4호
    • /
    • pp.79-90
    • /
    • 2014
  • An intonation curve stylization was used for an acoustical analysis of English speech. For the analysis, acoustical feature values were extracted from 1,848 utterances produced with normal and fast speech rate by 28 (12 women and 16 men) native speakers of English. Men are found to speak faster than women at normal speech rate but no difference is found between genders at fast speech rate. Analysis of pitch point features has it that fast speech has greater Pt (pitch point movement time), Pr (pitch point pitch range), and Pd (pitch point distance) but smaller Ps (pitch point slope) than normal speech. Men show greater Pt, Pr, and Pd than women. Analysis of sentence level features reveals that fast speech has smaller Sr (sentence level pitch range), Sd (sentence duration), and Max (maximum pitch) but greater Ss (sentence slope) than normal speech. Women show greater Sr, Ss, Sp (pitch difference between the first pitch point and the last), Sd, MaxNr (normalized Max), and MinNr (normalized Min) than men. As speech rate increases, women speak with greater Ss and Sr than men.

Simpson Style Caricature based on MLS

  • Lee, Jiye;Byun, Hae Won
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제7권6호
    • /
    • pp.1449-1462
    • /
    • 2013
  • We present a novel approach to producing facial caricature with Simpson cartoon style based on Moving Least Squares (MLS). We take advantage of employing the caricature stylization rule of caricature artist, Justin. Our method allows Simpson-style cartoon character similar to user's features by using Justin's technique, which is a set of caricature stylization rules. Our method transforms input photo image into Simpson style caricature by using MLS approximation. The unique characteristics of user in the photo can be detected by comparing to the mean face feature and the input face feature extracted by AAM(Active Appearance Model). To exaggerate the detected unique characteristics, we set up the exaggeration rules using Justin's technique. In addition, during the cartooning process, user's hairs and accessories are used to the deformed image to make a close resemblance. Our method preserves the reliable and stylized caricature through the exaggeration rules of the actual caricature artist's techniques. From this study, we can easily create a Simpson-style cartoon caricature to resemble user's features by combining a caricature with existing cartoon researches.

억양의 근접복사 유형화를 이용한 감정음성의 음향분석 (An acoustical analysis of emotional speech using close-copy stylization of intonation curve)

  • 이서배
    • 말소리와 음성과학
    • /
    • 제6권3호
    • /
    • pp.131-138
    • /
    • 2014
  • A close-copy stylization of intonation curve was used for an acoustical analysis of emotional speech. For the analysis, 408 utterances of five emotions (happiness, anger, fear, neutral and sadness) were processed to extract acoustical feature values. The results show that certain pitch point features (pitch point movement time and pitch point distance within a sentence) and sentence level features (pitch range of a final pitch point, pitch range of a sentence and pitch slope of a sentence) are affected by emotions. Pitch point movement time, pitch point distance within a sentence and pitch slope of a sentence show no significant difference between male and female participants. The emotions with high arousal (happiness and anger) are consistently distinguished from the emotion with low arousal (sadness) in terms of these acoustical features. Emotions with higher arousal show steeper pitch slope of a sentence. They have steeper pitch slope at the end of a sentence. They also show wider pitch range of a sentence. The acoustical analysis in this study implies the possibility that the measurement of these acoustical features can be used to cluster and identify emotions of speech.

물리적 모션 분석을 이용한 만화 스타일의 비디오 생성 (Cartoon-Style Video Generation Using Physical Motion Analysis)

  • 이선영;윤종철;이인권
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권5호
    • /
    • pp.522-526
    • /
    • 2008
  • 본 논문에서는 일반적인 비디오의 모션을 만화와 같은 스타일로 자동으로 변환해주는 시스템을 제안한다. 이 시스템은 비디오의 물리적인 상황에 맞게 자연스러운 변형을 손쉽게 적용할 수 있는 새로운 비디오의 만화화 방법이다. 선택된 비디오 오브젝트의 운동량, 운동방향, 힘과 같은 물리적인 요인들을 분석하여 물리적으로 타당한 변형을 적용함으로써 자연스러운 효과를 적용한다는 것이 장점이다. 전통적인 애니메이션에서 사용하는 몇 가지 전형적인 디포메이션 시나리오를 구축하고 사용자가 손쉽게 원하는 효과를 선택하여 적용한다. 타이밍 컨트롤과 카툰 렌더링을 사용하여 최종적으로 역동적이고 만화 같은 비디오를 만들어 낸다.