• Title/Summary/Keyword: 음성이미지

Search Result 221, Processing Time 0.035 seconds

Convergence of the Image of the Professor in Human Resources of Small and Medium Enterprises to Self Image : Mediating effect of voice image (중소기업 인적자원의 교수자이미지가 자아이미지에 미치는 융합연구 : 교수자음성이미지의 매개효과)

  • Kim, Jeoung-Yeoul
    • Journal of Convergence for Information Technology
    • /
    • v.7 no.4
    • /
    • pp.229-234
    • /
    • 2017
  • The purpose of this study was to investigate 188 university students at Seoul National University and to present self - image data to university students for the development of small and medium human resources. The results of the study are as follows. First, there was a positive correlation between the correlation between the image of the trainee perceived by university students and the self - image, the correlation between the image of the trainee perceived by the university students and the voice image, and the correlation between the voice image and the self - image perceived by university students. Second, as a result of examining whether or not the voice image is mediated in the relationship between the image of the talent and the self - image perceived by university students, Therefore, it is confirmed that as the image level of the talent related to the human resource of SMEs increases, the level of the voice image increases and the self image level also improves accordingly.

편측 성대마비와 성대폴립 환자의 수술 전후 음성검사와 이미지 화상분석의 상관관계에 대한 객관적 비교연구

  • 김시찬;최홍식;홍정표;오종석
    • Proceedings of the KSLP Conference
    • /
    • 1999.11a
    • /
    • pp.199-199
    • /
    • 1999
  • 각종 음성질환에 있어서 음성검사는 진단뿐 아니라 치료를 위한 중요한 방법으로 알려져 왔다. 특히 수술전후 음성질환의 평가에는 음성검사 뿐 아니라, 후두스트로보스코피를 이용하여 비교함으로써 가능하다. 이중 후두스트로보스코피는 방법이 간단하여 직접 수술전후의 변화를 알 수 있는 장점이 있으나, 객관적인 자료로는 이용하기가 어려운 문제점이 있다. 후두스트로보스코피의 영상자료를 컴퓨터에 연결, 영상신호를 디지털화하여 후두의 움직임을 객관적으로 관찰하려고 시도되어왔다 특히 편측 성대마비 환자에서는 성대의 위치가 외전 될뿐만 아니라 피열연골의 위치가 마비 후 시간이 경과됨에 따라 외회전 하고 성대가 전방으로 위축되어 성대 막성부의 길이가 짧아지는 틀의 후두스트로보스코피의 영상을 보이고, 성대폴립환자에서는 수술전후에 폴립의 크기와 성문면적에 변화를 보이게 된다. 본 연구의 목적은 편측 성대마비와 성대폴립과 같은 각기 다른 두 질병에서 음성경사와 후두스트로보스코피를 이용한 이미지 화상분석을 통해 각 성대의 길이, 각도, 성문틈의 면적과 폴립의 크기등을 측정함으로써 수술전후의 차이를 알아보고, 이미지 화상분석과 음성검사 사이에 어떠한 상관관계가 있는지를 알아보고자 하였다. (중략)

  • PDF

A Study Video using Image and Voice Search (음성과 이미지를 이용한 동영상 검색에 관한 연구)

  • Sin, In-Gyeong;Park, Sung-Hyun;Ahn, Hyo-Chang;Rhee, Sang-Burm
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.11a
    • /
    • pp.568-571
    • /
    • 2012
  • 정보화 사회의 정보 기반 구조로서, 고속 정보망의 구축, 개인용 컴퓨터의 급속한 보급, 멀티미디어 기술의 발전 등으로 인하여 정보 서비스의 새로운 장이 열리고 있다. 동영상 데이터는 텍스트만이 아니라 영상정보, 음성정보등 각종 의미있는 다양한 멀티미디어 정보를 포함하고 있다. 본 논문에서는 동영상에서 음성과 영상을 분리하여 음성을 이용하여 음성열을 분할 및 복원하여 음성을 텍스트로 변환하여 텍스트색인파일을 만들고 영상은 이미지를 분할 및 히스토그램을 사용하여 이미지 샷을 검출하여 두 색인파일을 이용하여 인덱싱을 하여 동영상 검색에 활용한다.

Emotional Image Color Transfer via Voice Emotion Analytics System Based on Raspberry Pi (라즈베리 파이 기반의 음성 감정 분석 시스템을 통한 감성적 이미지 색상 전달)

  • Kim, Jong-Hyun
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2019.01a
    • /
    • pp.391-393
    • /
    • 2019
  • 본 논문은 일상적인 대화로부터 감성을 추출하고 분석함으로써 상황에 맞는 대화의 내용과 분위기를 이미지의 색상으로 표현할 수 있는 이미지 색상 변환 프레임워크를 소개한다. 본 연구는 라즈베리 파이와 마이크 센서를 기반으로 사용자로부터 목소리를 입력받을 수 있는 모듈을 제작하고, 그 목소리로부터 감성을 분석한다. 분석된 감성을 이용하여 이미지의 색상을 자동으로 변환하는 기술과 통합함으로써 청각장애인 및 미취학 아동들이 화자의 대화를 이미지를 통해 쉽게 인지하여 의사소통 및 감성 전달 환경을 개선하고자 한다.

  • PDF

Bi-modal speech recognition in noisy environments (잡음환경에서의 바이모달 음성인식)

  • 박병구
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06c
    • /
    • pp.111-114
    • /
    • 1998
  • 기존의 음성인식시스템의 잡음환경에서 인식률의 한계를 극복하기 위해 음성신호뿐만이 아니라 입술정보를 결합하여 음성인식에 이용하여 바이모달(Bi-modal) 음성인식이 근래에 제안되어지고 있다. 그래서 바이모달 음성인식 시스템을 실제로 구현해보고 인식 실험을 수행해 보았다. 입술영상은 이미지에 근거한 입술모양을 파라메터화하여 인식실험에 사용하였으며 음성과 입술영상을 각각 인식한 후 인식스코어(Score)에 가중치를 적용하여 통합하는 방법을 사용하였다. 마지막으로 바이모달 음성인식의 잡음환경에서의 성능을 알아보기 위해 음성신호에 여러 레벨의 잡음을 섞어서 실험을 하고 잡음환경에서 인식률의 한계를 입술정보를 이용하여 극복할 수 있다는 것을 보이고자 한다.

  • PDF

Investigating the Relationship Between Vehicle Front Images and Voice Assistants (자동차 전면부와 음성 어시스턴트의 스타일 관계 분석)

  • Min-Jung Park;So-Yeong Min;Tae-Su Kim;Hyeon-Jeong Suk
    • Science of Emotion and Sensibility
    • /
    • v.25 no.4
    • /
    • pp.129-138
    • /
    • 2022
  • In the context of the increasing applications of voice assistants in vehicles, we focused on the association between the visual appeal of the cars and the acoustic characteristics of the voice assistants. This study aimed to investigate the relationship between the visual appeal of the vehicle and the voice assistant based on their emotional characteristics. A total of 15 adjectives were used to assess the emotional characteristics of 12 types of cars and six types of voices. An online interview was carried out, instructing participants to match three adjectives with the presented car images or voices. This was followed with a brief interview to allow the participants to reflect on the adjective matches. Based on the assessments, we performed principal component analysis (PCA) to determine factors. We aimed to deploy the cars and voices and analyze the patterns of clustering. The PCA analysis revealed two factors profiled as "Light-Heavy" and "Comfortable-Radical." Both car and voice stimuli were deployed in a two-dimensional space showing the internal relationship within and between the two substances. Based on the coordination data, a hierarchical cluster grouped the 18 stimuli into four groups labeled as challenge, elegance, majesty, and vigor. This study identified two latent factors describing the emotional characteristics of both car images and voice types clustered into four groups based on their emotional characteristics. The coherent matches between car style and voice type are expected to address the design concept more successfully.

Data Preprocessing Algorithm for Developing Voice Recognition-based Shopping Applications (음성 인식 기반 쇼핑 어플리케이션 개발을 위한 데이터 전처리 알고리즘)

  • Gu, Yeonwoo;Park, Eunbi;Choo, Seoyeon;Kim, Yujeong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.11a
    • /
    • pp.1006-1008
    • /
    • 2022
  • 시각장애인이 이미지로 구성된 온라인 쇼핑몰에서 정보를 얻기 어려운 문제를 해결하기 위해, 본 논문에서는 이미지 텍스트 변환 알고리즘 연구를 진행하였다. 해당 연구를 기반으로 개발한 어플리케이션 <들리네>는 쇼핑몰 홈페이지로부터 정보를 수집하고, 이미지 속 텍스트를 추출하여 전처리 및 음성 변환 과정을 거쳐 사용자에게 제공한다. <들리네>는 사용자가 이미지 정보로 이루어진 온라인 쇼핑몰에서 명확한 정보를 편리하게 얻는 것을 목표로 한다.

Facial image visualization using voice Big Data (Big Data를 활용한 얼굴 이미지 시각화 연구)

  • Kwak, Dong-Ryul;Kim, Min-Cheol;Kim, Chang-Soo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.10a
    • /
    • pp.634-636
    • /
    • 2018
  • 최근 들어 Big Data를 활용한 기술들이 많이 개발되고 있다. 본 연구에서는 Machine Learning과 Deep Learning을 이용하여 음성 Big Data를 활용한 이미지 시각화를 통해 보이스 피싱 등 여러 범죄에 도움이 되게 하고 그 외의 음성과 얼굴 매칭을 통한 새로운 보안시스템 및 다양한 시너지 효과들을 기대하는 서비스를 기술한다.

Time domain Filtering of Image for Lip-reading Enhancement (시간영역 이미지 필터링에 의한 립리딩 성능 향상)

  • Lee Jeeeun;Kim Jinyoung;Lee Joohun
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.45-48
    • /
    • 2001
  • 립리딩은 잡음 환경 하에서 음성 인식 성능을 향상을 위해 영상정보를 이용한 바이모달(bimodal)음성인식으로 연구되었다[1][2]. 그 일환으로 이미 영상정보를 이용한 립리딩은 구현되었다. 그러나 현재까지의 시스템들은 환경의 변화에 강인하지 못하다. 본 논문에서는 이미지 기반 립리딩 방법을 적용하여 입술 영역을 보다 안정적으로 찾아 성능을 향상 시켰다. 그러나 이 방법은 많은 데이터량을 처리해야 하므로 전처리 과정이 필요하다. 전처리로 입력영상을 그레이 레벨로 변환하는 방법과, 입술을 반으로 접는 방법, 그리고 주성분 분석(PCA: Principal Component Analysis)을 사용하였다. 또한 인식성능 향상을 위해 음성에서 잡음 제거나 분석$\cdot$합성에 효과적인 성능을 보이는 RASTA(Relative Spectral)필터를 적용하여 시간 영역에서의 변화가 적은 성분이나 급변하는 성분, 그 밖의 잡음 등을 제거하였다. 그 결과 $72.7\%$의 높은 인식 성능을 보였다.

  • PDF

Search Algorithm Embodiment which uses the Image and Speech Signal from the Vido (동영상에서 이미지와 음성신호를 이용한 검색 알고리즘 구현)

  • Shin, In-Kyoung;Rhee, Sang-Burm
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2010.06b
    • /
    • pp.88-91
    • /
    • 2010
  • 정보통신망 및 멀티미디어 기술의 발전으로 인해 정보의 형태는 단순한 텍스트 데이터에서 멀티미디어 데이터로 전환되고 있다. 멀티미디어 기술은 저장, 재생, 압축 등 관련 기술의 빠른 발전과 미디어의 사회, 문화적 역할이 계속 증가함에 따라 우리 사회 전반에 걸쳐 매우 광범위하게 사용되고 있으며, 이로 인해 동영상 검색등의 많은 검색을 요구 하고 있으나, 동영상 검색의 문제점은 생산되는 컨텐츠에서 동영상이 가지고 있는 비중은 계속해서 높아지지만 쌓아진 데이터를 검색하기엔 몇 가지 문제점이 있다. 첫 번째는 데이터의 중복성이고 두 번째는 제목, 내용 그리고 Keyword가 일치하지 않으며, 세 번째는 저자권 침해 등이 있다. 본 연구에서는 본 논문에서는 빠르게 변화되고 있는 정보화 시대에 맞게 동영상에서 음성과 얼굴영역을 검출하여, 검색 시 효율적이고 정확한 데이터의 검색이 이루어 질 수 있도록 검색 알고리즘을 제안하고 소개하며, 이중 두 번째의 문제점인 제목, 내용 그리고 Keyword의 불일치한 점에 두어 검색 시 영상의 이미지 검색과 음성을 통하여 keyword를 찾아 효율적이고 검색율의 높일 방법을 연구한다.

  • PDF