• 제목/요약/키워드: 음성 녹음 파일

검색결과 21건 처리시간 0.036초

청각장애학생의 영어 발성 주파수별 특징 분석 (Feature analysis of deaf students' English language by frequency)

  • 이근민;박혜정
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권4호
    • /
    • pp.819-828
    • /
    • 2014
  • 본 논문에서는 청각장애학생들의 영어 발성의 특징을 분석하여 그 특징들을 반영할 수 있는 맞춤형 영어 학습 보조 도구를 개발하기 위한 기초자료를 제시하고자 한다. 본 논문에서는 청각장애학생들의 영어 발성의 특징을 분석하기 위해서 서울과 대구에 있는 청각특수학교의 학생들을 대상으로 직접 방문하여 녹음하였으며, 음성파일을 분석하기 위해 음성분석 전문 프로그램인 플라트 프로그램을 활용하였다. 청각장애학생들의 영어 발성의 특징은 플라트 프로그램을 통해 음성학에서 사용하는 음성의 특징 값들을 추출하여, 그 특징 값들을 이용하여 비장애학생의 영어 발성의 특징과 비교분석하였다.

한국형 감정 음성 데이터베이스 구축을 위한 타당도 연구 (Development and validation of a Korean Affective Voice Database)

  • 김예지;송혜선;전예솔;오유림;이영미
    • 말소리와 음성과학
    • /
    • 제14권3호
    • /
    • pp.77-86
    • /
    • 2022
  • 본 연구는 운율을 기반으로 감정을 인식하는 능력을 측정할 때 이용할 수 있는 한국형 감정 음성 데이터베이스(Korean Affective Voice Database, 이하 KAV DB)를 개발하고, 해당 DB가 의사소통장애 관련 임상과 연구에서 활용될 수 있는지를 점검하기 위하여 신뢰도, 민감도, 특이도를 산출하여 그 타당성을 살펴보았다. 본 연구에서는 배우 2명(남 1명, 여 1명)이 의미적으로 중립적인 문장 10개를 행복, 분노, 공포, 슬픔, 놀람, 중립의 6개 정서로 표현하도록 하여 음성을 녹음하였다. 녹음된 음성 중에서 목표 정서가 잘 표현된 문장을 선별하여 타당도 점검을 위한 음성파일 세트를 구성하였으며, 청자 31명(남 14명, 여 17명)이 시각적 아날로그 평정법을 이용하여 각 음성에서 6개의 정서가 얼마나 반영되었는지 평정하도록 하였다. 그 결과, KAV DB에 대한 청자의 내적 일관성 신뢰도는 .872, 전체 민감도 82.8%, 전체 특이도 83.8%였다. 이를 통하여, 타당도가 확보된 KAV DB는 감정 음성 인식 및 산출과 관련된 연구와 임상 콘텐츠 제작 등에 활용될 수 있을 것으로 기대된다.

삭제된 휴대폰 음성 데이터 복원 방법론 (Carving deleted voice data in mobile)

  • 김상대;변근덕;이상진
    • 정보보호학회논문지
    • /
    • 제22권1호
    • /
    • pp.57-65
    • /
    • 2012
  • 휴대폰에서 사용하는 대화내용을 녹음하거나 음성으로 메모를 남기는 경우가 있는데 범죄의 은폐나 사용자의 실수로 중요한 음성 데이터를 삭제하는 경우가 있다. 음성 데이터는 어떤 사실에 대한 증거로써 영향력이 강하기 때문에 포렌식 조사를 위해서도 삭제된 음성 데이터를 복구해야 한다. 데이터가 조각나기 쉬운 플래시 메모리에 데이터를 저장하는 휴대폰의 특성상 음성 데이터를 복구하기 어렵다. 하지만 음성 데이터를 특정할 수 있는 패턴이 있다면 이 패턴으로 이미지를 조사하여 음성 데이터를 일정 이상 복원할 수 있다. 음성 데이터에는 여러 종류가 있고, 본 논문에서는 퀄컴의 QCP 파일 포맷에서 사용하는 EVRC, AMR 코덱에 대하여 데이터를 복구할 수 있는 방안을 제안한다.

Hi, KIA! 기계 학습을 이용한 기동어 기반 감성 분류 (Hi, KIA! Classifying Emotional States from Wake-up Words Using Machine Learning)

  • 김태수;김영우;김근형;김철민;전형석;석현정
    • 감성과학
    • /
    • 제24권1호
    • /
    • pp.91-104
    • /
    • 2021
  • 본 연구에서는 승용차에서 사람들이 기기를 사용하기 위해 사용하는 기동어인 "Hi, KIA!"의 감성을 기계학습을 기반으로 분류가 가능한가에 대해 탐색하였다. 감성 분류를 위해 신남, 화남, 절망, 보통 총 4가지 감정별로 3가지 시나리오를 작성하여, 자동차 운전 상황에서 발생할 수 있는 12가지의 사용자 감정 시나리오를 제작하였다. 시각화 자료를 기반으로 총 9명의 대학생을 대상으로 녹음을 진행하였다. 수집된 녹음 파일의 전체 문장에서 기동어 부분만 별도로 추출하는 과정을 거쳐, 전체 문장 파일, 기동어 파일 총 두 개의 데이터 세트로 정리되었다. 음성 분석에서는 음향 특성을 추출하고 추출된 데이터를 svmRadial 방법을 이용하여 기계 학습 기반의 알고리즘을 제작해, 제작된 알고리즘의 감정 예측 정확성 및 가능성을 파악하였다. 9명의 참여자와 4개의 감정 카테고리를 통틀어 기동어의 정확성(60.19%: 22~81%)과 전체 문장의 정확성(41.51%)을 비교했다. 또한, 참여자 개별로 정확도와 민감도를 확인하였을 때, 성능을 보임을 확인하였으며, 각 사용자 별 기계 학습을 위해 선정된 피쳐들이 유사함을 확인하였다. 본 연구는 기동어만으로도 사용자의 감정 추출과 보이스 인터페이스 개발 시 기동어 감정 파악 기술이 잠재적으로 적용 가능한데 대한 실험적 증거를 제공할 수 있을 것으로 기대한다.

블루투스의 보안 취약성과 공격 (Vulnerability and Attacks of Bluetooth System)

  • 이인범;류대현
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2011년도 춘계학술대회
    • /
    • pp.650-653
    • /
    • 2011
  • 본 논문에서는 먼저 블루투스 시스템과 블루투스 정보보호에 대해 설명하였고, 또한 블루투스 규격에서 정의하고 있는 정보보호 구조를 분석하고 그 취약성을 제시하고, 다양한 블루투스 해킹 기법들을 소개하였다. 또한 CarWhisperer를 이용하여 휴대폰에 사용하는 핸즈프리에 적용하여 핸즈프리에 임의의 음성 메시지를 주입하는 공격과 핸즈프리를 통해 대화하는 내용을 녹음하여 파일로 저장하는 공격 과정을 수행하였다.

  • PDF

KoBERT를 활용한 실시간 보이스피싱 탐지기법 개념설계 (Design of Real-Time Voice Phishing Detection Techniques using KoBERT)

  • 김영진;이병엽;강아름
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2024년도 제69차 동계학술대회논문집 32권1호
    • /
    • pp.95-96
    • /
    • 2024
  • 본 논문은 금융 범죄 중 하나인 보이스피싱을 실시간으로 예방하기 위한 탐지 기법을 제안한다. 제안된 모델은 수화기에 출력되는 음성을 녹음하고 네이버 CSR(Cloud Speech Recognition)을 통해 텍스트 파일로 변환한 후 딥러닝 기반의 KoBERT를 바탕으로 다양한 보이스피싱 패턴을 학습하여 실시간 환경에서의 신속하고 정확한 탐지를 위해 실제 통화 데이터를 적절하게 처리하여, 이를 통해 효과적인 보이스피싱 예방에 도움을 줄 것으로 예상된다.

  • PDF

VoiceXML과 GPS를 이용한 여행정보 서비스의 구현 (An Implementation of Travel Information Service Using VoiceXML and GPS)

  • 오재규;김선형
    • 한국산학기술학회논문지
    • /
    • 제8권6호
    • /
    • pp.1443-1448
    • /
    • 2007
  • 본 논문에서는 기존의 웹(인터넷)기반의 정보 제공 서비스의 범주를 벗어나, 음성 및 웹 브라우저 기반의 VoiceXML을 이용하여 웹과 음성 인터페이스를 동시에 사용할 수 있고 GPS 정보의 응용이 가능한 분산 환경 기반의 여행 정보 서비스를 제안한다. 기존의 여행 정보 콜 센터의 자동응답 서비스는 사전에 제작된 시나리오대로 운영돼 이용시간이 많이 걸릴 뿐 아니라 응답 내용을 바꿀 경우 시나리오를 다시 짠 후 녹음을 다시 해야 하는 불편함이 있었으나, 제안된 VoiceXML 기반의 여행 정보 시스템은 파일형태로 개별 대화 시나리오를 만들어 서버에 내장하는 방식으로 이루어져 시스템 개편이 쉬우며, GPS 정보를 이용한 사용자의 현 위치를 인지하고 이에 따른 다양한 여행 정보 서비스를 오지 환경과 같은 환경적 제약 변수에서도 쉽게 제공할 수 있다는 장점을 가지고 있다.

  • PDF

한국어 연속음성인식을 위한 발음사전 구축 (Pronunciation Dictionary For Continuous Speech Recognition)

  • 이경님;정민화
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.197-199
    • /
    • 2000
  • 연속음성인식을 수행하기 위해서는 발음사전과 언어모델이 필요하다. 이 둘 사이에는 디코딩 단위가 일치하여야 하므로 발음사전 구축시 디코딩 단위로 표제어 단위를 선정하며 표제어 사이의 음운변화 현상을 반영한 발음사전을 구축하여야 한다. 한국어에 부합하는 음운변화현상을 분석하여 학습용 자동 발음열을 생성하고, 이를 통하여 발음사전을 구축한다. 전처리 단계로 기호, 단위, 숫자 등 전처리 과정 및 형태소 분석 과정을 수행하며, 디코딩 단위인 의사 형태소 단위를 생성하기 위해 규칙을 이용한 태깅 과정을 거친다. 이를 통해 나온 결과를 발음열 생성기 입력으로 하며, 결과는 학습용 발음열 또는 발음사전 구성을 위한 형태로 출력한다. 표제어간 음운변화 현상이 반영된 상태의 표제어 단위이므로 실제 음운변화가 반영되지 않은 상태의 표제어와는 그 형태가 상이하다. 이는 연속 발음시 생기는 현상으로 실제 인식에는 이 음운변화 현상이 반영된 사전이 필요하게 된다. 생성된 발음사전의 효용성을 확인하기 위해 다음과 같은 실험을 통해 성능을 평가하였다. 음향학습을 위하여 PBS(Phonetically Balanced Sentence) 낭독체 17200문장을 녹음하고 그 전사파일을 사용하여 학습을 수행하였고, 발음사전의 평가를 위하여 이 중 각각 3100문장을 사용하여 다음과 같은 실험을 수행하였다. 형태소 태그정보를 이용하여 표제어간 음운변화 현상을 반영한 최적의 발음사전과 다중 발음사전, 언어학적 기준에 의한 수작업으로 생성한 표준 발음사전, 그리고 표제어간의 음운변화 현상을 고려하지 않고 독립된 단어로 생성한 발음사전과의 비교 실험을 수행하였다. 실험결과 표제어간 음운변화 현상을 반영하지 않은 경우 단어 인식률이 43.21%인 반면 표제어간 음운변화 현상을 반영한 1-Best 사전의 경우 48.99%, Multi 사전의 경우 50.19%로 인식률이 5~6%정도 향상되었음을 볼 수 있었고, 수작업에 의한 표준발음사전의 단어 인식률 45.90% 보다도 약 3~4% 좋은 성능을 보였다.

  • PDF

은둔형 습지 조류의 효과적인 조사 방법 탐색을 위한 국외 프로토콜의 시범 적용 (Application of Standardized North American Marsh Bird Monitoring Protocols to Survey Inconspicuous Marsh Birds in Korea)

  • 이상연;성하철
    • 생태와환경
    • /
    • 제52권2호
    • /
    • pp.143-150
    • /
    • 2019
  • 은둔형 습지 조류는 습지 생태계를 구성하는 중요한 고차소비자임에도 불구하고, 눈에 잘 띄지 않는 습성과 신뢰도 있는 조사 방법의 부재로 인하여 국내에서는 서식 현황 및 개체군 경향성이 잘 알려져 있지 않다. 이에 본 연구는 조류 조사 시 가장 일반적으로 활용하는 수동적인 성격의 정점조사법과 탐지 효과를 증가시키는 것으로 알려진 음성조사법을 병행하는 방식의 은둔형 습지 조류를 대상으로 한 국외 프로토콜(Standardized North American Marsh Bird Monitoring Protocols; SNAMBMP)을 시범적으로 적용하였다. 그 결과, 흰눈썹뜸부기(Rallus indicus)와 쇠뜸부기사촌(Porzana fusca), 뜸부기(Gallicrex cinerea), 호사도요(Rostatula benghalensis) 4종이 탐지되었지만, 점유율이 매우 낮은 상태로 상당히 희귀한 개체군으로 판단된다. 다만, 흰눈썹뜸부기와 뜸부기의 경우 동종의 음성을 이용한 조사 방법이 다른 방법에 비해 효과적이라는 것을 확인할 수 있었다. 국내에 서식하는 은둔형 습지 조류의 종 인벤토리 확보 및 개체군 경향성 파악을 위해서는 생물다양성 확보를 목적으로 한 전국 단위의 생태계 조사 사업 지침에 SNAMBMP 방식의 조사 세부 지침을 추가 수록함과 더불어 조사 시 전 과정에 대한 녹음을 통해 음성 파일 확보를 제안한다.

모바일 학습을 위한 스마트폰의 사운드 레코딩과 플레이어 구현에 관한 연구 (A Study on Implementation of Sound Recording and Player of Smartphone for Mobile Learning)

  • 서정희;박흥복
    • 한국전자통신학회논문지
    • /
    • 제8권6호
    • /
    • pp.847-854
    • /
    • 2013
  • 본 논문은 모바일 학습의 사운드 레코딩과 플레이어를 위한 스마트폰 애플리케이션을 구현한다. 스마트폰은 유비쿼터스로 언제 어디서나 사용 가능하고, 오디오를 지원하고 마이크로폰을 내장하고 있기 때문에 본 논문에서 제안하는 사운드 레코딩과 플레이어 애플리케이션의 개발은 추가적인 인프라가 필요없이 가격이 싸고 쉬운 방법으로 프로그래밍을 개발할 수 있다. 그리고 안드로이드 플랫폼에 내장된 DBMS인 SQLite를 이용하여 내장된 데이터베이스 기술에 기반한 노래의 가사 데이터 처리에 대한 기법을 설명한다. 따라서 스마트폰의 사운드 레코딩과 플레이어 앱을 개발하여 모바일 폰에 음원 파일만 있다면 언제 어디서나 음원에 맞춰 자신의 음성을 녹음할 수 있다. 따라서 본 논문은 학습자가 추가적인 인프라를 구성하지 않고 모바일 학습의 활성화를 기대할 수 있다.