• 제목/요약/키워드: 소리인식

검색결과 214건 처리시간 0.029초

ResNet 모델을 이용한 일상생활 소리 예측 및 알림 애플리케이션 (ResNet Model Based Real Life Sound Event Prediction and Notification Application)

  • 박유진;정은이;신지혜;박태정;양회석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.1004-1007
    • /
    • 2020
  • 본 논문에서는 청각 장애인이 가정에서 듣지 못해 발생하는 낭비와 위험을 미리 예방하기 위하여 가정에서 현재 발생하고 있는 소리를 알려주는 시스템을 구현하였다. 무지향성 마이크로 일상 소리 감지 후 음향 데이터에서 Mel-Spectogram 특징 벡터를 추출하여 Convolutional Neural Network(CNN) 모델의 Resnet 알고리즘을 진행한다. 서버에서 소리에 대한 분석을 진행한 후 그 결과를 안드로이드에서 실시간으로 5 초마다 확인하여 사용자에게 알림 서비스를 제공한다. 이를 통해 낭비를 줄이고 위험에 대처할 수 있게 한다. 청각 장애인의 소리에 대한 접근성을 다양한 측면으로 고려해야 한다는 사회적 인식을 확산시키고자 한다.

음성인식 기반 인터렉티브 미디어아트의 연구 - 소리-시각 인터렉티브 설치미술 "Water Music" 을 중심으로-

  • 이명학;강성일;김봉화;김규정
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 1부
    • /
    • pp.354-359
    • /
    • 2008
  • 소리-시각 인터랙티브 설치미술인 "Water Music" 은 관객의 음성에 따라서 변하는 물결의 파동을 표현한다. 음정인식 기반 인터페이스 기술을 이용하여 벽면에 비디오 프로젝션 된 시각적 물결이미지로 나타난다. 물결이미지는 동양화의 붓으로 그린 물결과 작은 원형의 입자들을 생성하여 표현된 영상으로 구성된다. 관객은 입김을 불어 넣거나 소리를 냄으로써 화면에서 연속적으로 생성되는 컴퓨터 프로그램 기반 물결의 움직임과 상호 반응할 수 있다. 이러한 공생적인 소리 시각 환경은 관객에게 생각으로 그리고 신체적으로 환영적 공간을 경험하도록 한다. 본 설치작업에서 관객과 상호 반응 할 수 있는 움직이는 물결을 생성하기 위하여 적용된 주요 프로그램은 Visual C++ and DirectX SDK이며, 풀 프레임 3D 렌더링 기술과 파티클 시스템이 사용되었다.

  • PDF

판소리의 영화적 해석과 변모의 과정 (The cinematic interpretation of pansori and its transformation process)

  • 송소라
    • 공연문화연구
    • /
    • 제43호
    • /
    • pp.47-78
    • /
    • 2021
  • 본 연구는 판소리를 소재로 한 영화를 대상으로 영화 속에서 판소리가 수용된 양상을 살핌으로써, 판소리에 대한 현대사회의 인식과 기대의 변화를 탐색하는 것을 목적으로 한다. 조선후기 상하층의 사랑을 두루 받았던 판소리는 일제 강점기와 한국 전쟁을 겪으며 그 위상이 꺾이게 된다. 일본에서 유입된 신문물의 영향과 미국 문화의 유입으로 대중적 관심을 잃게 되며, 고루하고 낡은 전통의 이미지를 갖게 되었다. 이에 국가는 점차 사라지는 판소리를 보호 및 계승하기 위해 1964년 판소리를 중요무형문화재로 지정하지만 1980년대까지도 판소리의 자생적 대중성 확보는 어려웠다. 그러나 판소리는 국가의 꾸준한 지원과 명창들의 판소리 전승 노력, 그리고 2000년대 들어 우리의 것을 세계화하자는 사회문화적 담론 속에서 점차 동시대의 대중과 호흡하는 노력을 해왔고, 문화콘텐츠의 주요 소재로도 각광을 받게 되었다. 그리고 지금은 팝밴드 '이날치'와 현대무용그룹 '앰비규어스 댄스 컴퍼니'가 선보인 뮤직비디오 형식의 'Feel the Rhythm of KOREA'가 보여주듯 현재의 주목받은 대중문화 가운데 하나가 되었다. 현대사회 속에서 점차 변화해가는 판소리에 대한 대중적 인식과 판소리의 위상은 영화라는 대중매체 속에서도 엿볼 수 있다. 본 연구는 1993년 임권택 감독의 <서편제>를 비롯하여 최근의 <소리꾼>까지 판소리를 소재로 한 6편의 영화를 선별하여 이와 같은 변화의 추이를 탐색하였다. 먼저 1990년대에 제작된 영화 <서편제>와 <휘모리>이다. 이 두 편의 영화는 모두 당대에서 그리 멀지 않은 시대의 판소리, 즉 20세기 초중반 전승의 위기와 대중적 관심에서 멀어진 판소리의 현실을 보여주며, 그 속에서도 판소리 자체의 예술적 완성을 위해 치열하게 분투하는 소리꾼의 모습을 영화에 담아내었다. 판소리가 가진 정서로써 '한'과 북과 소리의 조화를 통한 판소리 미학을 강조함으로써 우리 소리의 숭고함과 특수함을 대중에게 선보였다. 판소리에 관해 관심이 적었고, 따라서 이의 가치를 잘 모르던 대중은 즉각 이에 화답하며 우리 음악과 우리의 정서에 대한 폭발적 지지를 보여 이른바 '<서편제> 신드롬'을 불러일으키기도 하였다. <서편제>와 <휘모리>는 우리 소리에 대한 관심과 지식이 부족한 시기, 그러나 그 필요성이 지속적으로 요청되던 1990년대라는 시대적 상황이 영화의 내용과 구성에 반영되며 당대 판소리에 대한 사회적 인식과 기대를 드러내었다. 다음으로 2008년에 제작된 영화 <소리, 아이>와 2012년의 <두레소리>이다. 두 영화는 판소리와 국악을 하는 동시대의 어린이, 학생을 주인공으로 하여 예술을 하는 아이들의 성장기를 그려나가는 데 초점을 맞췄다. 이들 영화에서 판소리는 '요즘 세상에 누가 그것을 하냐'의 소리를 듣는 옛 음악도 아니고, 혹독한 수련과 고통 속에서 완성이 되는 숭고한 음악으로 묘사되지도 않는다. 부모님의 권유, 집안의 사정 속에서 판소리를 시작한 아이들이 소리를 익히고 성장하고, 갈등하고, 고민하는 이야기를 통해 판소리는 동시대의 하나의 자연스러운 예술로 그려질 뿐이다. 판소리를 비롯한 국악의 정통성을 신념화하여 강조하지 않고, 교조적으로 이를 대중에게 전달하지 않는다. 이는 동시대의 예술로 판소리를 바라보는 2000년대의 달라진 대중적 인식을 반영하는 속에서 판소리가 해석된 것이라 볼 수 있다. 마지막으로 2015년의 <도리화가>와 최근 상영된 2020년의 <소리꾼>이다. 흥미롭게도 두 작품 모두 판소리가 민중의 사랑을 가장 많이 받던 조선후기를 영화의 시간적 배경으로 삼고 있다. 영화의 이야기를 판소리의 역사를 토대로 구성하였는데, <도리화가>의 경우는 실존 인물인 신재효와 진채선을 바탕으로 영화적 상상력을 덧붙인 서사를 전개하였다. 그리고 <소리꾼>의 경우는 광대의 소리가 판소리 사설의 원류가 되었다는 판소리 이론과 판소리 <심청가>의 서사를 활용하여 당대 존재했을 법한 소리꾼의 삶의 이야기를 그려냈다. 두 영화는 판소리의 역사에서 이야기의 소재를 찾아 이를 영화화하였다고 할 수 있는데, 이는 전통을 문화콘텐츠의 소재로 삼고자 하는 시대적 분위기와 연결된다. 정보통신 기술의 발달로 국가 간의 문화장벽이 허물어지고 있는 때에, 콘텐츠의 소재는 더욱 다양해지고 있다. 역사를 활용한 이야기가 그간 없었던 것은 아니지만, 전통의 문화를 적극적으로 문화콘텐츠의 소재로 삼고자 하는 시도는 2000년대 들어 본격화되었고, 판소리의 음악뿐만 아니라, 판소리의 역사 또한 활용 가능한 콘텐츠의 대상이 되었다. 지금의 판소리는 향수를 불러일으키는 옛것도, 낡은 전통도 아닌 동시대와 끊임없이 소통하는 예술이자, 다양한 콘텐츠의 소재로 활용 가능한 자리에 온 것이다. 상기 영화들은 현대 판소리가 걸어온 길과 변모하는 위상, 그리고 이에 따라 달라지는 대중적 인식을 보여주고 있다는 점에서 판소리 문화의 흐름을 이해하는 기초가 될 수 있다.

비음수 제약을 통한 일반 소리 분류 (Classification of General Sound with Non-negativity Constraints)

  • 조용춘;최승진;방승양
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권10호
    • /
    • pp.1412-1417
    • /
    • 2004
  • 전체관적인 표현방법인 희소 코딩 또는 독릴 성분 분해(ICA)는 이전의 청각의 처리와 소리 분류의 작업을 해명하는데 성공적으로 적용되었다. 반대로 부분 기반 표현법은 뇌에서 물체를 인식하는 방법을 이해하는 또 다른 방법이다. 이 논문에서, 우리는 소리 분류의 작업에 부분기반 표현법을 학습시키는 비음수화 행렬 분해(NMF)(1) 방법을 적용하였다. 잡음이 존재할 때와 존재하지 않을 때 두 가지 상황에서, NMF를 이용하여 주파수-시간영역의 소리로부터 특징을 추출하는 방법을 설명한다. 실험결과에서는 NMF에 기반을 둔 특징이 ICA에 기반을 두어 추출한 특징보다 소리 분류의 성능을 향상시킴을 보여준다.

클라우드 기반 음성인식 서비스 활용도 향상을 위한 음성인식 공통 인터페이스 표준 포맷 (Common ASR Interface format for increasing usability of cloud-based ASR services.)

  • 오정섭;이병훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.423-425
    • /
    • 2022
  • 음성인식은 컴퓨터가 사람의 언어를 이해하여, 소리로 발화하는 사람의 음성을 인식하여 텍스트로 바꾸는 과정을 의미하며, 최근 활용도가 높아지고 있다. 음성인식 엔진은 얼마나 많은 학습데이터를 기반으로 훈련을 했느냐에 따라서 그 성능이 결정되기 때문에, 자신의 서비스 에 맞는 음성인식 엔진을 적절히 선택할 수 있어야 한다. 음성인식 엔진의 성능이 수시로 변경될 수 있기 때문에 표준 인터페이스를 빠른 개발을 진행할 수 있도록 표준 포맷을 제안하였다.

라즈베리파이 기반 소리인식 보안카메라 개발 (Development of Sound-sensible Security Camera based on Raspberry Pi)

  • 박대복;김선혁;김주영;노영주
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.1563-1566
    • /
    • 2015
  • 보안과 관련된 기술이 발전하여 대규모의 장소에 적합한 보안시스템들이 많이 개발되었다. 특히 CCTV를 이용한 감시카메라의 형태도 다양화되었다. 스마트폰의 어플리케이션이나 웹을 통해서 어디서든 감시할 수도 있어, 이를 통해 보안사고 시에 빠른 대처가 가능하다. 하지만 대규모 시스템이 아닌 경우에는 침입자 발견이 늦고, 뒤늦은 대처로 인해 큰 피해가 발생할 수 있다. 라즈베리파이, 실드 보드 등 기타 하드웨어들을 통하여 침입자를 스스로 감지하여 사용자에게 즉시 알림을 전송함으로써 보안사고에 대한 대처를 빠르고 효율적으로 할 수 있는 보안카메라를 구현하였다. 본 보안 시스템은 소리의 방향을 계산하고 정확한 방향으로의 보정을 통하여 최초 침입자를 인식한다. 이후 이미지트래킹을 통하여 침입자를 추적한다. 무선 네트워크를 이용하기 때문에 네트워크가 지원되는 어느 장소에서든지 사용이 가능하다. 대규모 보안시스템을 설치할 여건이 되기 어려운 작은 공장, 상가, 사무실 등에서 보안시스템으로 사용되면 유용할 것이다. 자세한 개발 내용은 본문에 기술한다.

지능형 TV의 음성인식을 위한 참조 잡음 기반 음성개선 (Reference Channel Input-Based Speech Enhancement for Noise-Robust Recognition in Intelligent TV Applications)

  • 정상배
    • 한국정보통신학회논문지
    • /
    • 제17권2호
    • /
    • pp.280-286
    • /
    • 2013
  • 본 논문에서는 지능형 TV의 음성인터페이스를 위한 잡음제거 시스템에 대해서 제안한다. 음성인식 성능 저하에 매우 나쁜 영향을 주는 TV 소리를 제거하기 위해서 TV 소리 자체를 참조 잡음으로 하는 잡음제거 알고리즘이 구현된다. 제안된 알고리즘에서 TV 스피커와 다채널 장비간의 전달함수를 추정한다. 그 후, 위너 필터를 동작시키기 위해서 잡음의 전력 스펙트럼이 추정된다. 추가적으로 후처리 과정이 적용되어 잔존 잡음을 제거한다. 실험의 의해서 제안된 알고리즘이 5 dB 입력 SNR에서 88 %의 음성인식률을 나타내었다.

다기능성을 가진 음성 인식 요람 연구 (Study on the multi-functional Cradle by Voice Recognitions)

  • 박광성;안상진;조경록;최시온;박용욱
    • 한국전자통신학회논문지
    • /
    • 제12권4호
    • /
    • pp.701-706
    • /
    • 2017
  • 본 연구에서는 요람을 기존의 리모컨이나 수동으로 구동하는 방식과 달리 APP을 통하여 사람의 음성을 인식하면 모터로 동작하도록 요람을 제작하였다. 또한 요람에 온습도센서를 장착하여 실시간으로 요람의 온도와 습도를 LCD를 통해서 확인할 수 있고, 또한 소리크기에 따라 결과 값을 가지는 사운드센서를 이용하여 결과 값을 a, b, c로 지정하여 이 결과 값의 합이 1150을 넘으면 아기의 울음소리로 인식하여 APP에 알림표시와 알림음이 작동하도록 하는 기능을 가지는 요람을 제작하였다.

소리 내어 읽기가 유학생의 영어 정형화 배열 학습에 미치는 영향 (Effects of Reading Aloud on International Students' English Formulaic Sequences Learning)

  • 이지현
    • 문화기술의 융합
    • /
    • 제8권1호
    • /
    • pp.341-348
    • /
    • 2022
  • 정형화 배열이란 연속적이거나 연속적이지 않은 하나의 덩어리로 인식되는 어휘 덩어리이다. 정형화 배열은 언어 발달의 핵심적인 역할을 하는 것으로 정형화 배열의 습득 여부가 언어 발달의 성패를 좌우한다. 본 연구에서는 유학생들의 정형화 배열 학습방안으로 소리 내어 읽기 활동을 제안한다. 서울 소재 대학의 교양 영어 수업을 듣는 유학생 41명을 대상으로 소리 내어 읽기 활동 중심의 수업을 진행하였다. 15주간 동영상 수업과 줌 실시간 수업을 병행하여 진행하였고, 교재는 애니메이션 겨울왕국을 이용하였다. 동영상 수업에서는 교사가 쉬운 한국어로 영화 대본을 해석하였고 정형화 배열을 소리 내어 읽기를 하였다. 학생들은 과제로 정형화 배열이 포함된 문장을 소리 내어 읽고 녹음하여 제출하였다. 실시간 수업에서는 학생들이 동영상 수업에서 학습한 정형화 배열을 소리 내어 읽기 활동을 하였다. 사전 평가 대비 사후 평가에서 정형화 배열 해석하기와 쓰기에서 유의미한 상승이 있었다. 설문에서는 학생들은 수업에 대한 정의적 영역에서 긍정적인 견해를 나타냈다.

청각장애인을 위한 사운드 정보 시각화 안경의 개발 (Development of Sound Information Visualization Glasses for the Hearing Impaired)

  • 이계환;김인현;이준호;이정훈;황광일
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 추계학술발표대회
    • /
    • pp.656-659
    • /
    • 2018
  • 통계적으로 일반인보다 청각장애인의 교통 사고율이 높은 것으로 나타나는데, 이는 청각 장애로 대표되는 차량을 포함한 위험 요소를 인식하기 힘든 상태나 조건에서 기인한다. 자동차가 접근하는 등의 소리를 듣지 못한다는 것은 결국 어떠한 위치에 위험요소가 존재하는지 인지하지 못함에 따라 사고로 이어질 가능성이 존재함을 의미하는데 이러한 문제점을 개선함과 동시에 대화중인 사람의 목소리를 시각화하여 정보를 제공함으로써 청각장애인으로 하여금 더 안전하고 쾌적한 삶을 누리게 하는 것이 청각장애인을 위한 사운드 정보 시각화 안경의 개발 목적이다. 위와 같은 배경을 통해 딥 러닝 기술에 기반하여 분류 과정을 거친 소리 정보의 판별을 통해 위험 요소를 인식한 후 시각화 하여 정보를 제공하는 디바이스를 제안한다.