• Title/Summary/Keyword: 오디오 인식

Search Result 118, Processing Time 0.028 seconds

수면의 질을 측정하기 위한 안대형 생체신호 측정기기 개발 (Development of an Eye Patch-Type Biosignal Measuring Device to Measure Sleep Quality)

  • 안창선;임재관;정봉수;김영주
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제12권5호
    • /
    • pp.171-180
    • /
    • 2023
  • 우리나라 3대 수면 질환으로는 코골이, 수면무호흡증, 불면증이 있다. 수면 부족은 만병의 근원이며 수면 부족으로 인한 질병은 심혈관계 질환, 인지장애, 비만, 당뇨, 대장염, 전립선암에 이르기까지 다양하게 나타난다. 수면 관리 중요성을 인식한 정부도 2018년 7월부터 수면다원검사를 국민건강보험 혜택을 적용해서 작은 부담으로 검사를 받아볼 수 있도록 하고 있다. 그럼에도 불구하고 불면증 환자는 시간적·공간적·경제적 부담감을 해소하고 일상생활 속에서 수면의 질을 관리할 필요가 있다. 이러한 문제를 해결하기 위해서 본 논문에서는 병원이 아닌 일상생활 속에서 수면관리에 활용할 수 있는 안대형 생체신호 측정기기를 개발하였다. 측정기기에서는 6개 생체신호(안구동작, 뒤척임, 체온, 산소포화도, 심박수, 오디오)를 측정할 수 있다. 사용되는 센서로는 안구동작, 뒤척임은 자이로스코프센서(MPU9250, InvenSense, 미국)가 사용되었다. 센서값 입력 범위는 258~460°/sec 단위로 조정되며, 입력 범위값 내에서 작동상태를 확인하였다. 체온, 산소포화도, 심박수는 센서(MAX30102, Analog Devices, 미국)를 사용하였다. 체온은 30~45℃ 작동상태를 확인했으며, 산소포화도 사용범위는 미사용상태는 0%이고 사용상태는 20~90%의 작동상태를 확인하였다. 심박수의 범위는 40~180 bpm에서 작동상태를 확인하였다. 오디오 신호는 센서(AMM2742-T-R, PUIaudio, 미국)를 통해서 생체신호를 측정하며 감도는 -42±1 dB이며 주파수 범위는 20~20 kHz에서의 작동상태를 확인하였다. 시스템 구성은 생체신호 측정기기와 데이터수집 장치로 PC 및 모바일 애플리케이션으로 구성되었다. 측정된 데이터는 모바일과 PC로 수집되며 수집된 데이터는 수면의 단계를 판단하고 수면 유도와 수면장애에 대한 사전 선별기능을 진행할 수 있는 기초자료로 사용될 수 있다. 앞으로 간편하게 가정에서 불면증 환자들에게 수면의 질을 측정할 수 있게 되어 불면증 환자들의 치료에 도움이 될 것으로 예상한다.

광고 효과 증대를 위한 실시간 다중 채널 미디어 재생기의 개발 (Development of the Real-Time Multiplex Channel Media Player to Heighten the Dramatic Effect of an Advertisement)

  • 김성호
    • 한국콘텐츠학회논문지
    • /
    • 제11권1호
    • /
    • pp.50-55
    • /
    • 2011
  • 본 논문은 각종 광고 효과를 효율적으로 증대시키기 위해서 다중 채널 미디어를 실시간으로 재생시키기 위한 방법론을 기술한다. 본 방법은 DirectX SDK, DirectShow 및 MS Visual Studio 2008 등의 소프트웨어가 설치된 컴퓨터 환경에서 구현하였으며, 다중 채널 미디어를 읽어오기 위한 메뉴 인터페이스를 갖추거나 숨기고 있다. 미디어 재생기에 사용된 실험용 데이터들은 동영상이 주를 이루고 있으며, 광고 효과를 증대시키기 위해서는 추가적으로 미디어 재생기에 배너 티커 및 GIF 애니메이션 등의 기능을 가진 영역을 추가하였다. 모든 미디어들은 Splitter를 통하여 비디오와 오디오로 분리되어지고, 각각은 Decoder 및 Render 과정을 거치게 하였으며, 알파 값을 사용하여 비디오 믹싱이 가능하게 하였다. 본 논문에서는 이를 위해 DirectShow의 VMR-9를 사용하였다. 본 재생기는 각종 미디어들을 다중 채널을 통하여 동시에 재생시켜줌으로서 다양한 형태의 광고 효과를 사용자들에게 확실하게 인식시켜줄 수 있다는 장점을 가지고 있다. 마지막으로 본 논문에서는 실험용 데이터들을 이용하여 다중 채널 미디어 재생기를 사용해 보고, 기존 미디어 재생기와 광고 효과를 위한 기능면에서의 차이점을 비교해본다.

TV News 영상구성에서 Imaginary Line 확대 적용에 관한 연구 - 이미지너리 라인의 특성을 중심으로 - (Research about Imaginary Line Extension Application in Composition of TV News - With Special Quality of Imaginary Line in Focus -)

  • 임평종;곽훈성
    • 한국콘텐츠학회논문지
    • /
    • 제8권9호
    • /
    • pp.55-65
    • /
    • 2008
  • 뉴스의 중요성이 한층 강조되고 있는 정보화시대에 TV뉴스의 영상제작 분야는 다매체 다채널 디지털방식 등 첨단 기술로 끊임없이 진보되어 오고 있다. 하루가 다르게 발전하는 첨단 방송장비들과 새로운 표현기법들은 오랫동안 방송현업에 종사하고 있는 사람들도 당황스럽게 한다. 영상제작방식은 변화의 속도를 더 빠르게 실감하고 있으며 고품질의 영상정보를 수용하려는 시청자들은 이런 변화들을 오히려 반겼을 것이다. 그 동안 전통적 관념으로 영상표현방식이 존재하고 있었는데 TV뉴스 영상에서는 이미지너리 라인을 적용한 표현방식이 있었다. 수용자에게 이제 전통적인 영상표현은 TV뉴스 속에서 중요성을 상실하고 있다. 그러나 진보되어가는 시대적 흐름에 영상표현 방식도 변화를 가져왔고 영상 제작자들은 시청자들의 욕구를 충족시키기 위하여 보완점을 만들어 냈다. 본 논문에서는 기존의 영상제작 방식도 시대적 흐름에 따르지 않고 적응하지 못하고 있다는 의미에서 TV뉴스영상의 이미지너리 라인을 확대 해석해야 할 필요성을 제기하고자 한다. 지금의 영상은 오직 비디오만을 주장하지 않는다. 비디오와 오디오를 통틀어 정의되고 있다. 아울러 이미지너리 라인의 개념도 영상제작에 확대 해석하고 적용해서 수용자들의 이해를 돕고 바른 TV뉴스 영상을 수용자 뿐 아니라 제작자들에게도 인식시키고자 한다.

H.323 트래픽 분석 시스템의 개발 (Implementation of Analysis System for H.323 Traffic)

  • 이선헌;정광수
    • 정보처리학회논문지C
    • /
    • 제13C권4호
    • /
    • pp.471-480
    • /
    • 2006
  • 최근 다양한 네트워크 환경이 고속으로 발전하면서 화상회의나 VoIP와 같은 고품질의 서비스들이 빠르게 보편화 되어 가고 있다. 오디오, 비디오와 같은 멀티미디어 화상회의 데이터를 인터넷을 통해 전송하기 위한 국제표준인, H.323은 가장 많이 개발되어 상용화된 프로토콜로 다양한 환경을 지원하면서도 성능이 뛰어난 것으로 인식되고 있다. 이러한 환경에서 사용자에게 제공하는 H.323 기반 서비스에 문제가 생기게 될 경우, H.323 을 구성하는 프로토콜들의 문제인지, 네트워크 자체의 문제인지를 제대로 분석하는 것이 매우 중요한 기술적 이슈로 대두되고 있다. 이러한 정확한 원인 분석은 H.323 기반의 서비스를 제공하는 네트워크 운영자뿐만 아니라 종단간의 사용자에게도 매우 중요한 서비스 품질의 판단 기준이 되며, 향후 H.323 기반 서비스의 유지 보수에도 많은 도움이 될 것으로 기대할 수 있다. 본 논문은 다양한 네트워크 환경에서의 H.323 기반의 영상 서비스를 가정할 때, H.323 프로토콜의 주요 하위 표준들인 H.245, H.225.0, RTP, RTCP등의 프로토콜을 정확히 분석할 수 있는 통합 분석 시스템인 H.323 Sniffer 개발을 목적으로 한다. 간단한 기능 실험과 성능 분석을 통해 본 논문에서 제안하고, 구현한 분석 시스템이 실제 네트워크 환경에서 서비스되는 H.323 기반 서비스의 상태를 성공적으로 분석하고 이를 통해 발생가능한 문제점의 원인을 판단할 수 있음을 검증하였다.

스마트 미러간 화상 통화와 메시징 기능을 가진 CoMirror 시스템 구현 (Implementation of CoMirror System with Video Call and Messaging Function between Smart Mirrors)

  • 황기태;김경미;김유진;박채원;유송연;정인환;이재문
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권6호
    • /
    • pp.121-127
    • /
    • 2022
  • 스마트 미러는 거울에 디스플레이와 임베디드 컴퓨터를 부착하여 거울 기능과 함께 사용자에게 다양한 정보를 제공해주는 IoT 장치이다. 본 논문은 스마트 미러가 사용자에게 정보를 제공하는 독립형 장치(stand alone device)라는 개념에서 벗어나 스마트 미러들이 연결되는 네트워크를 구성하고 사용자들이 다른 스마트 미러 사용자들과 대화하고 정보를 공유하는 CoMirror 시스템을 제안하고 구현하였다. CoMirror 시스템은 1개의 CoMirror 서버를 중심으로 여러 CoMirror 클라이언트들이 연결되는 구조이다. CoMirror 클라이언트는 라즈베리파이와 미러 필름, 터치 패드, 디스플레이 장치, 웹 카메라 등으로 구성되며, 서버에는 얼굴 학습과 인식, 사용자 관리, 클라이언트들 사이의 메시지 교환을 위한 중계 역할, 화상 통화 연결 설정 등의 기능이 구현되었다. 사용자들은 서버를 경유하여 다른 CoMirror 사용자들과 텍스트, 이미지, 오디오 등의 메시지를 주고받을 뿐 아니라, 1:1 화상 통화를 할 수 있도록 구현되었다.

국내 전자출판물의 납본·수집 현황 분석 (Analysis of the Status of Legal Deposit and Acquisition of Electronic Publications in Korea)

  • 김규환;정대근;김수정
    • 한국도서관정보학회지
    • /
    • 제54권4호
    • /
    • pp.281-306
    • /
    • 2023
  • 본 연구는 최근 3년(2020-2022)간 국내 전자출판물의 납본·자체수집·수증 현황과 ISBN이 발급된 전자출판물의 납본 및 미납본 현황을 분석하였다. 이를 통해 국내 전자출판물의 납본 의무 이행 독려하기 위한 개선방안을 제안하고자 하였다. 먼저 국내 전자출판물의 납본·자체수집·수증 현황의 주요 분석결과는 다음과 같다. 전자출판물 수집형태는 자체수집(57.07%), 납본(41.74%), 수증(1.19%)이었으며, 파일 형식은 전자책(pdf, epub), 웹툰(jpg), 오디오북(mp3)으로 다양하였다. 주로 2012년부터 2022년 사이에 출판된 전자출판물이 수집되었으며, 1960년부터 2011년 사이에 출판된 자료도 일부 수집되었다. 자체수집은 웹툰이 많았고, 납본은 전자책이 주를 이루었다. ISBN 발급 현황을 보면, 자료유형은 전자책(96.2%)이, 주제분야는 문학 분야가 가장 많은 ISBN을 발급받았다. 2020년부터 2022년 사이에 가장 많은 ISBN이 발급되었다. ISBN 발급 상위 10위 발행처의 납본율을 보면, 전체적으로 ISBN 발급을 받은 발행처들의 납본율이 저조하여 이를 개선하기 위한 노력이 필요한 것으로 나타났다. 이에 개선방안으로 발행처의 납본 의무에 대한 인식 제고, 인센티브 제공 및 제재 조치 강화, 납본 현황의 투명한 공개를 통한 자발적 참여 유도, 그리고 ISBN 발급 및 납본 시스템의 데이터 정확성 향상을 위한 기술적 조치의 필요성을 제안하였다.

한국형 멀티모달 몽타주 앱을 위한 생성형 AI 연구 (Research on Generative AI for Korean Multi-Modal Montage App)

  • 임정현;차경애;고재필;홍원기
    • 서비스연구
    • /
    • 제14권1호
    • /
    • pp.13-26
    • /
    • 2024
  • 멀티모달 (multi-modal) 생성이란 텍스트, 이미지, 오디오 등 다양한 정보를 기반으로 결과를 도출하는 작업을 말한다. AI 기술의 비약적인 발전으로 인해 여러 가지 유형의 데이터를 종합적으로 처리해 결과를 도출하는 멀티모달 기반 시스템 또한 다양해지는 추세이다. 본 논문은 음성과 텍스트 인식을 활용하여 인물을 묘사하면, 몽타주 이미지를 생성하는 AI 시스템의 개발 내용을 소개한다. 기존의 몽타주 생성 기술은 서양인들의 외형을 기준으로 이루어진 반면, 본 논문에서 개발한 몽타주 생성 시스템은 한국인의 안면 특징을 바탕으로 모델을 학습한다. 따라서, 한국어에 특화된 음성과 텍스트의 멀티모달을 기반으로 보다 정확하고 효과적인 한국형 몽타주 이미지를 만들어낼 수 있다. 개발된 몽타주 생성 앱은 몽타주 초안으로 충분히 활용 가능하기 때문에 기존의 몽타주 제작 인력의 수작업을 획기적으로 줄여줄 수 있다. 이를 위해 한국지능정보사회진흥원의 AI-Hub에서 제공하는 페르소나 기반 가상 인물 몽타주 데이터를 활용하였다. AI-Hub는 AI 기술 및 서비스 개발에 필요한 인공지능 학습용 데이터를 구축하여 원스톱 제공을 목적으로 한 AI 통합 플랫폼이다. 이미지 생성 시스템은 고해상도 이미지를 생성하는데 사용하는 딥러닝 모델인 VQGAN과 한국어 기반 영상생성 모델인 KoDALLE 모델을 사용하여 구현하였다. 학습된 AI 모델은 음성과 텍스트를 이용해 묘사한 내용과 매우 유사한 얼굴의 몽타주 이미지가 생성됨을 확인할 수 있다. 개발된 몽타주 생성 앱의 실용성 검증을 위해 10명의 테스터가 사용한 결과 70% 이상이 만족한다는 응답을 보였다. 몽타주 생성 앱은 범죄자 검거 등 얼굴의 특징을 묘사하여 이미지화하는 여러 분야에서 다양하게 사용될 수 있을 것이다.

합성곱 신경망의 비지니스 응용: 런웨이 이미지를 사용한 의류 분류를 중심으로 (Business Application of Convolutional Neural Networks for Apparel Classification Using Runway Image)

  • 서이안;신경식
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.1-19
    • /
    • 2018
  • 최근 딥러닝은 오디오, 텍스트 및 이미지 데이터와 같은 비 체계적인 데이터를 대상으로 다양한 추정, 분류 및 예측 문제에 사용 및 적용되고 있다. 특히, 의류산업에 적용될 경우 딥러닝 기법을 활용한 의류 인식, 의류 검색, 자동 제품 추천 등의 심층 학습을 기반으로 한 응용이 가능하다. 이 때의 핵심모형은 합성곱 신경망을 사용한 이미지 분류이다. 합성곱 신경망은 입력이 전달되고 출력에 도달하는 과정에서 가중치와 같은 매개 변수를 학습하는 뉴런으로 구성되고, 영상 분류에 가장 적합한 방법론으로 사용된다. 기존의 의류 이미지 분류 작업에서 대부분의 분류 모형은 의류 이미지 자체 또는 전문모델 착용 의류와 같이 통제된 상황에서 촬영되는 온라인 제품 이미지를 사용하여 학습을 수행한다. 하지만 본 연구에서는 통제되지 않은 상황에서 촬영되고 사람들의 움직임과 다양한 포즈가 포함된 스트릿 패션 이미지 또는 런웨이 이미지를 분류하려는 상황을 고려하여 분류 모형을 훈련시키는 효과적인 방법을 제안한다. 이동성을 포착하는 런웨이 의류 이미지로 모형을 학습시킴으로써 분류 모형의 다양한 쿼리 이미지에 대한 적응력을 높일 수 있다. 모형 학습 시 먼저 ImageNet 데이터셋을 사용하여 pre-training 과정을 거치고 본 연구를 위해 수집된 32 개 주요 패션 브랜드의 2426개 런웨이 이미지로 구성된 데이터셋을 사용하여 fine-tuning을 수행한다. 학습 과정의 일반화를 고려해 10번의 실험을 수행하고 제안된 모형은 최종 테스트에서 67.2 %의 정확도를 기록했다. 본 연구 모형은 쿼리 이미지가 런웨이 이미지, 제품 이미지 또는 스트릿 패션 이미지가 될 수 있는 다양한 분류 환경에 적용될 수 있다. 구체적으로는 패션 위크에서 모바일 어플리케이션 서비스를 통해 브랜드 검색을 용이하게 하는 서비스를 제공하거나, 패션 잡지사의 편집 작업에 사용되어 브랜드나 스타일을 분류하고 라벨을 붙일 수 있으며, 온라인 쇼핑몰에서 아이템 정보를 제공하거나 유사한 아이템을 추천하는 등의 다양한 목적에 적용될 수 있다.