• 제목/요약/키워드: 음성제어

검색결과 695건 처리시간 0.192초

PLC 통신을 이용한 피난구 유도장치 시스템 (A Shelter Guidance System using the PLC Communication)

  • 이창영;이규윤;이현관;김인국;엄기환
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 춘계종합학술대회
    • /
    • pp.583-586
    • /
    • 2005
  • 본 연구에서는 현재 지하공간에 설치되어 있는 기존의 피난구 유도등의 문제점을 개선하기 위하여 PLC 통신을 이용한 피난구 유도장치 시스템을 제안하였다. 제안한 피난구 유도장치 시스템은 주제어부, PLC 통신 원격 제어부, 충전부, 음성발생부, 표시부, 경보알람부, 연기감지부 등으로 구성된다. 제안한 PLC 통신을 이용한 피난구 유도 장치 시스템을 실험을 통하여 PLC 통신의 단점인 잡음을 개선하고 유용성을 확인하였다.

  • PDF

무선 멀티 서비스 WCDMA 네트워크에서의 형평성을 고려한 하향링크 서비스 수락 설계 (Fairness-Based Service Admission Scheme for Downlink in Wireless Multi-Service WCDMA Networks)

  • 노상현;김동우
    • 한국정보과학회논문지:정보통신
    • /
    • 제30권1호
    • /
    • pp.65-74
    • /
    • 2003
  • 본 논문에서는 멀티 서비스 WCDMA 이동 시스템을 위한 새로운 서비스 품질 예측 지표를 사용함으로써 사용자들의 QoS 요구치를 고려한 순방향 서비스 수락 기준을 제안한다. 제안된 순방향 서비스 수락 기준은 상대적인 외부 셀의 간섭을 가정하고 각 서비스의 평균 수신 전력을 계산함으로써 얻어진다. 제안한 방법을 이용하여 우리는 서로 다른 서비스의 사용자들이 허용될 수 있는 순방향 서비스 수락 영역을 얻는다. 그리고 제안한 순방향 서비스 수락 기준에 형평성을 고려하여 각각의 서비스를 사용하는 사용자들을 위한 또 다른 순방향 서비스 수락 기준을 제시한다. 수치적 예에서 음성 서비스와 데이타 서비스들의 형평성을 고려한 순방향 서비스 수락 영역과 형평성을 고려하지 않은 순방향 서비스 수락 영역은 제안된 파카의 순방향 서비스 수락 기준들을 이용하여 얻을 수 있다.

광대역 통합망(BcN)을 위한 무선 네트워크 진화 및 통합방안

  • 신용식;박용길;정원석;이주식
    • 정보와 통신
    • /
    • 제21권8호
    • /
    • pp.88-98
    • /
    • 2004
  • 본 고는 통신의 진화 방향인 통합(convergence)의 추세를 나타낸다. 통합은 서비스, 네트워크, 비즈니스 등의 통합으로 실현되고 있다. 통합 서비스를 위한 기본 인프라인 광대역통합망(Broadband convergence Network)의 개념, 서비스 특징 및 발전방향 등을 기술한다. 광대역 통합망은 유무선 통합, 통신/방송 융합, 음성 및 데이터의 통합을 위해 필요한 네트워크를 서비스 계층, 제어 계층, 전달망 계층, 접속 계층, 유비쿼터스 접속 및 가입자 단말 계층으로 구분한다. BcN은 사용자가 원하는 품질과 보안의 정도에 따라 차별화된 광대역 멀티미디어 서비스제공 및 관리가 가능한 네트워크이다. 이러한 BcN진화를 위한 무선 네트워크 관점의 All-IP진화 방향을 나타낸다. 먼저, 무선 네트워크에서의 광대역 멀티미디어 서비스의 특징 및 종류, 이를 위한 광대역 통합망의 특징을 살펴본다. 그리고 향후 BcN으로의 무선 네트워크의 진화 방향을 나타낸다. BcN의 무선 네트워크는 다양한 광대역 멀티미디어 서비스를 제공하기에 적합한 이동성 및 광대역 엑세스가 가능한 시스템이 추가될 전망이다. 마지막으로, 향후 통신 서비스의 진화 방향인 유비쿼터스 서비스를 위해 필요한 유비쿼터스 네트워크를 전망한다. 미래의 유비쿼터스 네트워크를 위한 지능형 플랫폼, 통합 단말 등 기술적 요구사항들과 진화방향을 나타낸다.

Network을 이용한 원격 핵자기 공명 영상 (Remotely controlled Interactive Magnetic Resonance Imaging in Network Environment)

  • 박정일;김치영;박대준;유완석;안창범
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1996년도 하계학술대회 논문집 B
    • /
    • pp.1383-1385
    • /
    • 1996
  • Network환경에서 World Wide Web을 이용하여, 원격 제어 핵자기 공명 영상 시스템을 구성하였다. 시스템 구성은 핵자기 공명 영상 시스템의 host computer에 HTTP server를 구축하였으며 원활한 원격 실험을 위하여 화상 및 음성통신 기능도 추가하였다. 개발된 시스템으로 광운대학교의 신호처리연구실에서 대전 KAIST의 의학 영상 공학 센터에 있는 원격 핵자기 공명 영상 시스템을 조정하여 실험을 수행할 수 있었다.

  • PDF

외출준비를 도와주는 전신거울형 안면인식 스마트 도어 (The Smart Door with the full body mirror to help you get ready to go out.)

  • 김진수;이상은;민채은;김진욱;최병조
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 추계학술발표대회
    • /
    • pp.501-503
    • /
    • 2018
  • 본 논문은 개인에 맞는 외출 시 필요한 정보를 문에 출력하여 외출 준비를 도와주는 스마트 도어 아이디오를 제안한다. 스마트 도어를 활성화 시켜 내장된 웹 카메라로 촬영된 사진을 이용하여 얼굴인식을 수행하고 수행한 결과로 개안 아이디를 통해 데이터베이스를 조작한다. 데이터베이스에 개인 준비물 데이터는 모바일 앱에서는 도어락을 제어하는 추가적인 기능도 수행한다. 개인 중비물외에도 개인 일정, 당일 날씨 및 교통 정보를 스마트 도어 LCD에 출력과 동시에 음성으로 알려준다. 본 논문에서 제시하는 스마트 도어는 LCD에 정보 출력뿐만 아니라 half-mirror와 함께 설계되어 전신 거울 기능도 포함된다. 스마트 도어는 어디에서 사용되는 문에 유용한 기능을 추가하여 공간 활용에 용이하고 필요한 소지품을 잊지 않고 챙길 수 있다.

차세대 통합네트워크를 위한 MEGACO 프로토콜 호 처리 시험기 연구 (A Study on a Tester of the MEGACO Protocol Call Processing for the Next Generation Convergence Network)

  • 이규호;성길영
    • 한국정보통신학회논문지
    • /
    • 제11권12호
    • /
    • pp.2265-2270
    • /
    • 2007
  • 본 논문은 IETF와 ITU-T에서 공동으로 권고하는 미디어 게이트웨이 제어 프로토콜인 MEGACO/H.248 기반의 미디어 게이트웨이 컨트롤러와 액세스 게이트웨이의 호 처리 성능 및 기능시험 연구에 관한 내용이다. 기존 PSTN망에서 서비스되고 있는 음성 트래픽을 IP망으로 통합하는 차세대 통합네트워크의 핵심적인 구성요소로서 미디어 게이트웨이 컨트롤러와 액세스 게이트웨이의 호 처리 성능 및 기능을 시험하기 위한 효과적인 방법 및 시험 시스템 구조에 관한 연구로, 특히 시험 환경 구축을 위해 액세스 게이트웨이에 접속되는 다수의 아날로그 라인들에 대한 가상 에뮬레이션 기능과, 미디어 게이트웨이 컨트롤러와 액세스 게이트웨이 시험을 위해, 프로토콜의 상대역할을 에뮬레이션하는 시험기로 동작하는 효과적인 방안과 그 타당성을 논의한다.

동굴관광용 고층수직이동 승강기의 긴급 음성구동 제어 (Voice Recognition Sensor Driven Elevator for High-rise Vertical Shift)

  • 최병섭;강태현;윤여훈;장훈규;소대화
    • 동굴
    • /
    • 제88호
    • /
    • pp.1-7
    • /
    • 2008
  • Recently, it is one of very interest technology of Human Computer Interaction(HCI). Nowadays, it is easy to find out that, for example, inside SF movies people has talking to computer. However, there are difference between CPU language and ours. So, we focus on connecting to CPU. For 30 years many scientists experienced in that technology. But it is really difficult. Our project goal is making that CPU could understand human voice. First of all the signal through a voice sensor will move to BCD (binary code). That elevator helps out people who wants to move up and down. This product's point is related with people's safety. Using a PWM for motor control by ATmega16, we choose a DC motor to drive it because of making a regular speed elevator. Furthermore, using a voice identification module the elevator driven by voice sensor could operate well up and down perfectly from 1st to 10th floor by PWM control with ATmega16. And, it will be clearly useful for high-rise vertical shift with voice recognition sensor driven.

스마트 CCTV 인공지능 자율주행 방범 서비스 (Smart CCTV Artificial Intelligence Self-driving Security Service)

  • 김준형;김아영;김예빈;이동엽;이지현;유상오
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.1071-1074
    • /
    • 2021
  • 본 논문은 펌웨어와 인공지능을 이용하여 지형의 사각지대를 이동하며 순찰 및 방범의 목적을 지닌 시스템을 소개하기 위함에 있다. 기존의 보안 시스템은 비상 상황 발생 시 인력이 직접 출동하여 상황을 해결함으로써 날로 증가하는 최저임금을 고려했을 때 이들의 인건비를 감당하기 어렵다는 단점이 있다. [1] 이러한 문제점을 해결하기 위해 앱 개발을 통해 RC카를 제어하는 아두이노와 연결하여 자율주행을 하게끔 하는 시스템을 개발했다. 또한, 라즈베리파이 웹캠을 부착해 실시간으로 현장을 촬영하여 사용자가 웹에만 접속하면 현장을 모두 감시할 수 있도록 시스템을 개발하였고, 단시간 푸리에 변환(STFT)을 통해 얻은 음성 데이터 변환맵을 인공지능 프로세서인 인텔리노에 학습 데이터로 학습시킨 후에 주변 환경에서 비명 소리만 감지할 수 있도록 시스템을 구현하였다. 본 논문에서는 이러한 시스템들이 기존의 인건비 증가에 대한 문제점을 해소할 수 있다고 생각하여 더욱 효율적으로 방범이 가능한 시스템을 소개한다.

심층신경망 기반 오디오 부호화기를 위한 Multi-time Scale 손실함수의 최적화 (Optimization of Multi-time Scale Loss Function Suitable for DNN-based Audio Coder)

  • 신승민;변준;박영철;백승권;성종모
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.1315-1317
    • /
    • 2022
  • 최근, 심층신경망 기반 오디오 부호화기가 활발히 연구되고 있다. 심층신경망 기반 오디오 부호화기는 기존의 전통적인 오디오 부호화기보다 구조적으로 간단하지만, 네트워크의 복잡도를 증가시키지 않고 인지적 성능향상을 기대하는 것은 어렵다. 이 문제를 해결하기 위하여 인간의 청각적 특성을 활용한 심리음향모델 기반 손실함수를 사용한 기법들이 소개되었다. 심리음향 모델 기반 손실함수를 사용한 오디오 부호화기는 양자화 잡음을 잘 제어하였지만, 여전히 지각적인 향상이 필요하다. 본 논문에서는 심층신경망 기반 오디오 부호화기를 위한 Multi-time Scale 손실함수의 지역 손실함수 윈도우 크기의 최적화 제안한다. Multi-time Scale 손실함수의 지역 손실함수 계산을 위한 윈도우 크기를 조절하며, 이를 통하여 오디오 부호화에 적합한 윈도우 사이즈를 결정한다. 실험을 통해 얻은 최적의 Multi-time Scale 손실함수를 사용하여 네트워크를 훈련하였고, 주관적 평가를 통해 기존의 심리음향모델 기반 손실함수보다 좋은 음성 품질을 보여주는 것을 확인하였다.

  • PDF

이미지-텍스트 자질을 이용한 행동 포착 비디오 기반 대화시스템 (Audio-Visual Scene Aware Dialogue System Utilizing Action From Vision and Language Features)

  • 임정우;장윤나;손준영;이승윤;박기남;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.253-257
    • /
    • 2023
  • 최근 다양한 대화 시스템이 스마트폰 어시스턴트, 자동 차 내비게이션, 음성 제어 스피커, 인간 중심 로봇 등의 실세계 인간-기계 인터페이스에 적용되고 있다. 하지만 대부분의 대화 시스템은 텍스트 기반으로 작동해 다중 모달리티 입력을 처리할 수 없다. 이 문제를 해결하기 위해서는 비디오와 같은 다중 모달리티 장면 인식을 통합한 대화 시스템이 필요하다. 기존의 비디오 기반 대화 시스템은 주로 시각, 이미지, 오디오 등의 다양한 자질을 합성하거나 사전 학습을 통해 이미지와 텍스트를 잘 정렬하는 데에만 집중하여 중요한 행동 단서와 소리 단서를 놓치고 있다는 한계가 존재한다. 본 논문은 이미지-텍스트 정렬의 사전학습 임베딩과 행동 단서, 소리 단서를 활용해 비디오 기반 대화 시스템을 개선한다. 제안한 모델은 텍스트와 이미지, 그리고 오디오 임베딩을 인코딩하고, 이를 바탕으로 관련 프레임과 행동 단서를 추출하여 발화를 생성하는 과정을 거친다. AVSD 데이터셋에서의 실험 결과, 제안한 모델이 기존의 모델보다 높은 성능을 보였으며, 대표적인 이미지-텍스트 자질들을 비디오 기반 대화시스템에서 비교 분석하였다.

  • PDF