• 제목/요약/키워드: 음성기반 혁신

검색결과 23건 처리시간 0.029초

"21C 댁내 정보화 기반조성을 위한 " 구내 통신선로설비 기반기술개발 및 표준화 계획

  • 최세하
    • 정보와 통신
    • /
    • 제15권12호
    • /
    • pp.97-113
    • /
    • 1998
  • 사회경제의 성장에 따른 수요 증가 및 서비스 다양화추세에 따라 음성통신, 데이터통신 및 간단한 영상통신 등을 서비스하기 위한 통신망이 구축, 발전되어 왔다. 다양한 종류의 멀티미디어 서비스가 하나의 통신매체를 통하여 송 수신될 것으로 예측되며, 이를 실현하기 위해서는 무엇보다도 가입자 댁내에 설치되는 구내통신선로설비의 고도화가 필수적이다. 특히 보다 빠른 속도의 다양한 정보통신서비스를 이용하고자 하는 가입자의 욕구증대와 이를 가능하게 하는 혁신적인 기술발전이 결합하여 가입자 댁내 어디서나 다양한 멀티미디어 서비스를 편리하게 이용할 수 있는 구내배선시스템이 초고속 정보통신망시대의 고부가가치를 창출하는 주력사업으로 부상함에 따라 이에 대한 연구개발이 선진국간에 경쟁력으로 진행 중에 있다. 선진국의 기술개발과 표준화 동향에 대하여 간략히 고찰 한 후, 21세기 정보사회에 대비하기 위하여 현재 정부가 추진중인 구내통신선로설비 기술개발 및 표준화 계획을 간략히 소개하고 향후 기술개발일정과 국제표준과 연계한 표준화 계획을 제시하고자 한다.

  • PDF

ICT 환경변화에 따른 주요 기술 동향 및 전망

  • 박영준;김이강;류승완
    • 정보와 통신
    • /
    • 제28권12호
    • /
    • pp.42-49
    • /
    • 2011
  • 최근 스마트폰의 급격한 보급과 음성 위주의 이동통신서비스가 무선 멀티미디어 콘텐츠를 중심으로 하는 데이터 위주의 서비스로 전환됨에 따라 ICT 환경은 과거의 어느때 보다 급격하게 변화하고 있다. 이러한 ICT 환경변화는 개방과 협력, 플랫폼 기반 동기화, 참여와 공유라는 키워드로 나타낼 수 있으며, 이에 따라 콘텐츠에서는 실감콘텐츠, 플랫폼에서는 웹기반 플랫폼, 네트워크에서는 혁신형 미래인터넷 및 트래픽 분산을 위한 단말 간 직접통신, 그리고 단말에서는 사용자 편의성을 위한 UI/UX 기술이 대두되고 있다. 본 고에서는 콘텐츠-플랫폼-네트워크-단말로 구성되는 ICT 가치사슬에 대해서 각 가치사슬별 환경변화에 따른 주요 기술 이슈에 대해 고찰한다. 특히 본 고에서는 개발자 입장에서의 구체적인 기술내용보다는 시장측면에서 요구되는 서비스 또는 기능중심으로 기술 특성을 살펴본다.

대형 사전훈련 모델의 파인튜닝을 통한 강건한 한국어 음성인식 모델 구축 (Building robust Korean speech recognition model by fine-tuning large pretrained model)

  • 오창한;김청빈;박기영
    • 말소리와 음성과학
    • /
    • 제15권3호
    • /
    • pp.75-82
    • /
    • 2023
  • 자동 음성 인식(automatic speech recognition, ASR)은 딥러닝 기반 접근 방식으로 혁신되었으며, 그중에서도 자기 지도 학습 방법이 특히 효과적일 수 있음이 입증되고 있다. 본 연구에서는 다국어 ASR 시스템인 OpenAI의 Whisper 모델의 한국어 성능을 향상시키는 것을 목표하여 다국어 음성인식 시스템에서의 비주류 언어의 성능 문제를 개선하고자 한다. Whisper는 대용량 웹 음성 데이터 코퍼스(약 68만 시간)에서 사전 학습되었으며 주요 언어에 대한 강력한 인식 성능을 입증했다. 그러나 훈련 중 주요 언어가 아닌 한국어와 같은 언어를 인식하는 데 어려움을 겪을 수 있다. 우리는 약 1,000시간의 한국어 음성으로 구성된 추가 데이터 세트로 Whisper 모델을 파인튜닝하여 이 문제를 해결한다. 또한 동일한 데이터 세트를 사용하여 전체 훈련된 Transformer 모델을 베이스 라인으로 선정하여 성능을 비교한다. 실험 결과를 통해 Whisper 모델을 파인튜닝하면 문자 오류율(character error rate, CER) 측면에서 한국어 음성 인식 기능이 크게 향상되었음을 확인할 수 있다. 특히 모델 크기가 증가함에 따라 성능이 향상되는 경향을 포착하였다. 그러나 Whisper 모델의 영어 성능은 파인튜닝 후 성능이 저하됨을 확인하여 강력한 다국어 모델을 개발하기 위한 추가 연구의 필요성을 확인할 수 있었다. 추가적으로 우리의 연구는 한국어 음성인식 애플리케이션에 파인튜닝된 Whisper 모델을 활용할 수 있는 가능성을 확인할 수 있다. 향후 연구는 실시간 추론을 위한 다국어 인식과 최적화에 초점을 맞춰 실용적 연구를 이어갈 수 있겠다.

KANO-TOPSIS 모델을 이용한 지능형 신제품 개발: 차량용 음성비서 시스템 개발 사례 (KANO-TOPSIS Model for AI Based New Product Development: Focusing on the Case of Developing Voice Assistant System for Vehicles)

  • 양성민;탁준혁;권동환;정두희
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.287-310
    • /
    • 2022
  • 인공지능의 등장으로 과학기술 분야 뿐만 아니라 산업의 고도화가 가속화되고 있다. 기업은 인공지능 기술의 효과적인 도입을 통한 지능형 제품 개발로 고객 경험 혁신 및 가치 창출을 실현하고자 한다. 그러나 지능형 제품은 인공지능과 같은 급진적인 기술을 기반으로 하는 제품의 특성상 기존 제품과 개발 방식에 있어 차이를 나타내며, 기존 제품 개발 방법론을 그대로 적용하기에 명확한 한계가 존재한다. 본 연구에서는 차량용 음성비서를 예시로 기업들의 성공적인 지능형 신제품 개발을 위한 KANO-TOPSIS 기반의 새로운 연구 방법을 제안한다. 먼저 KANO 모델을 통해 고객들이 신제품에 필요하다고 생각하는 기능을 선별 및 평가하고, TOPSIS를 통해 고객들이 필요로 하는 기능의 중요도를 구해 신제품 개발을 위한 새로운 기능의 우선순위를 도출한다. 분석을 위해 차량 상태 확인 및 기능 제어 요소, 주행 관련 요소, 음성비서 자체의 특성, 인포테인먼트 요소, 일상생활 지원 요소 등 주요 카테고리를 선정 및 고객 요구속성을 세분화하였으며, 분석 결과, 높은 인식 정확도가 차량용 음성비서 개발에 있어 최우선으로 고려되어야 할 요소로 나타났다. 운전자의 생체 정보, 사용 습관 등에 맞춤화된 콘텐츠를 제공하는 인포테인먼트 요소는 예상과 달리 낮은 우선순위를 나타낸 반면 차량 상태 알림, 주행 보조 및 보안 등 운전자의 안전과 관련된 기능들은 보다 우선적으로 개발되어야 할 요건으로 밝혀졌다. 본 연구는 KANO와 TOPSIS를 결합한 우수한 모델을 통해 혁신적인 지능형 신제품의 특성에 맞는 새로운 제품 개발 방법론을 제시했다는 점에서 의의가 있다.

장애인 접근성 향상을 위한 보조기기 및 대체자료 분석과 구현 방향 (The Implementation Directions and an Analysis of Assistive Devices and Alternative Formats to Improve Accessibility for Disabled People)

  • 임명환;길연희;전광일
    • 한국콘텐츠학회논문지
    • /
    • 제15권7호
    • /
    • pp.664-673
    • /
    • 2015
  • 장애인에 대한 정책과 지원, 장애인 접근성 향상을 위한 지침 제정, 기술혁신과 제품개발 등으로 장애인 보조기기 분야는 산업측면에서 크게 부각되고 있다. 최근에는 ICT 발전으로 시각 장애인용 스크린 리더, 점자 디스플레이, 화면 확대기, 문자음성 변환기 등이 출시되어 촉각과 청각으로 인터넷 접속이 용이해지고 스마트기기를 통해 편리하게 전자출판 콘텐츠를 활용하고 메일을 주고받을 수 있게 된 것이다. 그렇지만 급속하게 전환되고 있는 디지털 미디어기반의 스마트시대에 시각 장애인의 접근성은 아직도 열악하고 보조기기와 대체자료의 성능과 품질도 개선되어야 할 점이 많은 상황이다. 따라서 본 연구는 연구개발 혁신 측면에서 시각 장애인용 보조기기 및 대체자료의 현황과 구조를 분석하고 접근성 향상을 위한 구현 방향을 제시하고 있다. 연구결과, 향후에는 다양한 디지털 정보가 맞춤형 및 실감형 형태로 전환되고 장애인 전용 단말기 또는 스마트기기를 통해 유통될 것으로 예상된다.

인공지능 기반 영어 발음 인식에 관한 연구 (A Study on the Recognition of English Pronunciation based on Artificial Intelligence)

  • 이철승;백혜진
    • 한국전자통신학회논문지
    • /
    • 제16권3호
    • /
    • pp.519-524
    • /
    • 2021
  • 최근 4차 산업혁명은 주요 선진국을 중심으로 세계의 국가들의 관심을 갖는 분야가 되고 있다. 4차 산업혁명 기술의 핵심기술인 인공지능기술은 다양한 분야에 융합하는 형태로 발전하고 있으며, 에듀테크 분야에도 많은 영향을 미치고 있으며 교육을 혁신적으로 변화하기 위해 많은 관심과 노력을 하고 있다. 본 논문은 DTW 음성인식 알고리즘을 이용하여 실험환경을 구축하고 다양한 원어민 데이터와 비원어민 데이터를 딥러닝 학습하고, CNN 알고리즘과의 비교를 통해 영어 발음의 유사도를 측정하여 비원어민이 원어민과 유사한 발음으로 교정할 수 있도록 연구한다.

21C 댁내 정보화 기반조성을 위한 구내통신선로설비 기반기술개발 및 표준화 계획 (A base technical development and standardization plan of Customer Premises)

  • 최세하
    • 한국정보통신학회논문지
    • /
    • 제2권4호
    • /
    • pp.495-509
    • /
    • 1998
  • 사회경제의 성장에 따른 수요 증가 및 서비스 다양화추세에 따라 음성통신, 데이터통신 밑 간단한 영상통신 등을 서비스하기 위한 통신망이 구축, 발전되어 왔다 다양한 종류의 멀티미디어 서비스가 하나의 통신매체를 통하여 송 수신될 것으로 예측되며, 이를 실현하기 위해서는 무엇보다도 가입자 댁내에 설치되는 구내통신선로설비의 괴도화가 필수적이다. 특히 보다 빠른 속도의 다양한 정보통신서비스를 이용하고자 하는 가입자의 욕구증대와 이를 가능하게 하는 혁신적인 기술발전이 결합하여 가입자 댁내 어디서나 다양한 멀티미디어 서비스를 편리하게 이용할 수 있는 구내배선시스템이 초고속 정보통신망시대의 고부가가치를 창출하는 주력산업으로 부상하고 있다. 따라서, 이에 대한 연구개발이 선진국간에 경쟁적으로 진행 중에 있다. 본 논문에서는 선진국의 기술개발과 표준화 동향에 대하여 간략히 고찰한 후, 21세기 정보사회에 대비하기 위하여 현재 정부가 추진중인 구내 통신선로설비 기술개발 및 표준화 계획을 간략히 소개하고 향후 기술개발일정과 국제표준과 연계한 표준화 계획을 제시하고자 한다.

  • PDF

물체 검출 컨벌루션 신경망 설계를 위한 효과적인 네트워크 파라미터 추출 ((Searching Effective Network Parameters to Construct Convolutional Neural Networks for Object Detection))

  • 김누리;이동훈;오성회
    • 정보과학회 논문지
    • /
    • 제44권7호
    • /
    • pp.668-673
    • /
    • 2017
  • 최근 몇 년간 딥러닝(deep learning)은 음성 인식, 영상 인식, 물체 검출을 비롯한 다양한 패턴인식 분야에서 혁신적인 성능 발전을 거듭해왔다. 그에 비해 네트워크가 어떻게 작동하는지에 대한 깊은 이해는 잘 이루어지지 않고 있다. 본 논문은 효과적인 신경망 네트워크를 구성하기 위해 네트워크 파라미터들이 신경망 내부에서 어떻게 작동하고, 어떤 역할을 하고 있는지 분석하였다. Faster R-CNN 네트워크를 기반으로 하여 신경망의 과적합(overfitting)을 막는 드랍아웃(dropout) 확률과 앵커 박스 크기, 그리고 활성 함수를 변화시켜 학습한 후 그 결과를 분석하였다. 또한 드랍아웃과 배치 정규화(batch normalization) 방식을 비교해보았다. 드랍아웃 확률은 0.3일 때 가장 좋은 성능을 보였으며 앵커 박스의 크기는 최종 물체 검출 성능과 큰 관련이 없다는 것을 알 수 있었다. 드랍아웃과 배치 정규화 방식은 서로를 완전히 대체할 수는 없는 것을 확인할 수 있었다. 활성화 함수는 음수 도메인의 기울기가 0.02인 leaky ReLU가 비교적 좋은 성능을 보였다.

인공지능 딥러링 학습 플랫폼에 관한 선행연구 고찰 (A Review on Deep Learning Platform for Artificial Intelligence)

  • 진찬용;신성윤;남수태
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2019년도 춘계학술대회
    • /
    • pp.169-170
    • /
    • 2019
  • 인공지능이 글로벌 경쟁력 원천 기술로 부각되면서 정부도 자율주행차, 드론, 로봇 등 미래 신산업의 기반 기술이 되는 인공지능을 전략적으로 육성하고 있다. 국내 인공지능 연구 및 서비스는 네이버와 카카오를 중심으로 출시되었으나 해외에 비하면 규모나 수준이 미약한 편이다. 최근, 딥러닝 (deep learning)은 최근 음성인식과 영상인식을 비롯한 다양한 패턴인식 분야에서 혁신적인 성능을 기록하면서 많은 연구가 진행되고 있다. 그 뿐만 아니라 딥러닝은 초창기부터 산업계의 큰 관심을 끌어 구글이나 마이크로소프트, 삼성전자 등 글로벌 정보기술 회사에서 상용제품에 딥러닝 기술을 성공적으로 적용하고 있고 계속 연구개발을 진행하고 있어 대중매체에서도 관심을 가지고 주목하고 있다. 이러한 선행연구를 바탕으로 주목 받고 있는 인공지능에 대해 살펴보도록 하겠다.

  • PDF

위험사회 재난 안전 분야 대응을 위한 AI 조력자 (AI Advisor for Response of Disaster Safety in Risk Society)

  • 이용학;강윤희;이민호;박성호;강명주
    • Journal of Platform Technology
    • /
    • 제8권3호
    • /
    • pp.22-29
    • /
    • 2020
  • 4차 산업혁명은 초기 단순 제조업 혁신에서 사회 및 경제분야에서 다양한 기술적 융합 방향을 이끄는 메가 트랜드로서 국가별로 진행하고 있다. COVID-19와 같은 감염병의 유행은 디지털 중심의 비대면 비즈니스를 경제 운영에서 전환되고 있으며 온라인화 확산을 위해서는 개인 맞춤형서비스를 위한 AI와 빅데이터 기술의 활용은 필수적이다. 이 논문에서는 4차산업혁명을 주요한 기술 특징 및 정부에서 추진하는 디지털 뉴딜의 효과적 이행을 위해 핵심 기술인 인공지능기술의 적용을 중심으로 사례를 분석하고 재난대응 분야에서의 활용 사례를 기술한다. 재난대응 활용사례로서 AI 조력자는 긴급호출에서 신고자의 상태에 따른 적절한 대응책들을 제시한다. 이를 위해 AI 조력자는 적응적 대응을 위한 음성인식 데이터 기반 분석 및 변환 텍스트의 재난 분류를 제공한다.

  • PDF