• 제목/요약/키워드: 구글 음성 검색

검색결과 8건 처리시간 0.02초

검색 포털들의 모바일 검색 기능 분석 (Analysis of Mobile Search Functions of Korean Search Portals)

  • 박소연
    • 정보관리학회지
    • /
    • 제29권1호
    • /
    • pp.175-190
    • /
    • 2012
  • 본 연구에서는 국내 주요 검색 포털들인 구글 코리아, 네이버, 네이트, 다음, 야후 코리아의 모바일 검색 기능을 분석, 평가하고자 한다. 좀 더 구체적으로 이 연구에서는 유선 검색과 차별화되는 모바일 검색 기능인 음성 검색, 음악 검색, 코드 검색, 비주얼 검색(사물 검색) 등에 초점을 맞추고, 이러한 검색 기법의 특징을 포털별로 조사하고, 검색 성능을 인식의 정확도와 인식 속도에 근거하여 비교, 평가하고자 한다. 조사 결과, 네이버와 다음이 가장 다양한 모바일 검색 기능을 제공하고 있었으며, 구글은 음성 검색만을 제공하고 있었고, 네이트와 야후는 어떠한 특화된 기능도 제공하지 않고 있었다. 본 연구의 결과는 향후 포털의 효과적인 모바일 검색 기능의 개발에 활용될 수 있을 것으로 기대된다.

음성인식기술을 활용한 VTS 자동 기록 프로그램 개발의 필요성

  • 박민경;김명수;이상록;허영관
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2015년도 춘계학술대회
    • /
    • pp.314-315
    • /
    • 2015
  • 최근 음성인식기술이 눈부시게 발전하여 여러 분야에 걸쳐 폭넓게 활용되고 있는 추세에 맞추어, 음성으로 관제의 대부분을 시행하는 VTS에 적용하고자 하였다. 선박 사고 뿐만 아니라, 기타 선박 비리나 정보 공개 요청 등 여러 분야에서 활용할 수 있는 관제내용을 보다 객관적이고 정확하게 기록하고자 VTS 자동 기록 프로그램을 개발하고자 한다.

  • PDF

구글, 네이버, 다음 카카오 API 활용앱의 표준어 및 방언 음성인식 기초 성능평가 (A Basic Performance Evaluation of the Speech Recognition APP of Standard Language and Dialect using Google, Naver, and Daum KAKAO APIs)

  • 노희경;이강희
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제7권12호
    • /
    • pp.819-829
    • /
    • 2017
  • 본 논문에서는 음성인식 기술의 현황을 소개하고 기본적인 음성인식 기술과 알고리즘을 먼저 알아본 뒤에, 음성인식 기술에 필요한 API의 코드 흐름에 대해 설명을 할 것이다. 음성인식 API중에 가장 유명한 검색엔진을 가진 구글, 네이버 다음 카카오 각각의 Application Programming Interface(API)를 안드로이드 스튜디오 툴을 이용하여 음성인식이 가능한 앱을 만든다. 그런 뒤 성별, 나이별, 지역별에 따라 사람들의 표준어, 방언에 대한 음성인식 실험을 하여 음성 인식 정확도를 표로 정리한다. 방언에 대한 실험 지역으로는 방언의 정도가 심한 경상도, 충청도, 전라도 방언에 대해 실험하였고, 표준화된 방언를 기준으로 비교 실험을 진행하였다. 결과적으로 나온 문장에 따라 띄어쓰기, 받침, 조사, 단어를 기반으로 문장의 정확성을 확인하여 각각의 오류의 개수를 숫자로 표현하였다. 결과적으로 방언과 표준어의 음성 인식률에 따라 각각의 API의 장점에 대해서 소개하고, 어떤 상황에서 가장 효율적으로 사용할지에 대해 기본적인 틀을 마련하고자 한다.

음성인터페이스 기술 개요 및 스마트폰 환경에서의 서비스 동향

  • 이윤근
    • 정보와 통신
    • /
    • 제29권4호
    • /
    • pp.3-9
    • /
    • 2012
  • 본고에서는 최근 스마트폰 등에서 사용자에게 편리한 인터페이스 수단으로 활용되고 있는 음성인식 기술에 대하여 알아본다. 음성인식 기술은 컴퓨터가 인간의 말을 알아듣는 기술로서 50년 이상의 연구개발 역사를 가지고 있다. 그간 꾸준한 기술개발과 상용화 시도를 통하여 지속적인 발전을 이루어왔으며 최근 들어 스마트폰 활성화에 따라 관심도가 급속히 높아지고 있는 분야이다. 음성인식 기술은 언어와 관련된 기술이니만큼 기술측면과 시장측면에서의 특수성이 있으며 이를 충분히 고려한 연구개발전략이 수립되어야 한다. 현재, 구글, 애플, 마이크로소프트 등 세계적인 IT 선도기업이 음성인식 기술 개발에 많은 노력을 기울이고 있으며 특히 스마트폰 환경에서의 음성인식 응용 서비스인 음성검색, 자동통역, 인공지능 개인비서 등을 시작하며 본격적인 기술, 시장 선점 경쟁에 돌입하였다. 이들 서비스에 대하여 자세히 알아보고 이에 따른 시사점 및 국내 대응현황에 대해 알아본다.

CCTV 기능을 포함한 다용도 스마트 미러 (Multi-purpose smart mirror including CCTV function)

  • 이태남
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.863-865
    • /
    • 2022
  • 본 프로젝트는 시간, 날씨, 미세먼지 농도, 캘린더, 뉴스 등을 포함한 기본적인 생활정보를 스마트 미러에 디스플레이 해주며 추가적으로 구글 어시스턴트를 활용해 음성인식으로 유튜브 재생, 인터넷 검색 등 다양한 기능을 내재하고 있다. 아울러 인체 감지 센서를 이용해 움직임이 감지되지 않으면 절전모드로 동작하다 움직임이 감지하면 일반 모드로 동작한다. 마지막으로 CCTV 기능을 내재하고 있어 CCTV 화면을 웹 애플리케이션을 통해 실시간 스트리밍 하며 사람 얼굴이 감지될 시 화면을 녹화하는 기능을 포함하고 있다.

시각장애인을 위한 네비게이션 시스템 설계 및 구현 (Design and Implementation of a Navigation System for Visually Impaired Persons)

  • 장수민;황동교;강수;김은주;박준호;장기훈;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제12권1호
    • /
    • pp.38-47
    • /
    • 2012
  • 본 논문은 시각장애인들의 활동 범위를 확대하기 위해서 주변 시설물 검색서비스와 길안내 서비스를 제공하는 시각장애인을 위한 네비게이션 시스템을 설계하고 구현한다. 제안하는 네비게이션 시스템은 시각 장애인을 위한 경로 생성 모듈 및 저장 모듈로 구성된다. 특히, 제안하는 네비게이션 시스템은 시각 장애인을 위한 인터페이스로 TTS(Text-to-Speech) 프로그램을 이용하여 음성을 통한 안내서비스를 위한 음성 모듈과 촉각을 이용하여 점자를 출력하는 점자모듈을 통하여 구현한다. 또한 최신 지도정보를 서비스하기 위해서 구글 맵 API들을 사용한다.

음성인식을 이용한 개인맞춤형 스마트 미러 (Personalized Smart Mirror using Voice Recognition)

  • 강대철;임종석;이길호;이범희;박형근
    • 한국전자통신학회논문지
    • /
    • 제17권6호
    • /
    • pp.1121-1128
    • /
    • 2022
  • 본 논문에서는 일상생활 마이크에 원하는 정보를 입력했을 때 스피커를 통해 그에 대한 정보를 출력하는 스마트 미러를 제작하였다. 스마트 미러의 화면은 LCD 모니터를 사용하여 아크릴판이 결합하여 있는 액자에 하프미러를 붙여 디스플레이를 제외한 공간에는 빛이 투과되지 않도록 하여 거울 기능을 할 수 있게 만들었다. 소프트웨어 구성 중 Raspbian을 이용하여 시스템 환경을 구축하였다. 기본 메뉴는 실제 기능적인 부분에 있어서 사용되는 거울을 통해 다양한 정보를 제공할 수 있는 스마트 미러를 라즈베리 파이를 이용하여 개발하였다. 개발된 스마트 미러는 시간, 날씨, 구글 캘린더, 유튜브 음악, 웹브라우저 검색 기능 등의 다양한 정보를 제공하며, 핸드폰 무선 충전도 가능하게 하드웨어를 제작하였다. 기존의 스마트 미러는 미리 입력된 데이터 혹은 GUI 기능만 수행할 수 있었다면 본 논문의 스마트 미러는 'Google Assistant'를 연동하여 기존의 설정한 기능뿐만 아니라 알고리즘 검색을 활용하여 웹사이트 정보를 제공한다.

인공지능(AI) 스피커에 대한 사회구성 차원의 발달과정 연구: 제품과 시기별 공진화 과정을 중심으로 (A study of Artificial Intelligence (AI) Speaker's Development Process in Terms of Social Constructivism: Focused on the Products and Periodic Co-revolution Process)

  • 차현주;권상희
    • 인터넷정보학회논문지
    • /
    • 제22권1호
    • /
    • pp.109-135
    • /
    • 2021
  • 본 연구는 전통뉴스 보도에 나타난 인공지능(AI)스피커 뉴스 텍스트 분석을 통해 인공지능(AI) 스피커 발달과정을 분류하고 시기별 제품별 특성을 파악하였다. 또한 AI 스피커 사업자 제품별 뉴스 보도와 시기별 뉴스 보도간의 상관관계를 분석하였다. 분석에 사용된 이론적 배경은 뉴스의 프레임과 토픽프레임이다. 분석방법으로는 LDA 방식을 활용한 토픽모델링(Topic Modeling)과 의미연결망분석이 사용되었으며, 추가로 'UCINET'중 QAP분석을 적용하였다. 연구방법은 내용분석 방법으로 2014년부터 2019년까지 AI 스피커 관련 2,710건의 뉴스를 1차로 수집하였고, 2차적으로 Nodexl 알고리즘을 이용하여 토픽프레임을 분석하였다. 분석 결과 첫째, AI 스피커 사업자 유형별 토픽 프레임의 경향은 4개 사업자(통신사업자, 온라인 플랫폼, OS 사업자, IT디바이스 생산업자) 특성에 따라 다르게 나타났다. 구체적으로, 온라인 플랫폼 사업자(구글, 네이버, 아마존, 카카오)와 관련한 프레임은 AI 스피커를 '검색 또는 입력 디바이스'로 사용하는 프레임의 비중이 높았다. 반면 통신 사업자(SKT, KT)는 모회사의 주력 사업인 IPTV, 통신 사업의 '보조 디바이스' 관련한 프레임이 두드러지게 나타났다. 나아가 OS 사업자(MS, 애플)는 '제품의 의인화 및 음성 서비스' 프레임이 두드러지게 보였으며, IT 디바이스 생산업자(삼성)는 '사물인터넷(IoT) 종합지능시스템'과 관련한 프레임이 두드러지게 나타났다. 둘째, AI 스피커 시기별(연도별) 토픽 프레임의 경향은 1기(2014-2016년)에는 AI 기술 중심으로 발달하는 경향을 보였고, 2기(2017-2018년)에는 AI 기술과 이용자 간의 사회적 상호 작용과 관련되어 있었으며, 3기(2019년)에는 AI 기술 중심에서 이용자 중심으로 전환되는 경향을 나타냈다. QAP 분석 결과, AI 스피커 발달에서 사업자별과 시기별 뉴스 프레임이 미디어 담론의 결정요인에 의해 사회적으로 구성되는 것을 알 수 있었다. 본연구의 함의는 AI 스피커 진화는 사업자별, 발달시기별로 모회사 기업의 특성과 이용자 간의 상호작용으로 인한 공진화 과정이 나타냄을 발견할 수 있었다. 따라서 본 연구는 AI 스피커의 향후 전망을 예측하고 그에 따른 방향성을 제시하는 데 중요한 시사점을 제공한다.