• 제목/요약/키워드: Recognition of the AI

검색결과 380건 처리시간 0.025초

AI-based language tutoring systems with end-to-end automatic speech recognition and proficiency evaluation

  • Byung Ok Kang;Hyung-Bae Jeon;Yun Kyung Lee
    • ETRI Journal
    • /
    • 제46권1호
    • /
    • pp.48-58
    • /
    • 2024
  • This paper presents the development of language tutoring systems for nonnative speakers by leveraging advanced end-to-end automatic speech recognition (ASR) and proficiency evaluation. Given the frequent errors in non-native speech, high-performance spontaneous speech recognition must be applied. Our systems accurately evaluate pronunciation and speaking fluency and provide feedback on errors by relying on precise transcriptions. End-to-end ASR is implemented and enhanced by using diverse non-native speaker speech data for model training. For performance enhancement, we combine semisupervised and transfer learning techniques using labeled and unlabeled speech data. Automatic proficiency evaluation is performed by a model trained to maximize the statistical correlation between the fluency score manually determined by a human expert and a calculated fluency score. We developed an English tutoring system for Korean elementary students called EBS AI Peng-Talk and a Korean tutoring system for foreigners called KSI Korean AI Tutor. Both systems were deployed by South Korean government agencies.

로봇 비전의 영상 인식 AI를 위한 전이학습 정량 평가 (Quantitative evaluation of transfer learning for image recognition AI of robot vision)

  • 정재학
    • 문화기술의 융합
    • /
    • 제10권3호
    • /
    • pp.909-914
    • /
    • 2024
  • 본 연구에서는 로봇 비전용 영상 인식을 비롯한 다양한 AI 분야에서 널리 활용되는 전이학습에 대한 정량적 평가를 제시하였다. 전이학습을 적용한 연구 결과에 대한 정량적, 정성적 분석은 제시되나, 전이학습 자체에 대해서는 논의되지 않는다. 따라서 본 연구에서는 전이학습 자체에 대한 정량적 평가를 숫자 손글씨 데이터베이스인 MNIST를 기반으로 제안한다. 기준 네트워크를 대상으로 전이학습 동결층의 깊이 및 전이학습 데이터와 사전 학습 데이터의 비율에 따른 정확도 변화를 추적하였다. 이를 통해 첫번째 레이어까지 동결할 때 전이학습 데이터의 비율이 3% 이상일 경우, 90% 이상의 정확도를 안정적으로 유지할 수 있음이 확인되었다. 본 연구의 전이학습 정량 평가 방법은 향후 네트워크 구조와 데이터의 종류에 따라 최적화된 전이학습을 구현하는데 활용 가능하며, 다양한 환경에서 로봇 비전 및 이미지 분석 AI의 활용 범위를 확대할 것이다.

AI 멀티모달 센서 기반 보행자 영상인식 알고리즘 (AI Multimodal Sensor-based Pedestrian Image Recognition Algorithm)

  • 신성윤;조승표;조광현
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제67차 동계학술대회논문집 31권1호
    • /
    • pp.407-408
    • /
    • 2023
  • In this paper, we intend to develop a multimodal algorithm that secures recognition performance of over 95% in daytime illumination environments and secures recognition performance of over 90% in bad weather (rainfall and snow) and night illumination environments.

  • PDF

CNN-based Gesture Recognition using Motion History Image

  • Koh, Youjin;Kim, Taewon;Hong, Min;Choi, Yoo-Joo
    • 인터넷정보학회논문지
    • /
    • 제21권5호
    • /
    • pp.67-73
    • /
    • 2020
  • In this paper, we present a CNN-based gesture recognition approach which reduces the memory burden of input data. Most of the neural network-based gesture recognition methods have used a sequence of frame images as input data, which cause a memory burden problem. We use a motion history image in order to define a meaningful gesture. The motion history image is a grayscale image into which the temporal motion information is collapsed by synthesizing silhouette images of a user during the period of one meaningful gesture. In this paper, we first summarize the previous traditional approaches and neural network-based approaches for gesture recognition. Then we explain the data preprocessing procedure for making the motion history image and the neural network architecture with three convolution layers for recognizing the meaningful gestures. In the experiments, we trained five types of gestures, namely those for charging power, shooting left, shooting right, kicking left, and kicking right. The accuracy of gesture recognition was measured by adjusting the number of filters in each layer in the proposed network. We use a grayscale image with 240 × 320 resolution which defines one meaningful gesture and achieved a gesture recognition accuracy of 98.24%.

객체인식 AI적용 드론에 대응할 수 있는 적대적 예제 기반 소극방공 기법 연구 (A Research on Adversarial Example-based Passive Air Defense Method against Object Detectable AI Drone)

  • 육심언;박휘랑;서태석;조영호
    • 인터넷정보학회논문지
    • /
    • 제24권6호
    • /
    • pp.119-125
    • /
    • 2023
  • 우크라이나-러시아 전을 통해 드론의 군사적 가치는 재평가되고 있으며, 북한은 '22년 말 대남 드론 도발을 통해 실제 검증까지 완료한 바 있다. 또한, 북한은 인공지능(AI) 기술의 드론 적용을 추진하고 있는 것으로 드러나 드론의 위협은 나날이 커지고 있다. 이에 우리 군은 드론작전사령부를 창설하고 다양한 드론 대응 체계를 도입하는 등 대 드론 체계 구축을 도모하고 있지만, 전력증강 노력이 타격체계 위주로 편중되어 군집드론 공격에 대한 효과적 대응이 우려된다. 특히, 도심에 인접한 공군 비행단은 민간 피해가 우려되어 재래식 방공무기의 사용 역시 극도로 제한되는 실정이다. 이에 본 연구에서는 AI기술이 적용된 적 군집드론의 위협으로부터 아 항공기의 생존성 향상을 위해 AI모델의 객체탐지 능력을 저해하는 소극방공 기법을 제안한다. 대표적인 적대적 머신러닝(Adversarial machine learning) 기술 중 하나인 적대적 예제(Adversarial example)를 레이저를 활용하여 항공기에 조사함으로써, 적 드론에 탑재된 객체인식 AI의 인식률 저하를 도모한다. 합성 이미지와 정밀 축소모형을 활용한 실험을 수행한 결과, 제안기법 적용 전 약 95%의 인식률을 보이는 객체인식 AI의 인식률을 제안기법 적용 후 0~15% 내외로 저하시키는 것을 확인하여 제안기법의 실효성을 검증하였다.

어린이집내 인공지능 로봇 사용경험 여부에 따른 유아의 인공지능 인식 차이 (Differences in Preschool Children's Perceptions of Artificial Intelligence according to their Experiences with AI Robots in daycare centers)

  • 이보람;김수정
    • 한국보육지원학회지
    • /
    • 제19권2호
    • /
    • pp.43-59
    • /
    • 2023
  • Objective: This study investigated the differences in preschool children's perceptions of artificial intelligence (AI) and their distribution by latent profiles according to their experience with AI robots in daycare centers. Methods: The participants included 119 five-year-old children, 52 of whom had experience with AI robots in daycare centers and 67 of whom did not. Children's perceptions of AI were measured using the Godspeed scale from Bartneck et al.(2009). Data were analyzed using a t-test, latent profile analysis, and chi-square test. Results: The results showed that compared to the inexperienced group, the experienced group reported lower levels of animacy and perceived intelligence of AI robots, indicating higher levels of AI knowledge and understanding. In addition, the experienced group had a higher probability of belonging to the 'machine recognition' type than 'organism recognition' type, although the difference was not statistically significant. Conclusion/Implications: The findings suggest that experience with AI robots in daycare centers can improve children's AI knowledge and understanding. To further enhance this effect, it is necessary to increase the number of robots put into classrooms, and to consider various teaching media that reflect children's preferences.

화자식별 기반의 AI 음성인식 서비스에 대한 사이버 위협 분석 (Cyber Threats Analysis of AI Voice Recognition-based Services with Automatic Speaker Verification)

  • 홍천호;조영호
    • 인터넷정보학회논문지
    • /
    • 제22권6호
    • /
    • pp.33-40
    • /
    • 2021
  • 음성인식(ASR: Automatic Speech Recognition)은 사람의 말소리를 음성 신호로 분석하고, 문자열로 자동 변화하여 이해하는 기술이다. 초기 음성인식 기술은 하나의 단어를 인식하는 것을 시작으로 두 개 이상의 단어로 구성된 문장을 인식하는 수준까지 진화하였다. 실시간 음성 대화에 있어 높은 인식률은 자연스러운 정보전달의 편리성을 극대화하여 그 적용 범위를 확장하고 있다. 반면에, 음성인식 기술의 활발한 적용에 따라 관련된 사이버 공격과 위협에 대한 우려 역시 증가하고 있다. 기존 연구를 살펴보면, 자동화자식별(ASV: Automatic Speaker Verification) 기법의 고안과 정확성 향상 등 기술 발전 자체에 관한 연구는 활발히 이루어지고 있으나, 실생활에 적용되고 있는 음성인식 서비스의 자동화자 식별 기술에 대한 사이버 공격 및 위협에 관한 분석연구는 다양하고 깊이 있게 수행되지 않고 있다. 본 연구에서는 자동화자 식별 기술을 갖춘 AI 음성인식 서비스를 대상으로 음성 주파수와 음성속도를 조작하여 음성인증을 우회하는 사이버 공격 모델을 제안하고, 상용 스마트폰의 자동화자 식별 체계를 대상으로 실제 실험을 통해 사이버 위협을 분석한다. 이를 통해 관련 사이버 위협의 심각성을 알리고 효과적인 대응 방안에 관한 연구 관심을 높이고자 한다.

딥러닝 기반 OCR 인식 엔진의 정확도 향상을 위한 전/후처리기 기술 구현 (Implementation of Pre-Post Process for Accuraty Improvement of OCR Recognition Engine Based on Deep-Learning Technology)

  • 장창복;김기봉
    • 융합정보논문지
    • /
    • 제12권1호
    • /
    • pp.163-170
    • /
    • 2022
  • 4차산업 혁명이 도래함에 따라 AI 기술을 적용하는 솔루션 개발이 활발하게 이루어지고 있다. 2017년도부터 금융권, 보험사를 중심으로 AI 기반 RPA(Robotic Process Automation)을 이용한 업무 자동화 솔루션 도입이 이루어지기 시작했으며, 최근에는 RPA 솔루션 도입 단계를 지나 확산하는 시기로 진입하고 있다. 이러한 RPA 솔루션을 이용한 업무 자동화 중에서 각 종 문서들을 이용한 업무 자동화에는 문서내의 문자 정보를 얼마나 정확하게 인식하는지가 매우 중요하다. 이러한 문자 인식은 최근 딥러닝 기술을 도입함으로써 그 정확도가 많이 높아졌지만, 여전히 완벽한 인식 정확도 갖는 인식 모델은 존재하지 않는다. 따라서, 본 논문에서는 딥러닝 기반 문자 인식 엔진에 전/후 처리기 기술을 적용할 경우 얼마나 정확도가 향상되는지를 확인하고 RPA 인식 엔진과 연계 기술을 구현하였다.

랜드마크 이미지 AI 학습용 데이터 구축을 위한 메타데이터 표준 설계 방안 연구 (A Study on Designing Metadata Standard for Building AI Training Dataset of Landmark Images)

  • 김진묵
    • 한국문헌정보학회지
    • /
    • 제54권2호
    • /
    • pp.419-434
    • /
    • 2020
  • 본 연구의 목적은 랜드마크 이미지의 AI 학습용 데이터 구축을 위한 메타데이터 표준 설계 방안을 제시하기 위함이다. 이를 위해, 이미지 검색시스템의 종류와 각각의 색인 방식에 관한 최신 기술 현황을 포괄적으로 조사하여 분석하고, AI 머신러닝을 적용한 랜드마크 인식에 필수적인 학습용 공개 데이터셋과 이미지 객체 인식에 관한 기계학습 도구를 조사하였다. 이를 통해, 랜드마크 이미지 AI 학습용 데이터에 최적화된 메타데이터 요소를 선정하고 각각의 요소에 대한 입력 데이터를 정의하였다. 결론 및 제언에서는 랜드마크 인식을 활용한 추천시스템을 포함한 응용서비스 개발 방안을 논의하였다.

딥러닝 기반 포즈인식을 이용한 체력측정 시스템 (Fitness Measurement system using deep learning-based pose recognition)

  • 김형균;홍호표;김용호
    • 디지털융복합연구
    • /
    • 제18권12호
    • /
    • pp.97-103
    • /
    • 2020
  • 제안한 시스템은 AI 체력측정 파트와 AI 체력관리 파트 2가지 부분이 연계성을 가지고 구성되어 있다. AI 체력측정 파트에서 딥러닝 기반의 포즈인식을 통해 체력측정에 대한 가이드와 측정값의 정확한 연산을 수행한다. 이 측정값을 기반으로 AI 체력관리 파트에서는 개인 맞춤형 운동프로그램을 설계해 전용 스마트 어플리케이션에 제공한다. 측정자세 가이드를 위해 웹캠을 통해 측정대상자의 자세를 촬영해 골격선을 추출한다. 다음으로 학습된 준비자세의 골격선과 추출된 골격선을 비교해 정상 유무를 판단하고, 정상자세 유지를 위한 음성안내를 실시한다.