• 제목/요약/키워드: speech analysis

검색결과 1,587건 처리시간 0.026초

COMPOSITION OF A UNIFIED MODEL ACCORDING TO THE STRUCTURE OF QUALIFICATION TYPES OF LIFELONG EDUCATION PROFESSIONALS FOR THE DISABLED: A BASIC STUDY ON THE ESTABLISHMENT OF A CONVERGENCE MAJOR IN DAEGU UNIVERSITY

  • Kim, Young-Jun;Kim, Wha-Soo;Rhee, Kun-Yong
    • International Journal of Advanced Culture Technology
    • /
    • 제9권4호
    • /
    • pp.40-51
    • /
    • 2021
  • This study was conducted with the aim of constructing a unified model according to the structure of qualification types of lifelong education professionals for the disabled. The research method consisted of procedures in which literature analysis and expert meetings were constructed in connection with each other. The contents of the study were suggested from the classification of qualification types into professional teacher type and coordinator type by focusing on special education and rehabilitation, which are related convergence fields that affect the qualification training of lifelong education professionals for the disabled. The two convergence fields, such as special education and rehabilitation welfare, lead to a separate application base from the perspective of education and welfare for the qualification of lifelong education professionals for the disabled, and finally confusion and conflict in the nature and contents of the curriculum and related services. A dichotomy structure system in which this phenomenon results in a divided type of qualification training for lifelong education professionals with disabilities was composed of several samples. In this regard, the curriculum and related services that can build convergence fields related to lifelong education for the disabled were reflected in the context of priority through the criteria that should be emphasized from the standpoint of the disabled in the overall category of establishing lifelong education support system for the disabled. In addition, by forming four qualification criteria centering on this, the common convergence field was composed of special education, thereby enhancing the aspect of inclusion in the rehabilitation welfare field and specific convergence into lifelong education for the disabled. As a result, the two qualification types were unified.

Human Rights in The Context of Digitalization. International-Legal Analysis

  • Panova, Liydmyla;Gramatskyy, Ernest;Kryvosheyina, Inha;Makoda, Volodymyr
    • International Journal of Computer Science & Network Security
    • /
    • 제22권5호
    • /
    • pp.320-326
    • /
    • 2022
  • The use of the Internet has become commonplace for billions of people on the planet. The rapid development of technology, in particular, mobile gadgets, has provided access to communication anywhere, anytime. At the same time, there are growing concerns about the behavior of people on the Internet, in particular, towards each other and social groups in general. This raises the issue of human rights in today's information society. In this study, we focused on human rights such as the right to privacy, confidentiality, freedom of expression, the right to be forgotten, etc. We point to some differences in this regard, in particular between the EU, etc. In addition, we describe the latest legal regulation in this aspect in European countries. Such methods as systemic, factual, formal and legal, to show the factors of formation and development of human rights in the context of digitalization were used. The authors indicate which of them deserve the most attention due to their prevalence and relevance. Thus, we concluded that the technological development of social communications has laid the groundwork for a legal settlement of privacy and opinion issues on the Internet. Simultaneously, jurisdictions address issues on every aspect of human rights on the Internet, based on previous norms, case law, and principles of law. It is concluded that human rights legislation on the Internet will continue to be actively developed to ensure a balance of private and public interests, safe online access and unimpeded access to it.

PATTERNS OF ASSIMILATION OF IGBO VOWELS : AN ACOUSTIC ACCOUNT

  • Clara I. Ikekeonwu
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 1996년도 10월 학술대회지
    • /
    • pp.514-514
    • /
    • 1996
  • Igbo, a new Benue Congo language has a vowel harmony system which, like that of Akan, is based on the pharynx size or tongue root position. In this study we examine Igbo vowel harmony with particular reference to assimilatory patterns of vowels in different harmony sets. This is to gain some insight into the factors involved in Igbo vowel assimilation, and to establish to what extent reports on Akan vowel assimilation are validated in Igbo. Tokens of the eight phonemic vowels of Standard Igbo are recorded from three native speakers of Igbo. The vowels are acoustically investigated (using the LPC analysis of CSL) in individual lexical items and within carefully designed carrier phrases. The F1 and F2 values of the vowels are obtained as these formant values are generally useful in establishing the salient characteristics of vowels. Vowels from the harmony sets are juxtaposed in the carrier phrases to ascertain the extent of assimilation. Results of the investigation show that the F1 values, to a large extend, are enough to characterize these vowels. The (-Expanded) vowels have higher F1 values than their (+Expanded) counterpart. Where there is an overlap in F1 values for some vowels the F1 bandwidth values serve to distinguish between the vowels. The overlap often reported in Akan for /I/ and /e/ on the one hand and /${\mho}$/ and /o/ on the other is not validated in Igbo. While the F1 values for these pairs of vowels are quite similar for one of our speakers, there is an appreciable difference between the F1 values of these vowels for the other two speakers. There is however an overlap for /e/ and /o/ for one of the speakers. Assimilations are generally regressive across word boundaries. It is, however, necessary to point out that the general perceptual impression that one of the vowels completely assimilates to the other, is not borne out by our investigation. Most of our F1 and F2 values for the vowels in individual lexical items are altered in assimilations. This then suggests that assimilation involving these vowels is partial rather than complete. The emerging 'allophones' are acoustically similar to the (+Expanded) vowel involved in the assimilation, that is when vowels from different harmony sets are involved. We conclude that while assimilation of Igbo vowels involves some phonological considerations, phonetic factors appear to be permanent in deciding the final form of the vowels.

  • PDF

Post-COVID-19 시대 마비말장애 재활을 위한 디지털 치료제 기반의 커뮤니티케어 방안 (A Study on the Digital Therapeutics Based Community Care for Rehabilitation in Dysarthria in the Post-COVID-19 Era)

  • 이상도
    • 한국융합학회논문지
    • /
    • 제13권1호
    • /
    • pp.313-323
    • /
    • 2022
  • 본 연구에서는 COVID-19시대에 비대면 서비스가 확대되고 있는 상황에서 마비말장애의 재활을 위한 디지털 치료제 기반의 커뮤니티케어 방안을 모색하고자 하였다. 이를 위하여 병원, 언어치료기관, 사회복지기관에서 근무하는 전문가들을 대상으로 질적연구를 수행하였고, 연구 결과 3개의 주제와 9개의 하위주제, 18개의 의미단위가 도출되었다. 분석결과에 근거한 디지털 치료제 기반의 커뮤니티케어 모델은 원격진단, 원격치료, 재활훈련 프로그램 제공, 동료지원가들의 지지, 임상적 지원, 의사소통 지원, 심리사회적 중재, 케어플랜 서비스 등 9가지 유형으로구성되었다. 본 연구는 디지털 치료제를 활용한 보건-복지 연계서비스를 위한 기초자료와 다학제간 협력에 기반한 공유케어 계획 수립의 가이드라인을 제공할 수 있을 것이다.

초등학생의 수학 청해력 실태 조사 연구 (South Korean Elementary Students' Mathematical Listening Ability)

  • 김리나
    • 한국수학교육학회지시리즈E:수학교육논문집
    • /
    • 제37권2호
    • /
    • pp.183-197
    • /
    • 2023
  • 수학 청해력이란 수학적 원리와 개념이 내포된 음성 언어를 듣고 그 의미를 파악하는 능력을 지칭한다. 수학 청해력은 타 교과 수업, 일상생활 속 듣기와 구분된다. 본 연구에서는 수학 청해력 측정 도구를 활용하여 초등학교 학생 834명의 수학 청해력 실태를 조사하였다. 설문조사의 통계 분석 결과를 통해 학생들의 수학 청해력은 성별, 학년, 학교의 위치와 통계적으로 유의미한 상관관계가 있음을 확인하였다. 여학생의 수학 청해력이 남학생보다 높으며, 수학 청해력은 학년에 따라 증가하다가 6학년에서 다시 감소하는 것을 알 수 있었다. 또한 학교의 위치에 따라 학생들의 수학 청해력이 유의미한 차이를 보였다. 본 연구의 결과는 수학 청해력 관련 후속 연구, 교수·학습 자료 개발의 토대로 활용될 수 있다.

Research on Developing a Conversational AI Callbot Solution for Medical Counselling

  • Won Ro LEE;Jeong Hyon CHOI;Min Soo KANG
    • 한국인공지능학회지
    • /
    • 제11권4호
    • /
    • pp.9-13
    • /
    • 2023
  • In this study, we explored the potential of integrating interactive AI callbot technology into the medical consultation domain as part of a broader service development initiative. Aimed at enhancing patient satisfaction, the AI callbot was designed to efficiently address queries from hospitals' primary users, especially the elderly and those using phone services. By incorporating an AI-driven callbot into the hospital's customer service center, routine tasks such as appointment modifications and cancellations were efficiently managed by the AI Callbot Agent. On the other hand, tasks requiring more detailed attention or specialization were addressed by Human Agents, ensuring a balanced and collaborative approach. The deep learning model for voice recognition for this study was based on the Transformer model and fine-tuned to fit the medical field using a pre-trained model. Existing recording files were converted into learning data to perform SSL(self-supervised learning) Model was implemented. The ANN (Artificial neural network) neural network model was used to analyze voice signals and interpret them as text, and after actual application, the intent was enriched through reinforcement learning to continuously improve accuracy. In the case of TTS(Text To Speech), the Transformer model was applied to Text Analysis, Acoustic model, and Vocoder, and Google's Natural Language API was applied to recognize intent. As the research progresses, there are challenges to solve, such as interconnection issues between various EMR providers, problems with doctor's time slots, problems with two or more hospital appointments, and problems with patient use. However, there are specialized problems that are easy to make reservations. Implementation of the callbot service in hospitals appears to be applicable immediately.

영상 콘텐츠의 오디오 분석을 통한 메타데이터 자동 생성 방법 (Method of Automatically Generating Metadata through Audio Analysis of Video Content)

  • 용성중;박효경;유연휘;문일영
    • 한국항행학회논문지
    • /
    • 제25권6호
    • /
    • pp.557-561
    • /
    • 2021
  • 영상 콘텐츠를 사용자에게 추천하기 위해서는 메타데이터가 필수적인 요소로 자리 잡고 있다. 하지만 이러한 메타데이터는 영상 콘텐츠 제공자에 의해 수동적으로 생성되고 있다. 본 논문에서는 기존 수동으로 직접 메타데이터를 입력하는 방식에서 자동으로 메타데이터를 생성하는 방법을 연구하였다. 기존 연구에서 감정 태그를 추출하는 방법에 추가로 영화 오디오를 통한 장르와 제작국가에 대한 메타데이터 자동 생성 방법에 대해 연구를 진행하였다. 전이학습 모델인 ResNet34 인공 신경망 모델을 이용하여 오디오의 스펙트로그램으로부터 장르를 추출하고, 영화 속 화자의 음성을 음성인식을 통해 언어를 감지하였다. 이를 통해 메타데이터를 생성 인공지능을 통해 자동 생성 가능성을 확인할 수 있었다.

딥러닝 기반 사용자 친화형 키오스크 시스템 (An User-Friendly Kiosk System Based on Deep Learning)

  • 강수연;이유진;정현아;조승아;이형규
    • 한국산업정보학회논문지
    • /
    • 제29권1호
    • /
    • pp.1-13
    • /
    • 2024
  • 본 연구는 키오스크 사용 증가로 인한 변화에 대응하기 위해 사용자 특성을 고려한 맞춤형 동적 키오스크 화면을 제공하는 것을 목표로 한다. 디지털 취약계층인 시각장애인, 노인, 어린이, 휠체어 사용자 등의 특성에 따른 화면 구성의 최적화를 위해 객체 탐지, 걸음걸이 인식, 음성발화 인식기술을 종합하여 사용자의 특성(휠체어 사용 여부, 시각 장애, 연령 등)을 실시간으로 분석하고, 이를 기반으로 9개의 카테고리로 사용자를 분류한다. 키오스크 화면은 사용자의 특성에 따라 동적으로 조정되어 효율적인 서비스 제공이 가능하다. 본 연구는 임베디드 환경에서 시스템 통신 및 운용이 이루어졌으며, 사용된 객체 탐지, 걸음걸이 인식, 음성발화 인식 기술은 각각 74%, 98.9%, 96%의 정확도를 보여준다. 제안된 기술은 프로토타입을 구현하여 그 효용성을 검증하였으며, 이를 통해 본 연구가 디지털 격차의 축소와 사용자 친화적인 "배리어 프리 키오스크" 서비스 제공의 가능성을 보였다.

대통령기록의 구조와 특징에 관한 연구 e지원시스템 생산기록(기록관리비서관실)을 중심으로 (A Study on the Structure and Characteristics of Presidential Records)

  • 양인호
    • 기록학연구
    • /
    • 제79호
    • /
    • pp.231-270
    • /
    • 2024
  • 본 연구는 대통령기록의 특성 및 생산맥락에 기반한 기록서비스를 제안하는 것을 목적으로 한다. 이를 위해 먼저 e지원시스템의 설계 방향 및 특징을 살핀 후 e지원시스템에서 생산된 기록의 구조와 특징을 분석하였다. 분석 대상 기록 유형은 e지원문서카드, e지원메모, e지원일정, e지원일지, e지원지시카드, 개별업무시스템_말씀록DB 등 6종이다. 다음으로 대통령기록포털의 기록서비스 분석을 통해 현재의 기록 서비스는 기록의 생산맥락 및 특징을 온전히 드러내지 못함을 지적하였다. 이에 대통령기록의 특성과 맥락에 기반한 서비스 전략으로 각 기록건의 카드(e지원문서카드 등)를 중심으로 한 서비스, 기록의 구조적 이해와 기록의 연계에 주목한 서비스를 제언하였다.

과학수업에서 나타나는 학생들의 행동적 참여 분석을 위한 영상 분석 도구의 개발 (Developing an Instrument for Analysing Students' Behavioral Engagement in School Science Classroom)

  • 최준영;나지연;송진웅
    • 한국과학교육학회지
    • /
    • 제35권2호
    • /
    • pp.247-258
    • /
    • 2015
  • 학생은 대화뿐만 아니라 비언어적인 행동을 통해서도 수업에 참여한다. 특히 과학교실에서는 다른 교과수업과 다르게 과학기구의 사용, 관찰, 측정 등의 비언어적인 행동들이 나타난다. 그런데 학생의 행동적 참여를 분석하는 기존의 도구들은 과학교과에서 나타나는 이러한 특징적인 활동을 반영하지 못하고 있다. 본 연구는 과학교과의 학습 활동을 고려한 행동적 참여 영상 분석 도구를 개발하였다. 분석 도구를 개발하기 위하여, 첫째, 문헌연구와 초등학교 과학수업 관찰을 바탕으로 수업 중에 나타나는 학생의 행동을 14가지로 범주화하였다(자유발화, 음독, 경청하기, 묵독, 쓰기, 주의 집중하기, 손들기, 이동하기, 비참여적 움직임, 과제 움직임, 관찰하기, 측정하기, 분류하기, 실험도구 다루기). 둘째, 이를 바탕으로 '과학수업 중 행동적 참여 상태 분석틀'을 개발하였다. 셋째, Microsoft Excel Visual Basic을 이용하여 분석틀에 따라 학생들의 발화 여부, 시선, 몸의 움직임 등을 기록하고 분석할 수 있는 분석 도구를 개발하였다. 개발된 도구를 이용하면 수업 중학생의 각 행동이 수행된 시간과 학생의 네 가지 수업참여 상태(즉, 참여적 발화, 참여적 침묵, 비참여적 발화, 비참여적 침묵)를 파악할 수 있다. 개발된 분석 도구를 실제 과학시간의 초등학생 두 명을 대상으로 예시적으로 적용해 본 결과, 교사는 수업활동(일반, 시범실험, 실험활동)에 따라 발화의 양을 달리하였으며, 분석대상인 두 학생은 전체 수업시간 동안 참여적 침묵 상태에 있는 시간이 가장 길었다(학생 A: 63%, 학생 B: 72%). 참여적 침묵 상태에 있는 두 학생은 '경청하기'를 하는 시간이 가장 길었는데(학생 A: 51%, 학생 B: 42%), 교사의 발화가 상대적으로 적었던 실험활동 시간에는 오히려 '경청하기'를 거의 하지 않은 대신에 '관찰하기'를 가장 많이 하였다(학생 A: 47%, 학생 B: 53%). 개발된 분석 도구가 비언어적인 행동을 통하여 과학수업에 참여하고 있는 학생의 행동을 이해하는 데 도움을 줄 수 있을 것이라 기대한다.