• 제목/요약/키워드: 자음정확도

검색결과 22건 처리시간 0.02초

딥러닝를 사용한 온라인 게임에서의 욕설 탐지 (Abusive Sentence Detection using Deep Learning in Online Game)

  • 박성희;김휘강;우지영
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2019년도 제60차 하계학술대회논문집 27권2호
    • /
    • pp.13-14
    • /
    • 2019
  • 욕설은 게임 내 가장 큰 불쾌 요소 중 하나이다. 지금까지 게임 사용자들의 욕설을 방지하기 위해서 금칙어를 기반으로 필터링 해왔으나, 한국어 특성상 단어를 변형하거나 중간에 숫자를 넣는 등 우회할 방법이 다양하기 때문에 효과적이지 않다. 따라서 본 논문에서는 실제 온라인 게임 'Archeage'에서 수집된 채팅 데이터를 기반으로 딥러닝 기법 중 하나인 콘볼루션 신경망을 사용하여 욕설을 탐지하는 모델을 구축하였다. 한글의 자음, 모음을 분리하여 실험하였을 때, 87%라는 정확도를 얻었다. 한 글자씩 분리한 경우, 조금 더 좋은 정확도를 얻었으나, 사전의 수가 자소를 분리한 경우보다 10배 이상 늘어난 것을 고려해보면 자소를 분리한 것이 더 효율적이다.

  • PDF

조음복잡성 및 조음중증도에 따른 마비말장애인의 자음정확도와 말명료도 (Effects of Phonetic Complexity and Articulatory Severity on Percentage of Correct Consonant and Speech Intelligibility in Adults with Dysarthria)

  • 송한내;이영미;심현섭;성지은
    • 말소리와 음성과학
    • /
    • 제5권1호
    • /
    • pp.39-46
    • /
    • 2013
  • This study examined the effects of phonetic complexity and articulatory severity on Percentage of Correct Consonant (PCC) and speech intelligibility in adults with dysarthria. Speech samples of thirty-two words from APAC (Assessment of Phonology and Articulation of Children) were collected from 38 dysarthric speakers with one of two different levels of articulatory severities (mild or mild-moderate). A PCC and speech intelligibility score was calculated by the 4 levels of phonetic complexity. Two-way mixed ANOVA analysis revealed: (1) the group with mild severity showed significantly higher PCC and speech intelligibility scores than the mild-moderate articulatory severity group, (2) PCC at the phonetic complexity level 4 was significantly lower than those at the other levels and (3) an interaction effect of articulatory severity and phonetic complexity was observed only on the PCC. Pearson correlation analysis demonstrated the degree of correlation between PCC and speech intelligibility varied depending on the level of articulatory severity and phonetic complexity. The clinical implications of the findings were discussed.

다운증후군아동과 일반아동의 구강운동기능이 자음정확도 및 말명료도에 미치는 영향 (Effects of oral-motor function on PCC and intelligibility in children with Down's syndrome and typically developing children)

  • 강은혜;심현섭
    • 말소리와 음성과학
    • /
    • 제9권2호
    • /
    • pp.125-135
    • /
    • 2017
  • The current study examines PCC (percentage of correct consonant), speech intelligibility, and oral motor function between the group of typically developing children and the group of children with Down's syndrome. To 15 children with Down's syndrome (mean CA: 9;7) and 15 typically developing children on receptive language age, the following tests were administered: K-WPPSI (2001), Picture Vocabulary Test (Kim et al., 1995), Oral and Speech Motor Control Protocol for total oral functional score (Robbins et al., 1987), DDK and Assessment of Phonology and Articulation for Children (APAC, Kim et al., 2007) for PCC and speech intelligibility. Pearson correlation coefficients were computed for the total oral functional score, PCC and DDK of each group. The statistical analysis showed that there is no significant difference in total functional score and DDK when IQ was controlled. There was a significant correlation between total oral functional score and PCC in the Down's syndrome group and a significant correlation between total oral functional score and intelligibility in the Down's syndrome group whether IQ was controlled or not. The findings suggest that both cognitive ability and overall oral motor function need to be considered for the intervention to enhance PCC or speech intelligibility of children with Down's syndrome.

일반 청자의 아동 발화 단음절에 대한 교차 지각 분석 (Cross-sectional perception studies of children's monosyllabic word by naive listeners)

  • 하승희;소정민;윤태진
    • 말소리와 음성과학
    • /
    • 제14권1호
    • /
    • pp.21-28
    • /
    • 2022
  • 자음의 정확도와 습득 시기에 관한 국내외 선행연구들은 상당히 많은 반면, 유아 혹은 아동의 발화를 대상으로 한 비전문가 혹은 일반 성인을 대상으로 한 지각 실험은 상당히 빈약한 편이다. 본 논문에서는 그러한 공백을 채우기 위해 2세에서 6세 사이의 아동들이 자신들에게 친숙하다고 판단되는 단음절 단어를 발화하게 하여, 이 단음절 단어를 자극으로 사용하여 일반 성인화자들을 대상으로 교차 지각 실험을 수행되었다. CVC 형태의 단음절 단어들은 2-6세 사이의 아동들의 발화에서 추출되었으며, 전체 20명으로 구성된 성인 화자들을 5 그룹으로 나누어, 아동 발화를 들리는 대로 받아 적게 하는 과업을 수행하였다. 분석을 위해서는 다음의 3가지 조건을 상정하여 분석하였다: (1) VC를 고려하지 않은 상태에서 초성 자음만 아동의 조음과 성인의 화자가 일치하는 조건, (2) 종성은 고려하지 않으면서 CV 형태만 조음과 지각이 일치하는 조건, 그리고 (3) CVC 형태인 단어 전체의 조음과 지각이 일치하는 조건. 분석 결과를 살펴보면, 단어 전체의 일치도가 가장 낮았으며, 초성만 고려했을 때의 일치도가 가장 높았다. 또한 일반적인 경향은 아동들의 나이가 많아짐에 따라 아동의 발화와 성인의 지각 반응 사이에 일치도가 높아졌다. 하지만 아동 자음의 습득 연령이 빠르면 2세부터 시작되어 5세 정도면 거의 완성된다고 보고한 전문가들의 진단과는 달리, 일반 성인 화자들은 아동의 발화에 대해서 적어도 5세 정도는 되어야 75% 정도의 일치도를 보이는 것으로 관찰되었다. 본 연구는 아동의 언어 발달 과정에서 관찰되는 일반 성인들의 지각에 대한 이해를 높이는 데 중요한 기여를 하였다. 즉 본 연구가 가지는 의의는 아동의 말소리 습득과 관련하여 전문가의 정확한 판단과 아동을 양육하는 부모 혹은 전문가가 아닌 일반 성인의 지각이 다를 수 있다는 것이다. 아동 발달 과정에서 5세 전의 아동들에게서 다소 알아듣기 힘든 단어나 자음이 관찰되더라도, 이는 말소리 지연이나 언어 장애와 관련된 현상은 아니라, 아동의 말소리에 익숙하지 않은 일반 성인이 가지는 지각의 한계일 수 있다는 점을 염두에 둘 필요가 있다.

한국어 규칙 합성을 위한 다이폰의 자동 추출 (An Automatic Diphone Segmentation for Korean Speech Synthesis-by-Rule)

  • 정인종;경연정;김한우;이양희
    • The Journal of the Acoustical Society of Korea
    • /
    • 제12권2E호
    • /
    • pp.63-72
    • /
    • 1993
  • 본 논문에서는 무제한 음성 생성을 위한 단위음성으로서의 다이폰을 2음절 자연음성으로부터 자동 추출하는 알고리즘을 제안한다. 입력음성을 개량 켑스트럼 파라미터로 분석하여 이로부터 다이폰 추출 파라미터들을 도출한다. 제안된 파라미터로는 에너지 레벨을 나타내는 0차 켑스트럼의 동적변화량, 스펙트럼의 시간 변화량 영교차율, 캡스트럼의 유클리디안 거리이다. 스펙트럼 포락의 변화가 완만한 모음 연쇄등의 음소 경계를 보다 효율적으로 검출하기 위해 스펙트럼의 시간 변화를 미세부분과 개형부분으로 나누어 각각을 파라미터로 사용한다. VV(모음연쇄), VCV(C: 반모음, 자음), VCCV형들로 이루어진 2음절 단어들에 대해 실험한 결과, 모음연쇄 등이 포함되어 있음에도 약 85% 정확도의 음소경계검출을 얻었다. 본 논문에 의한 다이폰을 이용한 합성음의 청취실험 결과 명료도가 높음을 확인하였다.

  • PDF

주성분 분석을 활용한 생체인식 (Biometrics through PCA & LDA)

  • 오세빈
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2017년도 춘계학술대회
    • /
    • pp.515-518
    • /
    • 2017
  • 생체인식기술을 보안에 활용하기 위해 주성분분석을 활용한다. 손의 모양과 동작의 구분을 확인하기 위해 ㄱ부터 ㅎ까지의 수화동작을 촬영한다. 총 스무 명의 성인 남성이 실험에 참여했으며, 각 자음 당 10회씩 촬영을 진행하여 1인당 140장, 총 2800장의 사진을 통해 데이터베이스를 확보하였다. 이를 통해 얻은 데이터베이스에 MATLAB을 이용하여 이미지의 차원을 줄여주는 주성분분석(PCA)과 주요인분석법(LDA)을 적용하여 분석하고, 그 정확도와 신뢰도를 확인하기 위해 동일오류율(EER)을 이용한다.

  • PDF

뇌성마비로 인한 마비말장애 성인의 최대 혀 및 입술 강도와 자음정확도 및 말명료도의 관계 (Relationship between the Maximal Tongue and Lip Strength and Percentage of Correct Consonants and Speech Intelligibility in Dysarthric Adults with Cerebral Palsy)

  • 최여진;심현섭
    • 말소리와 음성과학
    • /
    • 제5권2호
    • /
    • pp.11-22
    • /
    • 2013
  • The purpose of this study was to identify the relationship between the strength of the tongue/lip strength and speech production for dysarthric adults with cerebral palsy. The maximal tongue and lip strengths of 22 normal adults, 27 dysarthric adults (10 adults with mild dysarthria, 10 adults with moderate dysarthria, and 7 adults with severe dysarthria) were measured with Iowa Oral Performance Instrument (IOPI). The percentage of correct consonants (PCC) and speech intelligibility were calculated from the words and sentences spoken by the subjects. The results of the study are as follows: First, both the maximal tongue and the maximal lip strength differed significantly between the control group and the group with dysarthria. While the group with mild dysarthria did not show meaningful difference in maximal tongue and lip strengths from the control group, the group with moderate and severe dysarthria showed significantly weaker tongue and lip strength than the control group and the group with mild dysarthria. Second, the current study suggests the existence of a significant correlation between the maximal tongue and lip strength and the PCC and speech intelligibility within all subjects with dysarthria. These findings can serve as an effective foundation to diagnose dysarthria quickly and accurately. The results of this study also indicate that in addition to the maximal tongue strength, the maximal lip strength can prove to be an important index in predicting the speech intelligibility of dysarthric adults with cerebral palsy.

중국어를 학습하는 한국어 모국어 화자의 중국어 성조 지각과 산출 (Perception and production of Mandarin lexical tones in Korean learners of Mandarin Chinese)

  • 고성실;최지연
    • 말소리와 음성과학
    • /
    • 제12권1호
    • /
    • pp.11-17
    • /
    • 2020
  • 비성조 모국어 화자가 성조 언어를 학습할 때 모국어에 없는 성조 체계 학습에 어려움을 보인다. 본 연구는 비성조 언어인 한국어 모국어 성인 화자가 중국어를 학습할 때 중국어 성조의 지각과 산출에서 어떤 어려움을 보이는지 규명하고자 하였다. 추가적으로 중국어 분절음이 한국어와 유사하지 않을 경우 초분절음인 성조 지각 및 산출에 어려움을 가중시키는지 알아보기 위해 중국어 자음의 한국어 자음과의 유사성을 조작하여 실험을 진행하였다. 실험 결과, 지각과 산출 간 정확도 및 반응시간이 각 성조 별로 차이를 보였다. 즉, 1성과 2성에서는 지각 과제에서 산출 과제에 비해 어려움을 보인 반면 3성에서는 산출 과제에서 지각 과제보다 어려움을 보였다. 오류 패턴 분석 결과, 지각 과제에서 2성과 3성을 서로 혼동을 하는 반면 산출 과제에서는 2성을 3성으로 산출하는 오류는 줄어들고 3성을 2성으로 산출하는 오류가 증가한 것을 보였다. 마지막으로, 한국어 유사성의 조작은 성조의 지각 및 산출에 영향을 주지 않았다.

음질, 운율, 발음 특징을 이용한 마비말장애 중증도 자동 분류 (Automatic severity classification of dysarthria using voice quality, prosody, and pronunciation features)

  • 여은정;김선희;정민화
    • 말소리와 음성과학
    • /
    • 제13권2호
    • /
    • pp.57-66
    • /
    • 2021
  • 본 논문은 말 명료도 기준의 마비말장애 중증도 자동 분류 문제에 초점을 둔다. 말 명료도는 호흡, 발성, 공명, 조음, 운율 등 다양한 말 기능 특징의 영향을 받는다. 그러나 대부분의 선행연구는 한 개의 말 기능 특징만을 중증도 자동분류에 사용하였다. 본 논문에서는 음성의 장애 특성을 효과적으로 포착하기 위해 마비말장애 중증도 자동 분류에서 음질, 운율, 발음의 다양한 말 기능 특징을 반영하고자 하였다. 음질은 jitter, shimmer, HNR, voice breaks 개수, voice breaks 정도로 구성된다. 운율은 발화 속도(전체 길이, 말 길이, 말 속도, 조음 속도), 음높이(F0 평균, 표준편차, 최솟값, 최댓값, 중간값, 25 사분위값, 75 사분위값), 그리고 리듬(% V, deltas, Varcos, rPVIs, nPVIs)을 포함한다. 발음에는 음소 정확도(자음 정확도, 모음 정확도, 전체 음소 정확도)와 모음 왜곡도[VSA(vowel space area), FCR (formant centralized ratio), VAI(vowel articulatory index), F2 비율]가 있다. 본 논문에서는 다양한 특징 조합을 사용하여 중증도 자동 분류를 시행하였다. 실험 결과, 음질, 운율, 발음 특징 세 가지 말 기능 특징 모두를 분류에 사용했을 때 F1-score 80.15%로 가장 높은 성능이 나타났다. 이는 마비말장애 중증도 자동 분류에는 음질, 운율, 발음 특징이 모두 함께 고려되어야 함을 시사한다.

이집트 한국어 학습자들의 한국어 음소 학습용이성 (Egyptian learners' learnability of Korean phonemes)

  • ;이호영;황효성
    • 말소리와 음성과학
    • /
    • 제11권4호
    • /
    • pp.19-33
    • /
    • 2019
  • 이 연구는 한국어 자음과 모음 대해 단기간의 지각 훈련을 받은 이집트인 학습자들이 학습 수준별로 어떠한 지각 개선 양상을 보이는지 조사하고, 각 음소 쌍의 학습용이성 정도를 파악해 이집트인 학습자들을 대상으로 하는 한국어 발음교육에 실질적인 기여를 하는 것을 목적으로 한다. 이를 위해 50명의 한국어 학습자를 대상으로 이집트 현지에서 고변이 음성 훈련을 실시하였다. 한국어 수준에 따라 학습자를 초급 집단과 중고급 집단으로 나누었고, 2주간에 걸쳐 각 집단에 대해 30~40분의 지각 훈련을 10회 진행하였다. 고변이 음성 훈련용 자료는 다수의 한국어 원어민 화자가 발화한 자연음이었으며, 최소대립 쌍을 이루는 단어와 문장으로 최대한 다양하게 구성하였다. 사전과 사후 테스트 비교 결과, 이집트인 초급과 중고급 집단의 한국어 모음과 초성에 대한 지각 능력이 뚜렷하게 향상된 것을 확인할 수 있었다. 종성에 대한 지각 능력 역시 향상되었지만 훈련 전부터 정확도가 높아 향상폭은 다소 낮게 나타났다. 각 음소에 대한 지각 정확도와 향상도를 바탕으로 음소 쌍별 학습용이성을 측정하고, 이집트인 학습자를 위한 학습용이성 위계를 학습 단계별로 설정하였다.