• 제목/요약/키워드: 단어길이

검색결과 147건 처리시간 0.027초

뇌성마비 마비말장애 성인의 파찰음 실현 양상 분석 (Acoustic analysis of Korean affricates produced by dysarthric speakers with cerebral palsy)

  • 문지현;김선희;정민화
    • 말소리와 음성과학
    • /
    • 제13권2호
    • /
    • pp.45-55
    • /
    • 2021
  • 본 연구는 경직형 경도-중등도 뇌성마비 마비말장애 성인이 산출한 한국어 파찰음의 음향학적인 특징을 분석한다. 한국어의 마찰음과 파찰음은 조음오류가 빈번하게 발생하는 자음인데, 기존 연구들은 마찰음에만 집중했다. 따라서 본 연구에서는 마비말장애 화자가 산출한 파찰음을 음향학적으로 분석하고자 한다. QoLT_SPEECH_2014 데이터베이스 내에서 파찰음 /tɕ, tɕh, ͈tɕ/이 어두 초성 및 어중 초성에 위치하는 단어를 선정하여 경도-중등도 경직형 장애 남성 화자 6명과 비장애 남성 화자 5명의 발화 데이터를 분석에 사용하였다. 한국어의 파찰음의 특성을 고려하여 파찰음의 음향학적 특징을 나타내는 매개변수를 선정하여 분석을 시행하였다: 마찰구간의 길이, 묵음 구간의 길이, 무게중심, 분산, 왜도, 첨도, 중심적률. 분석 결과는 다음과 같다: 1) 어중 초성 파찰음에서 마비말장애인이 유의하게 긴 마찰구간의 길이를 보였다, 2) 마비말장애인이 유의하게 긴 묵음 구간의 길이를 보였다, 3) 무게중심의 경우 두 집단 간의 유의한 차이가 존재하지 않았다, 4) 마비말장애인이 유의하게 큰 왜도 값을 보였다, 5) 마비말장애인이 유의하게 큰 중심적률 값을 보였다. 본 연구는 마비말장애인이 산출한 파찰음의 특성을 분석하고, 비장애인이 산출한 파찰음과의 차이를 밝혔다.

해외어학연수의 외국어 정확성 향상에 대한 효과 (The Effect of Overseas Language Training on the Development of Foreign Language Accuracy)

  • 차미양
    • 산업융합연구
    • /
    • 제18권4호
    • /
    • pp.93-99
    • /
    • 2020
  • 본 연구는 해외어학연수의 외국어 정확성 향상에 대한 효과를 조명하기 위해 한 학기 동안 해외대학에서 어학연수를 받은 27명의 한국 대학생들이 한 학기의 시간차를 두고 작성한 두 영작문 간의 차이와 오류들을 조사하고, 그러한 차이가 통계적으로 유의미한지를 검정하여 외국어 정확도 면에서의 변화를 분석하였다. 어학연수 이후에 영작문의 길이와 문장의 길이가 증가하였으나 전체 문장수는 감소하였다. 학생들은 더 많은 수의 단어를 더 복잡한 구조의 문장에서 사용하여 오류의 수도 증가하였다. 이를 볼 때, 어학연수 이후 학생들의 문장 생성능력이 향상되고 복잡한 형태의 문장들을 쓰려고 시도한 것을 알 수 있다. 본 연구의 결과는 한 학기 동안 해외어학연수를 받은 이후 대체로 학생들의 문장생성능력은 다소 증진하였지만, 문법적 요소들을 문장 속에서 정확하게 사용하는 문법적 정확성은 크게 향상하지 않은 것으로 나타났다. 이는 비록 해외 어학연수가 집중적으로 목표언어만 학습하여 언어입력을 확대할 수 있을 뿐만 아니라, 목표언어에 자연스럽게 노출될 수 있는 환경적 이점을 제공하긴 하지만, 한 학기라는 기간 안에 문법적으로 정확한 문장을 생성해내는 문법능력을 향상시키는 데는 크게 효과적이지 않았다는 것을 시사한다.

한국어 부사어의 분류와 분포 제약

  • 채희락
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2001년도 학술대회 논문집
    • /
    • pp.95-96
    • /
    • 2001
  • 문장에서 술어를 수식하는 대표적인 표현은 부사어이다. 부사어는 일반적으로 문장 구성에서 핵심적 역할을 하지 않는 첨가어(adjuncts)이기 때문에 핵심적인 역할을 하는 보충어(complements)에 비해 상대적으로 연구가 덜 이루어진 분야이다. 그렇지만 부사어는 피수식어의 의미를 구체화/한정하는 기능을 하기 때문에 정확한 의사소통을 위해서는 반드시 필요한 요소이며 어순, 호응(concord)등의 통사적 현상과도 밀접한 관련이 있다. 이 연구의 일차적 목적은 이러한 부사어를 통사적, 의미적 기준에 의해 정확하게 분류하고 그들의 분포제약을 밝히는 것이다. 그 다음으로, 부사어와 관련된 통사 현상으로, 부사어와 피수식어의 공 기(co-occurrence)관계 및 부사어와 술어 어미의 호응 관계에 대한 분석을 제공하려고 한다. 부사어는 통사적인 기준과 의미적인 기준으로 분류할 수 있다 (손남익 1995, 김경훈 1996, 임유종 1998). 통사적 기준으로는 단어나 구를 수식하는 성분부사와 문장을 수식하는 문장 부사로 나누는 방법과 위치에 대한 제약이 있느냐 없느냐에 따라 제약부사와 자유부사로 나 누는 방법이 있다. 이 두 통사론적 기준에 의해 분류되는 부사들은 서로 어떤 상관관계를 보이고 있는지 살펴 볼 것이다. 일반적으로 문장부사는 문두에 놓여야 한다는 위치적 제 약 이 있기 때문에 제약부사로 분류된다. 의미적 기준으로 부사어를 분류할 수도 있는데, 시간/ 공간 부사어, 양태/정도 부사어 등으로 나눌 수 있다. 의미적 기준에 의해 분류된 부사어는 통사적 기준에 의해 분류된 것들과는 어떤 상호 관련성을 맺고 있는지 살펴 볼 것이다. 일 반적으로 시간부사와 장소부사는 자유부사에 속하며 양태부사와 정도부사는 제약부사에 속 한다. 부사어와 피수식 요소와의 통사적 공기 관계 및 의미적 관계 그리고 그와 관련된 문 법 현상도 연구의 대상이 된다. 예를 들어, 자유로운 어순을 가진 부사들이지만 “*순이는 빨리 과연 달린다”에서 볼 수 있는 종류의 분포적 특성을 알아 볼것이다 (심재기 1982, 송 철의 1989). 또한 “길이/*길게 빛나다”와 “*길이/길게 드리워졌다”와 같은 대조에서 나타나는 통사, 의미적 기능의 상관 관계 및 제약들의 상호 작용도 살펴 볼 것이다.

  • PDF

스마트폰 애플리케이션을 위한 임베디드형 피드백 지원 검색체 (Embeded-type Search Function with Feedback for Smartphone Applications)

  • 강문중;황민태
    • 한국정보통신학회논문지
    • /
    • 제21권5호
    • /
    • pp.974-983
    • /
    • 2017
  • 본 논문에서는 안드로이드 기반의 각종 어플리케이션에 내장시켜 사용가능한 검색체에 대해 연구하였다. 이를 위해 조사와 같이 무의미하지만 자주 사용되는 단어를 빈도수에 따라 억제하는 BM25, 아이템의 길이 편차에 따른 검색 순위 문제를 해결하기 위해 아이템의 길이에 따라 중요도를 보정하는 Pivoted Length Normalization, 그리고 벡터공간 모형 상에서 쿼리 벡터를 관련 있는 것으로 판정된 아이템들의 벡터 그룹으로 끌어당겨 보정하는 Rocchio's Method를 사용해 묵시적 피드백 기능을 지원하도록 하였다. 그리고 색인 작업은 오프라인 동작을 위한 간단 색인과 온라인 동작을 위한 정밀 색인의 두 단계로 나누어 동작성을 보장하도록 하였다. 본 논문에서 연구한 피드백 지원 검색체는 쿼리 유추를 통해 사용자의 입력을 색인된 자료와 비교해 입력 내용을 예측하고 오타 등의 사용자 실수에 대해서도 대응하므로 스마트폰 어플리케이션에 손쉽게 탑재되어 검색 기능을 향상시킬 수 있을 것으로 기대한다.

대용량 전자사전 구축을 위한 국어 대사전의 통계 정보 (Statistical Information of Korean Dictionary to Construct an Enormous Electronic Dictionary)

  • 김철수;김양범
    • 한국콘텐츠학회논문지
    • /
    • 제7권6호
    • /
    • pp.60-68
    • /
    • 2007
  • 언어 정보 처리 응용 분야는 정보검색, 형태소분석, 철자검색, 음성인식, 문자 인식 등 다양하다. 이러한 정보처리 과정은 전자 사전이 필수적이다. 본 논문에서는 국어대사전에 대한 기본적인 통계 정보들을 살펴보고, 전자사전 구축에 대하여 알아보았다. 대상 정보는 고어 및 불완전음절을 포함하는 단어를 제외한 표제어들에 대하여, 대사전의 표제어수, 전자사전의 엔트리수, 사용된 전체음절수, 서로 다른 음절수, 엔트리들의 평균 길이, 품사별 분포, 전자사전을 트라이로 구축할 때 사용되는 노드 수 등 이다. 전자사전의 전체 엔트리 수는 361,980개, 사용된 음절수는 1,289,659개로 엔트리들의 평균 길이는 3.56이었으며 서로 다른 음절수는 2,463개였다. 이러한 통계 정보들은 전자사전 구축 및 한국어 정보처리에 도움이 될 것이다.

음향 데이터로부터 얻은 확장된 음소 단위를 이용한 한국어 자유발화 음성인식기의 성능 (Performance of Korean spontaneous speech recognizers based on an extended phone set derived from acoustic data)

  • 방정욱;김상훈;권오욱
    • 말소리와 음성과학
    • /
    • 제11권3호
    • /
    • pp.39-47
    • /
    • 2019
  • 본 논문에서는 대량의 음성 데이터를 이용하여 기존의 음소 세트를 확장하여 자유발화 음성인식기의 성능을 향상시키는 방법을 제안한다. 제안된 방법은 먼저 방송 데이터에서 가변 길이의 음소 세그먼트를 추출한 다음 LSTM 구조를 기반으로 고정 길이의 잠복벡터를 얻는다. 그런 다음, k-means 군집화 알고리즘을 사용하여 음향적으로 유사한 세그먼트를 군집시키고, Davies-Bouldin 지수가 가장 낮은 군집 수를 선택하여 새로운 음소 세트를 구축한다. 이후, 음성인식기의 발음사전은 가장 높은 조건부 확률을 가지는 각 단어의 발음 시퀀스를 선택함으로써 업데이트된다. 새로운 음소 세트의 음향적 특성을 분석하기 위하여, 확장된 음소 세트의 스펙트럼 패턴과 세그먼트 지속 시간을 시각화하여 비교한다. 제안된 단위는 자유발화뿐만 아니라, 낭독체 음성인식 작업에서 음소 단위 및 자소 단위보다 더 우수한 성능을 보였다.

스펙트럼사상기법을 기초로 한 잡음음성인식 (Noisy Speech Recognition Based on Spectral Mapping Techniques)

  • 이기영
    • The Journal of the Acoustical Society of Korea
    • /
    • 제14권1E호
    • /
    • pp.39-45
    • /
    • 1995
  • 본 논문에서는 화자적응방법에서의 스펙트럼사상기법을 기초로한 잡음인식방법을 제시하였다. 제시한 방법에서는 스펙트럼사상에 의하여 잡음음성의 스펙트럼왜곡을 감소시키며, 스펙트럼을 더욱 정확히 사상하기 위하여 정합창의 기울기로 하여금 여러 단어의 길이에 적응하도록 하였다. 인식실험의 결과, 잡음처리를 하지 않는 VQ와 DTW를 이용한 기존의 방법보다 놓은 인식율을 얻었으며, 0 dB 의 SNR 레벨에서도 기존방법의 인식율을 10배 이상으로 향상시키므로써 스펙트럼사상을 이용한 화자적응기법이 잡음음성의 인식성능을 향상시킬 수 있음을 확인하였다.

  • PDF

문맥종속 반음소단위에 의한 자동 음운 레이블링 시스템의 구현 및 성능평가 (Implementation of Automatic Phoneme Labelling System Using Context-dependent Demi-phone Unit and Performance Evaluation)

  • 박순철;김태환;김봉완;이용주
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 2호
    • /
    • pp.65-70
    • /
    • 1999
  • 음소 단위로 레이블링된 데이터베이스는 음성연구에 있어 매우 중요하다. 그러나 수작업에 의한 음소분할 및 레이블링 작업은 많은 시간과 노력이 필요하기 때문에 자동 음소분할 및 레이블링 시스템에 대한 많은 연구가 진행되고 있다. 저자들은 자동레이블링 시스템에서 레이블링 분할의 단위로monophone과 triphone의 장점을 포함하는 문맥 종속 반음소 단위 모델을 이용한 자동 음소분할 및 레이블링 시스템을 제안한바 있다[1]. 본 논문에서는 문맥종속 반음소 단위 자동음소분할 및 레이블링 시스템의 성능을 개선하기 위하여, 반음소의 단위를 개선하였다. 기존에 제안된 반음소 단위는 음소의 중점을 기준으로 left/right의 반음소 단위로 양분하였다. 본 논문에서는 음소의 길이가 120ms 이상일 경우 음소의 천이구간의 특성을 잘 나타낼 수 있도록, 음소의 앞뒤구간 각각 60ms를 전반음소와 후반음소로 나누고, 나머지 안정구간을 별도의 모델로 구성하였다. 본 논문에서 제안한 반음소 단위의 성능을 평가하기 위하여 PBW 452단어를 발성한 남자 30명분의 데이터를 이용하여 레이블링 시스템을 훈련하고, 훈련에 사용하지 않은 남자 4명분의 데이터를 이용하여 테스트 하였다. 실험결과, 기존의 반음소 단위에 비하여 10ms에서 $69.09\%$$1.65\%$, 20ms에서 $85.32\%$$1.02\%$의 성능향상을 가져왔다.

  • PDF

정보검색에서의 어의 중의성 해소를 위한 자동 키워드망의 이용 (Resolving the Ambigities in World Sense by using Automatic Keyword Network in Information Retrieval)

  • 김정세;장덕성
    • 한국정보처리학회논문지
    • /
    • 제7권12호
    • /
    • pp.3855-3865
    • /
    • 2000
  • 문서 검색 시스템에서 자동 색인은 필수적이다. 그러나 자동 색인만으로 최적합 문서들을 상위에 위치시키기 불가능하다. 뿐만 아니라 동음이의어를 갖는 부적합한 문서들이 상위에 위치되는 것을 막을 길이 없다. 본 논문에서는 이런 문제를 해소하고 검색 효과를 높이기 위해 2차 검색에 자동 키워드망을 이용하는 두 단계 검색시스템을 연구하였다. 1차 검색은 자동색인으로 만들어진 역색인 파일을 이용하며, 2차 검색은 단어 연관성을 기초로 만든 자동 키워드망을 이용한다. 2차 검색을 위한 문서 순위 재조정 식들을 여러 개 만들어 비교하였으며, 이 식들이 동음이의어 어의 중의성 해소에 얼마나 효과가 있는지 성능을 평가하였다.

  • PDF

자소 클래스 인식에 의한 off-line 필기체 한글 문자 분할 (Consonant-Vowel Classification Based Segmentation Technique for Handwritten Off-Line Hangul)

  • 황순자;김문현
    • 한국정보처리학회논문지
    • /
    • 제3권4호
    • /
    • pp.1002-1013
    • /
    • 1996
  • 문자 분할은 필기체 문서 서식의 자동 인식 과정에서 중요한 부분이다. 본 연구는 off-line 필기체 한글로부터 문자를 분할하기 위한 방법을 제안한다. 제안한 방법은 한글의 구조적 특성에 기반을 두고 있다. 먼저 투영에 의하여 입력 단어로 부터 분할 을 위한 특징과 연결 화소, 획을 추출한다. 두 번째 단계에서 획의 모양과 위치, 획과 획과의 관계를 이용하여 한글의 기본 자소 클래스 영역을 찾는다. 세 번째 단계는 분할 과정으로 WRC(While Run Column)다음에 초성이나 수평 모음이 오는 경우 이 WRC에서 수직으로 분할하며, 분할된 세그먼트의 길이가 임계값 이상아면 자소 클래 스와 문자의 칼럼에 대한 특징을 이용하여 예상 분할 영역을 찾고, 이 영역에 있는 획을 따라 요철 형태로 분할한다.

  • PDF