• 제목/요약/키워드: 음절

검색결과 571건 처리시간 0.019초

은닉 마르코프 모델을 이용한 음차표기된 외래어의 자동인식 및 추출 기법 (Automatic Detection and Extraction of Transliterated Foreign Words Using Hidden Markov Model)

  • 오종훈;최기선
    • 인지과학
    • /
    • 제12권3호
    • /
    • pp.19-28
    • /
    • 2001
  • 본 논문에서는 한국어문서에서 음차표기된 외래어를 자동적으로 인식 및 추출하는 알고리즘을 제안한다. 제안된 방법에서는 음차표기된 외래어 인식 및 추출 문제를 음절태깅문제로 변환한다. 음절태깅문제는 주어진 단어 내의 음절들에 대하여 순수 한국어를 구성하는 음절인지 또는 음차표기된 외래어를 구성하는 음절인지를 태깅하는 작업으로 정의된다. 이를 위하여. 주어진 어절 내의 음절의 나열을 순수 한국어 음절을 표현하는 상태와 외래어 음절을 표현하는 상태의 이진 상태(binary state)로 모델링한 은닉 마르코프 모델을 이용한다. 제안된 방법은 기존 연구에 비하여 높은 재현율과 정확률로 음차표기된 외래어를 인식 및 추출하였다.

  • PDF

영어 단음절 차용어의 음절수 예측을 위한 알고리즘 (An Algorithm on Predicting Syllable Numbers of English Monosyllabic Loanwords in Korean)

  • 초미희
    • 한국콘텐츠학회논문지
    • /
    • 제5권2호
    • /
    • pp.251-256
    • /
    • 2005
  • 영어 단음절 차용어가 한국어에 적응될 때 여분의 음절이 더해져서 음절수가 증가하는 경향이 있다. 본 논문에서는 음절수를 증가시키는 구체적인 조건을 밝힐 뿐만 아니라, 음절수를 예측하는 알고리즘을 제안하는 것을 목적으로 한다. 음절수를 증가시키는 요인은 3가지가 있는데, 우선 단어에 이중 모음이나 자음 군이 있으면 음절수가 증가한다. 세 번째 요인으로는, 단어에서 마지막 자음의 특성에 따라서 어말 모음이 삽입될 수 있다. 이 세 가지 요인에 근거하여 단음절 차용어의 음절수 예측 알고리즘을 3가지 규칙으로 제시하고 그 구체적인 적용과정을 데이터를 통해서 보여주고 있다.

  • PDF

한국어 리듬의 음성학적 연구

  • 이현복
    • 대한음성학회지:말소리
    • /
    • 제4호
    • /
    • pp.31-48
    • /
    • 1982
  • 음악에서 뿐 아니라, 언어에도 리듬이 있고 그 유형은 말에 따라 달라짐을 알 수 있다. 심지어는 한 언어의 방언간에도 리듬에 차이가 나다. 가령 표준말과 경상도 말은 낱낱의 소리에서 뿐 아니라, 리듬에서도 큰 차이를 들어낸다. 이 글에서 필자는 표준말의 리듬 구조를 분석 기술한다. 한국어 표준말씨의 리듬은 '을 단위로 하여 구성된다. 하나의 말토막은 하나의 강세음절과 전후에 하나 또는 그 이상의 약음절로 이루어지는데, 강세 음절은 강하고 길게 발음되고 약음절은 말토막의 끝에 오는 음절을 제외하고는 짧고 약하게 난다. 강세 음절을 리듬 단위의 핵이라 하고 핵의 앞에 오는 약음절을 머리, 핵의 뒤에 오는 약음절을 꼬리라고 이름하면, 한국어 리듬의 구조는 다음과 같은 공식으로 나타낼 수 있다. 말토막 $\rightarrow$ (머리+)핵(+꼬리) 또한 한국어의 리듬은 일부에서 말하듯이 음절(시간)중심이 아니고, 강세(시간)중심의 리듬 구조를 지니고 있음을 위의 공식은 설명하고 있다.

  • PDF

한글 단어 재인에서 음절 전위 효과의 재검토: 표기 처리와 형태소 처리의 영향 분석 (Revisiting the Effect of Syllable Transposition in Korean Word Recognition: Disentangling Orthographic and Morphological Influences)

  • 배성봉;이창환
    • 인지과학
    • /
    • 제35권3호
    • /
    • pp.161-185
    • /
    • 2024
  • 문자 전위 효과는 단어 내 문자의 위치 부호화가 고정적인지 아니면 유동적인지를 규명하는 데 중요한 역할을 한다. 한국어 단어 재인에서 음절은 핵심적인 단위이지만, 음절 전위 효과에 대한 기존 연구들은 일관된 결과를 보이지 않는다. 이는 한글 단어 재인에서 음절 전위 효과의 메커니즘이 아직 충분히 이해되지 않았음을 나타낸다. 본 연구는 한글 표기 음절이 표기 단위이면서 동시에 형태소 단위로 기능한다는 점에 주목하여, 표기 처리와 형태소 처리의 영향을 분리하여 음절 전위 효과를 재검토하였다. 이를 위해 한글 표기 2음절 단어를 사용한 차폐 점화 어휘 판단 과제를 이용한 두 개의 실험을 진행했다. 실험 1에서는 고유어, 한자어, 외래어를 대상으로 음절 전위 효과를 검토해 어종의 영향을 측정했고, 실험 2에서는 단일어와 합성어를 활용해 형태소/의미적 처리가 음절 전위 효과에 미치는 영향을 직접적으로 비교했다. 실험 1과 2의 결과는 모두 2음절 단어에서 유의미한 음절 전위 효과를 분명하게 보여주었으며, 단어의 어종이나 합성성 여부에 관계없이 이 효과는 일관되게 관찰되었다. 이는 형태소/의미적 요인보다는 표기 처리가 한국어 단어 재인에서 음절 전위 효과를 주도한다는 것을 시사한다. 결과적으로, 본 연구는 한글 단어 재인의 초기 단계에서 음절 위치의 부호화가 유동적임을 보여주는 동시에, 음절 전위 효과가 의미 처리가 아니라 지각적인 표기 기반 처리에 의해 발생한다는 것을 의미한다.

한국어 음가의 표기 복원을 위한 표기 후보 생성 및 감소에 관한 연구 (A Study On Generation and Reduction of the Notation Candidate for the Notation Restoration of Korean Phonetic Value)

  • 이상범;박성현
    • 정보처리학회논문지B
    • /
    • 제11B권1호
    • /
    • pp.99-106
    • /
    • 2004
  • 음절 복원은 음성 인식 장치에서 인식된 음가열을 발성 이전의 표기 형태로 복원하는 과정이다. 본 논문에서는 음절 복원 과정을 위하여 표준 발음법을 기반으로 음절 복원 규칙을 작성하였다. 음절 복원 규칙을 이용하여 표기 후보 집합의 생성 방법을 연구하였다. 또한 생성된 표기후보의 수를 감소시키기 위하여, 비 표기 음절을 포함한 표기 후보 감소, 비 어휘 음절을 포함한 표기 후보 감소, 비어간 음절을 포함한 표기 후보 감소의 3단계 감소 과정을 제안하였다. 제안된 방법을 통하여 실험한 결과 평균 74%의 표기 후보 감소율을 나타내었다.

운율 정보를 이용한 한국어 위치 정보 데이터의 발음 모델링 (Pronunciation Variation Modeling for Korean Point-of-Interest Data Usins Prosodic Information)

  • 김선희;박전규;전재훈;나민수;정민화
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2006년도 제18회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.51-56
    • /
    • 2006
  • 일반적으로 운율 정보를 음성인식에 이용한 연구들에 있어서는 대부분 운율의 음향적 정보를 이용하는데 반하여, 본 연구에서는 운율어나 음절수와 같은 운율의 구조적 정보가 인식률 향상에 기여함을 보인다. 본 논문은 두 가지 운율 정보, 즉 운율어와 음절수를 이용하여 발음모델링을 할 경우에 음성인식기의 성능을 평가하는 것을 목표로 하는 것으로, 먼저, 운율어를 이용하여 위치 정보데이터의 가능한 모든 발음을 생성하고, 다시 음절 수를 기준으로 발음변이 수를 조절하는 방법을 제시한 다음, 제안한 방법에 의하여 생성한 발음사전을 이용하여 음성인식의 성능을 평가하였다. 실험결과 운율어를 이용하여 발음 사전을 제작한 모든 경우에 베이스라인과 비교하여 성능이 향상됨을 보였는데, 베이스라인의 WER 4.63% 에서 최대 8.4%의 WER 가 감소하였다. 위치 정보 데이터의 음절수에 따라서 발음 변이의 수를 조절한 결과도 전체적으로는 3 음절로 그 수를 제한한 경우, 6 음절이상 단어에서는 4음절로 제한한 경우에 가장 좋은 인식 성능을 얻을 수 있어서, 음절수에 따른 발음변이 수의 조절이 효과적임을 알 수 있었다.

  • PDF

초등학교 6학년 국어교과서의 어휘 통계조사 (Statistical Survey of Vocabulary in Korean Textbook for Elementary School 6th-Grade)

  • 김종영;김철수
    • 한국콘텐츠학회논문지
    • /
    • 제12권5호
    • /
    • pp.515-524
    • /
    • 2012
  • 본 연구는 초등학교 6학년 국어교과서 4종(6-1 읽기, 6-1 말하기 듣기 쓰기, 6-2 읽기, 6-2 말하기 듣기 쓰기)에 나타나는 어휘들에 대한 통계(전체 음절수, 음절종류, 음절 출현빈도, 어절 개수, 어절 종류, 어절 평균길이, 어절 출현빈도, 품사 등)를 조사하였다. 한글 음절수는 194,683개, 음절종류는 1,290개, 평균 음절 출현빈도는 150.9회이다. 어절 개수는 70,185개, 어절 종류는 22,647개, 어절 평균 출현빈도는 3.1회이다. 평균 음절 길이는 2.8음절이며, 가장 긴 어절은 10음절이다. 품사는 읽기 교과는 명사가 말하기 듣기 쓰기교과는 동사가 약간 많다.

한국어 성조 이벤트와 음향적 길이 (Correlation between tonal events and their acoustic duration)

  • 이숙향
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.383-386
    • /
    • 1998
  • 한국어의 운율구조는 발화문장(utterance), 억양구(intonational phrase), 악센트구(accentual phrase), 음운적 어절(phonological word), 음절(syllable) 순의 계층적 구조를 가지고 있다. 본 연구에서는 운율구조의 각 층에서 성조 이벤트가 얹혀지는 음절이나 또는 각 층의 운율단위말의 음절의 음향적 길이를 측정함으로써 첫째, 운율단위말의 음절의 음향적 길이 또한 계층적 순위를 보이는지 둘째, 성조 이벤트(tonal event)와 음향적 길이 사이에 높은 상관관계를 보이는지 보고자 한다. 즉, 두 가지 측면에서 길이비교가 수행되었는데 하나는 언어 보편적 현상으로 알려진 구말 장음화 현상으로써 각 층 운율적 단위의 마지막 음절의 모음 길이 비교이며 다른 하나는 억양구초 고성조가 실현되는 음절의 모음과 어절 내 모음, 그리고 고성조가 실현되는 억양구말 음절의 모음간의 길이 비교이다. 남녀 각각 200문장의 각 분절음과 운율분석을 한 후 길이에 대한 일원분산분석 실시 결과 억양구말은 악센트구말 보다 길었으나 악센트구말은 어절말과 차이를 보이지 않거나 남자 화자의 경우 오히려 짧게 나타났다. 그리고 남자화자의 경우 악센트구초 고성자가 얹혀지는 음절의 길이는 어절 내 어절말 음절을 제외한 그 외 음절과 화자에 따라 큰 차이를 보이지 않거나 그보다 조금 짧게 실현되는 것으로 나타났다. 위의 결과는 첫째, 단위말 음절 모음의 장음화는 운율적 구조의 층위에 일대일 대응을 보이지 않는 것으로 해석되며 둘째, 성조 이벤트와 그것이 실현되는 분절음의 음향적 길이와는 큰 상관관계를 보이지 않는 것으로 해석될 수 있겠다. 그러나 이러한 일반화에 대한 충분한 근거 제공을 위해서는 해당음절의 모음 길이 뿐만 아니라 초성자음의 길이간의 비교와 음절자체의 길이 비교 또한 필요한 것이며 모음길이에 대한 선행자음의 분절음적 영향 고려가 수반되어야 할 것으로 보인다. 다음 내용을 정리해 보고자 한다.리해 보고자 한다.rc$ 구입할 때 중점적으로 살펴보는 사항은 신선도와 순수재래종 여부, 위생상태였다. 한편 소비자가 언제나 구입할 수 없다는 의견이 85.2%나 되어 원활한 공급과 시장조성이 아직 정착되지 않고 있었다. $\bigcirc$ 현재 유통되고 있는 재래종닭은 소비자 대부분이 잡종으로 인식하고 있었으며, 재래종과 일반육계와의 구별은 깃털색, 피부색, 정강이색등 외관상으로 구별하고 있었다. 체중에 대한 반응은 너무 작다는 의견이었고, 식품으로의 인식도는 비교적 고급식품으로 인식하고 있다. $\bigcirc$ 재래종닭고기의 브랜드화에 대한 견해는 젊고 소득이 높은 계층에서 브랜드화의 필요성을 강조하고 있다. $\bigcirc$ 재래종달걀의 소비형태는 대부분의 소비자가 좋아하였으나 아직 먹어보지 못한 응답자가 많았다. 재래종달걀의 맛에 대해서는 고소하고 독특하여 차별성을 느끼고 있었다. $\bigcirc$ 재래종달걀의 구입장소는 계란판매점(축협.농협), 슈퍼, 백화점, 재래닭 사육 농장등 다양하였으며 포장단위는 10개를 가장 선호하였고, 포장재료는 종이, 플라스틱, 짚의 순으로 좋아하였다. $\bigcirc$ 달걀의 가격은 200원정도를 적정하다고 하였으며, 크기는 (평균 52g)는 가장 적당하다고 인식하고 있으며, 난각색은 대부분의 응답자가 갈색을 선호하였다. $\bigcirc$ 재래종달걀의 구입시 애로사항은 믿을수 없고, 구입장소를 몰라서, 값이 싸다 등이었고, 앞으로 신뢰할 수 있고 위생적인 생산 및 유통체계가 확립될 경우 더 많이 소비하겠다는 의견이었다. $\bigcirc$ 재래닭 판매업소(식당)의 판매형태는 66.7%인 대부분의 업소가 잡종과 개량종 유색닭을 판매하고 있었으며, 1개 업소에서 1일 판

  • PDF

4~6세 일반아동 및 언어발달지연 아동의 음운인식 및 음운처리 능력이 언어 능력에 미치는 영향 (Effects of phonological awareness and phonological processing on language skills in 4- to 6-year old children with and without language delay)

  • 김신영;손진경;임동선
    • 말소리와 음성과학
    • /
    • 제12권1호
    • /
    • pp.51-63
    • /
    • 2020
  • 음운인식은 음운론 영역의 상위언어인식 능력으로, 읽기 및 어휘력 등의 언어능력을 예측하는 것으로 알려져 있다. 본 연구는 음운인식 능력과 기타 음운처리 능력, 그리고 언어능력 간의 관계를 일반아동 집단과 언어발달지연 아동 집단 간 비교를 통해 살펴보고자 하였다. 4~6세의 언어발달지연 아동(n=15)과 일반아동(n=18)을 대상으로 음운인식 능력을 평가하기 위하여 음절수세기, 음절탈락, 음절변별 과제를 실시하였다. 또한 비단어 따라말하기, 숫자 거꾸로 회상하기의 두 가지 음운처리 과제와 수용 및 표현어휘력, 문법성판단 과제와의 상관관계를 분석하고, 언어능력을 예측하는 음운인식 하위과제가 무엇인지 검토하였다. 음운인식 하위과제 중 음절수세기를 제외한 음절탈락, 음절변별 과제 수행력의 집단 간 차이가 유의하였다. 또한 일반아동 집단은 음절탈락과 숫자 거꾸로 회상하기, 음절변별과 수용어휘력 과제 수행력 간 상관관계가 유의하였으며, 언어발달지연 아동 집단은 음절수세기 과제와 숫자 거꾸로 회상하기, 수용어휘력, 표현어휘력, 문법성판단 과제의 수행력 간 상관관계가 유의하였다. 그리고 단계적 중다회귀분석 결과 일반아동 집단은 음절변별 과제가 수용어휘력 및 문법성판단 과제 수행력을 유의하게 예측하는 것으로 나타났으며, 언어발달지연 아동 집단은 음절수세기 과제가 수용어휘력, 표현어휘력, 문법성판단 과제 수행력을 유의하게 예측하는 것으로 나타났다. 언어발달지연 아동 집단은 일반아동 집단에 비해 음절수세기를 제외한 나머지 음절 수준의 음운인식 과제의 수행력이 저조하였으며, 이러한 특징이 상관관계 분석 및 회귀분석 결과에도 반영되었다. 또한 각 집단에서 음운인식 과제 수행력이 언어능력을 유의하게 예측하는 것으로 나타난 결과는 음운론 영역의 상위언어인식 능력의 중요성을 시사한다.

제주방언 억양패턴의 실험음성학적 연구 (An acoustic study on the intonation pattern of Cheju dialects in Korean)

  • 이숙향
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 2호
    • /
    • pp.369-372
    • /
    • 1999
  • 본 연구는 제주방언의 억양 패턴에 대하여 실험음성학적 분석을 하였다. 이전의 제주방언에 대한 음성 음운론적 연구는 거의 분절음 연구에 국한되었다. 억양 패턴 분석은 K-ToBI 레이블링 시스템에서 사용하는 성조기호를 사용하여 수행되었다 제주 방언의 운율구는 서울말, 전남방언과 같이 억양구와, 그 하위 층에 악센트구 두 개로 이루어져 있다. 본 연구는 크게 억양구의 경계성조 유형 연구와 악센트구의 성조 연구를 수행하였다. 억양구 경계성조로는 서울말과 같이 $L\%,\;H\%$를 기본으로 하여 $HL\%,\;LHL\%,\;HLHL\%,\;LHLHL\%,\;LH\%,\;HLH\%,\;LHLH\%,\;HLTLH\%$ 등의 유형과 그 외 제주방언만의 유형 또한 관찰되었다. 악센트구의 성조패턴 연구는 음절수와 억양구내 악센트구의 위치를 변수로 하여 살펴보았다. 제주방언의 악센트구 기본 성조는 'LH'로서 마지막 음절에서 ?'가 실현되는 패턴이다. 음절수가 많아지면 마지막 둘째음절에 아주 완만한 피치상승을 보이긴 하나 'H'로 기술하기에는 부적절하였다 유성음화의 범위는 서울방언에서와 같이 악센트구로 나타났다. 강자음이 악센트구 초에 올 때 ?'성조로 시작이 되었으며 피험자에 따라 'H'성조가 첫째음절에서만 실현되고 바로 하강하던가 또는 둘째음절까지 지속되는 것이 관찰되었다.

  • PDF