• 제목/요약/키워드: 단어길이

검색결과 147건 처리시간 0.023초

한국어 어휘특성들이 기억폭에 미치는 효과 (The Effects of Korean Lexical Characteristics on Memory Span)

  • 박태진;박선희;김태호
    • 인지과학
    • /
    • 제17권1호
    • /
    • pp.15-27
    • /
    • 2006
  • 한국어 단어의 글자 수, 받침의 수와 위치, 합성어 여부가 기억폭에 미치는 효과를 검증하였다. 그 결과, 전반적으로 글자가 많은 단어일수록 기억폭이 작았으며, 두 글자 단어들에서 받침이 많을수록 기억폭이 더 작았고(기억폭에 대한 받침효과), 합성어보다 단일어의 기억폭이 더 컸다. 단어당 읽기 속도를 측정한 결과, 글자가 많은 단어일수록 속도가 느렸지만, 두 글자 단어들에서 뒷받침단어의 읽기 속도가 받침없는 단어, 앞받침단어 및 양받침단어보다 더 빨랐고(읽기 속도에 대한 말미 받침효과), 합성어보다 단일어의 읽기 속도가 더 빨랐다. 기억폭과 읽기 속도간에 관찰된 이러한 관계는 단어길이효과에 대한 음운루프설명과 잘 부합되지 않으며, 기억폭이 음운정보 뿐만 아니라 시각적 캐시에 표상되는 철자 정보의 영향을 받는다는 설명을 지지해준다.

  • PDF

Keyword spotting에서의 후처리 과정에 관한 연구 (A Study on the Postprocessing In Keyword Spotting)

  • 송화전
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.249-252
    • /
    • 1994
  • Keyword spotting 이란 음성인식의 한 분야로서 컴퓨터가 사람의 음성을 입력받아 이 음성에 미리 정해진 특정단어 또는복수개의 단어들 중 어느 것이 포함되어 있는지의 여부를 찾아내고 이 단어를 식별해 내는 작업을 의미한다. 이러한 keyword spotting 시스템의 인식 오류들을 감소시키는 방법의 하나로 keyword spotting 시스템에 후처리 과정을 둠으로써 잘못 검출된 keyword 들을 제거시키는 방법이 사용될 수 있다. 본 논문에서는 keyword로 검출된 영역에 대한 keyword 모델의 likeihood와 그 여역에 대한 filler 모델의 likelihood의 ratio 와 second best keyword 의 likelihood 그리고, 끝점존재 영역의 구간 길이등 여러 가지 정보를 이용한 후처리과정을 검토하고 인식실험을 통해 이들의 성능을 비교하였다. 6개의 부서명을 keyword로 하는 불특정 화자 keyword spotting 실험을 수행한 결과 baseline 시스템의 경우 고립단어 및 문장 형태의 음성에 대해 95.0%의 keyword 인식률을 얻었으며, 본 논문에서 검토된 네 가지 후처리 방법에 의해 keyword rejection ratio를 0%에서 5%까지 변화시켜 나갈 경우 최저 95.3%에서 최고 97.1%까지 keyword 인식률이 향상된 결과를 얻었다. 특히 성능과 계산량을 종합적으로 고려할 때 끝점 존재 영역의 구간 길이 정보를 이용한 방법이 가장 우수하였다.

  • PDF

문장 길이와 단어 정렬에 기반한 한-영 문장 정렬 (Korean-English Sentence Alignment Based on Sentence Length and Word Alignment)

  • 임재수;서희철;이상주;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.302-309
    • /
    • 2001
  • 말뭉치를 통한 통계적인 자연 언어 처리에 관한 연구가 다국어 처리 분야에서도 활발히 진행되고 있는 가운데, 본 논문에서는 병렬 말뭉치 구축 및 활용의 기본이 되는 문장 정렬을 위한 효과적인 방법을 제안한다. 먼저, 기존의 문장 길이를 이용한 방법을 한-영 문장 정렬에 적용해 보고, 길이 정보만을 이용했을 때의 한계점을 지적한다. 그리고, 사전과 품사 대응 확률을 이용한 단어 정렬을 통하여, 길이 기반의 정렬 방식이 갖는 문제점을 보완할 수 있는 방법을 제시한다. 실험을 통하여 제안한 방법이 길이에 기반한 방법에 비하여 높은 성능을 나타냄을 알 수 있었다. 또한 한-영 문장 정렬에의 어휘 정보 활용에 있어서 문제가 될 수 있는 요소가 어떤 것들이 있는지 알아본다.

  • PDF

우리 문장 읽기에서 안구 운동의 특성: 어절 길이, 단어 빈도 및 착지점 관련 효과 (The characteristics of eye-movement in Korean sentence reading: cluster length, word frequency, and landing position effects)

  • 고성룡;윤낙영
    • 인지과학
    • /
    • 제18권4호
    • /
    • pp.325-350
    • /
    • 2007
  • 본 연구에서는 대학생 독자들이 48개의 평이한 문장을 읽을 때, 전반적인 안구 운동의 특성과 어절/단어 수준에서의 특성을 알아보았다 대학생 독자들은 어절을 대략 225ms 보다가 3.6자 정도 뛰어 다음 어절로 눈을 움직였다. 어절이 짧고 단어가 고빈도일 때는 어절을 건너뛰기도 하고, 앞으로만 읽어가는 것이 아니라 19% 정도 다시 되돌아가서 읽기도 했다. 물론 고정과 도약의 양상은 독자에 따라 개인차가 있었다. 이런 전반적인 양상과 더불어, 어절 수준에서 어절 길이, 단어 빈도 및 착지점 관련 효과를 살펴보았는데, 눈은 대체로 어절의 중앙에 자주 착지했으며, 가장자리에 착지했을 때가 중앙에 착지할 때보다 그 어절을 다시 더 고정했다. 또한 독자들은 단어가 고빈도인 어절을 저빈도인 어절보다 훨씬 빨리 읽었다.

  • PDF

교육산업 활성화를 위한 영어발음 연구 (A Study on the English Pronunciation for English-related Industry)

  • 박희석
    • 융합정보논문지
    • /
    • 제8권1호
    • /
    • pp.37-42
    • /
    • 2018
  • 본 연구는 다섯 개의 문장을 선정하여 그 안에 들어있는 다섯 개의 단어와 그 단어 내에 들어있는 모음들을 대상으로 하여 한국인들의 모음발음 길이를 Praat 프로그램을 이용하여 측정한 후에 원어민의 실험결과와 비교분석한 연구이다. 20명의 한국인 피 실험자들이 실험을 위해 실험문장을 읽고 녹음하였으며, 음향적 특질들은 스펙트로그램 등을 활용한 Praat Software 프로그램을 이용하여 측정하여 그 결과를 얻었다. 이러한 과정을 통해 얻어진 결과들은 통계분석 하였다. 분석결과, 단어단위에서는 3개의 단어에서 두 집단 간 차이가 있었으며, 5개의 모음들은 모두 그 차이가 유의미하였다. 또한 두 실험집단 간 단어와 모음발음크기 비율에 관한 비교에서는 모든 단어와 모음들의 발음크기 비율이 두 집단 간 유의미한 차이를 보여주었다. 이러한 실험결과를 통해 영어전설저모음인 /${\ae}$/와 영어이중모음/ai/, 그리고 첫 번째 음절에 영어강세모음이 오는 경우에 그 발음 길이크기를 분석해보면 한국인 피 실험자집단에서는 외국인어투가 존재함을 다시 확인할 수 있었다.

한국인과 일본인의 호주 영어 모음 연쇄 /w+V/ 조음 비교 (Australian English sequences of semivowel /w/ + Back Vowel /3:/, / :/ or / / production by Korean and Japanese learners of English)

  • 박시균
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.188-191
    • /
    • 1998
  • 호주 영어의 단어 중 한국인과 일본인이 구별하기 어려운 'work', 'walk', 'wok' 세 단어에 대해 다룬다. 우선 한국인과 일본인이 이들 세 단어를 어떻게 조음할 것인가를 예측하고, 실제로 한국인과 일본인 화자들이 조음한 자료를 가지고 모듬의 음질과 길이 두가지 측면으로 나누어 예측한 사항과 비교하고 또 이들 단어를 조음할 때 한국인과 일본인 사이에 어떤 음성 음운적 특징이 나타나는지도 비교 분석한다. 결과는 모국어의 음성, 음운적 영향이 목표어의 음소를 습득하고 발음하는데에 영향을 미친다는 사실을 보여주고 있다. 하지만 wok/wo k/의 예는 언어 보편적인 요소가 L2의 음소를 습득하는데 있어 또 하나의 요소로 작용하고 있음도 알려주고 있다.

  • PDF

길이 정보와 유사도 정보를 이용한 한영 문장 정렬 (Korean-English Sentence Alignment using Length and Similarity Information)

  • 홍진표;차정원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2010년도 제22회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.130-135
    • /
    • 2010
  • 문장 정렬은 두 개의 문서 간의 대응이 되는 문장을 찾는 작업이다. 이 방법은 통계적 기계 번역의 학습 문서인 병렬 말뭉치를 자동으로 구축하는데 필수적인 방법이다. 본 연구에서는 길이 정보에 추가적으로 유사도 정보를 반영하는 한영 문장 정렬 방법을 제안한다. 먼저 한국어로 된 문서를 기계번역 시스템에 적용하여 영어 문서로 변환한다. 그리고 번역된 영어로 된 문서 결과와 영어로 된 대상 문서 간의 정렬 작업을 수행한다. 정렬 완료된 결과와 원시 문서, 대상 문서로부터 최종적인 결과를 생성해낸다. 본 논문에서는 기계 번역을 이용하는 방법과 더불어 기존의 길이 기반 문장 정렬 프로그램에 문장 유사도 정보를 추가하여 단어 정렬의 성능 향상을 꾀하였다. 그 결과 "21세기 세종기획"의 최종 배포본 내에 포함된 한영 병렬 말뭉치에 대해 한영 문장 정렬 F-1 자질의 결과가 89.39%를 보였다. 이 수치는 기존의 길이 기반의 단어 정렬의 성능 평가 결과와 비교했을 때 약 8.5% 가량 성능이 향상되었다.

  • PDF

패턴을 이용한 상품평 감정 단어 추출 방법 (Sentiment words extraction method using pattern)

  • 천은혜;심수정;박혁로
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2010년도 제22회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.112-113
    • /
    • 2010
  • 최근 오피니언 마이닝 관련 연구 중 감정 분류에 대한 관심이 높아지면서 많은 연구가 진행되고 있다. 기존 영어권 연구에서 제시되어온 방법은 한국어 상품평에 적용하는 것이 쉽지 않다. 영어 시소러스 기반 한국어 감정단어 추출 기술은 한국어와 영어 단어가 일대일로 일치하기가 어렵다는 문제가 있다. 기존 관련 연구 중 k-Structure 기법은 패턴의 길이가 3인 단순한 문장에 속성단어와 감정단어가 포함되었을 경우를 기준으로 한 것이므로 한정적이다. 본 논문에서 제안하는 방법은 상품평에서 의미적인 패턴을 추출하여 감정 단어의 위치를 파악하는 방법이다.

  • PDF

HMM에 기반한 한국어 개체명 인식 (HMM-based Korean Named Entity Recognition)

  • 황이규;윤보현
    • 정보처리학회논문지B
    • /
    • 제10B권2호
    • /
    • pp.229-236
    • /
    • 2003
  • 개체명 인식은 질의응답 시스템이나 정보 추출 시스템에서 필수 불가결한 과정이다. 이 논문에서는 HMM 기반의 복합 명사 구성 원리를 이용한 한국어 개체명 인식 방법에 대해 설명한다. 한국어에서 많은 개체명들이 하나 이상의 단어로 구성되어 있다. 또한, 하나의 개체명을 구성하는 단어들 사이와 개체명과 개체명 주위의 단어 사이에도 문맥적 관계를 가지고 있다. 본 논문에서는 단어들을 개체명 독립 단어, 개체명 구성 단어, 개체명 인접 단어로 분류하고, 개체명 관련 단어 유형과 품사를 기반으로 HMM을 학습하였다. 본 논문에서 제안하는 개체명 인식 시스템은 가변길이의 개체명을 인식하기 위해 트라이그램 모델을 사용하였다. 트라이그램 모델을 이용한 HMM은 데이터 부족 문제를 가지고 있으며, 이를 해결하기 위해 다단계 백-오프를 이용하였다. 경제 분야 신문기사를 이용한 실험 결과 F-measure 97.6%의 결과를 얻었다.

Ontofitting: 의미 표현을 위한 벡터 조정 (Ontofitting: Specialization of Word Vectors for Semantic Representation)

  • 오진영;차정원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.537-540
    • /
    • 2018
  • 우리는 단어 임베딩에 외부지식을 내재할 수 있는 Ontofitting 방법을 제안한다. 이 방법은 retrofitting의한 방법으로 유의어, 반의어, 상위어, 하위어 정보를 단어 임베딩에 내재할 수 있다. 유의어와 반의어 정보를 내재하기 위해서 벡터의 각 유사도를 사용하였고 상하위어 정보를 내재하기 위해서 벡터의 길이 정보를 사용하였다. 유의어 사이에는 작은 각도를 가지고 반의어 사이에는 큰 각도를 가지게 된다. 하위어는 상위어보다 상대적으로 작은 길이를 가지게 된다. SimLex와 HyperLex로 실험하여 효과와 안정성을 검증하였다. 의미정보를 내재한 임베딩을 사용할 수 있다면 QA, 대화 등 응용에서 보다 좋은 성능을 보일 수 있을 것이다.

  • PDF