• 제목/요약/키워드: 단어 빈도

검색결과 542건 처리시간 0.026초

한국인의 영어단어 재인과정:어휘접근과 단어길이효과 (English visual word recognition of Korean: lexical access and word length effect)

  • 이윤형;최원일;정유진;남기춘
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 춘계 학술대회
    • /
    • pp.279-284
    • /
    • 2000
  • 시각적으로 제시된 영어 단어 재인시에 주로 단어빈도와 단어길이가 영향을 준다고 알려져 있다. 그러나, 단어빈도와 관련된 연구는 체계적으로 이루어져 왔지만 단어길이와 관련된 연구는 체계적으로 이루어지지 않은 편이다. 또한, 단어빈도와 단이길이에 따라 단어가 성 어휘집(mental lexicon)에 어떻게 표상되어 있으며, 상호간에 어떠한 관계가 있는 것인지에 대해서는 아직 구체적으로 알려져 있지 않다. 본 연구의 목적은 첫째, 단어길이와 빈도가 시각적으로 제시된 영어단어 어휘접근에 어떠한 영향을 미치는지 알아보아 단어길이효과가 어휘접근단계에서 영향을 미치는지 알아보고자 하며 둘째, 단어길이와 빈도가 미국인과 한국인의 어휘접근시 어떤 차이를 보이는지 알아보아 한국인과 미국인의 영어단어 정보처리의 차이를 살펴보고자 하는 것이다. 단어 명명과제와 어휘판단과제를 사용한 실험결과 한국인과 미국인에게 모두 단어 길이와 빈도가 어휘접근에 영향을 주었다. 그러나, 한국인의 경우는 상대적으로 어휘판단과제에서 보다는 단어명명과제에서 어려움을 겪는다는 결과를 보여주었다. 이와 같은 결과를 볼 때 한국인이 영어단어 어휘에 접근할 때에도 미국인과 유사한 방식으로 처리를 하는 것으로 보인다. 그러나, 한국인의 경우는 미국인보다 조음과정에 상대적으로 더 어려움을 느끼는 것으로 보이며, 이것은 영어교육시 단순한 어휘암기보다 음운부호를 산출하고 단어를 말하는 능력을 향상시키는 방법을 좀 더 강조해야 한다는 것을 시사한다.

  • PDF

단어 구름과 동적 그래픽스 기법을 이용한 영어성경 텍스트 시각화 (English Bible Text Visualization Using Word Clouds and Dynamic Graphics Technology)

  • 장대흥
    • 응용통계연구
    • /
    • 제27권3호
    • /
    • pp.373-386
    • /
    • 2014
  • 단어 구름은 문자 텍스트 상의 복수개의 단어들을 대상으로 그 단어들의 출현 빈도에 비례하는 글자의 크기나 글자의 색깔로 중요도를 나타내는 텍스트 시각화 방법이다. 이 그림은 텍스트 상의 핵심단어를 재빨리 인지하고 단어들의 상대적 출현빈도수에 맞추어 배열하는 데 유용하다. 동적 그래픽스를 이용하여 텍스트 장들의 변화에 따른 핵심단어와 단어출현빈도의 패턴의 변하는 모습을 살필 수 있다. 행들이 텍스트 상의 장들이고 열들이 텍스트에 출현하는 단어들의 출현빈도수 순위들인 단어출현빈도행렬을 정의할 수 있고 이 행렬을 이용하여 단어출현빈도행렬그림을 그릴 수 있다. 동적 그래픽스를 이용하여 출현빈도수 순위의 변화에 따른 단어출현빈도행렬의 패턴의 변하는 모습을 살필 수 있다. 우리는 단어 구름과 동적 그래픽스 기법을 사용하여 영어성경 텍스트 시각화를 수행할 수 있다.

한국어 단어재인에 있어서 빈도와 길이 효과 탐색 (The exploration of the effects of word frequency and word length on Korean word recognition)

  • 이창환;이윤형;김태훈
    • 한국산학기술학회논문지
    • /
    • 제17권1호
    • /
    • pp.54-61
    • /
    • 2016
  • 단어는 언어의 기초적인 의미 단위이기 때문에 단어재인에 대한 연구는 언어 연구에서 중요하며 단어처리에 기여하는 변인이 무엇인지에 관한 연구가 이루어져 왔다. 본 연구에서는 한국어 단어재인 과정의 주요 변인 중 단어 빈도와 단어길이의 영향을 탐색하였다. 먼저 단어 빈도와 관련하여, 한국어의 특징 중 하나인 한자어로 이루어진 단어에서도 기존의 연구와 동일한 양상의 빈도 효과가 나타나는지를 탐색하였다. 이를 위해 순 한글 단어와 한자어로 이루어진 단어를 비교하였으며, 그 결과 한자어로 이루어진 단어에서는 빈도 효과가 나타나지 않았다. 한편 단어 길이 효과의 경우, 단음절로 구성된 단어의 양상을 확인해 보고자, 음절의 개수를 변화시켜 단어 길이 효과를 측정하였다. 그 결과 단음절 단어는 이음절 단어에 비해 느리게 처리되었다. 특정 유형의 단어에 대한 빈도 효과의 부재 및 단음절 단어의 느린 처리는 한국어의 특징을 반영한 결과라 할 수 있으며 추후 연구를 통해 이에 대한 좀더 자세한 탐색이 필요할 것이다.

워드임베딩을 이용한 온라인 비디오 강의의 고빈도 단어와 키워드 간의 유사도 비교 연구 (A Study on Comparative Analysis with High-Frequency Word and Keyword using Word Embedding)

  • 조재춘;임희석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.385-386
    • /
    • 2017
  • 무료 온라인 교육환경은 교육의 기회를 제공함으로써, 지속적으로 관심이 높아지고 있으며 배움에 대한 노력에 중시하고 있다. 따라서 본 연구는 배움에 대한 노력을 온라인에서 자동으로 판단할 수 있는 최소학습 판단 시스템을 제안해 왔다. 최소학습을 판단하기 위해 온라인 비디오 강의에서 고빈도 단어를 추출하여 단어게임을 통해 판단하는데, 이때 고빈도 단어가 최소학습을 판단하기 위한 키워드로 사용할 수 있는지에 대한 검증 실험이 요구되었다. 따라서 본 논문은 워드임베딩을 이용하여 고빈도 단어와 키워드간의 유사도를 비교하여 고빈도 단어에 대한 검증 실험을 실시하였다. 실험 결과, 고빈도 단어가 온라인 비디오 강의를 대표할 수 있는 키워드로 사용될 수 있는 긍정적인 결과를 보였고 최소 학습을 판단하기 위한 요소(Feature)로 충분히 사용가능함을 보였다.

명명 과제에서 음절 토큰 및 타입 빈도 효과 (The Syllable Type and Token Frequency Effect in Naming Task)

  • 권유안
    • 인지과학
    • /
    • 제25권2호
    • /
    • pp.91-107
    • /
    • 2014
  • 음절 빈도 효과란 고빈도 음절로 시작되는 단어가 저빈도 음절로 시작되는 단어에 비해 어휘 판단 속도가 느리며 어휘 판단 오류율도 증가하는 효과를 의미한다. 이 효과를 유발하는 원인은 전체 단어 수준에서 활성화된 음절 이웃 단어의 방해로 알려져 있으며 이 방해의 크기는 표적 단어가 얼마나 많은 음절 이웃 단어를 또는 얼마나 강력한 음절 이웃 단어를 가지고 있는지에 의해 결정된다. 그러나 음절 빈도의 정의가 음절 타입 빈도와 토큰 빈도로 구분됨에도 불구하고 이를 구분하지 않고 많은 연구들이 수행되어 왔다. 최근 Conrad, Carreiras, & Jacobs(2008)에 따르면 음절 토큰 빈도는 전체 단어 처리 수준을 반영하는 변인이며 음절 타입 빈도는 하위 어휘 처리 수준의 음절 처리 수준을 반영하는 변인일 수 있다고 주장하였다. 이에 본 연구는 이들의 주장이 맞다면 음절 타입 빈도는 단어 명명 속도를 촉진 시킬 것이며 반대로 음절 토큰 빈도는 명명 시간과 관련 없을 것이라고 예측하였다. 왜냐하면 표기 심도가 얕고 음절의 경계가 명확한 언어에서 명명 과제는 전체 단어수준을 덜 참고하기 때문이었다. 실험 1결과에서 음절 토큰 빈도를 통제한 상태에서 고빈도 타입음절의 단어 명명 시간은 유의미하게 짧았다. 실험 2에서 음절 타입 빈도를 통제한 상태에서 음절토큰 빈도의 증가는 명명 시간을 역시 단축시켰다. 이에 본 연구는 음절 토큰 빈도가 하위 어휘 처리와 무관하다는 Conrad, Carreiras, & Jacobs(2008)의 주장을 반박하였다.

단어 중의성 해소를 위한 SVM 분류기 최적화에 관한 연구 (A Study on Optimization of Support Vector Machine Classifier for Word Sense Disambiguation)

  • 이용구
    • 정보관리연구
    • /
    • 제42권2호
    • /
    • pp.193-210
    • /
    • 2011
  • 이 연구는 단어 중의성 해소를 위해 SVM 분류기가 최적의 성능을 가져오는 문맥창의 크기와 다양한 가중치 방법을 파악하고자 하였다. 실험집단으로 한글 신문기사를 적용하였다. 문맥창의 크기로 지역 문맥은 좌우 3단어, 한 문장, 그리고 좌우 50바이트 크기를 사용하였으며, 전역문맥으로 신문기사 전체를 대상으로 하였다. 가중치 부여 기법으로는 단순빈도인 이진 단어빈도와 단순 단어빈도를, 정규화 빈도로 단순 또는 로그를 취한 단어빈도 ${\times}$ 역문헌빈도를 사용하였다. 실험 결과 문맥창의 크기는 좌우 50 바이트가 가장 좋은 성능을 보였으며, 가중치 부여 방법은 이진 단어빈도가 가장 좋은 성능을 보였다.

협력적 필터링을 위해 연관 단어 빈도를 이용한 웹 문서 분류 (Classification of Web Documents Using Associative Word Frequency for Collaborative Filtering)

  • 하원식;정경용;정헌만;류중경;이정현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.160-162
    • /
    • 2004
  • 기존의 웹 문서 분류 시스템서는 많은 시간과 노력을 요구하며, 연관 단어가 아닌 단일 단어만으로 웹 문서들을 분류하여 단어의 중의성을 반영하지 못해 많은 오분류가 있었다. 이러한 문제점을 해결하기 위해 본 논문에서는 협력적 필터링을 위한 연관 단어 빈도를 사용한 웹 문서 분류 방법을 제안한다. 제안된 방법에서는 웹 문서 내에서 단어들을 추출하고 빈도 가중치를 계산한다. 추출된 단어를 Apriori 알고리즘에 의해 연관 규칙을 생성하고 신뢰도에 단어 빈도 가중치를 반영한다. 수정된 신뢰도를 ARHP 알고리즘에 적용하여 연관 단어들 사이의 유사정도를 계산하고 유사 클래스를 구성한다 생성된 유사 클래스들을 기반으로 웹 문서를 $\alpha$-cut을 이용하여 분류한다 성능평가를 위해 기존의 문서 분류 방법들과 비교 평가를 하였다.

  • PDF

한국어 음소결합확률 계산기 개발연구 (A Study of Development for Korean Phonotactic Probability Calculator)

  • 이찬종;이현복;최훈영
    • 한국음향학회지
    • /
    • 제28권3호
    • /
    • pp.239-244
    • /
    • 2009
  • 본 연구는 현대 한국어 단어의 말소리가 결합하는 음소결합확률 (Phonotactic Probability)을 예측하는 계산기 엔진 개발에 관한 연구이다. 한국어 음소결합확률계산기 (이하, KPPC)는 첫째로, 한국어의 주어진 단어에서의 음소와 그 음소의 음소결합의 빈도를 예측하여 말소리가 단어내의 특정위치에서 특정 분절음이 나타나는 빈도 값, 두 음소간의 결합의 빈도값, 그리고 세 음소간의 결합의 빈도 출현률을 예측하여 계산한다. 둘째로 한국어의 주어진 단어에서 말소리 하나만 다르면서 실제로 존재할 수 있는 근접밀도 (neighborhood density)의 값을 계산한다. University of Kansas에서 개발된 음소결합계산기는 영어 20,000단어의 D/B를 대상으로 위치별 분절음빈도와 두 음소간의 음소결합률 빈도를 컴퓨터가 읽을 수 있는 발음기호를 통해서만 가능하다. 본 연구에서는 분절음빈도와 두 음소간의 빈도뿐만 아니라 세 음소간의 결합률 빈도와 근접밀도율을 예측할 수 있고 입력할 때 발음기호뿐만 아니라 단어를 입력하면 확률값을 얻을 수 있다. 이 엔진은 67,284단어의 한국어 표준발음을 D/B로 구축하여 고빈도 음소결합확률, 저빈도 음소결합확률, 고빈도 근접밀도, 저빈도 근접밀도의 값을 예측할 수 있다.

작업기억 부하가 단어빈도에 미치는 효과 (The Effects of Working Memory Load on Word Frequency)

  • 이창환;오지향;편성범;임희석
    • 한국산학기술학회논문지
    • /
    • 제10권3호
    • /
    • pp.567-571
    • /
    • 2009
  • 본 연구는 단어 재인에서 작업 기억의 역할을 규명하기 위하여 진행되었다. 단어 재인에서의 작업 기억 역할 규명을 위하여 단어 빈도와 직업 기억 부담을 조절한 명명 과제 실험을 실시하였다. 실험 결과 단어 빈도는 작업 기억 부담에 영향을 받는 것으로 분석되었다. 작업 기억의 부담은 고빈도 단어 재인에서보다 저빈도 단어 재인에서 더 높은 영향을 미쳤다. 이러한 결과는 작업 기억이 저빈도 단어 재인에서 더 많은 영향을 갖음을 시사하는 것이다.

비유창성 실어증 환자의 단어빈도 및 길이, 생물성에 따른 이름대기 수행의 차이 (The Differences of Naming by Word Frequency, Length, and Animacy in Nonfluent Aphasic Patients)

  • 권정희;최현주
    • 재활복지
    • /
    • 제20권1호
    • /
    • pp.171-188
    • /
    • 2016
  • 이 연구는 비유창성 실어증 환자 집단과 정상 성인 집단을 대상으로 단어빈도, 단어길이, 생물성의 세 가지 어휘조건에 따른 이름대기 수행에 차이가 있는지 알아보는 것을 목적으로 하였다. 연구 대상은 비유창성 실어증 환자 15명과 정상 성인 15명이었다. 이름대기 과제의 목표 단어는 그림으로 표현 가능한 구체명사만 사용하였으며, 이름대기 평가는 그림을 이용한 대면이름대기방법을 사용하였다. 목표 단어는 단어빈도(저빈도어/고빈도어), 단어길이(1음절/3음절), 생물성(생물/무생물)의 어휘조건을 적용하여 총 40개의 문항으로 구성하였다. 연구 결과를 살펴보면 다음과 같다. 첫째, 두 집단 모두 고빈도 단어의 이름대기 수행이 저빈도 단어보다 높게 나타났다. 둘째, 두 집단 모두 1음절 단어의 이름대기 수행이 3음절 단어보다 높게 나타났다. 셋째, 두 집단 모두 생물성에 따른 이름대기 수행에는 유의한 차이가 없었다. 넷째, 집단과 어휘조건의 상호작용 효과는 단어빈도에서만 나타났다. 이러한 결과는 비유창성 실어증 환자들의 어휘조건에 따른 이름대기 능력의 저하는 단어길이나 생물성에 비해 단어빈도의 효과가 크다는 것을 시사한다. 이러한 연구결과는 비유창성 실어증 환자의 이름대기 평가와 중재의 기초 자료로 활용될 수 있다.