• 제목/요약/키워드: Effect of morphemes

검색결과 8건 처리시간 0.019초

한국어 음절의 표기빈도와 형태소빈도가 단어인지에 미치는 효과 (Effects of orthographic and morphological frequency of a syllable in Korean word recognition)

  • 이광오;배성봉
    • 인지과학
    • /
    • 제20권3호
    • /
    • pp.309-333
    • /
    • 2009
  • 2음절 한자 합성어의 어휘판단에서 형태소 처리와 글자 처리의 역할을 조사하였다. 실험 1의 단어에 대한 반응에서는 어두와 어말 위치 모두에서 형태소 빈도의 효과는 나타나지 않았으나, 비단어에 대한 반응에서는 글자 빈도의 효과와 글자-형태소 대응의 효과가 나타났다. 빈도가 높은 글자를 포함하는 비단어일수록 반응시간이 길었고, 글자-형태소의 대응이 불투명한 비단어일수록 반응시간이 길었다. 실험 2에서는 실험 1에서 나타난 글자-형태소 대응의 효과를 단어에서 직접 관찰하고자 하였다. 그 결과, 단어 자극에 대해서도 글자-형태소 대응이 불투명할수록 어휘 판단이 느렸으며, 비단어 자극에서 그러한 경향이 더 뚜렷하였다. 본 연구의 결과는, 글자-형태소 대응이 불투명한 단어의 경우 다양한 형태소를 활성화시키게 되고, 그 결과 형태소의 파악은 늦어지고, 결국은 단어 인지의 지연으로 연결된다는 주장을 지지한다. 실험 결과를 바탕으로 하여 한글 표기 한자어의 인지에서 형태소 위치 효과, 글자 빈도의 역할 등에 대해서 논의하였다.

  • PDF

The Syllable Frequency Effect in Semantic Categorization Tasks in Korean

  • Kim, Ji-Hye;Kwon, You-An;Nam, Ki-Chun
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제5권10호
    • /
    • pp.1879-1890
    • /
    • 2011
  • Previous studies of syllable frequency effects have proposed that inhibitory effects due to high first syllable frequency were the products of competitions between activated lexical candidates within a lexical level. However, these studies have primarily used lexical decision tasks to examine the nature of syllable frequency effects. This study investigates whether a syllable frequency effect can arise in semantic categorization tasks and whether phonologically or orthographically defined syllables interact with semantically related variables such as morphological family size. If the syllable frequency effect was created by activations and competitions on a lexical level, it is highly possible that the effect was related to semantic categorization tasks. To test this hypothesis, we conducted two experiments. In Experiment 1, morphological family size and phonological syllable frequency were factorially manipulated. In Experiment 2, morphological family size and orthographic syllable frequency were factorially manipulated. The results demonstrate that morphemes have no relationship with phonological syllables but do with orthographic syllables. This suggests that phonological syllables and orthographic syllables have different roles in the syllable frequency effect on visual word recognition process.

형식형태소가 한국어 단어 벡터 생성에 미치는 영향 (Grammatical morphemes' effect on Korean word vector generation)

  • 윤준영;김도원;민태홍;이재성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.179-183
    • /
    • 2017
  • 단어 벡터는 단어 사이의 관계를 벡터 연산으로 가능하게 할 뿐 아니라, 상위의 신경망 프로그램의 사전학습 데이터로 많이 활용되고 있다. 한국어 어절은 생산적인 조사나 어미 때문에 효율적인 단어 벡터 생성이 어려워 대개 실질형태소만을 사용하여 한국어 단어 벡터를 생성한다. 본 논문에서는 실질형태소와 형식형태소를 모두 사용하되, 형식형태소를 적절하게 분류하여 단어 벡터의 성능을 높이는 방법을 제안한다. 자체 구축한 단어 관계 테스트 집합으로 추출 성능을 평가해 본 결과, 제안한 방법으로 형식형태소를 사용할 경우, 성능이 향상되었다.

  • PDF

형식형태소가 한국어 단어 벡터 생성에 미치는 영향 (Grammatical morphemes' effect on Korean word vector generation)

  • 윤준영;김도원;민태홍;이재성
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.179-183
    • /
    • 2017
  • 단어 벡터는 단어 사이의 관계를 벡터 연산으로 가능하게 할 뿐 아니라, 상위의 신경망 프로그램의 사전학습 데이터로 많이 활용되고 있다. 한국어 어절은 생산적인 조사나 어미 때문에 효율적인 단어 벡터 생성이 어려워 대개 실질형태소만을 사용하여 한국어 단어 벡터를 생성한다. 본 논문에서는 실질형태소와 형식형태소를 모두 사용하되, 형식형태소를 적절하게 분류하여 단어 벡터의 성능을 높이는 방법을 제안한다. 자체 구축한 단어 관계 테스트 집합으로 추출 성능을 평가해 본 결과, 제안한 방법으로 형식형태소를 사용할 경우, 성능이 향상되었다.

  • PDF

동적 프로그래밍기법에 근거한 예측중심의 한국어 형태소 분석 (Predictive Morphological Analysis of Korean with Dynamic Programming)

  • 김덕봉;최기선
    • 인지과학
    • /
    • 제4권2호
    • /
    • pp.145-180
    • /
    • 1994
  • 본 논문은 단어를 구성하는 모든 가능한 형태소열 생성하는 효율적인 한국어 형태소분석 모델을 제시한다.본 논문의 형태소분석 모델은 결정적인(deterministic) 철자규칙의 적용을 보장하며,복합어나 중의성을 지니는 단어의 경우에도 불필요한 계산을 방지한다.이러한 효율성의 획득은 (1)철자규칙을 해석하는 새로운 방법. (2)입력단어에 적합한 철자규칙만을 적용하는 예측중심의 규칙적용방법.(3)중의성이 있는 단어의 경우 이미 분석된 형태부분의 반복계산을 방지하는 동적 프로그래밍 기법의 사용에 의한 새로운 분석기술에 의하여 이루어진다.본 논문에서는 제시된 형태소 분석 모델은 국민학교 국어교과서에서 무작위로 추출된 413,975개의 단어 를 대상으로 실험되었으며, 실험 결과는 본 모델이 효율적이면서도 견고한 형태소 분석을 보장하는것으로 나타났다.

한국어 단어재인에 있어서 빈도와 길이 효과 탐색 (The exploration of the effects of word frequency and word length on Korean word recognition)

  • 이창환;이윤형;김태훈
    • 한국산학기술학회논문지
    • /
    • 제17권1호
    • /
    • pp.54-61
    • /
    • 2016
  • 단어는 언어의 기초적인 의미 단위이기 때문에 단어재인에 대한 연구는 언어 연구에서 중요하며 단어처리에 기여하는 변인이 무엇인지에 관한 연구가 이루어져 왔다. 본 연구에서는 한국어 단어재인 과정의 주요 변인 중 단어 빈도와 단어길이의 영향을 탐색하였다. 먼저 단어 빈도와 관련하여, 한국어의 특징 중 하나인 한자어로 이루어진 단어에서도 기존의 연구와 동일한 양상의 빈도 효과가 나타나는지를 탐색하였다. 이를 위해 순 한글 단어와 한자어로 이루어진 단어를 비교하였으며, 그 결과 한자어로 이루어진 단어에서는 빈도 효과가 나타나지 않았다. 한편 단어 길이 효과의 경우, 단음절로 구성된 단어의 양상을 확인해 보고자, 음절의 개수를 변화시켜 단어 길이 효과를 측정하였다. 그 결과 단음절 단어는 이음절 단어에 비해 느리게 처리되었다. 특정 유형의 단어에 대한 빈도 효과의 부재 및 단음절 단어의 느린 처리는 한국어의 특징을 반영한 결과라 할 수 있으며 추후 연구를 통해 이에 대한 좀더 자세한 탐색이 필요할 것이다.

텍스트네트워크분석을 활용한 국내·외 호스피스 간호 연구 주제의 비교 분석 (A Comparison of Hospice Care Research Topics between Korea and Other Countries Using Text Network Analysis)

  • 박은준;김영지;박찬숙
    • 대한간호학회지
    • /
    • 제47권5호
    • /
    • pp.600-612
    • /
    • 2017
  • Purpose: This study aimed to identify and compare hospice care research topics between Korean and international nursing studies using text network analysis. Methods: The study was conducted in four steps: 1) collecting abstracts of relevant journal articles, 2) extracting and cleaning keywords (semantic morphemes) from the abstracts, 3) developing co-occurrence matrices and text-networks of keywords, and 4) analyzing network-related measures including degree centrality, closeness centrality, betweenness centrality, and clustering using the NetMiner program. Abstracts from 347 Korean and 1,926 international studies for the period of 1998-2016 were analyzed. Results: Between Korean and international studies, six of the most important core keywords-"hospice," "patient," "death," "RNs," "care," and "family"-were common, whereas "cancer" from Korean studies and "palliative care" from international studies ranked more highly. Keywords such as "attitude," "spirituality," "life," "effect," and "meaning" for Korean studies and "communication," "treatment," "USA," and "doctor" for international studies uniquely emerged as core keywords in recent studies (2011~2016). Five subtopic groups each were identified from Korean and international studies. Two common subtopics were "hospice palliative care and volunteers" and "cancer patients." Conclusion: For a better quality of hospice care in Korea, it is recommended that nursing researchers focus on study topics of patients with non-cancer disease, children and family, communication, and pain and symptom management.

The Unsupervised Learning-based Language Modeling of Word Comprehension in Korean

  • Kim, Euhee
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권11호
    • /
    • pp.41-49
    • /
    • 2019
  • 본 연구는 비지도 기계학습 기술과 코퍼스의 각 단어를 이용하여 한국어 단어를 형태소 분석하는 언어 모델을 구축하는데 목적을 둔다. 그리고 이 언어 모델의 단어 형태소 분석의 결과와 언어 심리 실험결과에서 얻은 한국어 언어사용자의 단어 이해/판단 시간이 상관관계을 갖는지를 규명하고자 한다. 논문에서는 한국어 세종코퍼스를 언어 모델로 학습하여 형태소 분리 규칙을 통해 한국어 단어를 자동 분리하는데 발생하는 단어 정보량(즉, surprisal(놀라움) 정도)을 측정하여 실제 단어를 읽는데 걸리는 반응 시간과 상관이 있는지 분석하였다. 이를 위해 코퍼스에서 단어에 대한 형태 구조 정보를 파악하기 위해 Morfessor 알고리즘을 적용하여 단어의 하위 단위 분리와 관련한 문법/패턴을 추출하고 형태소를 분석하는 언어 모델이 예측하는 정보량과 반응 시간 사이의 상관관계를 알아보기 위하여 선형 혼합 회귀(linear mixed regression) 모형을 설계하였다. 제안된 비지도 기계학습의 언어 모델은 파생단어를 d-형태소로 분석해서 파생단어의 음절의 형태로 처리를 하였다. 파생단어를 처리하는 데 필요한 사람의 인지 노력의 양 즉, 판독 시간 효과가 실제로 형태소 분류하는 기계학습 모델에 의한 단어 처리/이해로부터 초래될 수 있는 놀라움과 상관함을 보여 주었다. 본 연구는 놀라움의 가설 즉, 놀라움 효과는 단어 읽기 또는 처리 인지 노력과 관련이 있다는 가설을 뒷받침함을 확인하였다.