• 제목/요약/키워드: Compound Word

검색결과 107건 처리시간 0.029초

사용빈도와 의미투명도가 복합명사의 분리처리에 미치는 효과 (Effects of word frequency and semantic transparency on decomposition processes of compound nouns)

  • 이태연
    • 인지과학
    • /
    • 제18권4호
    • /
    • pp.371-398
    • /
    • 2007
  • 이 연구는 의미점화과제와 반복점화과제를 사용하여 사용빈도와 의미투명성이 복합명사의 분리처리 양상에 어떤 영향을 미치는지를 알아보았다. 실험 1에서는 사용빈도에 따라 복합명사의 분리처리 양상이 달라지는지를 검토하였다. 의미점화효과가 복합명사 연상어 조건에서 자극제시시차나 사용빈도와 무관하게 관찰되었으며, 반복점화효과는 부분조건과 전체조건에서 모두 관찰되었지만 부분조건에서 더 큰 반복점화효과를 보였다. 이 결과는 복합명사가 하위 형태소로 분리되어 처리되는 경로와 복합명사 전체로 처리되는 경로가 함께 존재할 가능성을 보여준다. 실험 2에서는 의미투명도에 따라 복합명사의 분리처리 양상이 달라지는지를 검토하였다. 의미점화효과가 복합명사 연상어 조건에서 자극제시시차나 의미투명도에 무관하게 관찰되었으며, 반복점화과제에서도 실험 1b와 유사한 결과를 보였다. 실험 1과 2의 결과는 어휘수준에서 분리처리경로와 전체처리경로를 통해 활성화된 의미가 개념 수준에서 이루어지는 상호작용과정을 통해 복합명사의 의미를 결정함을 시사한다.

  • PDF

Effective Thematic Words Extraction from a Book using Compound Noun Phrase Synthesis Method

  • Ahn, Hee-Jeong;Kim, Kee-Won;Kim, Seung-Hoon
    • 한국컴퓨터정보학회논문지
    • /
    • 제22권3호
    • /
    • pp.107-113
    • /
    • 2017
  • Most of online bookstores are providing a user with the bibliographic book information rather than the concrete information such as thematic words and atmosphere. Especially, thematic words help a user to understand books and cast a wide net. In this paper, we propose an efficient extraction method of thematic words from book text by applying the compound noun and noun phrase synthetic method. The compound nouns represent the characteristics of a book in more detail than single nouns. The proposed method extracts the thematic word from book text by recognizing two types of noun phrases, such as a single noun and a compound noun combined with single nouns. The recognized single nouns, compound nouns, and noun phrases are calculated through TF-IDF weights and extracted as main words. In addition, this paper suggests a method to calculate the frequency of subject, object, and other roles separately, not just the sum of the frequencies of all nouns in the TF-IDF calculation method. Experiments is carried out in the field of economic management, and thematic word extraction verification is conducted through survey and book search. Thus, 9 out of the 10 experimental results used in this study indicate that the thematic word extracted by the proposed method is more effective in understanding the content. Also, it is confirmed that the thematic word extracted by the proposed method has a better book search result.

한국어 어휘특성들이 기억폭에 미치는 효과 (The Effects of Korean Lexical Characteristics on Memory Span)

  • 박태진;박선희;김태호
    • 인지과학
    • /
    • 제17권1호
    • /
    • pp.15-27
    • /
    • 2006
  • 한국어 단어의 글자 수, 받침의 수와 위치, 합성어 여부가 기억폭에 미치는 효과를 검증하였다. 그 결과, 전반적으로 글자가 많은 단어일수록 기억폭이 작았으며, 두 글자 단어들에서 받침이 많을수록 기억폭이 더 작았고(기억폭에 대한 받침효과), 합성어보다 단일어의 기억폭이 더 컸다. 단어당 읽기 속도를 측정한 결과, 글자가 많은 단어일수록 속도가 느렸지만, 두 글자 단어들에서 뒷받침단어의 읽기 속도가 받침없는 단어, 앞받침단어 및 양받침단어보다 더 빨랐고(읽기 속도에 대한 말미 받침효과), 합성어보다 단일어의 읽기 속도가 더 빨랐다. 기억폭과 읽기 속도간에 관찰된 이러한 관계는 단어길이효과에 대한 음운루프설명과 잘 부합되지 않으며, 기억폭이 음운정보 뿐만 아니라 시각적 캐시에 표상되는 철자 정보의 영향을 받는다는 설명을 지지해준다.

  • PDF

A Deterministic Method for Structural Analysis of Compound Words in Japanese

  • Han, Dongli;Ito, Takeshi;Furugori, Teiji
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2002년도 Language, Information, and Computation Proceedings of The 16th Pacific Asia Conference
    • /
    • pp.79-91
    • /
    • 2002
  • Structural analysis of compound words is necessary and an important process in natural language processing. Proposed here is a corpus- and statistics- based method for the structural analysis of compound words in Japanese. We determine the structure of a compound word by using Internet corpus and calculating the strength of word association among its constituent words. Experiments with 5, 6, 7, and 8 kanji compound words show that our method works well and its performance is better than those of other comparable studies.

  • PDF

잇사매와 함사매의 名稱

  • 김진구
    • 복식문화연구
    • /
    • 제7권2호
    • /
    • pp.220-224
    • /
    • 1999
  • This study is concerned with the names of is sa mai(잇사매) and ham sa mai(함사매). Origins and meanings of these terms were traced and examined. Some significant findings can be summarized as follows : Korean word is sa mai(잇사매) was a compound word. Korean character is (잇) is derived from Chinese character i, and sa mai(사매) in Korean means sleeves 神 in Chinese character. The character ham in Ham sa mai(함사매) is its origin in Chinese : Korean character ham was Korean pronounciation of the Chinese character, han. ham sa mai is a compound word of ham(함) (Korean), (han ) (Chinese) and sa mai(사매) sleeves(Korean). Thus, first characters of is(잇) in is sa mai(잇사매) and ham(함) in ham sa mai(함사매) are originated from Chinese, where as the word sa mai in the end of is sa mai and ham sa mai is pure Korean. Both character i and ham(han, Chinese) in Chinese means a jaw. Thus, both is sa mai(잇사매) and ham sa mai(함사매) means “jawed sleeves”. That is long and wide round sleeves with narraw wrists.

  • PDF

영어 중첩복합어 분석 (An Analysis of English Reduplicative compounds)

  • 김형엽
    • 인문언어
    • /
    • 제2권1호
    • /
    • pp.303-314
    • /
    • 2002
  • The main purpose of this paper is to show how Jespersen analyzed the date of English compound related with reduplication. Especially dealing with the compound words he classified the examples related with reduplication as a separate part and attempted to account for the patters based on the structure of the first syllable constituting the initial part of the second element in a compound word. 1 tried to explain the peculiar shape of the reduplicational pattern in English based on the Optimality Theory, especially the method of 'melodic overwriting' of McCarthy(1997). According to the analysis the initial part of the second element of a compound has to be stipulated before reduplication occurs. When the reduplicant has to be decided at the first syllable of the second element, the form which is stipulated to take the position comes to appear at the post instead of repeating the morphemic shape of the first syllable at the first element of the word.

  • PDF

마코프 체인 밀 음절 N-그램을 이용한 한국어 띄어쓰기 및 복합명사 분리 (Korean Word Segmentation and Compound-noun Decomposition Using Markov Chain and Syllable N-gram)

  • 권오욱
    • 한국음향학회지
    • /
    • 제21권3호
    • /
    • pp.274-284
    • /
    • 2002
  • 한국어 대어휘 연속음성인식을 위한 텍스트 전처리에서 띄어쓰기 오류는 잘못된 단어를 인식 어휘에 포함시켜 언어모델의 성능을 저하시킨다. 본 논문에서는 텍스트 코퍼스의 띄어쓰기 교정을 위하여 한국어 음절 N-그램을 이용한 자동 띄어쓰기 알고리듬을 제시한다. 제시된 알고리듬에서는 주어진 입력음절열은 좌에서 우로의 천이만을 갖는 마코프 체인으로 표시되고 어떤 상태에서 같은 상태로의 천이에서 공백음절이 발생하며 다른 상태로의 천이에서는 주어진 음절이 발생한다고 가정한다. 마코프 체인에서 음절 단위 N-그램 언어모델에 의한 문장 확률이 가장 높은 경로를 찾음으로써 띄어쓰기 결과를 얻는다. 모든 공백을 삭제한 254문장으로 이루어진 신문 칼럼 말뭉치에 대하여 띄어쓰기 알고리듬을 적용한 결과 91.58%의 어절단위 정확도 및 96.69%의 음절 정확도를 나타내었다. 띄어쓰기 알고리듬을 응용한 줄바꿈에서의 공백 오류 처리에서 이 알고리듬은 91.00%에서 96.27%로 어절 정확도를 향상시켰으며, 복합명사 분리에서는 96.22%의 분리 정확도를 보였다.

통사적 모호성과 음운 구조 (Syntactic ambiguity and phonological structure)

  • 임운
    • 대한음성학회지:말소리
    • /
    • 제42호
    • /
    • pp.57-69
    • /
    • 2001
  • Syntactic ambiguity can be understood by context usually, especially in reading and writing. Because phonological structure including stress, intonation and phonological phenomena can be pronounced differently according to different syntactic structures, syntactic ambiguity can be solved by phonological structure in listening and speaking. The objectives of this study was to survey how Korean English teachers apply phonological structures in order to solve syntactic ambiguity. The results of this study is as follows: First, Korean English leachers applied Compound Stress Rules well, when the second word was not branched. But they did not apply Compound Stress Rules well, when the second word was branched. Second, several Korean English teachers did not apply Nuclear Stress Rules well. They usually put the strongest stress on the first word. Third Korean English teachers did not differentiate appropriate applying situation of palatalization. They applied palatalization at both the single and the separated Phonological Phrase. Fourth, Korean English teachers did not apply stress shifting when stress crash happened. Because they did not apply stress shifting, they put the strongest stress on inappropriate syllable.

  • PDF

상호정보량과 복합명사 의미사전에 기반한 동음이의어 중의성 해소 (Homonym Disambiguation based on Mutual Information and Sense-Tagged Compound Noun Dictionary)

  • 허정;서희철;장명길
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권12호
    • /
    • pp.1073-1089
    • /
    • 2006
  • 자연언어처리의 목적은 컴퓨터가 자연어를 이해할 수 있도록 하여, 인간에게 다양한 정보를 정확하고 빠르게 전달할 수 있도록 하고자 하는 것이다. 이를 위해서는 언어의 의미를 정확히 파악하여야 하는데, 어휘 의미 중의성 해소가 필수적인 기술이다. 본 연구는 상호정보량과 기 분석된 복합명사 의미사전에 기반한 동음이의어 의미 중의성 해소를 위한 기술을 소개한다. 사전 뜻풀이를 이용하는 기존 기술들은 어휘들간의 정확한 매칭에 의존하기 때문에 자료 부족 현상이 심각하였다. 그러나, 본 연구에서는 어휘들간의 연관계수인 상호정보량을 이용함으로써 이 문제를 완화시켰다. 또한, 언어적인 특징을 반영하기 위해서 상호정보량을 가지는 어휘 쌍의 비율 가중치, 의미 별 비율 가중치와 뜻풀이의 길이 가중치를 사용하였다. 그리고, 복합명사를 구성하는 단일명사들은 서로의 의미를 제약한다는 것에 기반하여 고빈도 복합명사에 대해서 의미를 부착한 의미사전을 구축하였고, 이를 동음이의어 중의성 해소에 활용하였다. 본 시스템의 평가를 위해 질의응답 평가셋의 200 여 개의 질의와 정답단락을 대상으로 동음이의어 의미 중의성 해소 평가셋을 구축하였다. 평가셋에 기반하여 네 유형의 실험을 수행하였다. 실험 결과는 상호 정보량만을 이용하였을 때 65.06%의 정확률을 보였고, 가중치를 활용하였을 때 85.35%의 정확률을 보였다. 또한, 복합명사 의미분석 사전을 활용하였을 때는 88.82%의 정확률을 보였다.

Noun Sense Identification of Korean Nominal Compounds Based on Sentential Form Recovery

  • Yang, Seong-Il;Seo, Young-Ae;Kim, Young-Kil;Ra, Dong-Yul
    • ETRI Journal
    • /
    • 제32권5호
    • /
    • pp.740-749
    • /
    • 2010
  • In a machine translation system, word sense disambiguation has an essential role in the proper translation of words when the target word can be translated differently depending on the context. Previous research on sense identification has mostly focused on adjacent words as context information. Therefore, in the case of nominal compounds, sense tagging of unit nouns mainly depended on other nouns surrounding the target word. In this paper, we present a practical method for the sense tagging of Korean unit nouns in a nominal compound. To overcome the weakness of traditional methods regarding the data sparseness problem, the proposed method adopts complement-predicate relation knowledge that was constructed for machine translation systems. Our method is based on a sentential form recovery technique, which recognizes grammatical relationships between unit nouns. This technique makes use of the characteristics of Korean predicative nouns. To show that our method is effective on text in general domains, the experiments were performed on a test set randomly extracted from article titles in various newspaper sections.