• Title/Summary/Keyword: 단어

Search Result 3,786, Processing Time 0.028 seconds

Deciding The Relevance of Web Documents Using WordNet and BPN (WordNet과 BPN을 이용한 웹 문서 적합성 판단)

  • 김원우;변영태
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.91-93
    • /
    • 2001
  • 본 논문은 웹 문서가 특정 주제와 관련된 정보를 담고 있는지를 특정 주제의 단어와 다른 주제의 단어들 사이의 관계를 이용해 평가할 수 있는 방법을 제시하고자 한다. 특정 주제와 관련된 웹 문서에 단어$_{A}$와 단어$_{B}$가 그렇지 않은 웹 문서보다 나온 수가 더 많다면, 단어$_{A}$와 단어$_{B}$의 연결 관계는 특정 주제에 대해 Positive하다고 볼 수 있다. 반대의 경우에는 Negative하다고 볼 수 있다. 이러한 단어와 단어의 연결 관계를 수치화하여 특정 주제와 관련된 웹 문서의 평가에 사용할 수 있도록 WordNet과 BFN을 이용해 보고자 한다.

  • PDF

Efficient Term Weighting For Term-based Web Document Search (단어기반 웹 문서 검색을 위한 효과적인 단어 가중치의 계산)

  • 권순만;박병준
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10a
    • /
    • pp.169-171
    • /
    • 2004
  • 웹(WWW)은 방대한 양의 정보들과 함께 그에 따른 웹의 환경과 그에 따른 정보도 증가하게 되었다. 그에 따라 사용자가 찾고자 하는 정보가 잘 표현된 웹 문서를 효과적으로 찾는 것은 중요한 일이 되었다. 단어기반의 검색에서는 사용자가 찾고자 하는 단어가 나타난 문서들을 사용자에게 보여주게 된다. 검색 단어를 가지고 문서에 대한 가중치를 계산하게 되는데, 본 논문에서는 이러한 단어기반의 검색에서 단어에 대한 가중치를 효과적으로 계산하는 방법을 제시한다 기존의 방식은 단어가 나타난 빈도수에 한정되어진 계산을 하게 되는 반면, 수정된 방식은 태그별로 분류를 통한 차별화 된 가중치를 부여하여 계산된다. 기존의 방식과 비교한 결과 본 논문에서 제시한 수정된 방식이 더 높은 정확도를 나타냈다.

  • PDF

Korean Word Sense Disambiguation Using BERT (BERT를 이용한 한국어 단어 의미 모호성 해소)

  • Youn, Jun Young;Shin, Hyeong Jin;Park, Jeong Yeon;Lee, Jae Sung
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.485-487
    • /
    • 2019
  • 단어의 의미 모호성을 해결하기 위한 연구는 오랫동안 지속되어 왔으며, 특히 최근에는 단어 벡터를 이용한 연구가 활발하게 이루어져왔다. 본 논문에서는 문맥 기반 단어 벡터인 BERT를 이용하여 한국어 단어 의미 모호성을 해소하기 위한 방법을 제안하고, 그 실험 결과를 기존의 한국어 단어 의미 모호성 연구 결과와 비교한다.

  • PDF

Word Sense Classification Using Support Vector Machines (지지벡터기계를 이용한 단어 의미 분류)

  • Park, Jun Hyeok;Lee, Songwook
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.5 no.11
    • /
    • pp.563-568
    • /
    • 2016
  • The word sense disambiguation problem is to find the correct sense of an ambiguous word having multiple senses in a dictionary in a sentence. We regard this problem as a multi-class classification problem and classify the ambiguous word by using Support Vector Machines. Context words of the ambiguous word, which are extracted from Sejong sense tagged corpus, are represented to two kinds of vector space. One vector space is composed of context words vectors having binary weights. The other vector space has vectors where the context words are mapped by word embedding model. After experiments, we acquired accuracy of 87.0% with context word vectors and 86.0% with word embedding model.

Parafoveal Semantic Preview Effect in Reading of Chinese-Korean Bilinguals (글 읽기에서 나타난 중심와주변 의미 미리보기 효과 : 중국어-한국어 이중언어자 대상으로)

  • Wang, Shang;Choo, Hyeree;Koh, Sungryoung
    • Korean Journal of Cognitive Science
    • /
    • v.34 no.4
    • /
    • pp.315-347
    • /
    • 2023
  • This study aimed to investigate the semantic preview effect in the parafoveal processing of words that are presented in advance in the parafoveal area ahead of the fixation point, benefiting word processing in the fovea. Using the boundary technique in eye-tracking experiments, 25 Chinese-Korean bilinguals, whose native language is Chinese, were presented with 96 sentences that contained a mix of Chinese and Korean, where Korean words were associated with Chinese characters semantically. The study aimed to determine whether a semantic preview effect could be extracted in reading. The experimental sentences were divided into four conditions: the same Korean native word condition (e.g., "나라" meaning "country"), the same Korean word with semantic equivalent in Chinese condition (e.g., "국가" meaning "country"), the same Chinese condition with semantic equivalent in Korean (e.g., "国家" meaning "country"), and the unrelated Chinese condition to the target word (e.g., "围裙" meaning "apron"). The results showed a preview effect in both the Korean word and Chinese word conditions, with a larger preview effect observed in the Chinese word condition compared to the Korean word condition.

Translation Disambiguation Based on 'Word-to-Sense and Sense-to-Word' Relationship (`단어-의미 의미-단어` 관계에 기반한 번역어 선택)

  • Lee Hyun-Ah
    • The KIPS Transactions:PartB
    • /
    • v.13B no.1 s.104
    • /
    • pp.71-76
    • /
    • 2006
  • To obtain a correctly translated sentence in a machine translation system, we must select target words that not only reflect an appropriate meaning in a source sentence but also make a fluent sentence in a target language. This paper points out that a source language word has various senses and each sense can be mapped into multiple target words, and proposes a new translation disambiguation method based on this 'word-to-sense and sense-to-word' relationship. In my method target words are chosen through disambiguation of a source word sense and selection of a target word. Most of translation disambiguation methods are based on a 'word-to-word' relationship that means they translate a source word directly into a target wort so they require complicate knowledge sources that directly link a source words to target words, which are hard to obtain like bilingual aligned corpora. By combining two sub-problems for each language, knowledge for translation disambiguation can be automatically extracted from knowledge sources for each language that are easy to obtain. In addition, disambiguation results satisfy both fidelity and intelligibility because selected target words have correct meaning and generate naturally composed target sentences.

The Effects of Visual and Phonological Similarity on Hanja Word Recognition (시각 형태 정보와 소리 정보가 한자 단어 재인에 미치는 영향)

  • Nam, Ki-Chun
    • Annual Conference on Human and Language Technology
    • /
    • 1995.10a
    • /
    • pp.244-252
    • /
    • 1995
  • 본 연구는 한자를 이용하여 시각 정보 (Visual Information)와 음성 정보(Phonological Information)가 단어 재인과 단어 명명 과정에 어떻게 영향을 주는 지를 조사하기 위하여 실시되었다. 기존의 영어를 이용한 연구에서는 시각 정보와 음성 정보를 독립적으로 조작할 수 없었기에 두 요소가 단어 재인에 어떤 영향을 주는 지를 살피는데 어려움이 있었다. 그러나 한자단어를 이용하면 시각 정보와 음성 정보를 독립적으로 조작할 수 있기 때문에 영어 단어를 사용하는 것보다 유리하다. 본 실험에서는 한자 단어를 이용하여 점화 단어 (Prime Word)와 목표 단어(Target Word)간의 시간간격(SOA)을 100 ms, 200 ms, 750 ms, 그리고 2000 ms로 변화시키면서 시간이 흐름에 따라 시각적 유사성과 음성적 유사성에 의한 점화 효과(Priming Effect)가 어떻게 변화하는 지를 조사하였다. 이 실험 결과에 의하면, 100 ms 조건에서는 시각적 유사성에 의한 점화 효과만 있었다. 그러나, 200 ms, 750 ms, 2000 ms 조건들에서는 시각적 유사성뿐만 아니라 음성적 유사성에 의해서도 점화효과가 있었다. 이와 같은 실험 결과는 최초의 한자 단어의 어휘 접근 (Lexical Access)이 시각 정보에 의해 결정됨을 보여주고 있다.

  • PDF

An Algorithm for Text Image Watermarking based on Word Classification (단어 분류에 기반한 텍스트 영상 워터마킹 알고리즘)

  • Kim Young-Won;Oh Il-Seok
    • Journal of KIISE:Software and Applications
    • /
    • v.32 no.8
    • /
    • pp.742-751
    • /
    • 2005
  • This paper proposes a novel text image watermarking algorithm based on word classification. The words are classified into K classes using simple features. Several adjacent words are grouped into a segment. and the segments are also classified using the word class information. The same amount of information is inserted into each of the segment classes. The signal is encoded by modifying some inter-word spaces statistics of segment classes. Subjective comparisons with conventional word-shift algorithms are presented under several criteria.

Brain Activation Associated With Verbal Fluency Tasks : A fMRI study (단어 유창성 과제 수행에 동반된 뇌활성화 양상)

  • Lee, Soo-Hwa;Lee, Kyoung-Min
    • Annual Conference on Human and Language Technology
    • /
    • 1998.10c
    • /
    • pp.186-190
    • /
    • 1998
  • 정상 피험자에 있어서 수행 성적의 차이를 보이는 음소적 단어 생성과 의미적 단어생성에 관련한 대뇌 피질의 활동양상의 차이를 밝히기 위해 피험자에게 단어 생성의 과제를 주면서 기능적 자기공명 영상술(functional magnetic resonance imaging, fMRI)을 시행하였다. 모두 7명의 정상인에서 음소 단서에 의한 단어생성은 의미 범주 단어에 의한 단어생성보다 광범위한 피질 영역의 활성화를 보였는데, 특히 bilateral posteroinferior temporal cortices, left premotor cortex, right cerebellum, bilateral superior parietal lobules에서 더 높은 활성화를 보였다. 이에 반하여 의미적 단어생성은 주로 bilateral posterior cingulate gyri에서 더 높은 활성화를 보였다. 이런 결과는 음소적 생성은 가능한 자모를 조합하여 어휘를 생성한 후 작업기억에 일시 저장시켜 놓고 verbal rehearsal 과정을 사용하여 단어 여부를 판별하는 것을 시사하며, 의미적 생성은 mental imagery를 통하여 시각적 인출 단서를 찾은 후, 의미 기억으로부터 단어를 직접 인출하는 것으로 보인다.

  • PDF

우리 글 읽기에서 중심와주위 단어 첫 음절 음운정보의 미리보기 효과

  • Kim, Jeong-Tae;Go, Seong-Ryong
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2010.05a
    • /
    • pp.31-36
    • /
    • 2010
  • 우리글 읽기에서 중심와주위에 위치한 단어의 음운정보가 중심와주위 미리보기이득에 영향이 있음을 2음절의 표적단어를 사용하여 확인한 앞선 연구에 이어서, 본 연구에서는 중심와주위에 제시된 2음절 단어의 음운정보 중 첫째 음절의 음운정보 역할에 대해 알아보았다. 이를 위해 표적단어(예: '손목')에 대한 미리보기 자극으로 첫음절_동일비단어(예: '손욘'), 첫음절_음운유사비단어(예: '솜욘'), 첫음절_표기유사비단어(예: '��욘'), 첫음절_무관비단어(예: '�F�E')가 제시되었고 경계선기법을 사용하여 눈이 도약하는 동안에 미리보기 자극들은 표적자극으로 바뀌도록 하였다. 표적단어의 주시시간을 측정한 결과, 첫음절_음운유사비단어가 중심와주위에 먼저 제시되었을 때가 첫음절_표기유사비단어나 첫음절_무관비단어가 제시되었을 때보다 짧았다. 이러한 결과는 중심와주위 단어 첫 음절의 음운정보만으로도 고정 간 정보통합에 영향을 주어 중심와주위 미리보기이득에 기여한 것으로 해석되었다.

  • PDF