• Title/Summary/Keyword: 어휘의 수준

Search Result 152, Processing Time 0.031 seconds

The Contextual Effects on Pronoun Reaolution (대명사의 참조관계 처리시의 맥락의 역할)

  • 방희정
    • Korean Journal of Cognitive Science
    • /
    • v.2 no.2
    • /
    • pp.279-307
    • /
    • 1990
  • The present research inverstigates the nature of contextual effects on pronoun reference resolution during text comprehesion.Through three experiments,this research examines how various contextuall informations influence on reference resolution and interact with syntactic variables.In experiment 1,the local context was controlled by biasing the pronoun-sentence context towards a certain preceding referent.The lexical decision time and the forced choice time for the correct referent were measured.The results showed that the local contexts have clear effect on reference resolution.The effects of syntactic ambiguity were also observed though the local context was biased towards a certain referent noun.In experiment 2,the global context effect was examined by introducing the text-thematic context in a preceding sentence while keeping the following pronoun-sentence context neutral.The results showed that the global thematic context bias towards a subject or object in a preceding sentence entails a faster response time than the thematically neutral context.In experiment 3,another aspects of context effects were inverstigated by manipulating the consistency of the preceding thematic context with the following pronoun-sentence context.The results showed that the lexical decision responses and forced referent choice responses were faster when the prethematic context and the post-anaphoric context match than when they mismatch.In sum,the overall results of three experiments of this research indicates that context has a clear effect on pronoun reference resolution during text comprehension.

The Processing and Representations of Ambiguos Morpheme in Korean Words : Centered in Aphasics. (한국어 중의적 형태소 표상양식과 처리 특성 : 실어증 환자를 중심으로)

  • 정재범;편성범;김태훈;남기춘
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2002.05a
    • /
    • pp.151-156
    • /
    • 2002
  • 중의적인 단어를 처리하는 방법에 대한 선행연구로, 첫째 문맥에 맞는 의미가 먼저 활성화된다는 가설과 둘째, 여러 뜻 중에 상대적인 빈도에 따라 많이 쓰이는 의미가 먼저 활성화되고, 그것이 문맥과 일치하지 않는다면, 다른 관련된 의미를 찾는다는 가설이 제기되었다. 마지막으로 문맥에 상관없이 모든 의미가 활성화 된 후 문맥을 고려하여 문맥에 적절한 의미를 선택한다는 가설이 있다. 본 연구에서는 '먹을', '감을' 등과 같이 2가지 의미의 품사가 다른 중의 어절과 '쥐어', '감어' 등과 같이 어절 문맥('어')이 주어진 어절의 의미 활성화가 어떻게 다른지를 조사하였다. 본 연구의 목적을 위해 점화어휘 판단 과제를 사용하였다. 실험 1의 결과는 SOA 150ms 조건에서 점화자극어절과 관련된 의미가 품사와 관련 없이 모두 활성화되었다. SOA 1000ms 조건에서는 상대적으로 많이 쓰이는 체언의 의미는 계속 활성화 되어 있는 반면, 용언의 의미 점화량은 감소하였다. 명칭성 실어증 환자인 SDK의 경우 SOA 150ms 조건에서는 일반인과 같은 형태소 처리특성을 보였으나 1000ms 조건에서는 달랐다. 다른 명칭성 실어증 환자인 BIS과 전반성 실어증 환자인 PSB는 SOA 150ms 조건과 1000ms 조건에서 일반인과 아주 다른 양상을 보였다. 이것은 실어증 환자의 타잎에 따라 형태소의 처리나 중의적인 의미 활성화가 일반인과는 다르다는 것을 보여준다. 실험 2에서는 어절 문맥이 있는 '먹어', '쥐어', '감어' 등과 같은 어절을 사용하였다. 실험 2의 결과는 SOA 150ms 조건일 때 어절문맥의 영향으로 용언의 의미만 촉진적 점화효과가 있었고, 체언의 의미는 활성화되지 않았다. 그러나 SOA 1000ms로 지연시켰을 때는 용언뿐만 아니라 체언의 의미도 촉진적 점화효과가 있었다. 실험 1과 2의 결과는 중의적인 한국어 어절의 경우에도 모든 의미가 활성화되나 어절 문맥이 존재할 때는 어절 문맥의 제약으로 어절 문맥에 맞는 한 가지 의미만 활성화된다는 것을 암시한다. 또한 이러한 결과는 한국어 어절이 분석된 형태가 아닌 어절 형태로 심성 어휘집에 저장되어 있다는 것을 암시한다. 실어증 환자의 경우 실험 1과 마찬가지로 환자의 수준이나 종류에 따라 다양한 반응을 보여주었다.

  • PDF

Semi-Supervised Learning for Sentiment Phrase Extraction by Combining Generative Model and Discriminative Model (의견 어구 추출을 위한 생성 모델과 분류 모델을 결합한 부분 지도 학습 방법)

  • Nam, Sang-Hyob;Na, Seung-Hoon;Lee, Ya-Ha;Lee, Yong-Hun;Kim, Jun-Gi;Lee, Jong-Hyeok
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2008.06c
    • /
    • pp.268-273
    • /
    • 2008
  • 의견(Opinion) 분석은 도전적인 분야로 언어 자원 구축, 문서의 Sentiment 분류, 문장 내의 의견 어구 추출 등의 다양한 문제를 다룬다. 이 중 의견 어구 추출문제는 단순히 문장이나 문서 단위로 분류하는 수준을 뛰어 넘는 문장 내 의견 어구를 추출하는 문제로 최근 많은 관심을 받고 있는 연구 주제이다. 그러나 의견 어구 추출에 대한 기존 연구는 문장 내 의견 어구부분이 태깅(tagging)된 학습 데이터와 의견 어휘 자원을 이용한 지도(Supervised)학습을 이용한 접근이 대부분으로 실제 적용 상의 한계를 갖는다. 본 논문은 문장 내 의견 어구 부분이 태깅된 학습 데이터와 의견 어휘 자원이 없는 환경에서도 문장단위의 극성 정보를 이용하여 의견 어구를 추출하는 부분 지도(Semi-Supervised)학습 장법을 제안한다. 본 논문의 방법은 Baseline에 비하여 정확률(Precision)은 33%, F-Measure는 14% 가량 높은 성능을 냈다.

  • PDF

The influence of the syllable frequency on transposed letter effect of Korean word recognition (한글 단어 재인 시 음절 빈도가 글자 교환 효과에 미치는 영향)

  • Lee, Seonkyoung;Lee, Yoonhyoung;Lee, Chang H.
    • Korean Journal of Cognitive Science
    • /
    • v.32 no.3
    • /
    • pp.99-115
    • /
    • 2021
  • Unlike most other alphabetic languages, letter transposition effect was not found in Korean except in the syllable level and in the morpheme level. This study was conducted in order to investigate the possible reason of the absence of letter transposition effect in Korean. Based on previous letter transposition studies, this study was to investigate on whether syllable frequency is a moderating variable and is responsible for the absence of the letter transposition effect. The results showed that significant letter transposition effect was found when a transposed non-word has high frequency syllable(e.g., 민주화 → 진무화), while such effect was not seen in a transposed non-word with low frequency syllable. The results showed that the letter transposition effect can found in Korean as well. The results also implicate the possibility that syllable frequency is the main moderating variable regarding the Korean letter transposition effect.

A Study on the Effectiveness of Using Keywords in Book Reviews for Customized Book Recommendation for Each Personality Type (성격유형별 선호도서 추천을 위한 서평 키워드 활용의 유효성 연구)

  • Cha, Yeon-Hee;Choi, Sung-Pil
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.55 no.3
    • /
    • pp.343-372
    • /
    • 2021
  • The purpose of this study is to select keywords that can recommend books by personality type, and to test whether the chosen keywords can be actually used in the categorization and customized recommendation of books for each personality type. To achieve the research goal, this study chose books that match the level of fifth and sixth grade elementary school students and first grade middle school students and commissioned an expert group to categorize the books into groups that are preferred by each personality type. As a result of the classification, half of the books in which more than five experts agreed showed high consensus. In addition, the results of classifying books by personality type with keywords extracted by the automatic word extraction system by collecting the book review data of the selected books were similar to the results of the final judgement by the expert group, except for a few books. In conclusion, this study proved that it is possible to classify and recommend books that are likely to be preferred by different personality types using review keywords.

Evaluating Korean Machine Reading Comprehension Generalization Performance using Cross and Blind Dataset Assessment (기계독해 데이터셋의 교차 평가 및 블라인드 평가를 통한 한국어 기계독해의 일반화 성능 평가)

  • Lim, Joon-Ho;Kim, Hyunki
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.213-218
    • /
    • 2019
  • 기계독해는 자연어로 표현된 질문과 단락이 주어졌을 때, 해당 단락 내에 표현된 정답을 찾는 태스크이다. 최근 기계독해 태스크도 다른 자연어처리 태스크와 유사하게 BERT, XLNet, RoBERTa와 같이 사전에 학습한 언어모델을 이용하고 질문과 단락이 입력되었을 경우 정답의 경계를 추가 학습(fine-tuning)하는 방법이 우수한 성능을 보이고 있으며, 특히 KorQuAD v1.0 데이터셋에서 학습 및 평가하였을 경우 94% F1 이상의 높은 성능을 보이고 있다. 본 논문에서는 현재 최고 수준의 기계독해 기술이 학습셋과 유사한 평가셋이 아닌 일반적인 질문과 단락 쌍에 대해서 가지는 일반화 능력을 평가하고자 한다. 이를 위하여 첫번째로 한국어에 대해서 공개된 KorQuAD v1.0 데이터셋과 NIA v2017 데이터셋, 그리고 엑소브레인 과제에서 구축한 엑소브레인 v2018 데이터셋을 이용하여 데이터셋 간의 교차 평가를 수행하였다. 교차 평가결과, 각 데이터셋의 정답의 길이, 질문과 단락 사이의 오버랩 비율과 같은 데이터셋 통계와 일반화 성능이 서로 관련이 있음을 확인하였다. 다음으로 KorBERT 사전 학습 언어모델과 학습 가능한 기계독해 데이터 셋 21만 건 전체를 이용하여 학습한 기계독해 모델에 대해 블라인드 평가셋 평가를 수행하였다. 블라인드 평가로 일반분야에서 학습한 기계독해 모델의 법률분야 평가셋에서의 일반화 성능을 평가하고, 정답 단락을 읽고 질문을 생성하지 않고 질문을 먼저 생성한 후 정답 단락을 검색한 평가셋에서의 기계독해 성능을 평가하였다. 블라인드 평가 결과, 사전 학습 언어 모델을 사용하지 않은 기계독해 모델 대비 사전 학습 언어 모델을 사용하는 모델이 큰 폭의 일반화 성능을 보였으나, 정답의 길이가 길고 질문과 단락 사이 어휘 오버랩 비율이 낮은 평가셋에서는 아직 80%이하의 성능을 보임을 확인하였다. 본 논문의 실험 결과 기계 독해 태스크는 특성 상 질문과 정답 사이의 어휘 오버랩 및 정답의 길이에 따라 난이도 및 일반화 성능 차이가 발생함을 확인하였고, 일반적인 질문과 단락을 대상으로 하는 기계독해 모델 개발을 위해서는 다양한 유형의 평가셋에서 일반화 평가가 필요함을 확인하였다.

  • PDF

Bilingual Word Embedding using Subtitle Parallel Corpus (자막 병렬 코퍼스를 이용한 이중 언어 워드 임베딩)

  • Lee, Seolhwa;Lee, Chanhee;Lim, Heuiseok
    • Proceedings of The KACE
    • /
    • 2017.08a
    • /
    • pp.157-160
    • /
    • 2017
  • 최근 자연 언어 처리 분야에서는 단어를 실수벡터로 임베딩하는 워드 임베딩(Word embedding) 기술이 많은 각광을 받고 있다. 최근에는 서로 다른 두 언어를 이용한 이중 언어 위드 임베딩(Bilingual word embedding) 방법을 사용하는 연구가 많이 이루어지고 있는데, 이중 언어 워드 임베딩에서 임베딩 절과의 질은 학습하는 코퍼스의 정렬방식에 따라 많은 영향을 받는다. 본 논문은 자막 병렬 코퍼스를 이용하여 밑바탕 어휘집(Seed lexicon)을 구축하여 번역 연결 강도를 향상시키고, 이중 언어 워드 임베딩의 사천(Vocabulary) 확장을 위한 언어별 연결 함수(Language-specific mapping function)을 학습하는 새로운 방식의 모델을 제안한다. 제안한 모델은 기존 모델과의 성능비교에서 비교할만한 수준의 결과를 얻었다.

  • PDF

Automatic Generation of Vocabulary Problem for Learning Korean as a Foreign Language (외국인의 한국어 학습을 위한 어휘 문제 자동 생성)

  • Kim, Seong-Uk;Lim, JaeHyun;Kim, Yein;Lee, Hyun Ah
    • Annual Conference on Human and Language Technology
    • /
    • 2014.10a
    • /
    • pp.247-250
    • /
    • 2014
  • 국내에서 거주하는 외국인들을 대상으로 한 여러 정책들이 만들어지고 있다, 그에 따른 한국어 교육의 수요는 증가하고 있지만 그에 적합한 한국어 교육시스템의 자동화 및 발전은 미약하다. 본 논문에서는 사전예문과 획득이 용이한 말뭉치를 가공하여 적절한 수준의 문제를 자동으로 생성하는 방법을 제안한다. 자동문제생성에서는 말뭉치와 사전 예문에서 문제와 보기문항을 생성하고, 보기 리스트를 생성한다. 웹문서 검색빈도를 이용하여 생성된 보기리스트의 적합성을 분석하여 정제된 보기 리스트를 획득한다. 얻어진 보기들을 임의로 선택하여 출력함으로써 사용자들이 다양한 문제를 접할 수 있도록 한다.

  • PDF

Modeling a Tagger for Korean Spoken Language (강화학습을 이용한 구어 태거의 모델링과 구어 태거의 구현)

  • Jeong, Hong;Seo, Myung-Won;Kim, Yong;Park, Gi-Yoon
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.367-369
    • /
    • 2001
  • 본 논문에서는 기존의 문어를 다루는 태거와는 달리 구어를 처리할 수 있는 구어태거를 구현하였다. 구어태거는 크게 심층구조와 표층구조의 두 가지 부분으로 구성되어 있으며, 촘스키의 구조에 따라 설계하였다. 심층구조에서 예측된 문장은 표층구조에서 실제의 입력과 음소열수준으로 비교되고 그 결과 가 다시 심층구조로 되메김된다. 이를 통해 가장 적합한 후부가 선택되며 또한 강화학습을 통해 문법과 어휘가 학습된다. 실험을 통해서 여러 가지 잡음이 섞인 입력단어를 본 태거가 얼마나 정확한 예측을 할 수 있는가를 보았으며, 그 결과 잡음에 강한 특성을 나타내는 것을 확인하였다.

  • PDF

A design and implementation of query processor for travel information retrieval system (관광 정보 검색을 위한 자연언어 질의 해석 시스템 구현)

  • Kim, Myong-Cheol;Seo, Kwang-Jun;Jeon, Kyong-Hun;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 1992.10a
    • /
    • pp.449-458
    • /
    • 1992
  • 본 논문은 관광정보검색용 한국어 자연언어 질의 해석 시스템의 모델 정립 및 구현에 대한 것이다. 본 자연언어 질의 해석 시스템은 질의로 부터 정보 검색 시스템의 검색어들을 추출한다. 이를 위하여 1만 단어 수준의 중형사전을 구축하였으며, 불용어 사전, 전거어 사전, 유사어 사전, 복합명사 사전을 구축하였다. 사전의 어휘를 추출하기 위해서 한국어 대화체 문장에 대한 자료수집과 분석을 하였으며, 관광 정보 검색 시스템의 텍스트를 분석하였다. 200여 자연언어 질의 문장으로 실험한 결과는 비교적 좋았다.

  • PDF