• 제목/요약/키워드: Verb

검색결과 342건 처리시간 0.027초

언어영역의 기능적 자기공명영상 (Functional MRI of Language Area)

  • 유재욱;나동규;변홍식;노덕우;조재민;문찬홍;나덕렬;장기현
    • Investigative Magnetic Resonance Imaging
    • /
    • 제3권1호
    • /
    • pp.53-59
    • /
    • 1999
  • 목적 : 언어기능의 지도화(language mapping) 및 우세반구 결정에 있어서 기능적 자기공명영상의 유용서을 알아보고자 하였다. 대상 및 방법 : 자원자 10명(남자 6명, 여자 4명, 오른손잡이 7명, 왼손잡이 3명)을 대상으로 단어생성 과제(명사만들기, 동사만들기)와 판단과제를 이용하여 언어영역의 활성화를 유도하였다. 1.5T 초진도 자기공명영상장치에서 EPI로 BOLD 기법을 이용하여 기능적 영상을 얻었으며, 여앙후처리는 SPM 분석 프로그램을 이용하였다. 기능적 영상은 2번의 활성기와 3번의 휴식기를 번갈아 시행하였고 스캔 시간은 각각30초였으며 총 영상획득시간은 162초였다. 유의수준 p<0.001을 기준ㅇ로 자극 과제에 따라 활성화된 뇌영역을 분석하였고 반구별로 활성화된 화소의 수를 측정하여 편재화지수(lateralization index)를 구하였다. 결과 : 왼손잡이 1명을 제외한 9명에서 성공적으로 기능적 영상을 얻었으며 양측 전운동영역(premotor area), 하전두회, 두정엽, 중측두회 등의 여러 영역에서 활성화 신호가 나타났다. 오른손잡이의 경우 편재화지수는 평균 0,64(0.16~1)로 모두 좌측으로 편재화 되었다. 과제별로는 동사만들기 과제가 명사만들기 및 판단 과제에 비해 언어 영역의 활성화가 많았고 편재화지수의 값도 높았다. 결론 : 기능적 자기공명영상은 언어영역의 뇌기능지도화 및 우세반구 결저에 있어서 유용한 검사 방법이 될 수 있으리라 생각된다.

  • PDF

동사 어휘의미망 평가를 위한 단어클러스터링 시스템의 활용 방안 (The Method of Using the Automatic Word Clustering System for the Evaluation of Verbal Lexical-Semantic Network)

  • 김혜경;윤애선
    • 한국문헌정보학회지
    • /
    • 제40권3호
    • /
    • pp.175-190
    • /
    • 2006
  • 최근 수년간 한국어를 위한 어휘의미망에 대한 관심은 꾸준히 높아지고 있지만. 그 결과물을 어떻게 평가하고 활용할 것인가에 대한 방안은 이루어지지 않고 있다. 본 논문에서는 단어클러스터링 시스템 개발을 통하여, 어휘의미망에 의해 확장되기 전후의 클러스터링을 수행하여 데이터를 서로 비교하였다 단어클러스터링 시스템 개발을 위해 사용된 학습 데이터는 신문 말뭉치 기사로 총 68.455.856 어절 규모이며, 특성벡터와 벡터공간모델을 이용하여 시스템A를 완성하였다. 시스템B는 구축된 '(-하)동사류' 3,656개의 어휘의미를 포함하는 동사 어휘의미망을 활용하여 확장된 것으로 확장대상정보를 선택하여 특성벡터를 재구성한다. 대상이 되는 실험 데이터는 '다국어 어휘의미망-코어넷'으로 클러스터링 결과 나타난 어휘의 세 번째 층위까지의 노드 동일성 석부로 정확률을 검수하였다. 같은 환경에서 시스템A와 시스템B를 비교한 결과 단어클러스터링의 정확률이 45.3%에서 46.6%로의 향상을 보였다. 향후 연구는 어휘의미망을 활용하여 좀 더 다양한 시스템에 체계적이고 폭넓은 평가를 통해 전산시스템의 향상은 물론. 연구되고 있는 많은 어휘의미망에 의미 있는 평가 방안을 확대시켜 나가야 할 것이다.

연구 논문의 의미 구조 기반 메타데이터 항목의 자동 식별 처리를 위한 문장 구조 분석 (Analyzing the Sentence Structure for Automatic Identification of Metadata Elements based on the Logical Semantic Structure of Research Articles)

  • 송민선
    • 정보관리학회지
    • /
    • 제35권3호
    • /
    • pp.101-121
    • /
    • 2018
  • 본 연구는 연구논문의 논리적 의미 구조 메타데이터 항목에 해당하는 데이터에 담겨 있는 문장의 구성에 따라 시스템에서 적절한 항목으로 자동 식별 처리될 수 있도록 하는, 문장의미론(Sentence Semantics)적 분석 방법을 제안하고자 하는 목적으로 수행되었으며, 의미 구조 메타데이터 항목 중 'Research Objectives'와 'Research Outcomes'에 해당하는 연구 논문 문장의 구조를 어절 수, 접속어 종류, 다수 출현한 단어들의 문장 내 역할, 문장에서 다수 출현한 어미 형태 등을 기준으로 분석해 정리하였다. 연구 결과, 문장들의 어절 수는 'Research Objectives'는 평균 38개, 'Research Outcomes'는 평균 212개로 나타났으며, 접속어의 경우 'Research Objectives'는 인과-순접-대등-환언/요약 관계를 나타내는 접속어 순으로, 'Research Outcomes'는 인과-대등-순접-환언/요약 관계를 나타내는 접속어 순으로 많이 출현한 것으로 파악되었다. 출현빈도가 높은 분석 대상 단어들은 각각 문장 내에서 주어, 목적어, 서술어 역할 등으로 사용되고 있었으며, '역할'이나 '요인', '관계'는 목적이나 결과 부분 모두에서 비슷한 역할을 담당하고 있었지만 '연구'는 같은 단어라도 연구의 목적 부분과 결과 부분에서 사용되는 역할에 차이를 보였다. 마지막으로 문장 내 동사의 어미는 'Research Objectives'에서 '~고자'와 '~였다', 'Research Outcomes'에서 '~었다', '~있다', '~였다'가 많이 출현하였다. 본 연구는 연구자의 학술적 이해형성을 지원하기 위해 연구논문이 담고 있는 공통된 논리적 의미를 반영한 메타데이터 요소의 자동 식별과 입력 방안을 제시하는 데 활용할 수 있는 기초 연구로서 의의가 있다.

텍스트 문서 기반의 감성 인식 시스템 (An Emotion Scanning System on Text Documents)

  • 김명규;김정호;차명훈;채수환
    • 감성과학
    • /
    • 제12권4호
    • /
    • pp.433-442
    • /
    • 2009
  • 요즈음 인터넷을 통해 물건을 구매하는 경향이 증가하고 있다. 또한 물건을 구매한 소비자는 리뷰, 댓글, 비평 또는 블로그 등의 형식으로 온라인에 그들의 사용 후기를 작성한다. 또한 작성된 사용 후기부터 많은 구매자들은 물건을 구매하기 전에 자신이 구입하고자 하는 물건에 대한 정보를 얻는다. 따라서 회사나 공공기관은 대중이 다른 사람의 의견에 관심을 기울인다는 점 때문에 대중의 의견을 수집하고 분석할 필요성에 직면하였다. 그러나 온라인상에 댓글이 너무 많고, 중복적이면서 짧은 경향이 있다. 이러한 환경 속에서 텍스트 문서의 감성을 인식하는 시스템의 필요성이 대두되었다. 텍스트로부터 작성자의 의견이나 주관적인 생각을 추출할 수 있게 영어에서는 단어에 속성이 주어진 GI와 LKB가 있으나 한글은 아직 속성이 주어진 사전이 존재하지 않는다. 이 논문에서는 한글 품사 중 4개의 품사(명사, 동사, 형용사, 부사)에 속성을 주었다. 그리고 학습 군을 만들어서 감성 단어의 패턴을 구성하고, 문장에서 단어 사이의 공기관계를 구성하여 학습 시켰다. 이 학습을 바탕으로, SO-PMI을 이용하여 문서를 긍정과 부정 2가지 극성을 분류하고, 4개의 품사(명사, 동사, 형용사, 부사)를 각각 조합하여 최상의 조건을 구하였다. 마지막으로 사용자 인터페이스를 통해 새로운 감성 표현, 구성형식, 단어 연관성을 반자동적으로 삽입하고 교정할 수 있는 시스템을 설계하였다.

  • PDF

영어 시제와 상 (Tense and Aspect in English)

  • 김정오
    • 한국콘텐츠학회논문지
    • /
    • 제13권3호
    • /
    • pp.502-510
    • /
    • 2013
  • 본고에서는 시제의 일반적 정의와 상에 관한 개념들을 정리 하였다. 시제는 시간을 나타내는 동사의 굴절형'이고 따라서 시제는 문법범주의 하나로서 영어의 경우 현재시제와 과거시제를 인정하고 있다. 시제처럼 상을 문법범주로 인정한다면 그 기술 대상은 당연히 문법적 표현에 국한될 것이고 반대로 문법범주가 아닌 의미범주로 간주하면 문법적 표현은 물론이고 어휘적 표현까지 기술대상이 될 것이다. 따라서 상은 문법범주로서 명시되어 있고 특히 영어의 상은 진행형과 완료형의 두 형태로 국한하고 있다. 이 경우에 진행상(the progressive aspect)은 진행형, 완료상(the perfect aspect)은 완료형을 가리킨다. 제 2장에서는 여러 학자들의 시제에 관한 정의를 살펴보고 또한 각 시제의 용법들을 정의 하였다. 3장에서는 상의 정의를 제시하였고, 상에는 문법적, 의미적상이 있음을 여러 학자들의 정의를 통하여 알아보았다. 시제와 상은 어떻게 보면 간단한 문법 범주이나 시각을 좀더 달리하면 다양한 스펙트럼을 가진 범주로 볼 수 있다. 따라서 시제와 상의 정의가 명확해지면 영어교육의 피대상자가 언어를 이해하는데 많은 도움이 될 것이다. 더하여 다양한 영역에서 시제와 상에 관한 개념정의가 필요하고 더 많은 연구가 있어야 할 것으로 여겨진다.

Part-of-speech Tagging for Hindi Corpus in Poor Resource Scenario

  • Modi, Deepa;Nain, Neeta;Nehra, Maninder
    • Journal of Multimedia Information System
    • /
    • 제5권3호
    • /
    • pp.147-154
    • /
    • 2018
  • Natural language processing (NLP) is an emerging research area in which we study how machines can be used to perceive and alter the text written in natural languages. We can perform different tasks on natural languages by analyzing them through various annotational tasks like parsing, chunking, part-of-speech tagging and lexical analysis etc. These annotational tasks depend on morphological structure of a particular natural language. The focus of this work is part-of-speech tagging (POS tagging) on Hindi language. Part-of-speech tagging also known as grammatical tagging is a process of assigning different grammatical categories to each word of a given text. These grammatical categories can be noun, verb, time, date, number etc. Hindi is the most widely used and official language of India. It is also among the top five most spoken languages of the world. For English and other languages, a diverse range of POS taggers are available, but these POS taggers can not be applied on the Hindi language as Hindi is one of the most morphologically rich language. Furthermore there is a significant difference between the morphological structures of these languages. Thus in this work, a POS tagger system is presented for the Hindi language. For Hindi POS tagging a hybrid approach is presented in this paper which combines "Probability-based and Rule-based" approaches. For known word tagging a Unigram model of probability class is used, whereas for tagging unknown words various lexical and contextual features are used. Various finite state machine automata are constructed for demonstrating different rules and then regular expressions are used to implement these rules. A tagset is also prepared for this task, which contains 29 standard part-of-speech tags. The tagset also includes two unique tags, i.e., date tag and time tag. These date and time tags support all possible formats. Regular expressions are used to implement all pattern based tags like time, date, number and special symbols. The aim of the presented approach is to increase the correctness of an automatic Hindi POS tagging while bounding the requirement of a large human-made corpus. This hybrid approach uses a probability-based model to increase automatic tagging and a rule-based model to bound the requirement of an already trained corpus. This approach is based on very small labeled training set (around 9,000 words) and yields 96.54% of best precision and 95.08% of average precision. The approach also yields best accuracy of 91.39% and an average accuracy of 88.15%.

한국어 복합문에서의 제로 대용어 처리를 위한 분해 알고리즘과 복원규칙 (Splitting Algorithms and Recovery Rules for Zero Anaphora Resolution in Korean Complex Sentences)

  • 김미진;박미성;구상옥;강보영;이상조
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권10호
    • /
    • pp.736-746
    • /
    • 2002
  • 한국어에는 복합문에서 영 대용이 빈번하게 발생하여 해석을 어렵게 한다. 따라서 본 논문에서는 한국어 영 대용어 처리를 위해 복합문 분해 알고리즘과 복합문 영 대용어 복원 규칙을 제안하고, 해결방법을 제시한다. 본 논문은 신문 기사의 복합문 중에서 보조용언 내포문을 제외한 인용문, 접속문, 내포문을 처리 대상으로 한다. 복합문 분해를 위해서는 복합문 구성에 관여하는 어미들의 어미 분류표를 이용하고, 영 대용어 복원을 위해서는 생략될 때 적용된 통사규칙을 역으로 이용한다. 인용문은 주어 인칭제약에 따른 동일 명사구 탈락규칙을, 명사화 내포문은 동일 명사구 탈락규칙을, 관형화 내포문은 관계 명사구 탈락규칙을 그리고 접속문은 접속 삭감규칙을 역으로 이용하여 처리한다. 제안한 방법을 이용한 결과 전체 영 대용어 중 83.53%가 해결 가능하며 11.52%는 부분적으로 해결 가능하다.

한국어의 양태 표현 교육 연구 : 한국어 '-(으)ㄹ 수 있다'와 중국어 '능(能)'의 대조를 중심으로 (A Study on the Teaching and Learning of Korean Modality Expressions)

  • 강비
    • 한국교육논총
    • /
    • 제40권1호
    • /
    • pp.17-42
    • /
    • 2019
  • 양태는 화자의 심리적 태도이다. 언어마다 사용된 문장은 양태를 포함한다고 할 수 있다. 전통적으로 양태는 인식양태와 의무양태로 분류할 수 있다. 본 연구는 한국어 양태 이론을 개관하고 이를 토대로 양태의 개념과 하위분류를 선정하였다. 아울러 본격적인 양태 표현의 의미, 기능 대조를 위해 한국어와 중국어의 양태 실현 양상을 밝혔다. 또한, 한국어의 양태 표현 '-(으)ㄹ 수 있다'와 이에 대응되는 중국어의 양태 조동사 '능(能)'을 통사적, 의미적, 화용적 측면에서 대조 분석하고 이를 바탕으로 양태 표현의 효과적인 교수·학습 방안을 마련하는 것을 목적으로 한다. 한국어 양태 표현은 화자의 주관적 태도를 나타내는 문법 요소로서 한국어 교재에서 매우 중요하게 다루고 있으며 많은 문법 항목이 이 양태에 속한다. 한국어의 양태 표현은 유사점이 많고 의미와 기능이 다양하기 때문에 중국인 학습자들이 학습했더라도 사용하기 어려운 문법이다. 따라서 본고는 대조 분석을 통해 중국인 학습자를 위한 효과적인 교수·학습 방안을 제시하고, 이를 활용한 한국어 양태 표현의 실제 교수·학습 모형을 구안하였다. 따라서 한국어 교육에서 양태 표현의 문법 교육 내용을 구성하는 데 도움이 될 것으로 기대한다.

  • PDF

한국과학교육학회지 논문의 글쓰기 사례 연구 (Case Study on the Writing of the Papers of Journal of the Korean Association for Science Education)

  • 한재영
    • 한국과학교육학회지
    • /
    • 제35권4호
    • /
    • pp.649-663
    • /
    • 2015
  • 과학교육 논문의 글쓰기 실태를 한국어 기초 문법과 번역투의 측면에서 조사하고 그 개선점을 찾아보았다. 과학교육 연구는 사회과학과 자연과학의 특성을 모두 나타내며 양적 연구를 더 많이 하는 특징이 있어 논문 글쓰기 방식에 영향을 미칠 수 있다. 이 연구에서 번역투는 순수한 한국어가 아닌 외국어에서 유래한 상투적 표현을 말한다. 한국어 기초 문법은 호응의 문제, 맞춤법 띄어쓰기 문장 부호의 문제, 사동표현의 문제, 무분별한 영어 사용의 문제로 정리하였고, 번역투는 영어번역의 문제, 일본어 번역의 문제, 영어와 일본어 번역의 문제로 구분하였다. 이에 따라 한국과학교육학회지 한 호에 실린 논문 9편의 글쓰기 중에서 한국어 기초 문법에 어긋나는 사례와 번역투에 해당하는 사례를 찾아 문제를 논의하고 대안을 제시하였다. 빈도가 높은 문제사례는 '~적', '영어 사용', '복수 표현', '하다류 피동', '~고 있는', '~을 통하여', '~에 대하여', '가지다', '관형격조사 ~의', '사물주어 수동태', '사동(시키다)' 등이었다. 연구 결과에 기초하여 과학교육 소논문의 글쓰기 특징을 '양적 연구의 글쓰기', '학술 연구의 객관적 글쓰기', '외국에서 유래한 연구의 글쓰기' 세 가지로 정리하였다. 과학교육 논문 글쓰기에 나타나는 문제를 개선하기 위해 과학교육 연구자는 한국어 기초 문법과 번역투에 관심을 기울이고, 구체적인 사례와 내용을 숙지할 필요가 있다. 이 연구의 결과는 한국어 글쓰기 교육과 문법 교육에 활용할 수 있다.

영어 트위터 감성 분석을 위한 SentiWordNet 활용 기법 비교 (A Comparative Study on Using SentiWordNet for English Twitter Sentiment Analysis)

  • 강인수
    • 한국지능시스템학회논문지
    • /
    • 제23권4호
    • /
    • pp.317-324
    • /
    • 2013
  • 트위터 감성 분석은 트윗글의 감성을 긍정과 부정으로 분류하는 작업이다. 이 연구에서는 SentiWordNet(SWN) 감성 사전에 기반한 트윗글 감성 분석을 다룬다. SWN은 전체 영어 단어에 대해 단어의 의미별로 긍정, 부정의 감성 강도를 저장해 둔 감성 사전이다. 기존 SWN 기반 감성 분석 연구들은 문서에 출현하는 각 용어의 감성을 SWN으로부터 결정한 다음 이를 바탕으로 문서 전체의 감성을 결정하였는데, 그 방법들이 매우 다양하다. 예를 들어, 한 용어의 감성 결정 시 해당 용어의 SWN 내 의미별 긍정, 부정 감성 강도 차이들의 평균을 계산하거나 긍정과 부정 각각의 감성 강도 평균 혹은 최대값을 구하기도 하며, 문서 전체의 감성을 결정하는 경우에도 문서 내 용어들의 감성 값들에 대해 평균 혹은 최대값을 취하기도 하였다. 또한 SWN 내 형용사, 동사, 명사, 부사의 품사 집합 전체 혹은 특정 부분집합에 대해 위의 감성 결정 작업을 적용하기도 한다. 이처럼 기존 연구에서는 SWN 기반의 다양한 감성 자질 추출 절차가 시도되고 있으나 이들 자질 추출 기법 전반에 대한 성능 비교 연구는 찾기 힘들다. 이 연구에서는 SWN을 트위터 감성 분석에 활용하는 다양한 방법들을 일반화하는 절차들을 소개하고 각 방법들의 성능 비교 및 분석 결과를 제시한다.