• 제목/요약/키워드: 어휘정보

검색결과 1,062건 처리시간 0.02초

블로고스피어에서 주제에 관한 의견을 찾는 융합적 의견탐지방법 (Fusion Approach to Targeted Opinion Detection in Blogosphere)

  • Yang, Kiduk
    • 한국도서관정보학회지
    • /
    • 제46권1호
    • /
    • pp.321-344
    • /
    • 2015
  • 이 논문은 여러가지 자료를 결합해 어떤 주제에 관한 의견이 실려있는 블로그를 찾는 융합적 의견탐지방법을 소개한다. 주제에 관한 의견이 담긴 블로그를 찾기위해 이 연구는 기존의 IR 방법으로 주제에 관한 블로그를 검색한 후 여러가지 의견탐지 방법을 합산한 의견점수로 검색결과의 순위를 조정하는 방법을 쓴다. 의견탐지 모듈의 주요 구성 요소는 의견이 실려있는 블로그에 자주 나오는 단어들을 활용한 고빈도 모듈, 강한 감정을 표현하는 희귀 한 용어들을 (e.g., "sooo good") 활용한 저빈도 모듈, "I"와 "you"에 묶인 n-gram을 (e.g., I believe, You will love) 활용한 IU모듈, 윌슨의 주관 용어 목록을 바탕으로 한 윌슨의 어휘모듈, 그리고 소수의 의견 약어를 (e.g., imho) 이용한 의견 약어 모듈들 이다. 본 연구의 결과는 여러 가지 방법을 융합하는 것이 의견 검출 성능을 향상시키는데 효과적이 다는 것을 보여주었다.

ASPECT SHIFT AND DURATIVE ADVERBIALS

  • 고희정
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2001년도 학술대회 논문집
    • /
    • pp.97-109
    • /
    • 2001
  • 이 논문은 영어와 한국어에서 나타나는 완수동사(Accomplishment Verb)와 지속부사구(durative adverbial)의 상호작용에 대해서 논한다. Smith(1991)에 의하면 완수동사가 지속부사구와 결합하면, 동사와 부사구의 의미적 자질의 충돌을 피하기 위해서 완수동사의 상변환(Apsect Shift)이 일어난다. 본 논문은 이 상변환이 영어와 한국어에서 어떻게 실현되는가를 보이고, 이를 형식의미론에서 어떻게 기술할 수 있는가를 논한다. 완수동사가 지속부사구와 결합할 때, 영어와 한국어 모두에서 닫힌 완료 관점(closed perfective viewpoint)에서 열린 관점(open viewpoint)으로 관점 변환(viewpoint shift)이 일어난다. 그러나, 한국어의 상변환과 영어의 상변환이 완전히 일치하는 것은 아니다. 한국어의 관점변환은 완료관점도 아니고 미완료 관점도 아닌, 중립관점(neutral viewpoint)으로의 변환인 반면, 영어의 관점변환은 단순히 미완료 관점으로의 변환임이 논의된다. 이 주장은 한국어의 관점변환 구문은 이질적인 다수 사건의 연속 해석(heterogeneous sequential reading of multiple events)을 허용하는 반면, 영어의 관점변환구문은 오직 동질적인 단일 사건의 동시 해석 (homogeneous simultaneous reading of a single event)만을 허용한다는 사실에 의해서 지지 된다. 본 논문은 완수동사가 지속부사구와 결합할 때 일어나는 상변환에 대한 형식의 미론 분석을 Heim & Kratzer (1998)의 틀에서 제시한다. 닫힌 관점에서 열린 관점으로의 상변환은 비가시적 시제 서법 운용자(covert temporal-modal operator)인 IMP를 지속부사구의 논항으로 설정하여 설명한다. IMP는 Dowty (1979)에서 미완료상의 모순(imperfective paradox)을 해결하기 위해서 설정한 PROG를 Heim & Kratzer (1998)의 틀에 맞게 수정한 것이다. IMP는 평가 세계 (evaluation world)를 현실 세계(actual world)에서 가상 관성 세계(possible inertia would)로 변화시켜서, 완수동사의 종결점(ending point)을 현실세계에서 가상의 미래 세계로 움직이는 역할을 한다. 결과적으로, IMP는 완수동사의 닫힌 완료 관점을 현실세계에서는 열린 미완료 관점으로 변환시키되, 가상 관성 세계에서는 그대로 닫힌 관점으로 유지 시키는 효과를 가진다. 한국어와 영어의 관점 변환 구문의 차이는 각 언어의 지속부사구의 어휘 목록의 전제(presupposition)의 차이로 설명된다. 본 논문은 영어의 지속부사구는 논항의 하위간격

  • PDF

한국어 어휘특성들이 기억폭에 미치는 효과 (The Effects of Korean Lexical Characteristics on Memory Span)

  • 박태진;박선희;김태호
    • 인지과학
    • /
    • 제17권1호
    • /
    • pp.15-27
    • /
    • 2006
  • 한국어 단어의 글자 수, 받침의 수와 위치, 합성어 여부가 기억폭에 미치는 효과를 검증하였다. 그 결과, 전반적으로 글자가 많은 단어일수록 기억폭이 작았으며, 두 글자 단어들에서 받침이 많을수록 기억폭이 더 작았고(기억폭에 대한 받침효과), 합성어보다 단일어의 기억폭이 더 컸다. 단어당 읽기 속도를 측정한 결과, 글자가 많은 단어일수록 속도가 느렸지만, 두 글자 단어들에서 뒷받침단어의 읽기 속도가 받침없는 단어, 앞받침단어 및 양받침단어보다 더 빨랐고(읽기 속도에 대한 말미 받침효과), 합성어보다 단일어의 읽기 속도가 더 빨랐다. 기억폭과 읽기 속도간에 관찰된 이러한 관계는 단어길이효과에 대한 음운루프설명과 잘 부합되지 않으며, 기억폭이 음운정보 뿐만 아니라 시각적 캐시에 표상되는 철자 정보의 영향을 받는다는 설명을 지지해준다.

  • PDF

감정 분류를 위한 한국어 감정 자질 추출 기법과 감정 자질의 유용성 평가 (A Korean Emotion Features Extraction Method and Their Availability Evaluation for Sentiment Classification)

  • 황재원;고영중
    • 인지과학
    • /
    • 제19권4호
    • /
    • pp.499-517
    • /
    • 2008
  • 본 논문에서는 한국어 감정 분류에 기반이 되는 감정 자질 추출의 효과적인 추출 방법을 제안하고 평가하여, 그 유용성을 보인다. 한국어 감정 자질 추출은 감정을 지닌 대표적인 어휘로부터 시작하여 확장할 수 있으며, 이와 같이 추출된 감정 자질들은 문서의 감정을 분류하는데 중요한 역할을 한다. 문서 감정 분류에 핵심이 되는 감정 자질의 추출을 위해서는 영어 단어 시소러스 유의어 정보를 이용하여 자질들을 확장하고, 영한사전을 이용하여 확장된 자질들을 번역하여 감정 자질들을 추출하였다. 추출된 한국어 감정 자질들을 평가하기 위하여, 이진 분류 기법인 지지 벡터 기계(Support Vector Machine)를 사용해서 한국어 감정 자질로 표현된 입력문서의 감정을 분류하였다. 실험 결과, 추출된 감정 자질을 사용한 경우가 일반적인 정보 검색에서 사용하는 내용어(Content Word) 기반의 자질을 사용한 경우보다 약 14.1%의 성능 향상을 보였다.

  • PDF

아동의 감성 함양을 위한 타이핑 교육 프로그램의 개발 (The Development of the Typing Education Program for Children's Sensibility)

  • 박판우;동영훈
    • 정보교육학회논문지
    • /
    • 제6권3호
    • /
    • pp.266-278
    • /
    • 2002
  • 본 논문은 감성어휘를 제시하는 타이핑 교육 프로그램을 개발하여 아동의 감성 함양에 도움을 주기 위한 것이다. 본 타이핑 교육 프로그램에서는 아동의 감성을 함양할 수 있는 의미 있는 낱말 즉, 국어사전에서 제공하는 형용사와 동요의 가사, 전래동요의 가사, 동시 중에서 모양이나 소리를 흉내내는 낱말을 무작위로 제시한다. 아동들이 제시되는 낱말을 타이핑하여 낱말들이 화면 위쪽에서 아래쪽으로 통과하는 제한된 시간 내에 일정한 점수를 얻으면 실행이 끝나도록 하는 게임형으로 설계하였으며, 게임을 통해 아동들의 흥미를 유발하고, 타이핑하는 동안 무의식적으로 의미 있는 낱말을 숙지하도록 하였다. 본 타이핑 교육 프로그램을 적용해본 결과 아동들이 의미 없는 낱말 연습보다는 의미 있는 낱말을 이용하여 보다 쉽게 숙지하게 되었으며, 학생들의 설문조사를 고찰한 결과 감성 함양에 도움이 되고 있음을 발견할 수 있었다.

  • PDF

C++ IDL 컴파일러 구현 (Implementation of C++ ID Compiler)

  • 박찬모;이준
    • 한국정보통신학회논문지
    • /
    • 제5권5호
    • /
    • pp.970-976
    • /
    • 2001
  • 본 논문에서는 IDL 정의를 입력받아 파싱하는 컴파일러의 전반부를 위해 OMG IDL 컴파일러를 사용하였다. 또한 ORB를 위해 omniORB3[1]를 사용했다. OMG IDL CFE는 IDL 정의를 입력받아 어휘 및 구문 분석을 한 후 AST 트리를 생성하며, 생성된 각 노드는 우리가 새로 추가한 BE_* 클래스의 인스턴스로 구성된다. IDL 컴파일러의 후반부는 AST의 각 노드를 반복자인 UTL_ScopeActiveIterator 클래스를 사용하여 반복적으로 각 순회하면서 해당하는 출력을 덤프한다. 이때 두개의 출력 파일을 생성토록 했다. 모든 코드 생성은 BE_produce.cc에서 시작되며, idl_global->root() 노드를 시작으로 하여 각 클래스에 해당 코드를 생성하는 dump* 함수를 호출하여 생성했다. 본 논문은 IDL 정의를 C++언어로 맵핑만을 실험했으며, 이것은 omniORB3에서 제공하는 IDL 컴파일러와 동일한 결과를 생성했으며, omniORB3[1] 환경에서 동작하는 변환된 C++ 코드임을 실험했다. 향후 IDL 컴파일러를 통한 성능 향상을 위해 마샬링 코드의 최적화를 할 수 있도록 하는 코드를 생성하는 문제에 관심을 가지고 있다.

  • PDF

다양한 웹 데이터를 이용한 특정 유기체의 단백질 상호작용 데이터베이스 개발 (Development of an Organism-specific Protein Interaction Database with Supplementary Data from the Web Sources)

  • 황두성
    • 정보처리학회논문지D
    • /
    • 제9D권6호
    • /
    • pp.1091-1096
    • /
    • 2002
  • 이 논문은 단백질 상호작용 데이터베이스 개발에 관해 기술한다. 개발된 시스템의 특징으로서는 첫째, 생물학자들의 직접적인 실험을 통해 얻어진 단백질 상호작용 및 유전인자 데이터를 제공한다. 둘째, 생물학적으로 관련 있는 다양한 형식의 데이터를 wrapper를 통해 광범위하게 분포된 웹사이트들로부터 추출한다. 셋째, 다양한 웹 데이터들 간의 어휘적, 의미적 이질성을 완화하기 위해 wrapper-mediator에 의한 계층적 모듈 구조를 이용하여 추출된 데이터는 통합 과정을 거친 후, 데이터베이스 저장 및 검색을 가능하게 하였다. 현재까지, 주어진 약 11,500 단백질들에 대해, 생물적으로 의미 있는 데이터를 약 40% 정도 데이터베이스 화 했다. 본 개발된 시스템은 프로티오믹스 연구에서 데이터 분석에 유용할 것으로 기대된다.

Word Spell: 외국어 학습자를 위한 단어 학습 방안, 연상 및 연음 효과를 중심으로 (Word Spell: Associative-Phonological Learning Method for Second Language Learners)

  • 홍원의;문성원;권가진
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권10호
    • /
    • pp.457-464
    • /
    • 2014
  • 외국어 단어를 학습하는 학습자는 새롭게 외운 단어를 가능한 오래 기억하기 원한다. 영어를 외국어로 학습하는 수요가 늘면서, 효과적인 영단어 암기 방안에 대한 관심 또한 꾸준히 증가하고 있다. 이러한 요구에 힘입어, 영단어 학습자의 단어 암기 효율을 높이기 위한 방안 및 학습 기기가 다수 제시되어 왔다. 본 연구에서는 특히 고급 영어 어휘를 암기하고자 하는 한국인 학습자를 대상으로 한 새로운 영어 단어 학습 기법을 소개하고 그 효과를 기존 사례와의 성능비교를 통해 성공적으로 검증하였다. 실험 결과로부터 본 방법을 통해 암기 과제를 수행한 학습자가 새로 암기한 단어들의 시간 지연에 따른 망각 정도가, 기존 방법을 따랐을 때보다 적음을 알 수 있었다. 본 연구가 영단어 학습자들이 보다 효과적으로 영단어를 학습할 수 있도록 도움이 될 것으로 기대한다.

연속된 수화 인식을 위한 자동화된 Coarticulation 검출 (Automatic Coarticulation Detection for Continuous Sign Language Recognition)

  • 양희덕;이성환
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권1호
    • /
    • pp.82-91
    • /
    • 2009
  • 수화 적출은 연속된 손 동작에서 의미 있는 수화 단어를 검출 및 인식하는 것을 말한다. 수화는 손의 움직임과 모양의 변화가 다양하기 때문에 수화 문장에서 수화를 적출하는 것은 쉬운 문제가 아니다. 특히, 자연스러운 수화 문장에는 의미 있는 수화, 수화가 아닌 손동작이 무작위로 발생한다. 본 논문에서는 CRF(Conditional Random Field)에 기반한 적응적 임계치 모델을 제안한다. 제한된 모델은 수화 어휘집에 정의된 수화 손동작과 수화가 아닌 손동작을 구별하기 위한 적응적 임계치 역할을 수행한다. 또한, 수화 적출 및 인식의 성능 향상을 위해 손 모양 기반 수화 인증기, 짧은 수화 적출기, 부사인(subsign) 추론기를 제안된 시스템에 적용하였다. 실험 결과, 제안된 방법은 연속된 수화 동작 데이타에서 88%의 적출률, 사전에 적출된 수화 동작 데이타에서 94%의 인식률을 보였으며, 적응적 임계치 모델, 짧은 수화 적출기, 손 모양 기반 수화 인증기, 부사인 추론기를 사용하지 않은 CRF 모델은 연속된 수화 동작 데이터에서 74%의 적출률, 사전에 적출된 수화 동작 데이타에서 90%의 인식률을 보였다.

주의집중 및 복사 작용을 가진 Sequence-to-Sequence 순환신경망을 이용한 제목 생성 모델 (Title Generation Model for which Sequence-to-Sequence RNNs with Attention and Copying Mechanisms are used)

  • 이현구;김학수
    • 정보과학회 논문지
    • /
    • 제44권7호
    • /
    • pp.674-679
    • /
    • 2017
  • 대용량의 텍스트 문서가 매일 만들어지는 빅데이터 환경에서 제목은 문서의 핵심 아이디어를 빠르게 집어내는데 매우 중요한 단서가 된다. 그러나 블로그 기사나 소셜 미디어 메시지와 같은 많은 종류의 문서들은 제목을 갖고 있지 않다. 본 논문에서는 주의집중 및 복사 작용을 가진 sequence-to-sequence 순환신경망을 사용한 제목 생성 모델을 제안한다. 제안 모델은 양방향 GRU(Gated Recurrent Unit) 네트워크에 기반 하여 입력 문장을 인코딩(encoding)하고, 입력 문장에서 자동 선별된 키워드와 함께 인코딩된 문장을 디코딩함으로써 제목 단어들을 생성한다. 93,631문서의 학습 데이터와 500문서의 평가 데이터를 가진 실험에서 주의집중 작용방법이 복사 작용방법보다 높은 어휘 일치율(ROUGE-1: 0.1935, ROUGE-2: 0.0364, ROUGE-L: 0.1555)을 보였고 사람이 정성평가한 지표는 복사 작용방법이 높은 성능을 보였다.