• 제목/요약/키워드: 객관적 문장

검색결과 43건 처리시간 0.03초

감정 표현구 단위 분류기와 문장 단위 분류기의 결합을 통한 주관적 문장 분류의 성능 향상 (Combining Sentimental Expression-level and Sentence-level Classifiers to Improve Subjective Sentence Classification)

  • 강인호
    • 정보처리학회논문지B
    • /
    • 제14B권7호
    • /
    • pp.559-566
    • /
    • 2007
  • 주관적 문장이란 주관적인 내용을 포함한 문장으로써 저자의 제품이나 사건에 대한 생각을 알 수 있다. 주관적 내용임을 나타내는 주관적인 표현은 문장 전반적으로 골고루 나타날 수도 있지만 일부 한정된 영역에서만 발견될 수도 있다. 따라서 보다 정확한 분류를 위해서는, 문장 전체를 고려하는 정보 외에 사실이나 감정을 표현하는 주관적 혹은 객관적 표현구 정보의 활용이 필요하다. 본 연구에서는 문장 전체를 이용한 분류 결과와 감정 표현구를 이용한 분류 결과를 결합하여 주/객관적 문장 분류기의 성능을 향상시키는 방법을 제안한다. 한 문장은 여러 개의 표현구를 가질 수 있어 복수개의 표현구 단위 결과를 얻게 되며 기계 학습을 응용하여 문장 단위 결과와 결합한다. 실험을 통한 결과, 표현구 단위 결과물 중 최대값을 가지는 두 가지 결과와 문장 전체를 이용한 결과를 합침으로써 2.5% 성능 향상된 79.7%의 정확률을 얻을 수 있었다.

LSA를 이용한 문장 상호 추천과 문장 성향 분석을 통한 문서 요약 (Document Summarization Using Mutual Recommendation with LSA and Sense Analysis)

  • 이동욱;백서현;박민지;박진희;정혜욱;이지형
    • 한국지능시스템학회논문지
    • /
    • 제22권5호
    • /
    • pp.656-662
    • /
    • 2012
  • 본 논문에서는 그래프기반 문장랭킹 방식인 문장 상호 추천과 문장의 주관, 객관 성향을 이용하는 문장 성향 분석을 혼합한 새로운 요약문 추출 방법에 대해서 기술한다. 문장 상호 추천에서는 문장을 단어벡터로 변환한 후에 LSA를 이용하여 문장과 문장 사이의 유사도 점수를 계산하였다. 이렇게 얻어진 유사도와 각 단어의 희귀도(Rarity Score)를 기반으로 문장과 문장 사이의 연결 강도를 정의하여, 그래프 기반 문장 랭킹 방식을 적용 하였다. 한편, 문장성향 분석에서는 주관, 객관 성향을 결정하기 위해서 기존의 Golden Standard 단어 성향 분류를 기반으로 워드넷을 확장하여 데이터베이스를 구축하였다. 이를 통해 각 단어들의 성향을 판단하고 단어들의 평균 성향을 문장의 전체 성향에 반영하여, 주관적 성향을 띄는 문장들을 선택하였다. 최종적으로 문장 상호 추천 결과와 문장 성향 분석 결과를 혼합하여 주어진 문서로부터 요약문을 추출하였다. 요약문 추출 기능의 객관적인 성능 평가를 위하여 추출된 요약문 토대로 한 분류게임을 실시하였고, 그 결과를 MS-Word에 포함된 문서 요약 기능과 비교함으로써, 제안한 모델의 효과성을 확인하였다.

유전자 알고리즘에 기반한 자연언어 문장의 정량적 질 평가 방법 (A Quantative Evaluation Method of the Quality of Natural Language Sentences based on Genetic Algorithm)

  • 양승현;김영섬
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권11호
    • /
    • pp.1372-1380
    • /
    • 1999
  • 본 논문에서는 자연언어 문장의 객관적 정량적인 질 측정 방법의 구축에 대해 설명하고, 이를 문장 퇴고 시스템의 사례에 적용해 본다. 문장의 질을 평가한다는 것은 본질적으로 주관적이고 정량화가 어려운 작업이기 때문에, 이 과정에서 질의 객관적 계량화가 가능한지 여부가 가장 중요한 문제가 된다. 이 논문에서는 이러한 문제를 해결하기 위해 유전자 알고리즘을 이용한 진화적 접근 방법을 통해 객관적이고 정량적인 질의 측정 공식을 유도하는 방법론을 제시하였다. 이 논문에서 제시한 방법론의 핵심은 간단히 말해서 사람이 행하는 정성적인 판단을, 이에 가장 근접하는 정량적 측정 체계로 전환시키는 것이라고 보면 된다. 이것을 위해 정량화 문제를 문장의 단순 언어 특징들의 변화값을 이용한 최적화 문제로 환원시키고, 다시 이 최적화 문제를 유전자 알고리즘을 이용해 해결함으로써 문제를 효과적으로 해결할 수 있었다. 실험 결과를 보면, 본 논문에서 제시한 최적화 방법은 주어진 훈련용 예제와 검증용 예제 중 각각 99.84%, 99.88%를 만족시키는 해를 찾아내었으므로 정량적 질 평가 공식의 유도에 매우 효과적임을 알 수 있었다. 또한 도출된 측정 공식을 이용해서 실제 퇴고 시스템 평가에 적용한 결과 문장 질의 측정에 매우 유용하게 이용될 수 있음을 알 수 있었다. 이와 같이 질의 정량적 평가가 가능하다는 사실이 갖는 또 한가지 중요한 의미는 최종 사용자의 구매 의사나 개발자의 공학적 의사 결정을 위한 객관적 성능 평가 자료의 제공에 이 방법이 유용하게 사용될 수 있다는 점이다.Abstract This paper describes a method of building a quantitative measure of the quality of natural language sentences, particularly produced by document revision systems. Evaluating the quality of natural language sentences is intrinsically subjective, so what is most important as to the evaluation is whether the quality can be measured objectively. To solve such problem of objective measurability, genetic algorithm, an evolutionary learning method, is employed in this paper. The underlying standpoint of this approach is that building the quality measures is a task of constructing a formulae that produces as close results as can to the qualitative decisions made by humans. For doing this, the problem of measurability has been simply reduced to an optimization problem using the change of the values of simple linguistic parameters found in sentences, and the reduced problem has been solved effectively by the genetic algorithm. Experimental result shows that the optimization task satisfied 99.84% and 99.88% of the given objectives for training and validation samples, respectively, which means the method is quite effective in constructing the quantitative measure of the quality of natural language sentences. The actual evaluation result of a revision system shows that the measure is useful to quantize the quality of sentences. Another important contribution of this measure would be to provide an objective performance evaluation data of natural language systems on a basis of which end-users and developers can make their decision to fit their own needs.

웹상에서의 퍼지추론을 이용한 서술식 평가 시스템 (The grade evaluation system applying the Fuzzy reasoning on Web)

  • 사공걸;김두완;정환묵
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2002년도 추계학술대회 및 정기총회
    • /
    • pp.455-458
    • /
    • 2002
  • 기존의 점수와 석차로서 학생을 평가하여 발생하는 문제점을 해결하기 위하여 서술식의 성적평가가 도입되고 있다. 그러나, 이 서술식으로 이루어지는 성적 평가는 업무를 증가시키고 또 교사의 주관적인 성적평가로 인해 성적처리의 일관성이 유지되기 어려운 문제점이 있다. 본 논문에서는 교사가 학생의 성적을 효과적으로 평가하기 위하여 퍼지 추론을 이용한 서술식 성적평가 시스템을 제안한다. 사용자(교사)로부터 수행평가요소의 결과와 과목의 최종적인 평가를 퍼지 추론에 적용하여 객관적인 성적평가를 한 후, 추론규칙의 적합도를 이용하여 성적평가 문장을 추출하여 서술식 평가 문장을 생성하도록 한다

주관적-객관적 수면시간 차이를 보이는 불면증 환자에서 일반적 불안에 비해 불면증 관련 자극으로 인한 뇌활성에 관한 기능적 자기공명영상 연구 (Functional Magnetic Resonance Imaging of Brain Reactivity to Insomnia-Related vs. General Anxiety-Inducing Stimuli in Insomnia Patients with Subjective-Objective Discrepancy of Sleep)

  • 김남범;이재준;조서은;강승걸
    • 수면정신생리
    • /
    • 제27권1호
    • /
    • pp.24-31
    • /
    • 2020
  • 목 적 : 주관적-객관적 수면시간의 차이는 불면증의 흔한 증상이자 주요한 유형이다. 본 연구는 주관적-객관적 수면시간 차이가 있는 불면증군, 주관적-객관적 수면시간 차이가 없는 불면증군, 건강대조군을 대상으로 전반적 불안-유발 자극에 대비하여 불면-관련 자극에 대한 뇌활성의 군간 차이가 있는지를 밝히고자 하였다. 방 법 : 모든 피험자들은 수면일기와 임상척도로 주관적 수면상태를, 수면다원검사와 활동기록기로 객관적 수면상태와 불면증 외의 수면장애를 확인하였다. 기능적 뇌영상 촬영동안 불면증-관련 문장 자극과 일반 불안-유발 문장자극을 피험자들에게 주어 유발되는 뇌활성의 세 군간 차이가 있는지를 비교하였다. 뇌활성은 전체 불면증군(주관적-객관적 수면시간의 차이 여부에 상관없이)과 건강대조군 두 군간에도 비교되었다. 결 과 : 주관적-객관적 수면시간 차이가 없는 불면증 군에 비해 차이가 있는 불면증 군에서 일반적 불안-유발 자극 대비 불면-관련 자극에 대해 우측 설전부와 보조운동영역에서 유의하게 증가된 blood oxygen level dependent (BOLD) 신호를 보였다. 또한, 같은 자극에 대해 통합 불면증군이 대조군 보다 좌측 앞 대상회 영역에서 유의하게 증가된 BOLD 신호를 보였다. 결 론 : 본 연구의 결과는 주관적-객관적 수면시간 차이를 가지는 불면증이 주관적-객관적 수면시간 차이가 없는 불면증에 비해 일반적 불안-유발 자극보다 불면-관련 자극에 대해 더 선택적인 집중과 불안을 가지고 증가된 뇌활성을 보인다는 결과로 수면상태 오지각이 증가된 불면증 자극에 선택적인 불안을 보임을 시사한다.

왜 수동구문이 학술적 전문어에서 특히 선호되고 있는가? (Warum werden die Passivkonstruktionen in den wissenschaftlichen Fachsprachen besonders bevorzugt?)

  • 강국진
    • 한국독어학회지:독어학
    • /
    • 제1집
    • /
    • pp.119-139
    • /
    • 1999
  • 일상어는 한 사회의 모든 구성원이 쉽게 이해할 수 있고 사회생활에서 아무런 어려움이 없이 상호간에 의사소통을 할 수 있는 언어의 표현 수단이다. 이에 반하여 학술어는 각각의 전문분야에서 사용되고 있는 언어의 한 형태이다. 학술적 텍스트에서 나타나는 일반적인 특징은 글이 객관적이면서도 명확하게 기술된다는 점이다. 일반독자는 자주 사용되는 전문어휘를 통하여 학술적 텍스트를 가장 쉽게 인식할 수 있으며, 또한 텍스트의 구성에 있어서도 학술적 텍스트가 일반 텍스트와 다르다는 사실을 알 수 있다. 이 외에도 독일어에서는 일정한 문법적 현상들이 학술적 전문어의 요소로서 사용되고 있다. 예를 들면 삼인칭 단수, 부사구, 명사화 경향, 기능동사구의 선호, 수동구문 등등이 있다. 일반적으로 학술적 전문어에 자주 사용되고 있는 문법적 요소 중의 하나가 수동구문이다. 학술어의 요소로서 수동구문이 갖는 언어적 기능은 다음과 같다: 1. 수동구문에서는 일반적으로 행위자가 언급되지 않음으로써 사실이 객관적으로 표현되며, 동시에 행위자의 억제는 언어의 경제성에 기여한다. 2. 경우에 따라서 행위자가 표현될 때, 직접적인 행위의 주체를 나타내는 von-전치사구 혹은 매개체나 원인을 표현하는 durch-전치사구를 통하여 사건을 정확하게 기술할 수 있다. 3. 테마-레마 구조와 관련하여 살펴보면 문장구성 혹은 문장연결을 위한 표현수단으로도 수동구문은 활용된다. 4. 수동구문을 사용함으로써 문체상의 단조롭고 획일적인 점을 회피할 수도 있다. 본 논문은 이와 같이 수동구문이 지니고 있는 언어적 기능을 살펴봄으로써 학술적 전문어의 특징과 전문어를 이해하는데 기여한다.

  • PDF

퍼지 의사결정 방법을 이용한 서술식 성적 평가 방법 (The Descriptive Grade Evaluation System using Fuzzy Decision Making Method)

  • 김두완;김성국;정환묵
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 춘계 학술대회 학술발표 논문집
    • /
    • pp.213-216
    • /
    • 2003
  • 본 논문에서는 교사가 학생의 성적을 효과적으로 평가하기 위하여 유사 척도 방법을 이용한 서술식 성적평가 시스템을 제안한다. 사용자(교사)로부터 수행평가요소의 결과와 과목의 최종적인 평가를 퍼지 추론에 적용하여 객관적인 성적평가를 한 후, 추론규칙과 실제 학생의 점수의 유사도를 이용하여 가장 높은 값의 성적평가 문장을 추출하여 서술식 평가 문장을 생성하도록 하였다.

  • PDF

단어 빈도와 유사도 분석 기반의 회의록 요약 시스템 설계 및 구현 (Design and Implementation of Minutes Summary System Based on Word Frequency and Similarity Analysis)

  • 허강호;양진우;김동현;복경수;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제19권10호
    • /
    • pp.620-629
    • /
    • 2019
  • 의사 결정을 위한 토론이나 토의의 내용을 객관적 요약하고 분류하는 자동화된 회의록 요약 시스템이 요구되고 있다. 본 논문은 기존에 사용되었던 회의록 요약 시스템을 보완할 수 있도록 word2vec 모델을 이용한 회의록 요약 시스템을 설계하고 구현한다. 제안 시스템은 형태소 분석 과정에서 불용어를 제거하고 문서에서 공통적인 의견을 가진 대표 문장을 추출하기 위해 추가로 word2vec 모델로 학습을 수행한다. 제안 시스템은 회의 과정에서 수집되는 문서를 분석하여 자동으로 분류하고 다양한 의견들 중 안건을 대표하는 대표 문장을 추출한다. 회의 진행자는 제안 시스템을 통해 회의에서 다뤄지는 모든 안건을 보다 빠르게 확인하고 관리할 수 있다. 제안 시스템은 대규모 토론이나 토의의 여러 가지 안건을 분석하여 대표 의견이 될 수 있는 문장을 요약하여 빠른 정확한 의사 결정을 지원한다.

SERI Test Suites '97 : 한국어 구문분석기 성능 평가용 문장 모음 (SERI Test Suites '97 : Test Sentences for Korean Syntactic Analyser)

  • 성원경;장명길;박재득;류법모;이현아;박동인
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.320-326
    • /
    • 1997
  • 자연어 정보처리 분야의 거듭된 발전은 다양한 언어처리 도구들의 출현을 가져왔다. 그러나 객관적인 성능 평가 기준의 부재로 인해, 개발된 도구들은 임의의 기준에 따라 평가될 수 밖에 없었다. 그 결과 성능 평가 결과는 평가자와 평가자가 제안한 기준에 따라 다를 수 밖에 없었고 따라서 평가 결과 자체 역시 설득력을 갖을 수가 없었다. 이와 같은 문제에 대한 해결책을 찾고자 하는 노력의 일환으로, 본 연구에서는 한국어처리 도구들 중 특히 구문분석기의 체계적이고도 객관적인 성능 평가를 목적으로 제작된 문장들과 관련 주석 정보들로 구성된 SERI Test Suites '97을 소개한다.

  • PDF

텍스트 기반 감정 추정을 위한 특징 추출 및 선택기법에 따른 성능 연구 (Study of the text analysis and feature selection performance for emotional inference)

  • 김한주;하헌석;박승현;윤성로
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.876-878
    • /
    • 2014
  • 인터넷 사용량이 급증하고 사용자들이 생성하는 데이터의 양이 증가함에 따라 사용자 데이터 분석은 객관적인 정보 탐색과 분석을 넘어 주관적인 감정을 분석하는 데까지 시도되고 있다. 이러한 감정 분석은 사업, 행정, 외교 등의 다양한 분야에 걸쳐 용용 될 수 있다. 본 연구에서는 텍스트 데이터를 주요 분석 대상으로 하여 문장 구성의 다양한 요소를 특징화하고, 특징화된 문장에 대해 다양한 서포트 벡터머신을 통한 학습을 시도함으로써 텍스트가 내포한 감정을 추측한다. 다양한 특징화 방법을 적용하되, 낮은 밀도가 될 것으로 추측되는 데이터 매트릭스의 차원 감쇄를 위해 정보엔트로피 기반의 특징 선택기법을 적용한다.