• 제목/요약/키워드: sentence analysis

검색결과 490건 처리시간 0.025초

ISAAC :문장분석용 통합시스템 및 사용자 인터페이스 (ISAAC : An Integrated System with User Interface for Sentence Analysis)

  • 김곤;김민찬;배재학;이종혁
    • 정보처리학회논문지B
    • /
    • 제11B권1호
    • /
    • pp.107-116
    • /
    • 2004
  • 본 논문에서 소개할 ISAAC(An Interface for Sentence Analysis & Abstraction with Cogitation)은 문장분석용 통합 사용자 인터페이스를 제공한다. 이 시스템에는 문장 분석 시 필요한 다양한 언어학적 도구와 자원이 통합되어 있다. 문장분석에 가용한 도구와 자원은 대부분 독립적으로 개발 축적된 것들이다. 이들을 활용한 문장분석의 경우, 단계적으로 얻어지는 문장분석 정보들을 문장분석가가 관리, 처리하기에는 어려움이 있다. 이에 본 논문에서는 가용 도구와 자원들을 통합하고, 각 기능들에 대해 사용자 중심의 일관된 인터페이스를 ISAAC이 제공하도록 하였다. 문장분석 처리과정은 총 14단계로 나눌 수 있었다. ISAAC에서는 이 단계들을 독립적인 기능을 가지는 4개의 모듈 - $\cicled1$문장의 통사구조 분석, $\cicled2$원형어휘 판별, $\cicled3$Roget 시소러스 범주정보 검색, $\cicled4$OfN(Ontology for Narratives) 범주정보 검색 - 로 처리하게 되어 있다. 따라서, ISAAC을 활용한 문장분석의 경우, 전체 14단계의 처리과정이 4개의 단계로 줄어든다. 이것은 문장분석가의 작업효율을 3.5배 이상 향상시킨 수 있음을 의미한다. 뿐만 아니라, 각 단계별 처리에 필요한 지루한 정보기록 이전작업을 ISAAC이 담당하게 함으로써 문장분석정보의 정확성도 높일 것으로 예상할 수 있다.

억양의 근접복사 유형화를 이용한 감정음성의 음향분석 (An acoustical analysis of emotional speech using close-copy stylization of intonation curve)

  • 이서배
    • 말소리와 음성과학
    • /
    • 제6권3호
    • /
    • pp.131-138
    • /
    • 2014
  • A close-copy stylization of intonation curve was used for an acoustical analysis of emotional speech. For the analysis, 408 utterances of five emotions (happiness, anger, fear, neutral and sadness) were processed to extract acoustical feature values. The results show that certain pitch point features (pitch point movement time and pitch point distance within a sentence) and sentence level features (pitch range of a final pitch point, pitch range of a sentence and pitch slope of a sentence) are affected by emotions. Pitch point movement time, pitch point distance within a sentence and pitch slope of a sentence show no significant difference between male and female participants. The emotions with high arousal (happiness and anger) are consistently distinguished from the emotion with low arousal (sadness) in terms of these acoustical features. Emotions with higher arousal show steeper pitch slope of a sentence. They have steeper pitch slope at the end of a sentence. They also show wider pitch range of a sentence. The acoustical analysis in this study implies the possibility that the measurement of these acoustical features can be used to cluster and identify emotions of speech.

통계 정보와 유전자 학습에 의한 최적의 문장 분할 위치 결정 (Determination of an Optimal Sentence Segmentation Position using Statistical Information and Genetic Learning)

  • 김성동;김영택
    • 전자공학회논문지C
    • /
    • 제35C권10호
    • /
    • pp.38-47
    • /
    • 1998
  • 실용적인 기계번역 시스템을 위한 구문 분석은 긴 문장의 분석을 허용하여야 하는데 긴 문장의 분석은 높은 분석의 복잡도 때문에 매우 어려운 문제이다. 본 논문에서는 긴 문장의 효율적인 분석을 위해 문장을 분할하는 방법을 제안하며 통계 정보와 유전자 학습에 의한 최적의 문장 분할 위치 결정 방법을 소개한다. 문장 분할 위치의 결정은 분할 위치가 태그된 훈련 데이타에서 얻어진 어휘 문맥 제한 조건을 이용하여 입력문장의 분할 가능 위치를 결정하는 부분과 여러 개의 분할 가능 위치 중에서 안전한 분할을 보장하고 보다 많은 분석의 효율 향상을 얻을 수 있는 최적의 분할 위치를 학습을 통해 선택하는 부분으로 구성된다. 실험을 통해 제안된 문장 분할 위치 결정 방법이 안전한 분할을 수행하며 문장 분석의 효율을 향상시킴을 보인다.

  • PDF

ELMo 임베딩 기반 문장 중요도를 고려한 중심 문장 추출 방법 (Method of Extracting the Topic Sentence Considering Sentence Importance based on ELMo Embedding)

  • 김은희;임명진;신주현
    • 스마트미디어저널
    • /
    • 제10권1호
    • /
    • pp.39-46
    • /
    • 2021
  • 본 연구는 뉴스 기사에서 기사문을 구성하는 문장별 중요도를 고려하여 요약문을 추출하는 방법에 관한 것으로 문장 중요도에 영향을 주는 특성으로 중심 문장(Topic Sentence)일 확률, 기사 제목 및 다른 문장과의 유사도, 문장 위치에 따른 가중치를 추출하여 문장 중요도를 계산하는 방법을 제안한다. 이때, 중심 문장(Topic Sentence)은 일반 문장과는 구별되는 특징을 가질 것이라는 가설을 세우고, 딥러닝 기반 분류 모델을 학습시켜 입력 문장에 대한 중심 문장 확률값을 구한다. 또한 사전학습된 ELMo 언어 모델을 활용하여 문맥 정보를 반영한 문장 벡터값을 기준으로 문장간 유사도를 계산하여 문장 특성으로 추출한다. LSTM 및 BERT 모델의 중심 문장 분류성능은 정확도 93%, 재현율 96.22%, 정밀도 89.5%로 높은 분석 결과가 나왔으며, 이렇게 추출된 문장 특성을 결합하여 문장별 중요도를 계산한 결과, 기존 TextRank 알고리즘과 비교하여 중심 문장 추출 성능이 10% 정도 개선된 것을 확인할 수 있었다.

An Acoustic Study of English Sentence Stress and Rhythm Produced by Korean Speakers

  • Kim, Ok-Young
    • 음성과학
    • /
    • 제14권1호
    • /
    • pp.121-135
    • /
    • 2007
  • The purpose of this paper is to examine how Korean speakers realize English stress and rhythm at the sentence level, and investigate what different acoustic characteristics of English sentence stress and rhythm Korean speakers have, compared with those of American English speakers. Stressed words in the sentence were analyzed in terms of duration, fundamental frequency, and intensity of the stressed vowel in the word with neutral stress and with emphatic stress, respectively. According to the results, when the words had emphatic stress, both Koreans' and Americans' F0 and intensity of the stressed vowel were higher than those with neutral stress. Korean speakers of English realized the sentence stress with shorter vowel duration and higher F0 than American English speakers when the words had emphatic stress. The analysis of the timing of the sentence with increased unstressed syllables showed that both Americans and Koreans produced the sentence with longer duration as the number of unstressed syllables increased. However, the duration of unstressed syllables between stressed syllables by Koreans was longer than that by Americans. Americans seemed to produce unstressed syllables between stressed syllables faster than Koreans for regular intervals of stressed syllables. This analysis implies that if there are more unstressed syllables between stressed syllables, Koreans might produce unstressed syllables and the whole sentence with longer duration.

  • PDF

수학 수업 발문유형 분석 및 대안 탐색 - 신임 교사 사례 연구 - (An Analysis on the pattern of questioning sentence - A case study for the newly appointed teachers -)

  • 강완;장윤영;정선혜
    • 한국수학교육학회지시리즈C:초등수학교육
    • /
    • 제14권3호
    • /
    • pp.293-302
    • /
    • 2011
  • 이 연구는 2년차 신임 교사의 사례 연구를 통해 수학수업에 대한 신임교사의 발문 유형의 특성을 분석하고 그에 따른 대안을 탐색하기 위한 것이다. 연구 결과, 확인을 위한 발문이 가장 많았으며(69%), 이해를 위한 발문(25%), 성찰을 위한 발문(6%) 순이었고, 창의성 신장을 위한 발문은 하지 않는 것을 알 수 있었다. 더불어 기존 연구를 바탕으로 신임교사의 발문과 관련된 대안적인 창의성 신장을 위한 발문을 제안해 보았다.

수학 문장제의 문장 구조와 해석상의 오류 분석 -초등학교 2학년을 중심으로- (An Analysis on Sentence Structures and Interpretation Errors in Word Problems in Mathematics -Focussing on the 2nd grade elementary students-)

  • 이병옥;안병곤
    • 한국초등수학교육학회지
    • /
    • 제12권2호
    • /
    • pp.185-204
    • /
    • 2008
  • 본 연구에서는 초등학교 2학년 수학 교과서에 제시된 문장제의 문장 구조와 해석상의 오류를 분석하고, 문장 구조가 해석상의 오류에 어떻게 관여하는지를 알아보았다. 이를 위해 초등학교 2학년 수학 교과서에 제시된 문장제 168문항의 문장 구조와 초등학교 2학년 160명의 학생을 대상으로 수학 문장제 해결과정에서의 오류경향을 분석한 결과, 문장제의 문장 구조는 쉽고 단순한 낱말이나 어휘를 반복적으로 사용하고 있으며, 과일이나 책, 사람 수 등의 특정한 실생활 소재를 반복적으로 많이 사용되고 있었다. 문장제의 오류 경향은 문장 해석상의 오류가 전체 오류의 51.56%로 계산상의 오류 39.20%보다 높았다. 이는 역연산(逆演算) 유형, 문장의 길이, 문제에 사용된 숫자의 개수 등이 해석상의 오류에 관여하는 것으로 분석되었다. 따라서 문장제의 문장을 구성할 때 교사의 관점에서 벗어나 학생들의 입장을 고려하는 것이 매우 중요하며, 학생들에게 기초적인 문장 해석 지도가 필요하다는 것을 알 수 있었다.

  • PDF

온라인 동향 분석을 위한 이벤트 문장 추출 방안 (Event Sentence Extraction for Online Trend Analysis)

  • 윤보현
    • 한국콘텐츠학회논문지
    • /
    • 제12권9호
    • /
    • pp.9-15
    • /
    • 2012
  • 기존의 이벤트 문장 추출에 관한 연구는 학습단계에서 3W 자질을 학습하지 않고, 추출단계에서 3W 자질의 존재여부에 따른 규칙만을 적용하여 이벤트 문장을 추출하였다. 본 논문에서는 온라인 동향 분석을 위해 학습단계에서 3W 자질을 추출하고 가중치를 계산하고, 추출단계에서 3W 자질을 반영하는 문장 가중치 기반 이벤트 문장 추출 방안을 제시한다. 실험결과, 자질필터링은 $TF{\times}IDF$ 가중치 기법을 사용한 상위 30% 자질만을 사용하는 것이 가장 우수한 결과를 보였다. 공공이슈 분야인 부동산 도메인에서 문장 가중치 기반 방법은 3W 자질 중 who와 when 자질이 가장 영향을 많이 미치는 것으로 나타났다. 아울러 다른 기계학습 방법과의 비교하여 공공이슈 분야인 부동산 도메인에서 문장 가중치 기반 이벤트 문장 추출 방법이 가장 좋은 성능을 보였다.

인허가관련 설계품질검토 자동화를 위한 건축법규 문장 관계논리에 관한 연구 (Relational Logic Definition of Articles and Sentences in Korean Building Code for the Automated Building Permit System)

  • 김현정;이진국
    • 한국CDE학회논문집
    • /
    • 제21권4호
    • /
    • pp.433-442
    • /
    • 2016
  • This paper aims to define the relational logic of in-between code articles as well as within atomic sentences in Korean Building Code, as an intermediate research and development process for the automated building permit system of Korea. The approach depicted in this paper enables the software developers to figure out the logical relations in order to compose KBimCode and its databases. KBimCode is a computer-readable form of Korean Building Code sentences based on a logic rule-based mechanism. Two types of relational logic definition are described in this paper. First type is a logic definition of relation between code sentences. Due to the complexity of Korean Building code structure that consists of decree, regulation or ordinance, an intensive analysis of sentence relations has been performed. Code sentences have a relation based on delegation or reference each other. Another type is a relational logic definition in a code sentence based on translated atomic sentence(TAS) which is an explicit form of atomic sentence(AS). The analysis has been performed because the natural language has intrinsic ambiguity which hinders interpreting embedded meaning of Building Code. Thus, both analyses have been conducted for capturing accurate meaning of building permit-related requirements as a part of the logic rule-based mechanism.

Out-of-Vocabulary 단어에 강건한 병렬 Tri-LSTM 문장 임베딩을 이용한 감정분석 (Sentiment Analysis using Robust Parallel Tri-LSTM Sentence Embedding in Out-of-Vocabulary Word)

  • 이현영;강승식
    • 스마트미디어저널
    • /
    • 제10권1호
    • /
    • pp.16-24
    • /
    • 2021
  • word2vec 등 기존의 단어 임베딩 기법은 원시 말뭉치에 출현한 단어들만을 대상으로 각 단어를 다차원 실수 벡터 공간에 고정된 길이의 벡터로 표현하기 때문에 형태론적으로 풍부한 표현체계를 가진 언어에 대한 단어 임베딩 기법에서는 말뭉치에 출현하지 않은 단어들에 대한 단어 벡터를 표현할 때 OOV(out-of-vocabulary) 문제가 빈번하게 발생한다. 문장을 구성하는 단어 벡터들로부터 문장 벡터를 구성하는 문장 임베딩의 경우에도 OOV 단어가 포함되었을 때 문장 벡터를 정교하게 구성하지 못하는 문제점이 있다. 특히, 교착어인 한국어는 어휘형태소와 문법형태소가 결합되는 형태론적 특성 때문에 미등록어의 임베딩 기법은 성능 향상의 중요한 요인이다. 본 연구에서는 단어의 형태학적인 정보를 이용하는 방식을 문장 수준으로 확장하고 OOV 단어 문제에 강건한 병렬 Tri-LSTM 문장 임베딩을 제안한다. 한국어 감정 분석 말뭉치에 대해 성능 평가를 수행한 결과 한국어 문장 임베딩을 위한 임베딩 단위는 형태소 단위보다 문자 단위가 우수한 성능을 보였으며, 병렬 양방향 Tri-LSTM 문장 인코더는 86.17%의 감정 분석 정확도를 달성하였다.