• 제목/요약/키워드: Sentence patterns

검색결과 128건 처리시간 0.02초

동형이의어 분별에 의한 한국어 의존관계 분석 (An Analysis of Korean Dependency Relation by Homograph Disambiguation)

  • 김홍순;옥철영
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권6호
    • /
    • pp.219-230
    • /
    • 2014
  • 의존관계 분석은 문장의 어절 간에 의존소-지배소를 결정하는 작업이다. 용언은 문형 및 하위범주화 정보의 선택제약에 의해 다른 어절과의 의존관계를 형성한다. 본 논문은 형태소 분석 단계에서 동형이의어 분별된 용언의 문형을 이용하여 용언의 의존관계를 분석하는 방법을 제안한다. 특히, 형태소분석 단계에서 품사 및 동형이의어 태깅을 위해 사용하는 단계별 전이모델의 학습사전을 재활용하여 {명사+격조사, 용언} 간의 의존관계를 확정하는 방안을 제안하고 그의 정확률 및 영향을 분석한다. 동형이의어가 부착되고 의존관계로 변경된 21개의 세종구문분석말뭉치를 이용하여 실험한 결과, 동형이의어 분별된 의존관계 분석 정확률이 80.38%로, 동형이의어가 분별되지 않은 의존관계분석에 비해 0.42%의 정확률 향상이 있었으며, 유의수준 1%의 검정통계량 Z는 ${\mid}Z{\mid}=4.63{\geq}z_{0.01}=2.33$으로 동형이의어 분별이 의존관계 분석에 영향이 있음을 보였다. 또한, 단계별 전이모델이 의존관계 분석 정확률에 약 7.14% 영향을 미치는 것을 알 수 있었다.

이미지 캡션 생성을 위한 심층 신경망 모델의 설계 (Design of a Deep Neural Network Model for Image Caption Generation)

  • 김동하;김인철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권4호
    • /
    • pp.203-210
    • /
    • 2017
  • 본 논문에서는 이미지 캡션 생성과 모델 전이에 효과적인 심층 신경망 모델을 제시한다. 본 모델은 멀티 모달 순환 신경망 모델의 하나로서, 이미지로부터 시각 정보를 추출하는 컨볼루션 신경망 층, 각 단어를 저차원의 특징으로 변환하는 임베딩 층, 캡션 문장 구조를 학습하는 순환 신경망 층, 시각 정보와 언어 정보를 결합하는 멀티 모달 층 등 총 5 개의 계층들로 구성된다. 특히 본 모델에서는 시퀀스 패턴 학습과 모델 전이에 우수한 LSTM 유닛을 이용하여 순환 신경망 층을 구성하며, 캡션 문장 생성을 위한 매 순환 단계마다 이미지의 시각 정보를 이용할 수 있도록 컨볼루션 신경망 층의 출력을 순환 신경망 층의 초기 상태뿐만 아니라 멀티 모달 층의 입력에도 연결하는 구조를 가진다. Flickr8k, Flickr30k, MSCOCO 등의 공개 데이터 집합들을 이용한 다양한 비교 실험들을 통해, 캡션의 정확도와 모델 전이의 효과 면에서 본 논문에서 제시한 멀티 모달 순환 신경망 모델의 높은 성능을 확인할 수 있었다.

자가음성 모니터링을 응용한 가창 프로그램이 인공와우이식 아동의 억양과 음고 변화에 미치는 영향 (Effects of a singing program using self-voice monitoring on the intonation and pitch production change for children with cochlear implants)

  • 김성경;김수지
    • 말소리와 음성과학
    • /
    • 제12권1호
    • /
    • pp.75-83
    • /
    • 2020
  • 본 연구는 인공와우아동을 대상으로 자가음성 모니터링(self-voice monitoring)을 응용한 가창 프로그램을 시행하여 억양의 개선과 음고 산출의 변화에 미치는 영향을 알아보기 위함이다. 연구대상자는 모집된 19명의 아동 중 참여기준을 충족하고 본인 및 보호자가 자발적인 참여 의사를 표현한 7명이 최종으로 선정되었다. 연구자는 CI 집단과 비교하기 위하여 같은 연령의 건청 아동 6명을 모집하였다. 자가음성 모니터링을 응용한 가창은 노래를 녹음하여 들어보고(listen), 음성의 음고 진행방향과 숨쉬기 구간 및 음질을 확인한(explore) 다음, 목소리를 수정하여 의도한 대로 재산출하는(reproduce) 세 단계로 구성되어 있다. 데이터는 문장과 노래로 나누어 측정하였다. 문장은 발화시간과 억양 기울기 및 산출 음고의 주파수 변화, 노래는 프레이즈(phrase) 구간 내 평균 음고의 주파수의 데이터를 수집하여 선율윤곽과 산출 주파수 범위를 측정한 후 건청집단과 비교하였다. 연구 결과 문장 분석에서 인공와우 아동 집단의 사후검사 시 의문문의 문미 2음절의 억양 기울기 및 패턴이 건청 아동과 같이 상행하는 윤곽으로 변화되었으며, 노래 데이터에서는 음고의 도약 및 산출 음고의 주파수 범위가 증가하였다. 이러한 결과는 인공와우 아동을 대상으로 한 자가음성 모니터링을 응용한 가창 프로그램이 억양의 개선과 음고 산출 정확도의 효과적인 중재방안이 될 수 있으며 이를 위한 지속적인 연구가 필요하다는 것을 시사한다.

휴지 단위와 호흡 단위의 실현 양상 연구 (Study on the realization of pause groups and breath groups)

  • 유도영;신지영
    • 말소리와 음성과학
    • /
    • 제12권1호
    • /
    • pp.19-31
    • /
    • 2020
  • 이 연구의 목적은 성인 화자의 휴지 단위와 호흡 단위의 실현 양상을 관찰하여, 이것이 인지적 차이나 사회 언어적 변수 간 차이를 어떻게 반영하고 있는지 고찰하는 것이다. 이러한 차이를 고찰하기 위해 과제, 세대, 성별에 따른 발화 길이와 호흡 단위의 실현을 살펴보았다. 이를 위해 청·장년층 남녀 화자 48명의 문단 낭독 발화와 자유 발화를 분석하였다. 과제와 성별 변수는 휴지 단위와 호흡 단위 실현에 모두 영향을 주었다. 발화 길이는 낭독 발화에서, 여성의 발화에서 더 길었고, 호흡 단위의 길이는 자유 발화와 남성의 발화에서 더 길게 나타났다. 한편 세대 변수는 발화 길이 실현에는 영향을 주지 못했지만, 음절 수와 어절 수 실현에는 영향을 주었다. 발화 과제에 따른 차이는 인지적 부담량을 반영한다. 발화 계획이 빈번하게 이뤄져야 하는 자유 발화는 상대적으로 더 짧은 발화 길이를 보인다. 호흡 단위의 길이가 낭독 발화에서 더 짧았던 이유는 낭독 발화의 문장 길이에 영향을 받은 것이다. 성별에 따른 차이는 남성과 여성의 발화 내 휴지 패턴 차이에서 기인하였다. 호흡 단위의 경우 남성이 여성보다 더 긴 길이를 보였는데, 이는 남성과 여성의 폐활량 차이에서 비롯한 것으로 보인다. 세대는 음절 수와 어절 수 실현에만 영향을 주었는데, 이는 세대 간 발화속도 차이에서 기인한 결과로 해석할 수 있다.

4세 말소리발달 선별검사 개발과 한국어말소리분석도구(Korean Speech Sound Analysis Tool, KSAT)의 활용 (Developing the speech screening test for 4-year-old children and application of Korean speech sound analysis tool (KSAT))

  • 김수진;장기완;장문수
    • 말소리와 음성과학
    • /
    • 제16권1호
    • /
    • pp.49-55
    • /
    • 2024
  • 본 연구는 4세 아동에 대한 말소리발달 평가를 위해 세 문장 따라말하기 선별검사를 개발하고 또래와 비교할 수 있는 규준을 제공하기 위한 것이다. 이를 위해 4세 전반과 후반 각각 24명씩 총 48명의 아동에게 선별검사를 실시하였다. 선별검사 결과는 기존의 말소리장애 평가 검사 결과와 .7의 상관을 보였다. 선별검사를 통해 구한 음운발달 지표와 오류패턴에서 4세 전반과 후반으로 나눈 두 집단에 차이가 있는지 비교하였다. 후반 아동의 발달지표가 높은 것으로 나왔지만 통계적으로 유의한 차이는 없었다. 모든 분석은 한국어말소리분석도구(Korean Speech Sound Analysis Tool, KSAT)를 사용하였으며, 자동분석 결과와 임상가의 수동분석 내용을 비교하였다. 자동분석과 수동분석의 오류패턴분석 일치도는 93.63%였다. 본 연구의 의의는 유도 문장수준에서 세 문장 따라말하기 선별검사의 4세 아동의 말소리 규준을 제시했다는 것과 KSAT의 임상과 연구 현장에서 적용 가능성을 검토하였다는 것이다.

한국사상사에서의 묵가(墨家) 비판 - 벽리단론(闢異端論)의 전개 양상을 중심으로 - (The Critic on Mohism in the History of Korean Thoughts Centered on the Theory of Rejecting Heterodoxy)

  • 윤무학
    • 한국철학논집
    • /
    • 제29호
    • /
    • pp.89-123
    • /
    • 2010
  • 이 글은 선유(先儒)들의 묵가에 대한 비판을 개괄하고, 이를 전제로 하여 고려말부터 시작하여 조선조 후기에 이르는 묵가 비판의 전개 양상을 고찰한 것이다. 우리나라 고려 이전의 문헌에서는 묵가나 묵자를 비롯한 제자백가를 명시적으로 배척한 사례가 보이지 않는다. 여말선초에 이르면 성리학의 수용과 더불어 맹자의 벽이단론의 관점이 부각되기 시작하면서 양주와 묵적에 대한 비판을 전제로 불교와 노자를 배척하기 시작하였다. 조선조 지식인들의 묵가에 대한 이해와 비판 양상의 특징은 묵가의 이념 자체에 대한 비판보다는 주로 다른 이념이나 부조리에 대한 비판의 도구로 활용되었다는 것이다. 여기에는 여말선초의 불교와 노자, 중후기의 문장학(과거학), 서학(천주교), 나아가 관료들의 부패 등이 포괄된다. 내용면에서 본다면, 묵가의 십대 주장 가운데 「겸애」와 「절용」(절장, 비악)에 대한 비판이 주를 이루고 있으며, 조선 중후기에 이르면서 「명귀(明鬼)」와 「천지(天志)」에 대한 비판이 포함되고 있다. 주목할 만한 점은 중국사상사에서와 마찬가지로 침략전쟁을 반대하는 평화 이념이 반영된 「비공(非攻)」이나 운명론을 부정하는 「비명(非命)」에 대한 비판은 보이지 않는다는 것이다. 이것은 유가의 인문주의적이고 현실주의적 측면에서 볼 때 적극적으로 비판할 여지가 없었던 데 연유하는 것으로 생각된다. 한편 묵가 이념과는 별도로 묵자 개인의 묵수(墨守)와 관련된 행위에 대해서는 대체로 긍정적인 평가를 하고 있다. 또한 후기에 이르면서 묵자서는 이념서가 아니라 유교 경전 내용을 고증하기 위한 사료로서 활용되고 있음을 확인할 수 있다.

뉴럴 텐서 네트워크 기반 주식 개별종목 지식개체명 추출 방법에 관한 연구 (A Study on Knowledge Entity Extraction Method for Individual Stocks Based on Neural Tensor Network)

  • 양윤석;이현준;오경주
    • 지능정보연구
    • /
    • 제25권2호
    • /
    • pp.25-38
    • /
    • 2019
  • 정보화 시대의 넘쳐나는 콘텐츠들 속에서 사용자의 관심과 요구에 맞는 양질의 정보를 선별해내는 과정은 세대를 거듭할수록 더욱 중요해지고 있다. 정보의 홍수 속에서 사용자의 정보 요구를 단순한 문자열로 인식하지 않고, 의미적으로 파악하여 검색결과에 사용자 의도를 더 정확하게 반영하고자 하는 노력이 이루어지고 있다. 구글이나 마이크로소프트와 같은 대형 IT 기업들도 시멘틱 기술을 기반으로 사용자에게 만족도와 편의성을 제공하는 검색엔진 및 지식기반기술의 개발에 집중하고 있다. 특히 금융 분야는 끊임없이 방대한 새로운 정보가 발생하며 초기의 정보일수록 큰 가치를 지녀 텍스트 데이터 분석과 관련된 연구의 효용성과 발전 가능성이 기대되는 분야 중 하나이다. 따라서, 본 연구는 주식 관련 정보검색의 시멘틱 성능을 향상시키기 위해 주식 개별종목을 대상으로 뉴럴 텐서 네트워크를 활용한 지식 개체명 추출과 이에 대한 성능평가를 시도하고자 한다. 뉴럴 텐서 네트워크 관련 기존 주요 연구들이 추론을 통해 지식 개체명들 사이의 관계 탐색을 주로 목표로 하였다면, 본 연구는 주식 개별종목과 관련이 있는 지식 개체명 자체의 추출을 주목적으로 한다. 기존 관련 연구의 문제점들을 해결하고 모형의 실효성과 현실성을 높이기 위한 다양한 데이터 처리 방법이 모형설계 과정에서 적용되며, 객관적인 성능 평가를 위한 실증 분석 결과와 분석 내용을 제시한다. 2017년 5월 30일부터 2018년 5월 21일 사이에 발생한 전문가 리포트를 대상으로 실증 분석을 진행한 결과, 제시된 모형을 통해 추출된 개체명들은 개별종목이 이름을 약 69% 정확도로 예측하였다. 이러한 결과는 본 연구에서 제시하는 모형의 활용 가능성을 보여주고 있으며, 후속 연구와 모형 개선을 통한 성과의 제고가 가능하다는 것을 의미한다. 마지막으로 종목명 예측 테스트를 통해 본 연구에서 제시한 학습 방법이 새로운 텍스트 정보를 의미적으로 접근하여 관련주식 종목과 매칭시키는 목적으로 사용될 수 있는 가능성을 확인하였다.

Bi-LSTM 기반의 한국어 감성사전 구축 방안 (KNU Korean Sentiment Lexicon: Bi-LSTM-based Method for Building a Korean Sentiment Lexicon)

  • 박상민;나철원;최민성;이다희;온병원
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.219-240
    • /
    • 2018
  • 감성사전은 감성 어휘에 대한 사전으로 감성 분석(Sentiment Analysis)을 위한 기초 자료로 활용된다. 이와 같은 감성사전을 구성하는 감성 어휘는 특정 도메인에 따라 감성의 종류나 정도가 달라질 수 있다. 예를 들면, '슬프다'라는 감성 어휘는 일반적으로 부정의 의미를 나타내지만 영화 도메인에 적용되었을 경우 부정의 의미를 나타내지 않는다. 그렇기 때문에 정확한 감성 분석을 수행하기 위해서는 특정 도메인에 알맞은 감성사전을 구축하는 것이 중요하다. 최근 특정 도메인에 알맞은 감성사전을 구축하기 위해 범용 감성 사전인 오픈한글, SentiWordNet 등을 활용한 연구가 진행되어 왔으나 오픈한글은 현재 서비스가 종료되어 활용이 불가능하며, SentiWordNet은 번역 간에 한국 감성 어휘들의 특징이 잘 반영되지 않는다는 문제점으로 인해 특정 도메인의 감성사전 구축을 위한 기초 자료로써 제약이 존재한다. 이 논문에서는 기존의 범용 감성사전의 문제점을 해결하기 위해 한국어 기반의 새로운 범용 감성사전을 구축하고 이를 KNU 한국어 감성사전이라 명명한다. KNU 한국어 감성사전은 표준국어대사전의 뜻풀이의 감성을 Bi-LSTM을 활용하여 89.45%의 정확도로 분류하였으며 긍정으로 분류된 뜻풀이에서는 긍정에 대한 감성 어휘를, 부정으로 분류된 뜻풀이에서는 부정에 대한 감성 어휘를 1-gram, 2-gram, 어구 그리고 문형 등 다양한 형태로 추출한다. 또한 다양한 외부 소스(SentiWordNet, SenticNet, 감정동사, 감성사전0603)를 활용하여 감성 어휘를 확장하였으며 온라인 텍스트 데이터에서 사용되는 신조어, 이모티콘에 대한 감성 어휘도 포함하고 있다. 이 논문에서 구축한 KNU 한국어 감성사전은 특정 도메인에 영향을 받지 않는 14,843개의 감성 어휘로 구성되어 있으며 특정 도메인에 대한 감성사전을 효율적이고 빠르게 구축하기 위한 기초 자료로 활용될 수 있다. 또한 딥러닝의 성능을 높이기 위한 입력 자질로써 활용될 수 있으며, 기본적인 감성 분석의 수행이나 기계 학습을 위한 대량의 학습 데이터 세트를 빠르게 구축에 활용될 수 있다.