• 제목/요약/키워드: 선형어휘

검색결과 9건 처리시간 0.026초

예측신경회로망 모델 음성인식기의 변별력있는 학습 알고리즘 (A Discriminative Training Algorithm for Speech Recognizer Based on Predictive Neural Network Models)

  • 나경민
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1993년도 학술논문발표회 논문집 제12권 1호
    • /
    • pp.242-246
    • /
    • 1993
  • 예측신경회로망 모델은 다층 퍼셉트론을 연속되는 음성특징 벡터간의 비선형예측기로 사용하는 동적인 음성인식 모델이다. 이 모델은 음성의 동적인 특성을 인식에 이용하고 연속음성인식으로의 확장이 용이한 우수한 인식 모델이다. 그러나, 예측신경회로망 모델은 음운학적으로 유사한 음성구간에서의 변별력이 낮다는 문제점이 있다. 그것은 기존의 학습 알고리즘이 다른 어휘와의 거리는 고려하지 않고 대상어휘의 예측오차만 최소화시키기 때문이다. 따라서, 본 논문에서는 직접 인식오차를 최소화시키는 GPD알고리즘에 의해 유사어휘간의 거리를 고려하는 변별력있는 학습 알고리즘을 제안한다.

  • PDF

영화의 흥행 성과와 리뷰 감정어휘와의 관계 분석 (Relationship Analysis between the Box Office Performance and Sentimental Words in Movie Review)

  • 문성민;하효지;이경원
    • 디자인융복합연구
    • /
    • 제14권4호
    • /
    • pp.1-16
    • /
    • 2015
  • 본 연구는 영화 리뷰 값이 1000개 이상인 673개의 영화를 대상으로 영화 장르별로 관객들이 느끼는 감정 어휘의 분포를 탐색하고 영화 흥행도와 감정 어휘의 관계를 파악하는데 목적이 있다. 분석을 위해 네이버 영화 리뷰를 크롤링하고 감정 어휘 사전을 활용하여 7개의 대표 감정 어휘, 영화 티켓 판매액, 영화 관람 관객 수, 상영 스크린 수, 한 스크린 당 영화 관람 관객 수, 영화의 장르, 영화의 영문 이름으로 구성된 데이터를 생성하였다. 연구 목적을 위한 분석은 상관관계 분석 방법과 Parallel coordinates 시각화 분석 방법을 사용하였다. 연구 결과로는 첫째, 장르에 따른 영화 흥행도를 분석하여 영화 흥행도가 가장 높은 장르는 코미디이고 가장 낮은 장르는 호러라는 결과를 확인하였다. 둘째, 모든 장르에서 'Happy'와 'Surprise'의 값이 높게 나오지만 다른 장르들에 비해 판타지 장르의 영화는 지루한 감정이 많이 느껴지고, SF장르의 영화는 화나는 감정이 많이 느껴진다는 결과를 확인 하였다. 셋째, 모든 장르의 감정 어휘 별 상관관계를 분석하여 Disgust'의 값이 높아질 때 'Anger'의 값도 높아지고, 'Happy'의 값이 높아질 때 'Surprise'의 값은 낮아진다라는 결과를 확인하였다. 넷째, 영화 흥행도에 따른 감정 어휘를 분석하여 영화 흥행도와 'Happy'는 선형 관계이지만 영화 흥행도와 'Fear'는 비선형 관계인 것을 확인 하였다.

아르누보의 선형적 의미와 특성에 관한 연구 (A Study on Linear meanings and Characteristics of Art Nouveau)

  • 김성혜
    • 한국실내디자인학회논문집
    • /
    • 제19호
    • /
    • pp.98-104
    • /
    • 1999
  • The literal Meaning of Art Nouveau is 'New Art'. It means that Art Nouveau was conceived momentous sense of transition in the close of 19C and found the way to overcome that situatiov. So, This Study aims to discover the Meaning and Characteristic of Art Nouveau through it's Linear form. Through this study, linear form of Art Nouveau served not merely to decorate building, but to liberate space. With linear forms, Art Nouveau artists synthesize all exterior and interior elements - from doors and windows to carpets and furnishings - by one's emotional rhythm and occasionally change the feel of space that adorned with another style. First, of all, linear form is a method for 'Art for Art sake', and the possibility of linear form does not disappear.

  • PDF

과학영재학교 재학생 영어발화 주파수 대역별 음향 에너지 분포의 영어 성취도 예측성 연구 (A study on the predictability of acoustic power distribution of English speech for English academic achievement in a Science Academy)

  • 박순;안현기
    • 말소리와 음성과학
    • /
    • 제14권3호
    • /
    • pp.41-49
    • /
    • 2022
  • 본 연구는 미국영어 화자의 평균적 음향 스펙트럼 분포를 확보한 후 과학영재학교 재학생의 영어발화 양상을 비교하여 상대적으로 우수한 지적 역량을 갖춘 우리나라 과학영재들의 초분절적 영어 유창성 양상을 규명하고, 그 근접성 정도가 영재학교 학생의 영어 과목 정기고사 성취도와 어떤 관계성을 갖는지 탐구하고자 진행되었다. 불과 수 초에서 수십 초에 불과한 음성녹음 데이터 위주로 분석을 시행했던 종래의 연구와 달리 총 4시간에 달하는 미국영어 원어민 화자(남성 15명, 여성 15명)의 음성녹음 자료를 MATLAB(R2022a; The Math Works) 코드로 분석하여 20 -20,000 Hz 주파수 범위 내의 대역별로 장기 스펙트럼 음향에너지 분포값을 확보했으며, 이를 기준으로 과학영재학교 1학년 신입생 80명의 녹음데이터 LTASS(long-term average speech spectrum) 분석 수치와 비교한 결과, 영어 과목 학기말고사의 학업성취도 수준이 상위 30% 이내인 학생들의 표본을 제외하고는 미국영어 음향에너지 분포와의 근접성이 통계적으로 유미하지 않다고 밝혀졌다. 영재학교 입학 후 영어 성취도를 예측하기 위한 지표를 발견하기 위해 수용성 어휘크기검사(receptive vocabulary size test), 학기 중 복수 회 실시한 영어 어휘 형성평가 퀴즈 누적 점수, 공인 영어말하기시험(English Speaking Proficiency Test, ESPT) 성취도를 추가 변량으로 하여 정기고사 성취도와의 상관관계 분석 및 각 변량 간 선형 회귀분석을 시행하였는데, 대개 유년시절 완성되는 영어 유창성을 측정하는 ESPT보다는, 1학기 및 2학기 초 실시한 수용성 어휘크기검사 및 수과학 분야 저빈도 어휘 위주 형성평가 점수와의 통계적 유의성이 월등히 높다는 사실이 관찰되었다. 따라서, 본 연구로부터 확보된 이론적 기반을 토대로 국내 영재학교에서는 발음교육보다 과학영재를 주요 대상으로 한 전문적 수준의 저빈도어휘 교육이 보다 효과적인 교수 요목이라 추정할 수 있다.

전문어의 범용 공간 매핑을 위한 비선형 벡터 정렬 방법론 (Nonlinear Vector Alignment Methodology for Mapping Domain-Specific Terminology into General Space)

  • 김준우;윤병호;김남규
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.127-146
    • /
    • 2022
  • 최근 워드 임베딩이 딥러닝 기반 자연어 처리를 다루는 다양한 업무에서 우수한 성능을 나타내면서, 단어, 문장, 그리고 문서 임베딩의 고도화 및 활용에 대한 연구가 활발하게 이루어지고 있다. 예를 들어 교차 언어 전이는 서로 다른 언어 간의 의미적 교환을 가능하게 하는 분야로, 임베딩 모델의 발전과 동시에 성장하고 있다. 또한 핵심 기술인 벡터 정렬(Vector Alignment)은 임베딩 기반 다양한 분석에 적용될 수 있다는 기대에 힘입어 학계의 관심이 더욱 높아지고 있다. 특히 벡터 정렬은 최근 수요가 높아지고 있는 분야간 매핑, 즉 대용량의 범용 문서로 학습된 사전학습 언어모델의 공간에 R&D, 의료, 법률 등 전문 분야의 어휘를 매핑하거나 이들 전문 분야간의 어휘를 매핑하기 위한 실마리를 제공할 수 있을 것으로 기대된다. 하지만 학계에서 주로 연구되어 온 선형 기반 벡터 정렬은 기본적으로 통계적 선형성을 가정하기 때문에, 본질적으로 상이한 형태의 벡터 공간을 기하학적으로 유사한 것으로 간주하는 가정으로 인해 정렬 과정에서 필연적인 왜곡을 야기한다는 한계를 갖는다. 본 연구에서는 이러한 한계를 극복하기 위해 데이터의 비선형성을 효과적으로 학습하는 딥러닝 기반 벡터 정렬 방법론을 제안한다. 제안 방법론은 서로 다른 공간에서 벡터로 표현된 전문어 임베딩을 범용어 임베딩 공간에 정렬하는 스킵연결 오토인코더와 회귀 모델의 순차별 학습으로 구성되며, 학습된 두 모델의 추론을 통해 전문 어휘를 범용어 공간에 정렬할 수 있다. 제안 방법론의 성능을 검증하기 위해 2011년부터 2020년까지 수행된 국가 R&D 과제 중 '보건의료' 분야의 문서 총 77,578건에 대한 실험을 수행한 결과, 제안 방법론이 기존의 선형 벡터 정렬에 비해 코사인 유사도 측면에서 우수한 성능을 나타냄을 확인하였다.

최명희의 소설 『혼불』에서 추출한 소나무의 경관언어 (A Scenery Word of Pine Tree Extracted in Choi Myoung Hee's Novel 『Honbul』)

  • 노재현;김화옥;박율진
    • 한국전통조경학회지
    • /
    • 제32권4호
    • /
    • pp.61-72
    • /
    • 2014
  • 최명희의 소설 "혼불" 속 소나무 표현 어휘와 문장, 문맥 등의 분석과 해석을 통해 소나무의 지칭어와 상징성 등의 토속적 경관언어를 조명한 본 결과는 다음과 같다. 첫째, 소설 "혼불" 속에 묘사된 소나무 관련 경관언어는 매우 다채롭고 다양한 방식과 표현을 통해 전개되고 있다. 특히 소나무 지칭어와 쓰임새에 대한 어휘 표현상의 다양성과 세분화된 양상이 읽혀진다. 둘째, 소설 "혼불" 속 경관언어는 다양한 상징을 보이는데 소나무가 갖는 고유 이미지와 통시적 상징성뿐 만 아니라 소설의 서사구조상 '혼불'이라는 상징 이미지를 구체적으로 구현시키기 위한 경관언어로서 자리매김 된다. 셋째, 소설 "혼불"에 묘사된 경관언어는 소나무의 선형미와 재질감 그리고 오감을 통한 공감각적 표현 등으로 심미성을 극대화하고 있다. 넷째, "혼불"에 나타난 배경지 경관은 소나무 고유의 상징성과 이미지를 토대로 소설의 서사구조상, 소나무가 하늘과 땅, 신과 인간 그리고 성과 속을 넘나드는 상징적 배경막이다. 다섯째, 소나무 관련 경관언어는 소설 속 인물의 정신과 정서를 대변하는 표상이며 자연의 인격화, 사물의 신격화 그리고 공간의 우주화를 추구하기 위한 장치이자 소설 배경지의 경관성과 의미망을 표현하는 표상적 이미지 또는 상징체로 활용되고 있다. 소설 "혼불"에 등장하는 소나무의 어휘 표현 및 상징성을 다룬 본 고는 소설의 배경무대는 물론 남원 소나무의 토속적 경관 이미지와 경관언어를 이해하는데 시금석이 될 것으로 기대한다.

오차 역전파 알고리즘을 갖는 MLP를 이용한 한국 지명 인식에 대한 연구 (A Study on the Spoken Korean Citynames Using Multi-Layered Perceptron of Back-Propagation Algorithm)

  • 송도선;이재건;김석동;이행세
    • 한국음향학회지
    • /
    • 제13권6호
    • /
    • pp.5-14
    • /
    • 1994
  • 이 논문은 오차역전달(error back-propagation) 알고리듬을 갖는 다층구조 퍼셉트런(Multi-Layered Perceptron)을 사용하여 우리말 단어음성을 화자종속으로 기계 인식하는 실험에 관한 연구 결과다. 대상단어는 시외 자동전화 지역번호표에서 임의로 선택한 50개 지역명이며, 이 중 43개는 2음절로 구성되어있고 나머지 7개는 3음절이다. 단어를 음소나 음절별로 분리(segmentation)하지 않고, 단어의 각 부분에서 골고루 추출된 특징성분을 신경망에 입력하는 방법을 사용했다. 그렇게 함으로써 발음지속시간에 관계없는 결과를 얻을 수 있으며, 이 때 사용된 특징 성분은 선형예측분석으로 구해진 PARCOR계수다. 전체학습과 구분학습의 비교, 프레임 갯수와 PARCOR차수에 대한 인식률의 의존도, 중간층 뉴런의 갯수에 대한 인식률의 변동, 그리고 출력층 뉴런의 구성 방법에 따른 비교 등 4가지 실험을 통하여 가장 최량의 조건을 찾아보고자 하였다. 이 연구를 발전시킨다면 실시간의 화자독립 소규모어휘 음성인식이 가능해질 것으로 보인다.

  • PDF

표층 구문 타입을 사용한 조건부 연산 모델의 일반화 LR 파서 (Generalized LR Parser with Conditional Action Model(CAM) using Surface Phrasal Types)

  • 곽용재;박소영;황영숙;정후중;이상주;임해창
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권1_2호
    • /
    • pp.81-92
    • /
    • 2003
  • 일반화 LR(Generalized LR, 이하 GLR) 파싱은 선형 스택을 사용하는 전통적인 LR 파싱 방식의 한계를 극복하도록 만들어진 LR 파싱 기법의 하나로서, LR 기법에 여러 가지 매커니즘을 통합하여 자연어 파싱에 응용하는 작업의 토대가 되어 왔다. 본 논문에서는 기존의 확률적 LR 파싱 기법이 가지고 있는 문제를 개선한 조건부 연산 모델(Conditional Action Model)을 제안한다. 기존의 확률적 LR 파싱 기법은 그래프 구조 스택의 복잡성으로 인해 상대적으로 제한된 문맥 정보만을 사용하여 왔다. 제안된 모델은 부분 생성 파스의 표현을 위하여 표층 구문 타입(Surface Phrasal Type)을 사용하여 그래프 구조 스택에 들어 있는 구문 구조를 기술함으로써 좀 더 세분된 구조적 선호도를 파서에 반영시킬 수 있다. 실험 결과, 어휘를 고려하지 않고 학습한 조건부 연산 모델로 구현된 본 GLR 파서는 기존의 방식보다 약 6-7%의 정확도 향상을 보였으며, 본 모델을 통해 풍부한 스택 정보를 확률적 LR 파서의 구조적 중의성 해결에 효과적으로 사용할 수 있음을 보였다.

종단적 연구의 신뢰도 (Reliability in longitudinal study)

  • 김진욱
    • 응용통계연구
    • /
    • 제37권1호
    • /
    • pp.61-72
    • /
    • 2024
  • 본 연구의 목적은 동일 검사의 반복 시행이 이루어지는 종단적 연구의 재검사 신뢰도를 알아보는 것이다. 종단적 연구에서 나타날 수 있는 다양한 상황의 측정을 혼합모형을 이용하여 수립하였다. 참값은 안정성과 불안정성, 계통오차는 세 가지 형태의 조합에 의한 측정 모형을 고려하였으며 신뢰도를 정의하였다. 실제 종단적 자료의 적용과 신뢰도 분석을 위해 버클리 성장연구에서의 키 자료와 시카고 대학 실험학교에서의 어휘점수 자료를 이용했다. 혼합모형을 이용하면 참값과 오차의 공분산 구조를 따로 선택하여 신뢰도를 알아볼 수 있는 장점이 있다. 그러나 연구자는 종단적 연구의 적절한 신뢰도 분석을 위해 피험자와 검사, 그리고 연구에서 가해지는 처리의 특성과 같이 측정에서 발생가능한 변동 요인을 잘 살펴볼 필요가 있다. 그리고 이에 맞는 모형을 선택하고 시행마다 다른 신뢰도 계수로 측정의 질을 평가해야 한다.