• Title/Summary/Keyword: Data Word length

검색결과 48건 처리시간 0.022초

LSTM 언어모델 기반 한국어 문장 생성 (LSTM Language Model Based Korean Sentence Generation)

  • 김양훈;황용근;강태관;정교민
    • 한국통신학회논문지
    • /
    • 제41권5호
    • /
    • pp.592-601
    • /
    • 2016
  • 순환신경망은 순차적이거나 길이가 가변적인 데이터에 적합한 딥러닝 모델이다. LSTM은 순환신경망에서 나타나는 기울기 소멸문제를 해결함으로써 시퀀스 구성 요소간의 장기의존성을 유지 할 수 있다. 본 논문에서는 LSTM에 기반한 언어모델을 구성하여, 불완전한 한국어 문장이 입력으로 주어졌을 때 뒤 이어 나올 단어들을 예측하여 완전한 문장을 생성할 수 있는 방법을 제안한다. 제안된 방법을 평가하기 위해 여러 한국어 말뭉치를 이용하여 모델을 학습한 다음, 한국어 문장의 불완전한 부분을 생성하는 실험을 진행하였다. 실험 결과, 제시된 언어모델이 자연스러운 한국어 문장을 생성해 낼 수 있음을 확인하였다. 또한 문장 최소 단위를 어절로 설정한 모델이 다른 모델보다 문장 생성에서 더 우수한 결과를 보임을 밝혔다.

SPI-4.2 프로토콜을 사용한 PHY-LINK 계층간의 데이터 전송 성능평가 (The Performance Evaluation for PHY-LINK Data Transfer using SPI-4.2)

  • 박노식;손승일;최익성;이범철
    • 한국정보통신학회논문지
    • /
    • 제8권3호
    • /
    • pp.577-585
    • /
    • 2004
  • 시스템 패킷 인터페이스 4레벨 2단계(System Packet Interface Leve14 Phase 2)는 10Gbps 이더넷 응용 뿐만아니라, OC-192 대역폭의 ATM 및 POS를 통한 패킷 또는 셀 전송을 위한 물리계층과 링크계층 소자간의 인터페이스이다. 본 논문에서는 시스템 패킷 인터페이스 4레벨 2단계(SPI-4.2)에 대한 연구와 C언어를 이용한 인터페이스 모듈의 성능평가를 실시하였다. SPI-4.2 인터페이스 모들은 512워드의 FIFO를 사용할 경우 랜덤 유니폼 트래픽에서는 97%까지, 버스트 길이 32를 갖는 버스트 트래픽에서는 94% 까지의 offered load에 대해 적응이 가능하다. 그리고 14 바이트 미만의 작은 크기 패킷을 대규모로 수신할 경우, 오버헤드로 인한 성능 저하가 발생한다는 것을 확인하였다. SPI-4.2 인터페이스 모듈은 기가비트/테라비트 라우터, 광학 크로스바 스위치 및 SONET/SDH 기반의 전송 시스템에서 라인카드로 사용할 경우 적합할 것으로 사료된다.

Praat을 활용한 영어발음특성의 시각적 연구 (A Visual Study of the Quality of English Pronunciation Using the Praat Program)

  • 박희석
    • 디지털콘텐츠학회 논문지
    • /
    • 제14권3호
    • /
    • pp.323-331
    • /
    • 2013
  • Praat프로그램을 활용하면 시각적인 영어교육효과를 얻을 수 있다. 시청각교육이 중시되는 영어교육의 방법론에 비추어볼 때 시각적인 연구의 활용은 교육의 효율성 측면에서 기대되는바가 크다고 할 수 있다. 이러한 점에 착안하여 본 연구에서는 현재 고등학교에 재학 중인 학생들 중 영어성적이 1,2등급에 해당되는 학생과 5,6등급에 해당되는 학생들을 두 그룹으로 나누어 각각의 그룹이 원어민의 발음과 어떤 차이를 보이는지를 알아보고, 그 차이가 어떻게 다른지를 시각적인 면으로 규명해보고자 시도하였다. 이를 위해 원어민이 녹음한 CD가 내장되어있는 영어발음교재를 실험자료로 활용하였다. 구체적으로 영어발음에서 외국인어투를 보일 가능성이 있는 영어저모음과 이중모음이 들어있는 단어와 문장을 대상으로 하였으며, 단어와 문장들은 캠브리지대학교 출판국에서 출간된 English Pronunciation in Use의 교재내용 중의 일부를 활용하였다. 실험을 통해 나타난 결과를 보면 한국인 피 실험자의 두 집단 간에 공히 모음이나 단어단위에선 집단 간, 그리고 원어민의 녹음자료와의 사이에서도 유의미한 차이가 나타나지 않았다. 그러나 다섯 단어 이상으로 구성된 상대적으로 긴 문장단위의 실험에서는 5,6등급 집단의 발음이 유의미하게 크게 나타났다. 이러한 결과는 한국인 피 실험자들의 억양구현실패에서 기인한 것으로 보여지며, 이러한 분석은 Praat프로그램에서 제공한 시각적인 자료에 의해 뒷받침되고 있다.

벡터양자화된 부대역 코덱에서 최적필터의 구현 (The Design of Optimal Filters in Vector-Quantized Subband Codecs)

  • 지인호
    • 한국음향학회지
    • /
    • 제19권1호
    • /
    • pp.97-102
    • /
    • 2000
  • 부대역 코딩은 데이터의 압축을 위해 신호의 주파수를 부대역 필터로 통과시켜 서로 상관이 없는 주파수대역으로 분할하여 각 대역의 신호의 에너지에 적합한 비트 할당을 사용하여 인코딩한다. 실제로 부대역 신호의 코딩은 PCM, DPCM이 사용되는 데 고압축의 전송속도를 얻기 위해서 벡터양자기를 사용하였다. 대부분의 연구자들은 부호화기의 오차에만 주안점을 두고 전체 필터대역의 회복오차와 이 오차가 필터대역에 의존되는 것에는 연구가 진행되지 않았다. 본 논문은 벡터양자기를 사용한 부대역 코덱의 분석과 최적구현의 새로운 접근방법을 제공하여 준다. 본 논문에서는 부대역 코덱에서 벡터양자기의 코드 북의 크기와 벡터크기 그리고 대역필터계수에 의존되는 전체 시스템의 회복오차인 Mean Squared reconstruction Error(MSE)를 계산하였다. 본 논문에서는 각 대역의 구조에서 이 MSE로 양자화를 모델링하고 주어진 전송속도, 필터길이, 입력신호 상관모델의 함수인 이 MSE를 최소화하는 최적의 Finite Impulse Response(FIR) 필터를 구현하였다. 최적구현의 예로 2-채널의 paraunitary 필터뱅크의 4-tap 필터계수를 구하였다. 이 paraunitary 최적의 필터 계수들을 Monte Carlo 모의시험을 사용하여 구하였다. 이 논문은 벡터양자기를 사용한 부대역 코덱의 분석방법을 제공하여 주어서 그 활용도가 기대된다.

  • PDF

상태레벨 공유를 이용한 MLLR 적응화의 회귀클래스 생성에 관한 연구 (A Study on Regression Class Generation of MLLR Adaptation Using State Level Sharing)

  • 오세진;성우창;김광동;노덕규;송민규;정현열
    • 한국음향학회지
    • /
    • 제22권8호
    • /
    • pp.727-739
    • /
    • 2003
  • 본 논문에서는 HM-Net (Hidden Markov Network)을 다양한 태스크에의 적용과 화자의 특성을 효과적으로 나타내기 위해 HM-Net 음성인식 시스템에 MLLR (Maximum Likelihood Linear Regression) 적응방법을 도입하였으며, HM-Net 학습 알고리즘을 개량하여 회귀클래스 생성방법을 제안한다. 제안방법은 PDT-SSS (Phonetic Decision Tree-based Successive State Splitting)알고리즘의 문맥방향 상태분할에 의한 상태레벨 공유를 이용한 방법이다. 즉, 문맥방향의 각 상태에 적응화자 음성데이터에 포함된 문맥정보를 분할하여 적응화될 음소환경을 결정하는 것이다. 따라서 제안방법은 새로운 화자로부터 문맥정보와 적응화 데이터의 발성 양에 의존하여 결정된 많은 적응 파라미터들을 (평균, 분산) 자유롭게 제어할 수 있게 된다. 제안방법의 유효성을 확인하기 위해 국어공학센터 (KLE) 452 데이터와 항공편 예약관련 (YNU200) 연속음성을 대상으로 인식실험을 수행한 결과, 음소인식, 단어인식, 연속음성인식에 대해서, 평균 34∼37%, 평균 9%, 평균 20%의 성능 향상을 각각 보였다. 또한 적응화 데이터의 양에 따른 인식성능 비교에서 제안방법을 적용한 인식 시스템이 적응 데이터의 양이 적은 경우에도 향상된 인식률을 보여 MLLR 적응방법의 특성을 만족하였다. 따라서 MLLR 적응방법을 도입한 HM-Net 음성인식 시스템에 제안한 회귀클래스 생성방법이 유효함을 확인할 수 있었다.

건강과 환경 메시지 프레이밍에 따른 소비자 태도와 구전에 미치는 영향: 비건 제품을 중심으로 (The Effect of Health and Environmental Message Framing on Consumer Attitude and WoM: Focused on Vegan Product)

  • 박서영;임보람
    • 서비스연구
    • /
    • 제13권3호
    • /
    • pp.127-146
    • /
    • 2023
  • 최근 디지털 광고는 15초 미만의 짧은 광고를 통해 메시지를 전달해야 하며, 소셜미디어에서 광고는 소비자가 스킵하기 전까지 5초 이내에 메시지를 전달해야 한다. 광고의 길이가 짧아졌지만, 인공지능을 통한 알고리즘과 빅데이터 분석은 고객의 관심사에 맞는 메시지 전달을 가능하게 하였다. 이런 변화 속에서 짧고 효율적인 광고를 이용한 소비자 맞춤 메시지 전달의 중요성은 날로 커지고 있다. 본 연구에서는 효과적인 메시지 전달을 위한 메시지 프레이밍 효과에 대해 살펴보았다. 구체적으로, 비건 제품에 대한 '건강'과 '환경' 두 가지 프레이밍 효과의 차이를 살펴보았다. 건강과 환경에 대한 소비자 관심의 증가는 비건 제품에 대한 관심을 높였으며, 비건 시장은 날로 크게 성장하고 있다. 소비자가 비건 제품을 구매하는 이유는 소비자 개인의 건강을 위해서이기도 하지만, 윤리적 소비라고 할 수 있는 환경에 대한 책임감 또한 무시 못 할 요인이다. 기존 연구에서는 건강과 환경 메시지 프레이밍 간의 효과의 차이가 측정되지 못하였으며, 연구 대상도 비건 식품에 국한되었다. 본 연구에서는 주방세제 제품군을 이용하여 '건강과 환경 메시지 프레이밍' 효과의 차이를 밝혀내고자 한다.

3차원 수리모델을 이용한 한강 상수원구간 지류영향 분석 및 수질오염사고 시나리오 모의 (Impact Analysis of Tributaries and Simulation of Water Pollution Accident Scenarios in the Water Source Section of Han River Using 3-D Hydrodynamic Model)

  • 김은정;박창민;나미정;박현;김복순
    • 한국물환경학회지
    • /
    • 제34권4호
    • /
    • pp.363-374
    • /
    • 2018
  • The Han River serves as an important water resource for the city of Seoul, Korea and in the neighboring metropolitan areas. From the Paldang dam to the Jamsil submerged weir, the 4 water intake stations that are located for the Seoul metropolitan population were under review in this study. Therefore the water quality management in this section is very important to monitor, analyze and review to rule out any safety concerns. In this study, a 3-D hydrodynamic model, EFDC (Environmental Fluid Dynamics Code), was applied to the downstream of the Paldang Dam in the Han River, which is about 23 km in length, to determine issues related to water resource management. The 3-D grid was composed of 2,168 horizontal grids and three vertical layers. In this case, the hydrodynamic model was calibrated and verified with an observed average daily water surface elevation, water temperature and flow rate data for 3 years (2013~2015). The developed EFDC model proved to reproduce the hydrodynamics of the Han River well. The composition ratios of the noted incoming flows at the monitored intake stations for 3 years and their flow patterns in the river were analyzed using the validated model. It was found that the flow of the Wangsuk Stream depended on the Paldnag dam discharge, and it was noted that the composition ratios of the stream at the intake stations changed accordingly. In a word, the Wangsuk Stream moved mainly along the right bank of the Han River under the condition of a normal dam flow. As can be seen, when the dam discharge rate was low, the incidence of lateral mixing was often seen. The scenario analyses were also conducted to predict the transport of conservative pollutants as in the case of a chemical spill accident. Generally speaking, when scenarios were applied, the arrival time and concentration of pollutants at each intake station was thus predicted.

온라인 리뷰의 감성과 독해 용이성이 리뷰 유용성에 미치는 영향: 가산형 리뷰 유용성 정보 활용 (The Effects of Sentiment and Readability on Useful Votes for Customer Reviews with Count Type Review Usefulness Index)

  • 루스 안젤리 크루즈;이홍주
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.43-61
    • /
    • 2016
  • 온라인 쇼핑몰의 상품에 대한 고객 리뷰는 구매자들의 구매 의사결정에 영향을 미치고 있으며 중요한 구전효과의 원천과 의사결정의 정보 원천의 역할을 하고 있다. 한 제품에 대한 리뷰가 무척 많기에 온라인 쇼핑몰들은 고객 리뷰 평가 방안을 도입하였고, 이를 통해 고객들에게 유용하리라고 판단되는 리뷰들을 걸러서 보여주거나 강조할 수 있게 되었다. 리뷰 평가 방안은 해당 리뷰가 도움이 되었는지 혹은 도움이 되지 않았는 지를 리뷰를 읽은 고객이 평가하게 하는 방안이다. Amazon.com은 고객 평가를 바탕으로 총 투표 수 중에서 유용하다는 투표 수의 비율을 리뷰 유용성 지표로 삼고 있으며, Yelp.com은 유용하다는 투표 수 자체를 유용성 지표로 삼고 있다. 본 연구는 고객 리뷰의 감성과 독해 용이성이 리뷰의 유용성에 미치는 영향을 파악하고자 한다. Amazon.com의 고객 리뷰 자료를 활용하여 비율형 유용성 지표를 종속변수로 하는 유사한 연구들이 수행되어 왔다. 본 연구에서는 Yelp.com의 리뷰 자료를 활용하여 가산형 리뷰 유용성 지표인 경우에도 동일한 효과가 존재하는지를 검토하고자 한다. Yelp.com의 음료와 음식 카테고리에 해당하는 업종에 대한 리뷰를 자료로 활용하였으며, 점포의 명성과 인기도 데이터를 파악할 수 있는 170,294개의 리뷰를 분석에 활용하였다. 분석결과는 리뷰의 긍정 정도는 유용 투표수를 늘리는데 음의 영향을 미쳤다. 평가가 긍정적인 리뷰에서는 음의 영향관계가 유의 하였으나, 평가가 부정적인 리뷰에서는 리뷰의 긍정 정도가 유용 투표 수에 미치는 영향은 유의하지 않았다. 독해 용이성은 리뷰가 읽기 어려울 수록 높은 값을 갖으며, 독해의 어려운 정도는 유용 투표수 획득에 음의 영향을 미쳤다. 독해 용이성은 긍정 리뷰, 부정 리뷰 관계없이 모두 음의 영향을 미치는 것으로 분석되었다. 이 결과는 유용 투표수가 0인 리뷰를 포함하여 영과잉 음이항 회귀분석을 수행한 경우와 유용 투표수가 0인 리뷰를 제외하고 음이항 회귀분석을 수행한 경우 모두 동일하게 파악되었다.