통합 검색 | Korea Science

조음결합을 고려한 4연 숫자음 인식에 관한 연구 (A Study on the Recognition of Korean 4 Connected Digits Considering Co-articulation)

이종진;이광석;허강인;김명기;고시영
- 한국통신학회논문지
- /
- 제17권1호
- /
- pp.20-28
- /
- 1992
조음결합은 연결단어 음성인식에서 오인식을 발생시키는 주된 요인이다. 본 연구에서는 표준패턴의 접속 부분에서 선행단어의 영향을 받아 후속단어의 선두 부분하는 것을 고려해 조음결합 모델을 적용하여 후속단어에 변형을 주었다. 조음결합 모델은 임계제동형 선형 2차계를 이용하였으며 1단 DP매칭 인식 알고리즘에 이 모델을 조합하여 효과를 조사했다. 그 결과 화자 5명에 의한 4연 숫자음 35어의 인식 실험에서 조음결합 처리에 의한 인식율이 평균 4.7%개선 되었다.
PDF

자연언어에 의한 질의응답 시스템의 설계 (Design of Q/A System By Natural Language Processing)

김영길;강석훈;우요섭;김한우;최병욱
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 1992년도 제4회 한글 및 한국어정보처리 학술대회
- /
- pp.469-477
- /
- 1992
본 논문에서는 자연언어 처리를 기반으로 한 질의응답 시스템을 설계하며 그 대상을 호텔 예약 시스템으로 한다. 시스템은 크게 언어 해석부, 문맥 처리부, 화제 처리부 및 한국어 생성부로 구성한다. 언어 처리부에서는 단일화 문법을 적용하여 사용자가 입력한 질의문을 해석하며 그 해석결과로부터 이 후 질의응답에 사용되는 정보들인 술어, 각 명사구들의 의존 관계치 및 의미 제약치를 얻어 낸다. 문맥처리를 수행하여 생략문 등에 의해 결핍된 정보들을 추출함으로서 정보의 손실을 보완한다. 이 정보들을 이용하여 사용자와 시스템간의 자연스러운 대화를 진행하기 위한 화제처리를 수행하며, 최종적으로 화제 처리부에서 파악한 화자의 의도를 기초로 사용자가 요구한 정보를 제공하고 계속된 대화진행을 위해 적절한 한국어를 생성해 주는 한국어 생성부를 거치게 된다. 본 논문에서는 호텔 예약이라는 정해진 영역하에서 자연언어처리에 의해 추출한 술어, 각 명사구들의 의존관계치 및 의미제약치 정보들을 이용하여 문맥처리와 화제처리를 수행함으로서 더욱 효율적인 질의응답 시스템을 구현할 수 있음을 보인다.
PDF

이전 문장 자질과 다음 발화의 후보 화행을 이용한 한국어 화행 분석 (Korean Speech Act Tagging using Previous Sentence Features and Following Candidate Speech Acts)

김세종;이용훈;이종혁
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 2007년도 제19회 한글 및 한국어 정보처리 학술대회
- /
- pp.23-30
- /
- 2007
화행 분석이란 자연언어로 된 발화를 통해서 나타나는 화자의 의도를 인식하는 것으로 대화를 처리하는 여러 응용 분야에서 중요하게 요구되는 과정이다. 기존의 연구에서는 이전 발화의 화행과 현재 발화의 문장 자질을 사용하여 규칙 기반 및 통계 기반의 연구가 진행되었다. 하지만 본 논문에서는 현재 발화 이후의 후보 화행을 추정하여 이를 현재 발화의 화행을 결정하는데 사용함으로써 기존의 연구와 차별화를 두었으며, 실제로 기존 방법보다 약 4%의 성능향상을 보인 96.08%의 정확도(accuracy)를 보였다. 또한 이전 발화의 화행 정보 대신 이전 화행을 결정하는데 사용했던 문장 자질을 현재 발화의 화행 결정에 직접 사용함으로써 실제 이전 화행을 적용했을 때보다 향상된 성능을 가져왔으며, 이전 문장 자질과 후보 화행을 함께 사용하여 화행을 결정했을 경우 96.96%의 정확도를 보였다.
PDF

영어의 강음절(강세 음절)과 한국어 화자의 단어 분절 (Strong (stressed) syllables in English and lexical segmentation by Koreans)

김선미;남기춘
- 말소리와 음성과학
- /
- 제3권1호
- /
- pp.3-14
- /
- 2011
It has been posited that in English, native listeners use the Metrical Segmentation Strategy (MSS) for the segmentation of continuous speech. Strong syllables tend to be perceived as potential word onsets for English native speakers, which is due to the high proportion of strong syllables word-initially in the English vocabulary. This study investigates whether Koreans employ the same strategy when segmenting speech input in English. Word-spotting experiments were conducted using vowel-initial and consonant-initial bisyllabic targets embedded in nonsense trisyllables in Experiment 1 and 2, respectively. The effect of strong syllable was significant in the RT (reaction times) analysis but not in the error analysis. In both experiments, Korean listeners detected words more slowly when the word-initial syllable is strong (stressed) than when it is weak (unstressed). However, the error analysis showed that there was no effect of initial stress in Experiment 1 and in the item (F2) analysis in Experiment 2. Only the subject (F1) analysis in Experiment 2 showed that the participants made more errors when the word starts with a strong syllable. These findings suggest that Koran listeners do not use the Metrical Segmentation Strategy for segmenting English speech. They do not treat strong syllables as word beginnings, but rather have difficulties recognizing words when the word starts with a strong syllable. These results are discussed in terms of intonational properties of Korean prosodic phrases which are found to serve as lexical segmentation cues in the Korean language.
PDF

한국어 TTS 시스템을 위한 운율구 경계 예측 (Prosodic-Boundary Prediction for Korean Text-to-Speech System)

전진욱;김한우;김동건;이양희
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
- /
- pp.77-82
- /
- 2002
운율은 음성의 초분절적인 면에 연관하는 음성의 한 성으로서 통상적으로 화자는 음성을 달하는 과정에서 청자의 이해를 돕기 위해 운율을 사용하게 된다. 본 논문은 이러한 운율을 이루는 성분 중의 하나인 운율구의 위치 예측에 대한 성능을 향상시키는 것에 그 목적을 둔다. 한국어 운율 정보에 대한 표기 방법 중의 하나인 K-ToBI를 기반으로 하여, 운율구의 경계와 그에 대한 레벨을 Break Indices 정보로서 나타내었고, 통계학 분야에서 제안된 Support Vector Machine(SVM)을 이용하여 시스템의 예측률 향상을 꾀하였다. 기존의 방법에서 사용된 트리 기반 모델을 이용하여 한국어 운율에 가장 많은 영향을 끼치는 언어 정보들을 추출하였고 이를 실험에 적용하였다. 기존의 트리 모델과 SVM 모델에 대한 예측률을 비교한 결과, 경계 유무 정보 예측과 4단계의 레벨을 가지는 경계 정보의 예측에서 모두 본 방법이 보다 높은 예측률을 보여 주어 본 연구에서 제시한 접근법이 운율구의 경계 정보를 예측하는 데에 있어 더욱 효과적인 접근법임을 실험적으로 입증하였다.
PDF

Leuconostoc mesenteroides B-742CB와 B-512FMCM Dextransucrase의 수용체 반응을 이용한 고분지 Isomaltodextrin의 생산 (Sythesis of Highly Branched Isomaltodextrin by Acceptor Reaction using Dextransucrases from L. mesenteroides B-742CB and B-512FMCM)

김문수;이선옥;류화자;강희경;유선균;장석상;김도원;김도만;김성혁
- KSBB Journal
- /
- 제16권2호
- /
- pp.200-206
- /
- 2001
In this study we tried to optimize the enzyme reaction conditions for the synthesis of highly branched isomaltodextrin (Mw > 2.5 kDa) using two dextransucrases from L. mesenteroides B-742CB and B-512FMCM that are dextransucrase constitutive mutants. As the concentration of sucrose or the ratio of maltose to sucrose increased, the amount of dextran decreased and the number and the amount of acceptor-products (of sucrose or maltose) increased. With high sucrose concentration (over 34%), there was more branched isomaltodextrin (as acceptor products) than dextran. When the ratio of sucrose to maltose was 2.5, there produced 86.7% of isomaltodextrin were produced. The Mw of dextrans, however, was over 2${\times}$10(sup)6 and there was no significant amounts of branched clinical dextran or high molecular weight oligosaccharides. With the combined activities of B-742CB dextransucrase and B-512FMCM dextransucrase we could synthesize high molecular weight branched isomaltodextrin (Mw>2.5 kDa). The high molecular weight dextran was composed of high branches as B-742CB dextran.
PDF

Neural-HMM을 이용한 고립단어 인식 (Isolated-Word Recognition Using Neural Network and Hidden Markov Model)

김연수;김창석
- 한국통신학회논문지
- /
- 제17권11호
- /
- pp.1199-1205
- /
- 1992
본 논문에서는 HMM(Hidden Markov Models)에서 문제점이 되는 개인차에의한 변동을 흡수하고, 적은 학습 데이타로서 인식률을 향상시키기 위하여 신경회로망을 이용한 NN-HMM(Neural Network Hidden Makov Models)에 의해 한국어 인식에 관하여 연구하였다. 이 방법은 HMM과 신경회로망의 출력을 각각 독립적인 인식값으로 가정하여 두 시스템의 확률곱으로 서로 보정되어 최대 인식확률의 음성모델을 인식하는 음성인식 시스템이다. 본 방법의 타당성을 평가하기 위하여 남, 여화자가 28개의 DDD 지역명을 발성한 음성데이타로 실험한 결과, 이산분포 HMM에 의한 방법에서는 91[%], 신경회로망에 의한 방법에서는 89[%], 제안된 방법에서는 95[%]의 향상된 인식률을 얻으므로써 인식성능의 우수함을 확인하였다.
PDF

폐절제술후 사망율과 이환율에 영향을 미치는 요소 (The Risk Factors of Morbidity and Mortality after Pulmonary Resection)

서연호;김민호;구자홍;조중구;김공수
- Journal of Chest Surgery
- /
- 제32권12호
- /
- pp.1100-1105
- /
- 1999
배경 :폐절제술은 절제가능한 폐암 또는 염증성 폐질환 선천성 폐질환의 치교적 술식이 된다. 술후 경과에 영향을 줄수 있는 예측기능 요소를 인지하는 것은 중요하나 합병증에 이환된 경향이 높은 환자에 대하여 각별한 주의를 기울임으로서 술후 합병증 및 사망률은 감소시킬수 있을 것이다 방법 및 대상: 술후 결과에 영향을 미치는 요소를 예측하기 위해 1994년부터 1998 년까지 본 병원에서 종양성 및 염증성 폐질환으로 폐절저술을 시행받은 153명의 환자를 대상으로 입원챠트를 열람하여 연구하였다 평균 연령은 54.3$\pm$10.6세였다. 96명 (62%) 의 환자는 폐암화자였으며 47명 (30%)의 환자의 염증성 폐질환자였고 10명 (7%)의 환자는 선천성 폐질환자이거나 기타 폐질환자였다. 결과: 전체 153명중 폐엽절제술이 118례 전폐절제술이 29례 폐분엽절제술이 6례 시행되었다. 7명 (4.5%)의 환자가 술후 사망하였다 술후 원내 사망률의 가장 유의한 예측요소는 동반된 내과적 질환의 유무(p<0.001)과 70세 이상의 고령이다(p<0.003) 총 57명의 환자에게 67가지의 합병증이 발병되었다 그중 수술자체와 관련된 합병증이 50례 (32%) 호흡기계 합병증이 14례(9.1%) 심혈관계가 1례(0.6%) 기타 합병증이 2례(1.3%)였다 술후 합병증 이환율에 영향을 미치는 요소는 70세 이상의 고령이었다(p<0.004) 결론 : 동반된 내과적 질환과 70세 이상의 고령은 술후 사망률에 영향을 미치는 유의한 예측요소가 되며 또한 70세이상의 고령은 술 후 합병증 이환율에도 영향을 미치는 요소이다.
PDF

종격동에 발생한 결합조직형성 소원형세포 종양 - 1예 보고- (Desmoplastic Small Round Cell Tumor of the Mediastinum -A case report -)

김정원;차희정;박상규;정종필;신제균;박창률
- Journal of Chest Surgery
- /
- 제40권2호
- /
- pp.147-150
- /
- 2007
결합조직형성 소원형세포 종양(desmoplastic small round cell tumor)은 최근에 발생 빈도가 증가하는 추세인 희귀한 종양으로 주로 복강 내에서 발생하는 것으로 알려져 있다. 저자들은 15세 여자 화자의 종격동에 발생한 결합조직형성 소원형세포 종양에 대해 적극적인 항암화학요법, 수술, 방사선치료 및 자가 말초혈 조혈모세포 이식 등의 복합요법으로 만족스러운 결과를 얻었기에 이를 국내 최초로 보고하고자 한다.
PDF KSCI

영상 데이터 감정 분류를 위한 멀티 모달 기반의 ViT 모델 (Multi-Modal based ViT Model for Video Data Emotion Classification)

김예림;이동규;안서영;김지현
- 한국컴퓨터정보학회:학술대회논문집
- /
- 한국컴퓨터정보학회 2023년도 제67차 동계학술대회논문집 31권1호
- /
- pp.9-12
- /
- 2023
최근 영상 콘텐츠를 통해 영상물의 메시지뿐 아니라 메시지의 형식을 통해 전달된 감정이 시청하는 사람의 심리 상태에 영향을 주고 있다. 이에 따라, 영상 콘텐츠의 감정을 분류하는 연구가 활발히 진행되고 있고 본 논문에서는 대중적인 영상 스트리밍 플랫폼 중 하나인 유튜브 영상을 7가지의 감정 카테고리로 분류하는 여러 개의 영상 데이터 중 각 영상 데이터에서 오디오와 이미지 데이터를 각각 추출하여 학습에 이용하는 멀티 모달 방식 기반의 영상 감정 분류 모델을 제안한다. 사전 학습된 VGG(Visual Geometry Group)모델과 ViT(Vision Transformer) 모델을 오디오 분류 모델과 이미지 분류 모델에 이용하여 학습하고 본 논문에서 제안하는 병합 방법을 이용하여 병합 후 비교하였다. 본 논문에서는 기존 영상 데이터 감정 분류 방식과 다르게 영상 속에서 화자를 인식하지 않고 감정을 분류하여 최고 48%의 정확도를 얻었다.
PDF

검색결과 184건 처리시간 0.03초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)