• 제목/요약/키워드: Novel Corpus

검색결과 22건 처리시간 0.021초

영미 아동 모험 소설에 관한 코퍼스 분석 연구: 『보물섬』을 중심으로 (A Corpus Analysis of British-American Children's Adventure Novels: Treasure Island)

  • 최은샘;정채관
    • 한국콘텐츠학회논문지
    • /
    • 제21권1호
    • /
    • pp.333-342
    • /
    • 2021
  • 본 연구에서는 대표적인 영미 아동 모험 소설 『보물섬』의 언어적 특징을 파악하기 위해 『보물섬』을 코퍼스화 하여 어휘, 리마, 키워드, n-그램을 분석하였다. 이 연구를 통해 고빈도 어휘가 텍스트의 핵심어라는 일반적인 주장과 달리 『보물섬』의 고빈도 어휘는 『보물섬』과 직접 관련이 없는 기능어, 고유명사 등이 최상위층에 포진하고 있다는 것을 발견하였고, 통계적인 방법으로 추출한 『보물섬』 키워드 역시 『보물섬』의 내용을 가늠하기에 충분하지 않음을 발견하였다. 따라서 1차 정량적인 키워드 분석 후 진행된 2차 정성적인 키워드 분석을 통해 추출한 30개의 핵심 키워드를 통해 『보물섬』 내용을 신속하고 구체적으로 파악하는 단초를 마련하였고, 이를 바탕으로 그동안 직관적으로만 회자 되던 『보물섬』에 나타난 남성성을 계량적으로 분석할 수 있었다. 또한, n-그램 분석을 통해 『보물섬』의 작가가 다른 작가에 비해 선호하고 자주 사용하는 연속어휘구를 발견하였고, 이를 토대로 문학 작품의 계량적 연구가 가능한 코퍼스 문체론 연구의 가능성을 탐색하였다. 본 연구를 통해 밝혀낸 연구결과가 영미 아동문학 콘텐츠의 확산과 코퍼스 문체론 연구에 도움이 되기를 희망한다.

유성음 구간 검출 알고리즘에 관한 연구 (A Novel Algorithm for Discrimination of Voiced Sounds)

  • 장규철;우수영;유창동
    • 음성과학
    • /
    • 제9권3호
    • /
    • pp.35-45
    • /
    • 2002
  • A simple algorithm for discriminating voiced sounds in a speech is proposed. In addition to low-frequency energy and zero-crossing rate (ZCR), both of which have been widely used in the past for identifying voiced sounds, the proposed algorithm incorporates pitch variation to improve the discrimination rate. Based on TIMIT corpus, evaluation result shows an improvement of 13% in the discrimination of voiced phonemes over that of the traditional algorithm using only energy and ZCR.

  • PDF

조음자질을 이용한 한국인 학습자의 영어 발화 자동 발음 평가 (Automatic pronunciation assessment of English produced by Korean learners using articulatory features)

  • 류혁수;정민화
    • 말소리와 음성과학
    • /
    • 제8권4호
    • /
    • pp.103-113
    • /
    • 2016
  • This paper aims to propose articulatory features as novel predictors for automatic pronunciation assessment of English produced by Korean learners. Based on the distinctive feature theory, where phonemes are represented as a set of articulatory/phonetic properties, we propose articulatory Goodness-Of-Pronunciation(aGOP) features in terms of the corresponding articulatory attributes, such as nasal, sonorant, anterior, etc. An English speech corpus spoken by Korean learners is used in the assessment modeling. In our system, learners' speech is forced aligned and recognized by using the acoustic and pronunciation models derived from the WSJ corpus (native North American speech) and the CMU pronouncing dictionary, respectively. In order to compute aGOP features, articulatory models are trained for the corresponding articulatory attributes. In addition to the proposed features, various features which are divided into four categories such as RATE, SEGMENT, SILENCE, and GOP are applied as a baseline. In order to enhance the assessment modeling performance and investigate the weights of the salient features, relevant features are extracted by using Best Subset Selection(BSS). The results show that the proposed model using aGOP features outperform the baseline. In addition, analysis of relevant features extracted by BSS reveals that the selected aGOP features represent the salient variations of Korean learners of English. The results are expected to be effective for automatic pronunciation error detection, as well.

A Framework for Semantic Interpretation of Noun Compounds Using Tratz Model and Binary Features

  • Zaeri, Ahmad;Nematbakhsh, Mohammad Ali
    • ETRI Journal
    • /
    • 제34권5호
    • /
    • pp.743-752
    • /
    • 2012
  • Semantic interpretation of the relationship between noun compound (NC) elements has been a challenging issue due to the lack of contextual information, the unbounded number of combinations, and the absence of a universally accepted system for the categorization. The current models require a huge corpus of data to extract contextual information, which limits their usage in many situations. In this paper, a new semantic relations interpreter for NCs based on novel lightweight binary features is proposed. Some of the binary features used are novel. In addition, the interpreter uses a new feature selection method. By developing these new features and techniques, the proposed method removes the need for any huge corpuses. Implementing this method using a modular and plugin-based framework, and by training it using the largest and the most current fine-grained data set, shows that the accuracy is better than that of previously reported upon methods that utilize large corpuses. This improvement in accuracy and the provision of superior efficiency is achieved not only by improving the old features with such techniques as semantic scattering and sense collocation, but also by using various novel features and classifier max entropy. That the accuracy of the max entropy classifier is higher compared to that of other classifiers, such as a support vector machine, a Na$\ddot{i}$ve Bayes, and a decision tree, is also shown.

Periventricular nodular heterotopia in a child with a mild Mowat-Wilson phenotype caused by a novel missense mutation of ZEB2

  • Kim, Young Ok;Lee, Yun Young;Kim, Myeong-Kyu;Woo, Young Jong
    • Journal of Genetic Medicine
    • /
    • 제16권2호
    • /
    • pp.71-75
    • /
    • 2019
  • Periventricular nodular heterotopia (PNH) is a malformation of cortical development in which normal neurons inappropriately cluster in periventricular areas. Patients with Mowat-Wilson syndrome (MWS) typically present with facial gestalt, complex neurologic problems (e.g., severe developmental delay with marked speech impairment and epilepsy), and multiple anomalies (e.g., Hirschsprung disease, urogenital anomalies, congenital heart defects, eye anomalies, and agenesis of the corpus callosum [CC]). MWS is mostly caused by haploinsufficiency of the gene encoding zinc-finger E-box-binding homeobox 2 (ZEB2) due to premature stops or large deletions. We present a case report of a 9-year-old girl with PNH, drug-responsive epilepsy, severe intellectual disability, and facial dysmorphisms only in whom we performed whole-exome sequencing and found a de novo heterozygous missense mutation (c.3134A>C; p.His1045Pro) of ZEB2 (NM_014795.3; NP_055610.1). This mild case of MWS caused by a rare novel missense mutation of ZEB2 represents the first report of MWS with isolated PNH.

Spectral Subtraction Using Spectral Harmonics for Robust Speech Recognition in Car Environments

  • Beh, Jounghoon;Ko, Hanseok
    • The Journal of the Acoustical Society of Korea
    • /
    • 제22권2E호
    • /
    • pp.62-68
    • /
    • 2003
  • This paper addresses a novel noise-compensation scheme to solve the mismatch problem between training and testing condition for the automatic speech recognition (ASR) system, specifically in car environment. The conventional spectral subtraction schemes rely on the signal-to-noise ratio (SNR) such that attenuation is imposed on that part of the spectrum that appears to have low SNR, and accentuation is made on that part of high SNR. However, these schemes are based on the postulation that the power spectrum of noise is in general at the lower level in magnitude than that of speech. Therefore, while such postulation is adequate for high SNR environment, it is grossly inadequate for low SNR scenarios such as that of car environment. This paper proposes an efficient spectral subtraction scheme focused specifically to low SNR noisy environment by extracting harmonics distinctively in speech spectrum. Representative experiments confirm the superior performance of the proposed method over conventional methods. The experiments are conducted using car noise-corrupted utterances of Aurora2 corpus.

우르솔릭산의 혈관형성 억제활성 (Anti-angiogenic Activity of Ursolic Acid)

  • 손경희;이옥희;이열남;정해영;이정준;김규원
    • 약학회지
    • /
    • 제37권5호
    • /
    • pp.532-537
    • /
    • 1993
  • Angiogenesis refers to the formation of new capillary blood vessels, or neovascularization occurring under various physical conditions, such as development of the embryo, formation of corpus luteum, wound healing and pathological conditions including tumor growth and metastases, hemangiomas, diabetic retinopathy, rheumatoid arthritis. There are many evidences that angiogenesis is important for the progressive growth of solid tumors and also permits the shedding of metastatic tumors from the primary site. Thus, treatment of angiogenesis inhibitors might be a novel strategy for tumor growth inhibition. Normal vascular endothelial cells are in a state of differentiation and angiogenic endothelial cells migrate and proliferate, and they subsequently differentiate into vessel-forming quiescent phenotype cells, Therfore, it was speculated that a modifier of cell differentiation could also affect angiogenesis. In order to identify new antiangiogenic factors, the research was conducted to estimate the inhibitory activities of cell differentiation agents by means of chick embryo chorioallantoic membrane(CAM) assay. Hence, we have established the CAM assay for the screening of antiangiogenic agents. Using the CAM assay, we found that ursolic acid, a tumor cell differentiation-inducing agent, showed a markedly inhibitory effect on chick embryonic angiogenesis.

  • PDF

텍스트 마이닝을 이용한 상황 정보 분석 및 예측 프로세스에 관한 연구 (A novel on Context Information Analysis and Prediction Process using Text Mining)

  • 정세훈;강주희;김종찬;심춘보
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2015년도 추계학술대회
    • /
    • pp.1039-1040
    • /
    • 2015
  • 최근 IoT 및 인공지능 기술을 활용한 상황 정보 예측 서비스가 각광을 받고 있다. 본 논문에서는 특정 메타 데이터(Meta Data)로부터 입력되는 정보를 기반으로 상황 정보 분석 및 예측하는 프로세스를 제안한다. 주성분 분석 및 데이터의 집단화(Corpus), 문서 매트릭스(Document Matrix), 단어 빈도수(Frequency)에 따른 데이터 전처리 과정을 통해 상황정보 데이터를 확보한다. 또한 연관 규칙분석을 통해 분류된 데이터의 연관성을 분석하여 예측 데이터의 연관성을 확보한다. 제안하는 상황정보 분석 및 예측 모델은 R을 적용하여 설계한다.

  • PDF

테스트 프레임워크를 활용한 라이브러리 퍼징 환경 구축 자동화 (Automated Building Fuzzing Environment Using Test Framework)

  • 류민수;김동영;전상훈;김휘강
    • 정보보호학회논문지
    • /
    • 제31권4호
    • /
    • pp.587-604
    • /
    • 2021
  • 라이브러리는 독립적으로 실행되지 않고 많은 응용 프로그램에서 사용되므로, 라이브러리의 취약점을 사전에 탐지하는 것은 중요하다. 라이브러리 취약점을 탐지하기 위해 동적 분석 방법인 퍼징이 사용되고 있다. 퍼징 기술은 코드 커버리지 및 크래시 발생 횟수 측면에서 개선된 결과를 보여주지만, 그 효과를 라이브러리 퍼징에 적용하기는 쉽지 않다. 특히, 라이브러리의 다양한 상태를 재현하려면 특정 함수 시퀀스를 호출하고 퍼저의 입력을 전달하여 라이브러리 코드를 실행하는 퍼징 대상 파일과 시드 코퍼스가 필요하다. 그러나 퍼징 환경(시드 코퍼스, 퍼징 대상 파일)을 준비하는 것은 라이브러리에 대한 이해와 퍼징에 대한 이해가 동시에 필요한 어려운 일이다. 이에, 본 논문에서는 테스트 프레임워크를 활용하여 라이브러리 퍼징의 용이성을 확보하고, 코드 커버리지와 크래시 탐지 성능을 향상하기 위한 개선 방법을 제안한다. 본 논문에서 제안한 시스템은 9개의 오픈 소스 라이브러리에 적용하여 기존 연구들과 비교를 통한 개선 효과를 검증하였다. 실험 결과 코드 커버리지 31.2%, 크래시 탐지 기준 58.7%의 개선효과를 확인하였고, 3개의 알려지지 않는 취약점을 탐지하였다.

EPG5 유전자 변이가 확인된 Vici 증후군 1례 (Vici Syndrome with Novel Compound Heterozygous Mutations in EPG5)

  • 신제희;이현주;이영목
    • 대한유전성대사질환학회지
    • /
    • 제20권2호
    • /
    • pp.50-54
    • /
    • 2020
  • Vici 증후군은 18q12.3 염색체에 위치하는 EPG5 유전자의 돌연변이로 인해 발생하는 상 염색체 열성 증후군이다. EPG5 유전자는 리소좀 형성에 관여하는 자가 포식 경로의 중요한 조절자를 암호화하므로 이에 대한 돌연변이로 인해 다양한 임상증상을 나타나게 된다. 주요한 임상증상으로는 뇌량 무형성, 백색증, 백내장, 심근 병증, 중증 정신 운동 지체, 발작, 면역 결핍 등이 있으며 다양한 임상증상을 나타내는 만큼 다른 질환들과 임상적으로 구분하기가 어렵다. 저자들은 Vici 증후군으로 진단된 3세 남자 환아의 증례를 보고하고자 한다. 환아는 생후 2개월 경 근긴장 저하와 수유 곤란을 주소로 내원하였으며 이후 Vici 증후군에서 나타나는 특징적인 임상 증상들을 나타내었다. 임상증상들의 감별 진단을 위해 시행한 Whole-exome sequencing (WES) 결과, EPG5 유전자에서 c.2254 C>T (p.Gln752Ter)와 c.5511-5518+2 del TATGCAAAGT 새로운 변이가 이형접합체로 확인되었다. Vici 증후군과 같이 임상적으로 구분이 어려우며 다양한 신체기관에 걸쳐 영향을 미치는 질환의 진단 시에는 Whole-exome sequencing (WES)가 유용하게 사용될 수 있다. 이 증례는 한국에서 확인된 첫 Vici 증후군 case로써 의의가 있다.