• 제목/요약/키워드: Sentence Frequency

검색결과 143건 처리시간 0.03초

어휘망(U-WIN)의 구문관계 자동구축 (Automatic Construction of Syntactic Relation in Lexical Network(U-WIN))

  • 임지희;최호섭;옥철영
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권10호
    • /
    • pp.627-635
    • /
    • 2008
  • 본 연구에서는 사용자 어휘지능망(U-WIN)의 어휘 관계 중의 하나인 구문관계를 자동으로 구축하는 방법을 제시하고자 한다. 먼저, 구문관계를 형성할 수 있는 후보명사를 용언의 용례에서 문형 정보를 기준으로 추출함으로써, 용언의 세분화된 의미별로 정확하고 다양한 후보명사를 추출할 수 있다. 그러나 추출된 후보명사는 다양한 의미를 지니고 있으므로, 어휘간의 명확한 구문관계를 설정하기 위해서는 후보명사의 여러 의미 중에서 정확한 의미로 결정해야 한다. 그래서 본 연구에서는 용례 매칭 규칙, 구문 패턴, 의미 유사도, 빈도 정보 등을 이용하여 후보명사의 의미를 분별한다. 또한 구문패턴의 빈도 정보를 이용하여 용례에 나타나지 않지만 구문관계를 형성할 수 있는 명사를 추출하여 구문관계를 확장하고자 하였다. 이러한 연구는 명사 중심의 어휘망이 용언과의 구문관계 구축을 통해 형태소 분석, 구문 분석, 의미분석 등에 광범위하게 활용할 수 있는 어휘망의 기반을 다지는 작업이 될 수 있을 것이다.

SNS대상의 지능형 자연어 수집, 처리 시스템 구현을 통한 한국형 감성사전 구축에 관한 연구 (Research on Designing Korean Emotional Dictionary using Intelligent Natural Language Crawling System in SNS)

  • 이종화
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제29권3호
    • /
    • pp.237-251
    • /
    • 2020
  • Purpose The research was studied the hierarchical Hangul emotion index by organizing all the emotions which SNS users are thinking. As a preliminary study by the researcher, the English-based Plutchick (1980)'s emotional standard was reinterpreted in Korean, and a hashtag with implicit meaning on SNS was studied. To build a multidimensional emotion dictionary and classify three-dimensional emotions, an emotion seed was selected for the composition of seven emotion sets, and an emotion word dictionary was constructed by collecting SNS hashtags derived from each emotion seed. We also want to explore the priority of each Hangul emotion index. Design/methodology/approach In the process of transforming the matrix through the vector process of words constituting the sentence, weights were extracted using TF-IDF (Term Frequency Inverse Document Frequency), and the dimension reduction technique of the matrix in the emotion set was NMF (Nonnegative Matrix Factorization) algorithm. The emotional dimension was solved by using the characteristic value of the emotional word. The cosine distance algorithm was used to measure the distance between vectors by measuring the similarity of emotion words in the emotion set. Findings Customer needs analysis is a force to read changes in emotions, and Korean emotion word research is the customer's needs. In addition, the ranking of the emotion words within the emotion set will be a special criterion for reading the depth of the emotion. The sentiment index study of this research believes that by providing companies with effective information for emotional marketing, new business opportunities will be expanded and valued. In addition, if the emotion dictionary is eventually connected to the emotional DNA of the product, it will be possible to define the "emotional DNA", which is a set of emotions that the product should have.

유전자를 중간 매개로 고려한 동시발생 기반의 약물-질병 관계 추론 (Co-occurrence Based Drug-disease Relationship Inference with Genes as Mediators)

  • 신상원;신예은;장기업;윤영미
    • 한국정보기술학회논문지
    • /
    • 제16권11호
    • /
    • pp.1-9
    • /
    • 2018
  • 신약 재창출은 현재 사용되는 약물의 새로운 용도를 발견하는 방법이다. 텍스트 마이닝은 정형화되지 않은 문서로부터 의미 있는 지식을 획득하는 과정을 의미한다. 본 논문에서는 약물-유전자와 유전자-질병에서 동시에 측정된 유전자 출현 빈도의 비율을 고려하여 새로운 약물-질병 관계를 추론하는 방법을 제안한다. 생물학적 문헌으로부터 약물-유전자와 유전자-질병의 동시출현 빈도를 측정하고 각 약물과 질병에 대하여 유전자의 출현 비율을 계산한다. 약물-질병 관계의 가중치는 동시에 측정된 유전자 출현 비율의 평균을 이용하여 계산되고 이를 이용하여 각 질병의 분류 정확도를 측정한다. 약물-질병 관계를 추론하는 것에서 동시출현 빈도를 문장 단위로 측정하고 여러 관계를 고려하는 방법이 기존 방법보다 더 정확히 식별해내는 것을 보였다.

빅데이터 분석도구 R을 이용한 성경 데이터의 빈도와 소셜 네트워크 분석 (Frequency and Social Network Analysis of the Bible Data using Big Data Analytics Tools R)

  • 반재훈;하종수;김동현
    • 한국정보통신학회논문지
    • /
    • 제24권2호
    • /
    • pp.166-171
    • /
    • 2020
  • 데이터를 저장하고 분석하여 새로운 지식을 얻을 수 있는 빅데이터 처리기술은 사회의 여러 분야에서 중요성이 강조되고 있으며 정보통신기술 분야의 핵심 이슈로 부각되면서 관련 기술에 대한 관심이 증가하고 있다. 이러한 빅데이터를 분석할 수 있는 도구인 R은 통계 기반의 정보 분석을 가능하게 하는 언어와 환경이다. 본 논문에서는 이를 이용하여 성경데이터를 분석한다. 성경 중에서 신약성경의 4복음서의 데이터를 분석한다. 먼저 성경데이터를 수집하고 분석을 위한 필터링을 수행한다. 이후 R을 이용하여 어떠한 텍스트가 분포되어 있는지를 빈도 조사를 수행하며 정확한 데이터의 분석을 위해 한 문장에서 나오는 단어들을 쌍으로 표현하고 단어 간의 관계성을 분석하는 소셜 네트워크 분석을 통해 성경을 분석한다.

Long Term Average Spectrum을 이용한 성악가들의 Speaking Voice 분석 (Long Term Average Spectrum Characteristics of Speaking Voice of Western Operatic Singers)

  • 이경철;홍석진;진성민
    • 대한후두음성언어의학회지
    • /
    • 제15권2호
    • /
    • pp.122-127
    • /
    • 2004
  • Background and Objectives : Many studies have described and analyzed singer's formant and it has been shown that the epilaryngeal tube in the human airway is responsible for vocal ring, or the singer's formant. A similar phenomenon produced by trained singers in their speech led some authors to examine the speaker's ring. This study was designed to analyze the speaking voice of the singers and speaker's ring. Baterials and Methods : Ten tenors, fifteen baritones, fifteen sopranos and ten mezzo sopranos attending the music college, department of vocal music were chosen for this study. Fifteen male and fifteen female untrained normal speakers were chosen for control group. Each subject was asked to produce a sample of a sustained spoken vowel /ah/ sound for at least five seconds and read sentence 'Kaeul'. The sound data was analyzed using the Fast Fourier Transform(FFT) - based power spectrum, Long term average(LTA) power spectrum using the FFT algorithm of the Computerized Speech Lab(CSL, Kay elemetrics, Model 4300B, USA). Statistical analysis was performed using the Mann-Whitney test of the Statistical Package for Social Sciences(SPSS). Results : For LTA Power spectrum of/ah/ sound, a significant increase was seen in the 2,500-3,500Hz region(p<0.01) in four trained singer group compared with untrained speaker group, and a significant increase in the 9,000-10,000Hz region(p<0.01) in soparano group. Similarly, in sentence 'Kaeul', there was a significant increase in energy in the tenor, baritone, mezzo soprano group compared with the untrained speaker group in the 2,500-3,500Hz region(p<0.01), and a significant increase in all frequency region(p<0.01) in the soprano group. Conclusions : The LTA power spectrum suggests that trained singers group show more energy concentration in the 'singer's formant' region in the speaking voice, and authors believe this region to be the 'speaker's ring'. Further research is needed on the effect of singing training on the resonance of the speaking voice.

  • PDF

한국 신문의 영어 번역에 나타난 번역 보편소의 코퍼스 기반 분석 (A Corpus-based Study of Translation Universals in English Translations of Korean Newspaper Texts)

  • 고광윤;이영희
    • 비교문화연구
    • /
    • 제45권
    • /
    • pp.109-143
    • /
    • 2016
  • 본 연구는 번역된 텍스트들에 전형적으로 나타나는 언어적 특성들인 번역 보편소(translation universals)에 관한 코퍼스 기반 연구이다. 지금까지의 번역 보편소 연구는 언어계통상 서로 밀접한 관련이 있는 영어와 다른 유럽어 사이의 번역에 집중되어 왔으며, 다른 한편으로 주로 문학 장르의 분석에 치중되어 있다는 아쉬움을 지닌다. 본 연구에서는 관련 연구가 지닌 이러한 두 가지 주요 문제점을 보완하고자 하는 노력의 일환으로 한국어를 원문으로 하는 영어 번역 가운데 비문학 장르인 신문언어 텍스트를 분석대상으로 선택하였다. 먼저, 번역된 신문영어 텍스트와 비번역 신문영어 텍스트를 정해진 기준에 따라 수집하여 번역과 비번역 영어(translated and non-translated English)로 구성된 대응코퍼스(comparable corpora)를 구축하였다. 이렇게 구축된 대응 코퍼스를 바탕으로 기존 문헌에서 논의된 번역 보편소 가설 가운데 가장 대표적인 단순화(simplification), 명시화(explicitation), 규범화(normalization), 평준화(leveling-out) 현상이 한국어 신문의 영어 번역 텍스트에서 어떠한 양상을 보이는지 살펴봄으로써 각 가설들이 지니는 타당성을 검증해보고자 하였다. 본 연구의 분석결과를 종합해보면, 단순화와 규범화를 제외한 나머지 하위가설의 언어적 특성들은 모든 언어쌍과 모든 텍스트 장르에 걸쳐 일반화하기에 다소 한계가 있는 것으로 나타났다. 또한, 번역 보편소의 개념 규정이나 분석지표의 정교화, 그리고 결과의 일반화에는 신중한 접근이 필요할 것으로 보인다.

뇌파 신호 기반 스트레스 상태 분류 (Stress status classification based on EEG signals)

  • 강준수;장길진;이민호
    • 한국인터넷방송통신학회논문지
    • /
    • 제16권3호
    • /
    • pp.103-108
    • /
    • 2016
  • 일상생활에서 인간은 끊임없이 스트레스를 받으며 살아간다. 스트레스는 삶의 질과 밀접하게 연관이 있으며, 건강한 삶은 스트레스에 적절하게 대처하며 살아가는 삶이다. 스트레스는 호르몬 분비에 영향을 주며, 호르몬 분비의 변화는 뇌 신호 및 생체 신호에 영향을 준다. 이를 바탕으로, 본 논문은 스트레스와 뇌파 신호와의 관련성을 확인하였으며, 더 나아가 뇌파 신호 기반 정량적 스트레스 지수를 찾아보았다. 사용한 뇌파 장비는 32채널 유선 EEG 장비이며, 상업용 2채널(FP1, FP2) 뇌파 장비와의 비교를 위해, 상업용 뇌파 장비와 동일한 위치에 있는 2채널만 이용하여 데이터를 분석하였다. 뇌파의 주파수 특징점으로는 각 주파수 대역대의 파워 값, 주파수 대역대 파워 값들 간의 비율 및 차이 등을 테스트해 보았으며, 시간 특징점으로는 허스트 지수, 상관 지수, 리아프노프 지수 등을 테스트해 보았다. 총 6명의 피 실험자가 본 실험에 참여하였으며, 실험 과제로는 영어 지문이 사용되었다. 여러 특징점들 중 ${\theta}$ 파워/mid ${\beta}$ 파워가 가장 좋은 테스트 성능을 보여줬으며, 테스트 데이터에 대하여 평균 70.8%의 스트레스 분류 정확도를 얻었다. 추후, 저가 상용 2채널 뇌파 장치를 이용해서 비슷한 결과가 나오는지 확인해 볼 예정이다.

관상동맥 우회술환자의 수술 후 재발 관련 지식과 교육요구도와의 상관관계 (Correlation Between Knowledge and Educational Needs Related to Recurrent in Coronary Artery bypass graft patients)

  • 김희승;박민정
    • 대한간호학회지
    • /
    • 제30권3호
    • /
    • pp.549-559
    • /
    • 2000
  • The purpose of this study was to investigate the correlation between the knowledge and educational needs related to recurrent in coronary artery bypass graft patients as a basis to provide an individual nursing education for the population. The subjects consisted of 110 patients who had coronary artery bypass graft(CABG) at Asan Medical Center in Seoul and Sechong hospital in Buchon. Data was obtained from a knowledge questionnaire and a learning needs questionnaire between November 1998 and February 1999. Data were analyzed using SAS program for Wilcoxon rank sum test and Spearman correlation coefficient. The results were as follows : 1. With regard to the 18 items to measure knowledge, the mean (median) of items 'don't know' was 4.9(4) items. The mean (median) of items answered wrong was 3.2(3) items. The number of items answered 'don't know' tend to show higher in those who had less education, blue color jobs and myocardiac infarction history than in their counter parts. There were higher frequency of items answered 'don't know' in those who had no hypertension 2. With regard to the level of knowledge by questionnaire about CABG, The most "I dont know" (59.1%) highly response was 'He has to be treated with anticoagulant drug to prevent revasculized vessel from obstructing.' The seond highest response (56.4%) was 'If you were hypotensive, the coronary attack would collapse. 'During the hospitalized day, the patient has complete bedrest.' The highest error probability was cholesterol has not to intake.', 'After surgery, the sexual life is need controlled for 1 year. 3. The mean of educational needs was 3.38. With regard to the level of learning needs by sentence about CABG, 'Food that benefit heart disease', 'Recurrence possibility of heart disease', 'Management method of operation site', 'Risk symptom that visit hospital or report immediately' were higher than other sentenses. With regard to the level of learning needs by factor 'food(5 items)', 'disease(9 items)' and 'exercise(3 items)' showed the highest than other factors. The educational needs by patients characteristics tend to show higher in males, under the age of 49, middle or high school degree, previous experience of admission with coronary artery disease, history of myocardial infarction, expierience of PTCA, history of cerebro-vascular accident, previous expierience of smoking than in their counter parts. 4. The number of items answered 'don't know', wrong and correct weren't correlated with the level educational needs. As the results, the number of items answered 'don't know' tend to show higher in those who had less educated, blue color jobs and myocardiac infarction history than in their counter parts. There were higher frequency of items answered 'don't know' in those who had no hypertension .There were higher frequency of items answered 'don't know' on anti-thrombolitic theraphy, hypotension and pain relief. Also there were higher frequency of items answered wrong on bed rest period, cholesterol intake, and sexual life. Educational needs were higher in young age group, had previous experience of procesure and history of other disease. And when we educate CABG patients, education for diet, recurrence possibility of disease, management methods of operation site and risk symptom should be emphasized.

  • PDF

우리나라 시·군·구 지역보건의료계획의 비전(Vision) 문구 분석 (Analysis of Vision Statements in 6th Community Health Plan of Local Government in Korea)

  • 안치영;김현수;김원빈;오창훈;홍지영;김은영;이무식
    • 농촌의학ㆍ지역보건
    • /
    • 제42권1호
    • /
    • pp.1-12
    • /
    • 2017
  • 지역보건의료계획서에서 비전은 각 지역의 보건의료계획을 나타내는 핵심요소임에도 불구하고 작성방법에 대한 구체적인 지침이 부재하여 각 지역의 비전은 매우 다양하게 표현되어 있다. 이에 이 연구에서는 제6기 지역보건의료계획에서 제시한 비전 문구를 보건소 유형별, 권역별로 분석하였다. 전국 229개 지역의 제6기 지역보건의료계획서의 비전 문구와 이와 관련된 미션, 전략체계도, 중장기 추진과제 등을 대상으로 하였다. 지역을 권역별 4개, 읍 면 동 구성에 따른 보건소 유형을 4개로 분류하였고, 각 지역 비전의 글자 수, 문장 평가, 단어 빈도, 문구 평가를 빈도분석과 카이제곱검정, 일원배치분산분석을 이용하여 분석하였다. 비전의 글자 수가 17자 이하인 보건소가 172개소(75.1%)였고, 보건소 유형별로 유의한 차이가 있었다(p<0.05). 문구에 대한 수사표현에서 비유법(37.1%)이, 한글 외에 표현 언어 사용에서는 특수문자(43.2%)가 많았으며, 보건소 유형별로 유의한 차이가 있었다(p<0.01). 비전에 사용된 단어들은 '건강', '행복', '함께', '군민' 또는 '시민', '도시', '100세' 등이었다. 문구 평가 점수에서는 특 광역시 및 수도권에서 가장 높았으며, 보건소 유형 및 권역별로 유의한 차이를 보였다(p<0.05). 보건소 유형별로 과정 및 평가 영역, 공유가능성 등에서 유의한 차이가 있었다(p<0.01). 방향성은 충청권, 수도권 순으로 권역별로 유의한 차이가 있었으며(p<0.01), 미래지향성 및 공유가능성은 영남권이 가장 높아 권역별로 유의한 차이가 있었다(p<0.01). 비전은 지역보건의료계획에 가장 중요 요소 중 하나이다. 이 연구는 지역사회 특성별로 비전의 설정이 다름을 확인하였으며, 이러한 결과를 통하여 지역보건의료계획 등 보건소 비전 수립시 참고가 될 수 있는 기초적인 자료가 될 것으로 판단된다.

광합성 실험에서 나타난 초등 예비교사들의 반성적 사고와 실험 수행 능력 분석 (The Analysis of Elementary Pre-service Teachers' Reflective Thinking and Experiment Performance Ability on Photosynthesis Experiment)

  • 김동렬
    • 한국초등과학교육학회지:초등과학교육
    • /
    • 제34권4호
    • /
    • pp.502-518
    • /
    • 2015
  • 본 연구는 초등학교 과학교과서에 수록된 광합성 실험을 초등 예비교사들이 직접 수행하고 그 실험결과와 자신의 반성을 담은 탐구과정상의 어려움과 해결책을 탐구보고서에 작성하도록 하였다. 10개조의 탐구보고서와 발표자료를 바탕으로 초등 예비교사들의 반성적 사고와 실험 수행 능력을 분석하였다. 반성적 사고에 대해서는 10편의 탐구보고서에서 '지식', '과정', '지향', '태도' 4가지 유형과 관련된 총 108개의 진술 문장을 추출하였다. 분석 결과 광합성 실험을 통해 획득한 '지식'에 대한 반성적인 사고에 대한 내용이 가장 많았다. 지식유형에서도 실험을 통해 새롭게 알게 된 것이나 기존의 개념이해가 변화한 내용에 대한 반성이 가장 높은 빈도를 보였다. 실험 수행 능력은 10개조 중 반성적 사고 4가지 유형을 합산하여 가장 높은 빈도를 보인 한 개 조와 가장 낮은 빈도를 보인 한 개 조의 탐구보고서를 '실험준비 및 안전사고 예방', '실험 수행', '실험결과 정리 및 일반화', '실험결과 보완 및 피드백' 4단계에 따라 분석하여 56개의 문장을 추출하였다. 분석 결과 '실험결과 보완 및 피드백' 단계에서 두 조 간에 가장 큰 차이를 보였다. 최하위 조의 경우 '실험결과 정리 및 일반화' 단계의 '컴퓨터를 이용한 정보 처리', '대체 시약 및 재료 탐색', '대체 실험법 고안' 능력과 관련된 내용은 탐구보고서에서 찾을 수가 없었다.