• 제목/요약/키워드: degree words

검색결과 427건 처리시간 0.023초

빅데이터 분석을 위한 한국어 SentiWordNet 개발 방안 연구 : 분노 감정을 중심으로 (The Study of Developing Korean SentiWordNet for Big Data Analytics : Focusing on Anger Emotion)

  • 최석재;권오병
    • 한국전자거래학회지
    • /
    • 제19권4호
    • /
    • pp.1-19
    • /
    • 2014
  • 빅데이터 내에 존재하는 감정 정보를 추출하여 사용자들이 특정 대상에 대하여 갖고 있는 인식이 어떠한지를 파악하고자 하는 노력이 활발히 이루어지고 있다. 상품, 영화, 그리고 사회적 이슈 등에 대한 문장을 분석하여 사람들이 해당 주제에 어떠한 견해를 가지고 있는지를 분석하고 측정하여 구체적인 선호도를 알아내는 것이다. 문장에서 드러나는 감정 정도를 얻기 위해서는 감정어휘의 목록과 정도값을 제시할 수 있는 감정어휘사전이 필요하므로 본 연구에서는 감정어휘를 발견하는 방법과 이들의 정도값을 결정하는 문제를 다룬다. 기본적인 방법은 기초 감정어휘의 목록 수집과 이들의 정도값은 선행연구 결과와 직접 설문 방식을 이용하고, 확장된 목록의 수집과 정도값은 사전의 표제어 설명부(glosses)를 이용해 추론하는 것이다. 그 결과 발견된 감정어휘는 전형성을 띠고 있는 기본형 감정어휘, 기본형 감정어휘의 gloss에 사용된 확장형 1단계 1층위 감정어휘, 비 감정어휘 중 gloss에 기본형 또는 확장형 감정어휘를 가지고 있는 확장형 2단계 1층위 감정어휘, gloss의 gloss에 기본형 또는 확장형 감정어휘가 사용된 확장형 2단계 2층위 감정어휘의 네 종류로 나뉜다. 그리고 확장형 감정어휘의 정도값은 기본형 감정어휘의 정도값을 기초로 문형의 가중치와 강조승수를 적용하여 얻었다. 실험 결과 AND, OR 문형은 내포된 어휘의 감정 정도값을 평균내는 가중치를, Multiply 문형은 정도 부사어의 종류에 따라 1.2~1.5의 가중치를 갖는 것으로 파악되었다. 또한 NOT 문형은 사용된 어휘의 감정 정도를 일정 정도로 낮추어 역전시키는 것으로 추정된다. 또한 확장형 어휘에 적용되는 강조승수는 1층위에서 2, 2층위에서 3을 갖는 것으로 예상된다.

공공사업으로 인한 어업피해 범위와 피해정도 추정의 새로운 통계학적 접근 (A New Statistical Approach for the Estimation of Range and Degree of Fisheries Damages Caused by Public Undertaking)

  • 강용주;김기수;장창익;박청길;이종섭
    • 수산경영론집
    • /
    • 제35권1호
    • /
    • pp.117-132
    • /
    • 2004
  • This study attempts to suggest a new approach of the estimation of range and degree of fisheries damages caused by a large scale of reclamation undertaken in coastal area using the central limit theorem(CLT) in statistics. The key result of the study is the introduction of the new concept of critical variation of environmental factor($d_{c}$). The study defines $d_{c}$ as a standard deviation of the sample mean($\bar{X}$) of environmental factor(X), in other words, $\frac{\sigma}{ \sqrt{n}}$. The inner bound of $d_{c}$ could be the area of fisheries damages caused by public coastal undertaking. The study also defines the decreasing rate of fisheries production$\delta_{\varepsilon}$, in other words, degree of fisheries damages, as the rate of change in the distribution of sample mean(($\bar{X}$), caused by the continuous and constant variation of environmental factor. Therefore $\delta_{\varepsilon}$ can be easily calculated by the use of table of the standardized normal distribution.

  • PDF

웹 게시판에서 비속어사용실태와 문제 해결 방안의 제시 (Usage Analysis of Swearing Words on Web Board and Proposal of Problems Resolution Method)

  • 조동욱
    • 한국콘텐츠학회논문지
    • /
    • 제3권4호
    • /
    • pp.1-10
    • /
    • 2003
  • 최근 인터넷상의 웹 자유게시판에 쓰여지는 글들이 비속어를 많이 사용함으로써 인터넷 역기능의 대표적인 문제로 대두되고 있다. 이를 위해 본 연구에서는 웹 게시판에서 사용되는 비속어에 대한 실태 파악을 통해 비속어가 쓰여진 단어나 문장을 기술적으로 차단하는 방법론을 개발하고자 한다. 이는 크게 세 단계로 나누어 개발이 진행된다. 첫째가 비속어 사용 실태 및 이를 차단키 위한 알고리즘의 개발, 둘째가 비속어의 정도 차이를 파악키 위한 구체적이고 방대한 설문조사의 수행, 셋째가 이를 프로그램하여 실제 웹 상에서 비속어가 어느 정도 효과적으로 차단이 가능한지에 대한 시스템 구현 등으로 나누어진다. 본 논문은 이 같은 전체 시스템 중 첫째 단계인 웹 게시판에서의 비속어 사용 실태와 이를 해결키 위한 알고리즘 개발 부분에 대해 다루고자 한다.

  • PDF

사건명사의 네트워크 분석 (A Network Analysis of Event Nouns)

  • 김혜영;강범모;이도길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2010년도 제22회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.94-99
    • /
    • 2010
  • This paper is to present how a network between words is formed. Not only have we looked at the distributivity, frequency and strength in connections between related words, but we have also presented some way to shed lights on what this network means to linguistic and social studies. The target source is morpho-analysis components of Trends 21 corpus which cover all newspaper articles from lour major newspapers, including Chosun, Joongang, Donga, and Hankyoreh, issued between 2000 and 2008. Based on nodes, links, and their connectivity indexes - density, degree, and centralizations, we have been able to retrieve and cluster related words forming the network with 20 event nouns. To reduce noise, we have considered the words whose t-score is above 1.64. By conducting both network and statistical analyses, we have presented the network of each event noun.

  • PDF

Research trends in dental hygiene based on topic modeling and semantic network analysis

  • Yun-Jeong Kim;Jae-Hee Roh
    • 한국치위생학회지
    • /
    • 제22권6호
    • /
    • pp.495-502
    • /
    • 2022
  • Objectives: The purpose of this study was to analyze research trends in dental hygiene using topic modeling and semantic network analysis. Methods: A total of 261 published studies were collected 686 key words from the Research Information Sharing Service (RISS) by 2019-2021. Topic modeling and semantic network analysis were performed using Textom. Results: The most frequently and frequency-inverse document frequently key words were 'dental hygienist', 'oral health', 'elderly', 'periodontal disease', 'dental hygiene'. N-gram of key words show that 'dental hygienist-emotional labor', 'dental hygienist-elderly', 'dental hygienist-job performance', 'oral health-quality of life', 'oral health-periodontal disease' etc. were frequently. Key words with high degree centrality were 'dental hygienist (0.317)', 'oral health (0.239)', 'elderly (0.127)', 'job satisfaction (0.057)', 'dental care (0.049)'. Extracted topics were 5 by topic modeling. Conclusions: Results from the current study could be available to know research trends in dental hygiene and it is necessary to improve more detailed and qualitative analysis in follow-up study.

감정표현불능증(Alexithymia), 신체적 호소, 정서 및 어휘의 관계 (The Relation of Alexithymia, Somatic Complaints, Emotion and Vocabulary)

  • 전현태;이귀행;김재현;김한주;유용진;소광
    • 정신신체의학
    • /
    • 제8권1호
    • /
    • pp.58-64
    • /
    • 2000
  • 연구목적 : 본 연구는 정상 성인에서 성격의 일반적인 특정으로서의 감정표현불능증과 신체적 호소, 정서상태 및 어휘와의 상관관계를 알아봄으로써 감정표현불능증에 대한 이해를 넓히고자 하였다. 방법 : 신체적 질환을 가지고 있지 않은 정상 성인에서 한국판 20항목 Toronto 감정표현불능증 척도(TAS-20K), 신체적 호소, 연상한 단어의 수, 우울과 불안을 정도를 측정하여 그 결과들간의 상관관계를 알아 보았다. 총 662명을 평가한 후 체계적 표본추출 방법을 이용하여 다시 204명을 선택하였다. 결과 : 1) 감정표현불능증의 정도는 신체적 호소, 불안, 우울의 정도와 유의한 상관관계를 보였다. 2) 신체적 호소는 불안, 우울의 정도와 유의한 상관관계를 보였다. 3) 연상한 단어의 수는 나이와 부적 상관관계를 보였다. 4) 강정표현불능증의 정도는 연상한 단어의 수와 유의한 상관관계를 보이지 않았다. 결론 : 감정표현불능증의 정도가 심할수록 신체적 호소는 더 많으며 이는 불안, 우울의 정도와 연관되어 있었으나 어휘의 양과는 유의한 관계를 발견할 수 없었다.

  • PDF

정신지체아 부.모의 스트레스와 가족결합력 (The Perceived Stresses and Family Strengths by Fathers and Mothers having Mentally Retarded Children)

  • 김나영;윤호열
    • 대한가정학회지
    • /
    • 제38권7호
    • /
    • pp.53-65
    • /
    • 2000
  • This study is for examining the differences of perceived stresses and family strengths between the parents according to socio-demographic backgrounds(age, educational level, income and the degree of disorder) of the parents having mentally retarded children. The results were as follows. First, in the overall perceived stress level, there was no difference between fathers and mothers, but when compared in stress areas, fathers experience more distresses in general interpersonal areas than mothers. Fathers also shows differences according to the degrees of their income and their perception about disorder compared with mothers showing differences according to the degree of income. Second, there were no differences in family strengths perceived by both fathers and mothers, but were significant differences according to the level of education and income. Another words, higher the education and income level, higher is their family strengths level. Third, there were positive correlations between the perceived stresses and family strengths, and significant differences in family strengths according to the stress level(higher/lower part of the group). In other words, when the perceived stress level is high, the level of perceived family strengths is low.

  • PDF

연결망 분석을 활용한 우리나라 금연연구 동향분석 (A Social Network Analysis of Research Key Words Related Smoke Cessation in South Korea)

  • 안은성
    • 보건행정학회지
    • /
    • 제29권2호
    • /
    • pp.138-145
    • /
    • 2019
  • Background: The purpose of this study is supposed to figure out the keyword network from 2009 to 2018 with social network analysis and provide the research data that can help the Korea government's policy making on smoking cessation. Methods: First, frequency analysis on the keyword was performed. After, in this study, I applied three classic centrality measures (degree centrality, betweenness centrality, and eigenvector centrality) with R 3.5.1. Moreover, I visualized the results as the word cloud and keyword network. Results: As a result of network analysis, 'smoking' and 'smoking cessation' were key words with high frequency, high degree centrality, and betweenness centrality. As a result of looking at trends in keyword, many study had been done on the keyword 'secondhand smoke' and 'adolescent' from 2009 to 2013, and 'cigarette graphic warning' and 'electronic cigarette' from 2014 to 2018. Conclusion: This study contributes to understand trends on smoking cessation study and seek further study with the keyword network analysis.

단락 자동 구분을 이용한 문서 요약 시스템 (Korean Summarization System using Automatic Paragraphing)

  • 김계성;이현주;이상조
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권7_8호
    • /
    • pp.681-686
    • /
    • 2003
  • 본 논문은 단락의 자동 구분을 통해 중요한 문장을 추출하는 요약 시스템을 제안한다. 먼저 어휘의 재출현 여부를 파악하여 어휘의 일치도와 어휘의 역할 변화와 같은 재출현 어휘의 양상 정보를 수집하고, 이를 통하여 문장 간의 긴밀도를 정량적으로 계산한다. 다음으로 측정된 문장간 긴밀도를 이용하여 사용자의 추출 범위에 따라 단락을 구분하고, 각 단락의 대표 문장을 선정하여 최종 요약문을 추출한다. 제안한 방법은 문서 제목, 문장의 위치, 수사 구조 등의 정보를 이용하지 않기 때문에 수사 구조가 자주 발견되지 않는 문서에도 적용이 가능하다.

네트워크 텍스트 분석법을 활용한 STEAM 교육의 연구 논문 분석 (Analysis of Articles Related STEAM Education using Network Text Analysis Method)

  • 김방희;김진수
    • 한국초등과학교육학회지:초등과학교육
    • /
    • 제33권4호
    • /
    • pp.674-682
    • /
    • 2014
  • This study aims to analyze STEAM-related articles and to look into the trend of research to present implications for research directions in the future. To achieve the research purpose, the researcher searched by key words, 'STEAM' and 'Convergence Education' through the RISS. Subjects of analysis were titles of 181 articles in journal articles and conference papers published from 2011 through 2013. Through an analysis of the frequency of the texts that appeared in the titles of the papers, key words were selected, the co-occurrence matrix of the key words was established, and using network maps, degree centrality and betweenness centrality, and structural equivalence, a network text analysis was carried out. For the analysis, KrKwic, KrTitle, UCINET and NetMiner Program were used, and the results were as follows: in the result of the text frequency analysis, the key words appeared in order of 'program', 'development', 'base' and 'application'. Through the network among the texts, a network built up with core hubs such as 'program', 'development', 'elementary' and 'application' was found, and in the degree centrality analysis, 'program', 'elementary', 'development' and 'science' comprised key issues at a relatively high value, which constituted the pivot of the network. As a result of the structural equivalence analysis, regarding the types of their respective relations, it was analyzed that there was a similarity in four clusters such as the development of a program (1), analysis of effects (2) and the establishment of a theoretical base (1).