• 제목/요약/키워드: community clustering

검색결과 138건 처리시간 0.026초

키워드 자동 생성에 대한 새로운 접근법: 역 벡터공간모델을 이용한 키워드 할당 방법 (A New Approach to Automatic Keyword Generation Using Inverse Vector Space Model)

  • 조원진;노상규;윤지영;박진수
    • Asia pacific journal of information systems
    • /
    • 제21권1호
    • /
    • pp.103-122
    • /
    • 2011
  • Recently, numerous documents have been made available electronically. Internet search engines and digital libraries commonly return query results containing hundreds or even thousands of documents. In this situation, it is virtually impossible for users to examine complete documents to determine whether they might be useful for them. For this reason, some on-line documents are accompanied by a list of keywords specified by the authors in an effort to guide the users by facilitating the filtering process. In this way, a set of keywords is often considered a condensed version of the whole document and therefore plays an important role for document retrieval, Web page retrieval, document clustering, summarization, text mining, and so on. Since many academic journals ask the authors to provide a list of five or six keywords on the first page of an article, keywords are most familiar in the context of journal articles. However, many other types of documents could not benefit from the use of keywords, including Web pages, email messages, news reports, magazine articles, and business papers. Although the potential benefit is large, the implementation itself is the obstacle; manually assigning keywords to all documents is a daunting task, or even impractical in that it is extremely tedious and time-consuming requiring a certain level of domain knowledge. Therefore, it is highly desirable to automate the keyword generation process. There are mainly two approaches to achieving this aim: keyword assignment approach and keyword extraction approach. Both approaches use machine learning methods and require, for training purposes, a set of documents with keywords already attached. In the former approach, there is a given set of vocabulary, and the aim is to match them to the texts. In other words, the keywords assignment approach seeks to select the words from a controlled vocabulary that best describes a document. Although this approach is domain dependent and is not easy to transfer and expand, it can generate implicit keywords that do not appear in a document. On the other hand, in the latter approach, the aim is to extract keywords with respect to their relevance in the text without prior vocabulary. In this approach, automatic keyword generation is treated as a classification task, and keywords are commonly extracted based on supervised learning techniques. Thus, keyword extraction algorithms classify candidate keywords in a document into positive or negative examples. Several systems such as Extractor and Kea were developed using keyword extraction approach. Most indicative words in a document are selected as keywords for that document and as a result, keywords extraction is limited to terms that appear in the document. Therefore, keywords extraction cannot generate implicit keywords that are not included in a document. According to the experiment results of Turney, about 64% to 90% of keywords assigned by the authors can be found in the full text of an article. Inversely, it also means that 10% to 36% of the keywords assigned by the authors do not appear in the article, which cannot be generated through keyword extraction algorithms. Our preliminary experiment result also shows that 37% of keywords assigned by the authors are not included in the full text. This is the reason why we have decided to adopt the keyword assignment approach. In this paper, we propose a new approach for automatic keyword assignment namely IVSM(Inverse Vector Space Model). The model is based on a vector space model. which is a conventional information retrieval model that represents documents and queries by vectors in a multidimensional space. IVSM generates an appropriate keyword set for a specific document by measuring the distance between the document and the keyword sets. The keyword assignment process of IVSM is as follows: (1) calculating the vector length of each keyword set based on each keyword weight; (2) preprocessing and parsing a target document that does not have keywords; (3) calculating the vector length of the target document based on the term frequency; (4) measuring the cosine similarity between each keyword set and the target document; and (5) generating keywords that have high similarity scores. Two keyword generation systems were implemented applying IVSM: IVSM system for Web-based community service and stand-alone IVSM system. Firstly, the IVSM system is implemented in a community service for sharing knowledge and opinions on current trends such as fashion, movies, social problems, and health information. The stand-alone IVSM system is dedicated to generating keywords for academic papers, and, indeed, it has been tested through a number of academic papers including those published by the Korean Association of Shipping and Logistics, the Korea Research Academy of Distribution Information, the Korea Logistics Society, the Korea Logistics Research Association, and the Korea Port Economic Association. We measured the performance of IVSM by the number of matches between the IVSM-generated keywords and the author-assigned keywords. According to our experiment, the precisions of IVSM applied to Web-based community service and academic journals were 0.75 and 0.71, respectively. The performance of both systems is much better than that of baseline systems that generate keywords based on simple probability. Also, IVSM shows comparable performance to Extractor that is a representative system of keyword extraction approach developed by Turney. As electronic documents increase, we expect that IVSM proposed in this paper can be applied to many electronic documents in Web-based community and digital library.

관리(管理)를 중단(中斷)한 산지초지(山地草地)의 생태적(生態的) 특성(特性)에 관한 연구(硏究) II. 관리(管理)를 중단(中斷)한 산지초지(山地草地)의 식생천이(植生遷移)에 관한 연구(硏究) (Studies on Ecological Characteristics of Abandoned Hilly Pasture II. Studies on vegetational succession of abandoned hilly pasture)

  • 박근제;이종경;윤세형;김맹중;김정갑
    • 한국초지조사료학회지
    • /
    • 제18권4호
    • /
    • pp.337-344
    • /
    • 1998
  • 본(本) 시험(試驗)은 관리(管理)를 포기(抛棄)한 산지초지(山地草地)의 식생천이(植生遷移)를 조사(調査)하여 산지초지(山地草地) 관리(管理)에 이용(利用)코자 1993년부터 1996년까지 경기도 여주 야산지(野山地)에 조성(造成)한 초지(草地)에서 수행(遂行)되었던 바, 그 결과(結果)를 요약하면 다음과 같다. 1. 초지(草地)의 식생(植生)은 정지초지(整地草地)는 관리포기 후 l년차에, 임간초지(林間草地)는 방치후(放置後) 2년차에 식생이 가장 많이 변하였다. 2. 관리(管理)를 중단(中斷)한 후 초지식생(草地植生)의 생활형(生活型)은 미세지형(微細地形) 정지초지(整地草地)나 임간초지(林間草地) 공히 반지중식물(半地中植物), 지중식물(地中植物), 지표식물(地表植物)은 점차 감소하였으나, 1년생(年生) 식물(植物)과 어린나무를 포함한 관목류(灌木類)는 현저히 증가되었다. 3. 식생(植生)그룹간의 유사성(類似性)은 식생구성(植生構成) 초종(草種)에 따라 크게 영향을 받았는데, 이와 관련하여 초지(草地)의 식생구성(植生構成)이 비슷한 군락(群落)이 유클리드 거리계수(距離係數)가 가깝게 집단(集團)을 형성하였으며, 유사성(類似性)이 낮은 식생(植生)그룹은 유클리드 거리계수(距離係數)가 보다 먼 곳에서 서로 묶여지는 경향을 보였다. 미세지형(微細地形) 정지초지(整地草地)나 임간초지(林間草地) 공히 관리를 중단(中斷)하면 개량초지(改良草地)와는 다른 산지야초지(山地野草地)나 임야(林野)로 천이(遷移)되었다.

  • PDF

원주 지역 주민들의 사상체질과 심박수변이도와의 상관성 (Correlation Between Sasang Constitution and Heart Rate Variability in Won-ju Rural Population)

  • 김수연;선승호;유준상;고상백;박종구
    • 대한한방내과학회지
    • /
    • 제30권3호
    • /
    • pp.510-524
    • /
    • 2009
  • Objective : This study was designed to find the correlation between Sasang Constitution and heart rate variability(HRV). Method : There were 665 subjects (280 men and 385 women), between 39 and 72 years old. in a rural community. Sasang Constitution was diagnosed by a Sasang constitutional specialist using PSSC (Phonetic System for Sasang Constitution), face and tongue photo and checkup-list. A structured-questionnaire was used to assess the general characteristics. HRV was recorded using SA-2000 (medi-core). HRV was assessed by time domain and by frequency domain analysis. Metabolic syndrome was defined on the basis of clustering of risk factors, when three or more of the following cardiovascular risk factors were included : blood pressure, fasting blood sugar, triglyceride HDL-cholesterol, and abdominal obesity (waist). Because of the skewness of the data, logarithmic transformation was performed on the absolute units of the spectral components of HRV, and the resulting logarithmic values and normalized units were compared between the groups by a logistic regression. The 95% confidence interval (CI) of the odds ratio was used and calculated from the data laid out for a cross sectional study. Results : 1. Odds ratios of Taeeumin and Soeumin in female adults below 60 years old were significantly lower than that of Soyangin in LF norm and LF/HF ratio. Odds ratios of Taeeumin and Soeumin in female adults below 60 years old were significantly higher than that of Soyangin in HF norm. 2. There was no significant correlation between HRV and Sasang Constitution in female adults from 60 years old and over. 3. There was no significant correlation between HRV and Sasang Constitution in male adults. Conclusion : There is a statistically significant correlation between the HRV and Sasang Constitution. There is a tendency of increase in the sympathetic activity in Soyangin. There is a tendency of decrease in the parasympathetic activity in Taeeumin and Soeumin.

  • PDF

Intraspecies Volatile Interactions Affect Growth Rates and Exometabolomes in Aspergillus oryzae KCCM 60345

  • Singh, Digar;Lee, Choong Hwan
    • Journal of Microbiology and Biotechnology
    • /
    • 제28권2호
    • /
    • pp.199-209
    • /
    • 2018
  • Volatile organic compounds (VOCs) are increasingly been recognized as the chemical mediators of mold interactions, shaping their community dynamics, growth, and metabolism. Herein, we selectively examined the time-correlated (0 D-11 D, where D = incubation days) effects of intraspecies VOC-mediated interactions (VMI) on Aspergillus oryzae KCCM 60345 (S1), following co-cultivation with partner strain A. oryzae KACC 44967 (S2), in a specially designed twin plate assembly. The comparative evaluation of $S1_{VMI}$ (S1 subjected to VMI with S2) and its control ($S1_{Con}$) showed a notable disparity in their radial growth ($S1_{VMI}$ < $S1_{Con}$) at 5 D, protease activity ($S1_{VMI}$ > $S1_{Con}$) at 3-5 D, amylase activity ($S1_{VMI}$ < $S1_{Con}$) at 3-5 D, and antioxidant levels ($S1_{VMI}$ > $S1_{Con}$) at 3 D. Furthermore, we observed a distinct clustering pattern for gas chromatography-time of flight-mass spectrometry datasets from 5 D extracts of $S1_{VMI}$ and $S1_{Con}$ in principle component analysis (PC1: 30.85%; PC2: 10.31%) and partial least squares discriminant analysis (PLS-DA) (PLS1: 30.77; PLS2: 10.15%). Overall, 43 significantly discriminant metabolites were determined for engendering the metabolic variance based on the PLS-DA model (VIP > 0.7, p < 0.05). In general, a marked disparity in the relative abundance of amino acids ($S1_{VMI}$ > $S1_{Con}$) at 5 D, organic acids ($S1_{VMI}$ > $S1_{Con}$) at 5 D, and kojic acid ($S1_{VMI}$ < $S1_{Con}$) at 5-7 D were observed. Examining the headspace VOCs shared between S1 and S2 in the twin plate for 5 D incubated samples, we observed the relatively higher abundance of C-8 VOCs (1-octen-3-ol, (5Z)-octa-1,5-dien-3-ol, 3-octanone, 1-octen-3-ol acetate) having known semiochemical functions. The present study potentially illuminates the effects of VMI on commercially important A. oryzae's growth and biochemical phenotypes with subtle details of altered metabolomes.

국내 주요 강 생태계 내 동물플랑크톤의 탄소, 질소, 인 비율 해석 (Carbon, Nitrogen and Phosphorous Ratios of Zooplankton in the Major River Ecosystems)

  • 김현우;라긍환;정광석;김동균;황순진;이재용;김범철
    • 생태와환경
    • /
    • 제46권4호
    • /
    • pp.581-587
    • /
    • 2013
  • 국내 주요 강 생태계 (한강, 금강, 영산강, 섬진강)에서 지난 2004년부터 2008년까지 총 동물플랑크톤의 탄소(C), 질소(N) 및 인(P) 함량에 대해 평가하였다. 동물플랑크톤의 건중량 당 C, N P-함량은 강 시스템별로 변화가 뚜렷하였다. 조사지점별 평균 C, N, 그리고 P-함량의 범위는 $70{\sim}620mgC\;mg^{-1}$ D.W., $7.1{\sim}85.5{\mu}gN\;mg^{-1}$ D.W. 그리고 $2.5{\sim}7.4{\mu}gP\;mg^{-1}$ D.W.인 것으로 파악되었다. 평균 탄소: 질소: 인 비율은 지점별 상이한 차이를 보였으며 전 지점의 평균은 200 : 29 : 1인 것으로 파악되었다. 전 조사지점에서의 동물플랑크톤 군집의 탄소: 인 그리고 질소: 인 비율의 범위는 각 각 38에서 392 : 1과 4에서 65 : 1이었다. 자가조직화지도(SOM)을 활용한 평면상 지점들의 배치 양상과 화학양론 자료들 간의 주요그룹 분석 결과 크게 세 클러스터로 구분되었다. 클러스터링 결과 동물플랑크톤의 C, N, P-함량은 공간적 이질성에 의해 영향을 받았으며, 화학량론 자료는 강 생태계의 환경 특성 해석에 활용성이 높은 것으로 사료되었다.

강소농의 공간적 분포특성과 결정요인 분석 -사과를 중심으로- (The Spatial Distribution Characteristics and Determinants of Strong Small Farm: Focusing on Apples)

  • 김현중;이성우
    • 농촌지도와개발
    • /
    • 제19권4호
    • /
    • pp.961-987
    • /
    • 2012
  • 본 연구는 강소농의 개념 정립을 통해 사과를 대상으로 강소농의 공간적 분포특성과 결정요인을 분석하였으며, 2010년 농림어업총조사 자료를 활용하였다. 공간적 분포특성은 공간 클러스터링 기법을 이용하여 과수 강소농 가구가 어느 지역에 집중적으로 분포하는지를 분석하였다. 강소농과 비강소농의 이산적인 형태의 종속변인을 구성한 후, 프로빗 모형을 활용, 인구 경제적, 경영 특성 등의 독립변인을 통제한 상태에서 사과 강소농의 결정요인을 분석하였다. 분석결과, 2010년 현재 사과 강소농은 모두 1,529가구로 분석되었으며, 이들 가구들은 경상북도에 밀집하여 분포하는 것으로 드러났다. 강소농의 결정요인은 농가의 소득 결정요인과 유사한 결과를 보였다. 사과 주산지에 입지하고 있고, 정보화가 높은 농가일수록, 그리고 생산자 조직에 참여하고 있으며, 직접 판매를 하는 농가일수록 강소농일 확률이 높게 나타났다. 본 연구의 분석결과는 강소농 정책을 육성하는데 있어 반드시 요구되는 강소농의 특성을 파악하였다는 측면에서 향후 강소농 육성 정책에 다양한 기초자료를 제공할 수 있으리라 판단된다.

지역연계 대학창업교육 방향 연구 (A Study on the Direction of Entrepreneurship Education in Universities linked to Community)

  • 이원철;최종인
    • 벤처창업연구
    • /
    • 제12권6호
    • /
    • pp.89-98
    • /
    • 2017
  • 시대의 흐름에 따라 창업자본주의(Entrepreneurial Aapitalism)의 경향을 보이고 있는 현대사회에서 혁신적인 아이디어와 도전정신을 바탕으로 글로벌 진출을 도모하는 소규모 기업 또는 개인 창업자의 역동적인 창업활동은 창업생태계(Entrepreneurial Ecosystem)에서 새로운 성장 동력 창출로 이어진다. 이에 따라 우리나라 정부에서도 대학 창업을 촉진하기 위한 노력으로 '대학창업교육 5개년 계획(2013-2017)'과 '2015년도 정부 창업지원 효율화 방안', 그리고 '산학협력 활성화 5개년 기본계획(2016-2020)'등을 발표하였고, 대학과 연구소 등에서도 창업 활성화에 대한 많은 노력을 기울이고 있지만 여전히 현실적인 한계가 존재한다. 이러한 한계를 극복하기 위한 방안으로 본 연구에서는 대학 창업교육의 체계화를 목적으로 변화하는 대학의 역할과 클러스터(cluster), 그리고 창업교육에 대한 이론을 고찰한다. 또한, 미국 혁신대학의 대표적 사례를 중심으로 창의적인 대학 문화의 요인을 살펴보고, '창업 성공'과는 다른 '성공적인 창업'을 목적으로 클러스터 관점의 창업교육에 대한 개념적 프레임워크를 제시하고자 한다. 대학 기술기반의 창업 활성화를 위한 통합적 창업교육 플랫폼 구축의 기조(基調)가 되는 클러스터 관점의 창업교육에 대한 개념적 프레임워크는 관련 이론과 사례를 바탕으로 창의적 문화 구축과 효과적인 혁신 창출에 필요한 인재, 기술, 관용이라는 세 가지 요소의 역할이 중심이 되어 창업교육에 수반되어야 할 지역의 창업자원, 창업정책, 그리고 리더십의 클러스터링을 강조하고 있다.

  • PDF

과학기술 전거데이터 시스템에서의 해외 학술논문 저자 식별요소 추출 (Extraction of Author Identification Elements of Overseas Academic Papers on Authority Data System for Science and Technology)

  • 최현미;이석형;김광영;김환민
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2013년도 춘계학술대회
    • /
    • pp.711-713
    • /
    • 2013
  • 페이스북, 트위터, 등의 소셜 네트워크의 확산으로 전 세계의 다양한 인적정보를 접할 수 있다. 과학기술 분야에서도 많은 인적정보가 있지만 과학기술자 정보가 체계적으로 정리되지 않아 협력 연구 파트너, 등 업무에 적합한 연구자를 찾기 어려운 문제점이 있다. 이런 문제점을 해결하고자 학술문헌 저자를 중심으로 과학기술 전거데이터를 구축하고 있다. 이 논문에서는 1994년부터 2012년까지 수집한 해외 학술논문 저자명 전거데이터를 구축하기 위하여 수백만건의 학술논문에서 저자 식별 요소를 추출한다. 저자 식별요소는 한글, 영문, 한문(일본어 포함)을 대상으로 저자명, 소속기관명, 학술지명, 발행년도, 키워드, 공저자와 공저자 소속기관, 등이 있다. 이 언어별 식별정보를 기반으로 해외 학술논문 정보에서 저자 식별 정보를 추출하여 데이터베이스를 구축하였다. 향후, 이 추출된 정보를 기반으로 저자 식별 정보를 클러스터링하고 수정, 편집하여 연구자에 대한 학술정보 활동내역을 정리할 예정이다. 구축될 해외 학술논문 전거 데이터는 연구 협력 파트너 찾기, 과제 심사위원 추천, 등 연구자 정보의 활용도를 높여 연구자 커뮤니티를 활성화시키는데 유용하게 사용될 수 있다.

  • PDF

Dynamic changes of yak (Bos grunniens) gut microbiota during growth revealed by polymerase chain reaction-denaturing gradient gel electrophoresis and metagenomics

  • Nie, Yuanyang;Zhou, Zhiwei;Guan, Jiuqiang;Xia, Baixue;Luo, Xiaolin;Yang, Yang;Fu, Yu;Sun, Qun
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제30권7호
    • /
    • pp.957-966
    • /
    • 2017
  • Objective: To understand the dynamic structure, function, and influence on nutrient metabolism in hosts, it was crucial to assess the genetic potential of gut microbial community in yaks of different ages. Methods: The denaturing gradient gel electrophoresis (DGGE) profiles and Illumina-based metagenomic sequencing on colon contents of 15 semi-domestic yaks were investigated. Unweighted pairwise grouping method with mathematical averages (UPGMA) clustering and principal component analysis (PCA) were used to analyze the DGGE fingerprint. The Illumina sequences were assembled, predicted to genes and functionally annotated, and then classified by querying protein sequences of the genes against the Kyoto encyclopedia of genes and genomes (KEGG) database. Results: Metagenomic sequencing showed that more than 85% of ribosomal RNA (rRNA) gene sequences belonged to the phylum Firmicutes and Bacteroidetes, indicating that the family Ruminococcaceae (46.5%), Rikenellaceae (11.3%), Lachnospiraceae (10.0%), and Bacteroidaceae (6.3%) were dominant gut microbes. Over 50% of non-rRNA gene sequences represented the metabolic pathways of amino acids (14.4%), proteins (12.3%), sugars (11.9%), nucleotides (6.8%), lipids (1.7%), xenobiotics (1.4%), coenzymes, and vitamins (3.6%). Gene functional classification showed that most of enzyme-coding genes were related to cellulose digestion and amino acids metabolic pathways. Conclusion: Yaks' age had a substantial effect on gut microbial composition. Comparative metagenomics of gut microbiota in 0.5-, 1.5-, and 2.5-year-old yaks revealed that the abundance of the class Clostridia, Bacteroidia, and Lentisphaeria, as well as the phylum Firmicutes, Bacteroidetes, Lentisphaerae, Tenericutes, and Cyanobacteria, varied more greatly during yaks' growth, especially in young animals (0.5 and 1.5 years old). Gut microbes, including Bacteroides, Clostridium, and Lentisphaeria, make a contribution to the energy metabolism and synthesis of amino acid, which are essential to the normal growth of yaks.

2015 및 2022 개정 초등학교 과학과 교육과정에 대한 비교 - 네트워크 분석을 중심으로 - (Comparing the 2015 with the 2022 Revised Primary Science Curriculum Based on Network Analysis)

  • 조헌국
    • 한국초등과학교육학회지:초등과학교육
    • /
    • 제42권1호
    • /
    • pp.178-193
    • /
    • 2023
  • 본 연구는 2015 및 2022 개정 과학과 교육과정 중 초등학교급과 관련된 성취기준을 중심으로 네트워크 분석을 통해 어떠한 변화 양상을 갖는지 비교하고 이를 토대로 초등학교 과학 교수학습을 위한 시사점을 제공하는 것을 목적으로 하였다. 이에 따라 본 연구에서는 2015 및 2022 개정 초등 과학과 교육과 정의 성취기준을 추출하여 성취기준 영역 변화에 따른 차이를 살펴보고, 각 영역별 중심성 지수를 중심으로 한 비교, 커뮤니티 탐지 기법을 활용한 군집 분석을 통해 어떠한 변화가 있는지 분석하였다. 연구 결과, 2015 개정 과학과 교육과정에 비해 전체 성취기준은 10% 가량 감소하였으나, 성취 기준의 길이나 주요어의 빈도는 오히려 증가하였으며, 관찰이나 조사, 설명 외에도 공유, 실천, 설계 등 디지털 도구활용 및 협동학습과 관련된 과정·기능적 측면이 강조되었다. 그러나 이러한 변화는 과학의 각 영역에 따라 서로 다른 차이를 보임을 알 수 있었다. 또한 군집 분석 결과 대체적으로 군집의 숫자나 관련 개념이나 용어의 영역은 유사하였으나, 과정·기능 및 가치·태도와 관련된 주요어를 중심으로 수행 방식 등에 변화가 나타났음을 확인할 수 있었다. 이러한 연구 결과를 토대로 본 연구에서는 새로운 교육과정의 적용 시 고려해야 할 점들을 시사점으로 제시하였다.