• 제목/요약/키워드: 모델 생성

검색결과 6,414건 처리시간 0.029초

키워드 자동 생성에 대한 새로운 접근법: 역 벡터공간모델을 이용한 키워드 할당 방법 (A New Approach to Automatic Keyword Generation Using Inverse Vector Space Model)

  • 조원진;노상규;윤지영;박진수
    • Asia pacific journal of information systems
    • /
    • 제21권1호
    • /
    • pp.103-122
    • /
    • 2011
  • Recently, numerous documents have been made available electronically. Internet search engines and digital libraries commonly return query results containing hundreds or even thousands of documents. In this situation, it is virtually impossible for users to examine complete documents to determine whether they might be useful for them. For this reason, some on-line documents are accompanied by a list of keywords specified by the authors in an effort to guide the users by facilitating the filtering process. In this way, a set of keywords is often considered a condensed version of the whole document and therefore plays an important role for document retrieval, Web page retrieval, document clustering, summarization, text mining, and so on. Since many academic journals ask the authors to provide a list of five or six keywords on the first page of an article, keywords are most familiar in the context of journal articles. However, many other types of documents could not benefit from the use of keywords, including Web pages, email messages, news reports, magazine articles, and business papers. Although the potential benefit is large, the implementation itself is the obstacle; manually assigning keywords to all documents is a daunting task, or even impractical in that it is extremely tedious and time-consuming requiring a certain level of domain knowledge. Therefore, it is highly desirable to automate the keyword generation process. There are mainly two approaches to achieving this aim: keyword assignment approach and keyword extraction approach. Both approaches use machine learning methods and require, for training purposes, a set of documents with keywords already attached. In the former approach, there is a given set of vocabulary, and the aim is to match them to the texts. In other words, the keywords assignment approach seeks to select the words from a controlled vocabulary that best describes a document. Although this approach is domain dependent and is not easy to transfer and expand, it can generate implicit keywords that do not appear in a document. On the other hand, in the latter approach, the aim is to extract keywords with respect to their relevance in the text without prior vocabulary. In this approach, automatic keyword generation is treated as a classification task, and keywords are commonly extracted based on supervised learning techniques. Thus, keyword extraction algorithms classify candidate keywords in a document into positive or negative examples. Several systems such as Extractor and Kea were developed using keyword extraction approach. Most indicative words in a document are selected as keywords for that document and as a result, keywords extraction is limited to terms that appear in the document. Therefore, keywords extraction cannot generate implicit keywords that are not included in a document. According to the experiment results of Turney, about 64% to 90% of keywords assigned by the authors can be found in the full text of an article. Inversely, it also means that 10% to 36% of the keywords assigned by the authors do not appear in the article, which cannot be generated through keyword extraction algorithms. Our preliminary experiment result also shows that 37% of keywords assigned by the authors are not included in the full text. This is the reason why we have decided to adopt the keyword assignment approach. In this paper, we propose a new approach for automatic keyword assignment namely IVSM(Inverse Vector Space Model). The model is based on a vector space model. which is a conventional information retrieval model that represents documents and queries by vectors in a multidimensional space. IVSM generates an appropriate keyword set for a specific document by measuring the distance between the document and the keyword sets. The keyword assignment process of IVSM is as follows: (1) calculating the vector length of each keyword set based on each keyword weight; (2) preprocessing and parsing a target document that does not have keywords; (3) calculating the vector length of the target document based on the term frequency; (4) measuring the cosine similarity between each keyword set and the target document; and (5) generating keywords that have high similarity scores. Two keyword generation systems were implemented applying IVSM: IVSM system for Web-based community service and stand-alone IVSM system. Firstly, the IVSM system is implemented in a community service for sharing knowledge and opinions on current trends such as fashion, movies, social problems, and health information. The stand-alone IVSM system is dedicated to generating keywords for academic papers, and, indeed, it has been tested through a number of academic papers including those published by the Korean Association of Shipping and Logistics, the Korea Research Academy of Distribution Information, the Korea Logistics Society, the Korea Logistics Research Association, and the Korea Port Economic Association. We measured the performance of IVSM by the number of matches between the IVSM-generated keywords and the author-assigned keywords. According to our experiment, the precisions of IVSM applied to Web-based community service and academic journals were 0.75 and 0.71, respectively. The performance of both systems is much better than that of baseline systems that generate keywords based on simple probability. Also, IVSM shows comparable performance to Extractor that is a representative system of keyword extraction approach developed by Turney. As electronic documents increase, we expect that IVSM proposed in this paper can be applied to many electronic documents in Web-based community and digital library.

유치열과 영구치열의 구개 각부의 관계에 관한 연구 (A STUDY ON THE RELATIONS OF VARIOUS PARTS OF THE PALATE FOR PRIMARY AND PERMANENT DENTITION)

  • 이용훈;양연미;이용희;김상훈;김재곤;백병주
    • 대한소아치과학회지
    • /
    • 제31권4호
    • /
    • pp.569-578
    • /
    • 2004
  • 본 연구는 유치열과 영구치열에서 구개의 길이, 폭, 깊이 및 치열궁의 형태 등을 조사하여 남녀간의 차이와 유치열과 영구치열간의 변화양상을 파악하는 것이다. 유치열기 아동 100명과 영구치열기 성인 100명 총 200명을 대상으로 하여 상악 석고 모형을 채득하고 3차원 laser scanner(SD Scanner, DS4060, LDI, U.S.A.)를 통한 석고 모델의 측정을 통해 cloud data, polygonization, section curve and loft surface, fit and horizontal plane (Surfacer 10.0. Imageware, U.S.A.)을 기초로 하여 구개의 폭, 길이, 높이 및 치열궁의 형태 등을 계측하였다. 통계학적 분석을 위해 t-tests가 사용되었다. 이에 다음과 같은 결론을 얻었다. 1. 구개의 계측항목에서 유치열 전방부 구개높이를 제외한 나머지 항목에서 남자가 여자보다 크게 나왔으며, 유치열은 전구개폭(p<0.05)과 후구개폭(p<0.01), 영구치열은 구개폭(p<0.05)과 전구개길이(p<0.01), 중구개, 후구개길이(p<0.05)에서 남녀간에 유의한 차이가 있었다. 2. 남녀의 구개지수에서 유치열에서는 구개장고지수(p<0.05)와 구개장폭지수(p<0.01)가 남녀간에 통계학적으로 유의한 차이가 있었다. 영구치열의 구개지수에서는 남녀간에 유의한 차이가 없었다. 3. 유치열과 영구치열의 계측항목 비교에서 후방부 구개폭이 가장 많이 증가하였으며, 다음으로 후방부 구개높이, 전방부 구개폭, 전방부 구개길이 순이었다. 전방부 구개높이와 후방부 구개길이는 오히려 감소하였다. 4. 유치열과 영구치열의 구개지수 비교에서 구개장고지수와 구개장폭지수, 후구개폭고지수는 영구치열에서 증가하였고, 나머지 지수는 감소하였다.보아 Er:YAG 레이저와 Chinese ink로 photosensitization을 시행한 후의 Nd:YAG 레이저 조사는 일정시간 동안 S. mutans의 증식과 산 생성능을 억제시키므로써 치아우식증 예방효과를 얻을 수 있다고 사료되나 억제효과가 오래가지 않아 임상적으로 효과를 얻기 위해서는 자주 조사를 해주어야 한다는 문제점을 안고 있어 임상적으로 치아우식증 예방이란 단독 목적으로 사용하기에는 실용성이 크지 않다고 사료된다.전자현미경 관찰에서 초음파 진동을 가한 군에서 resin tag의 길이가 길었고, lateral branch의 수도 많이 관찰되었다.TEX>$1\rightarrow6$ 결합이 주된 결합인 수용성 글루캔이었다. 이상의 결과를 종합하면 구강에서 분리된 Streptococcus salivarius 119에 의한 Streptococcus mutans의 인공치태 형성 억제작용은 수용성 글루캔 형성에 의한 것으로 사료되었다.동을 유도할 수 있다고 사료된다. 또한 이유식을 통한 다양한 식품의 경험 및 식품 섭취방법 등을 연습하는 과정을 통해 앞으로의 식생활 및 성장 발달에 영향을 미칠 것으로 사료된다. 따라서 영유아의 성장발달에 따른 적절한 영양교육의 실시가 보다 체계적으로 활성화 되어야 하겠으며 이를 위해 실제로 도움이 될 수 있는 구체적인 교육내용, 방법 및 도구의 개발이 요구된다.어서, B군은 A군,C군,D군과 비교하여 통계학적으로 유의성 있는 차이를 보였고(p<0.05), E군은 F군,G군과 비교하여 통계학적으로 유의성 있는 차이를 보였다(p<0.05). 3. 광중합형 및 자가중합형 교정용 전색제는 법랑질탈회 예방효과가 있었다. 4. 광중합형 및 자가중합형 교정용 전색제는 법랑질탈회 진행억제효과가 있었다. 5. 광중합형 및 자가중합형 교정용 전색제 표본에

  • PDF

주가지수 방향성 예측을 위한 주제지향 감성사전 구축 방안 (Predicting the Direction of the Stock Index by Using a Domain-Specific Sentiment Dictionary)

  • 유은지;김유신;김남규;정승렬
    • 지능정보연구
    • /
    • 제19권1호
    • /
    • pp.95-110
    • /
    • 2013
  • 최근 다양한 소셜미디어를 통해 생성되는 비정형 데이터의 양은 빠른 속도로 증가하고 있으며, 이를 저장, 가공, 분석하기 위한 도구의 개발도 이에 맞추어 활발하게 이루어지고 있다. 이러한 환경에서 다양한 분석도구를 통해 텍스트 데이터를 분석함으로써, 기존의 정형 데이터 분석을 통해 해결하지 못했던 이슈들을 해결하기 위한 많은 시도가 이루어지고 있다. 특히 트위터나 페이스북을 통해 실시간에 근접하게 생산되는 글들과 수많은 인터넷 사이트에 게시되는 다양한 주제의 글들은, 방대한 양의 텍스트 분석을 통해 많은 사람들의 의견을 추출하고 이를 통해 향후 수익 창출에 기여할 수 있는 새로운 통찰을 발굴하기 위한 움직임에 동기를 부여하고 있다. 뉴스 데이터에 대한 오피니언 마이닝을 통해 주가지수 등락 예측 모델을 제안한 최근의 연구는 이러한 시도의 대표적 예라고 할 수 있다. 우리가 여러 매체를 통해 매일 접하는 뉴스 역시 대표적인 비정형 데이터 중의 하나이다. 이러한 비정형 텍스트 데이터를 분석하는 오피니언 마이닝 또는 감성 분석은 제품, 서비스, 조직, 이슈, 그리고 이들의 여러 속성에 대한 사람들의 의견, 감성, 평가, 태도, 감정 등을 분석하는 일련의 과정을 의미한다. 이러한 오피니언 마이닝을 다루는 많은 연구는, 각 어휘별로 긍정/부정의 극성을 규정해 놓은 감성사전을 사용하며, 한 문장 또는 문서에 나타난 어휘들의 극성 분포에 따라 해당 문장 또는 문서의 극성을 산출하는 방식을 채택한다. 하지만 특정 어휘의 극성은 한 가지로 고유하게 정해져 있지 않으며, 분석의 목적에 따라 그 극성이 상이하게 나타날 수도 있다. 본 연구는 특정 어휘의 극성은 한 가지로 고유하게 정해져 있지 않으며, 분석의 목적에 따라 그 극성이 상이하게 나타날 수도 있다는 인식에서 출발한다. 동일한 어휘의 극성이 해석하는 사람의 입장에 따라 또는 분석 목적에 따라 서로 상이하게 해석되는 현상은 지금까지 다루어지지 않은 어려운 이슈로 알려져 있다. 구체적으로는 주가지수의 상승이라는 한정된 주제에 대해 각 관련 어휘가 갖는 극성을 판별하여 주가지수 상승 예측을 위한 감성사전을 구축하고, 이를 기반으로 한 뉴스 분석을 통해 주가지수의 상승을 예측한 결과를 보이고자 한다.

무극과 태극 상관연동의 대순우주론 연구 (A Study on the Daesoon Cosmology of the Correlative Relation between Mugeuk and Taegeuk)

  • 김용환
    • 대순사상논총
    • /
    • 제33집
    • /
    • pp.31-62
    • /
    • 2019
  • 본 연구는 무극과 태극 상관연동의 대순우주론에 관한 연구를 목적으로 한다. 대순우주론은 구천상제께서 세상에 펼친 대순에 근거하여 이루어진 우주론이다. 이 글에서는 대순우주론이 구천상제의 무극초월, 도주정산의 태극내재, 무극과 태극 상관연동의 후천개벽의 삼단계로 전개되고 있음을 밝히고자 한다. 먼저 구천상제의 무극초월은 생장염장과 무위이화로 드러난다. '생장염장(生長斂藏)'의 사의(四義)는 우주순환 원리를 표상하며, 무위이화는 그 성품을 바르게 하고 기운을 올곧게 함은 꾸밈이 없이 성취함을 일컫는다. 이는 상생진법의 정음정양에 근거하여 이루어진다고 말할 수 있다. 또한 도주정산의 태극내재는 만물생장과 생성변화로 이루어진다. 만물생장은 세상의 모든 것들이 저마다 생명을 틔워 생장하면서 각각 생애 절정을 향해 빛내려고 하는 특징을 드러낸다고 할 것이다. 아울러 뇌성보화의 지배자양에 의해 선천의 상극기운과 습관을 버리고, 음양이기(陰陽二氣)를 결합하여 동정진퇴(動靜進退)의 내재변화(內在變化)로 천기(天氣)와 지기(地氣)를 승강(昇降)하게 한다. 그리고 무극과 태극 상관연동의 후천개벽은 무극초월과 태극내재 상관연동의 대순일원으로 일상에서 도를 체화하는 단계로서 켄 윌버의 통합모델과 상통한다. '도통진경(道通眞境)'은 참된 도를 체화하는 경지이고, '도지통명(道之通明)'은 도를 밝혀 후천개벽의 새 세상을 전개함을 의미한다. 선녀들이 음악을 연주하고, 불로초가 피어나고, 학들이 노니는 안온하고 평화로운 모습이다. 인간은 지상신선이 되고, 후천개벽의 실화기제가 되어 마침내 시공(時空)을 넘나드는 대자유인으로서 행복결실을 맺는 형상이다. 대순사상은 대순진리의 사상으로 도주께서 50년간 각고의 고초를 겪으시며 '태극내재'를 새 밝힘으로 함으로 진법(眞法)을 완성시킨 것에 근거한다. 도주께서 1958년, 도전께 종통을 물려주시면서 도의 전반을 맡아가도록 하명함으로 대순사상은 도전에 의해 대순사상으로 계승되었다. 또한 도전께서 '대순(大巡)'을 크게 순찰하는 의미로 새겨서, 구천상제의 삼계대순(三界大巡) 개벽공사(開闢公事) 뜻을 담보했다. 아울러 '대순(大巡)이 원(圓)으로, 무극과 태극의 상관연동 우주론을 나타내고 있다고 새 밝힘 하였다. 결국 대순사상 우주론은 대순사상의 심층차원을 이해할 수 있게 하면서, 무극초월과 태극내재 상관연동으로 대순일원의 정체성을 드러내고 있음을 새 밝힘 할 수 있다. 대순우주론은 대순일원으로서 생활실천으로 원융회통 성격을 제시한다. 본 연구에서는 문헌학의 진정성과 해석학의 합당성을 활용하여, 대순우주론의 무극과 태극 상관연동의 공공작용을 규명하게 된다. 다양·다중·다층 해석학으로 후천개벽의 생활실화에 접근함으로, 후천개벽의 실천담론을 실화기제로 밝히고자 한다. 대순사상 미래전망은 무극초월과 태극내재 상관연동으로 대순의 '일원회통(一圓會通)' 원만구족으로 생명살림에 관건이 있다고 할 것이다.