• 제목/요약/키워드: Context Tree

검색결과 143건 처리시간 0.027초

시맨틱 구문 트리 커널을 이용한 생명공학 분야 전문용어간 관계 식별 및 분류 연구 (A Study on the Identification and Classification of Relation Between Biotechnology Terms Using Semantic Parse Tree Kernel)

  • 최성필;정창후;전홍우;조현양
    • 한국문헌정보학회지
    • /
    • 제45권2호
    • /
    • pp.251-275
    • /
    • 2011
  • 본 논문에서는 단백질 간 상호작용 자동 추출을 위해서 기존에 연구되어 높은 성능을 나타낸 구문 트리 커널을 확장한 시맨틱 구문 트리 커널을 제안한다. 기존 구문 트리 커널의 문제점은 구문 트리의 단말 노드를 구성하는 개별 어휘에 대한 단순 외형적 비교로 인해, 실제 의미적으로는 유사한 두 구문 트리의 커널 값이 상대적으로 낮아지는 현상이며 결국 상호작용 자동 추출의 전체 성능에 악영향을 줄 수 있다는 점이다. 본 논문에서는 두 구문 트리의 구문적 유사도(syntactic similarity)와 어휘 의미적 유사도(lexical semantic similarity)를 동시에 효과적으로 계산하여 이를 결합하는 새로운 커널을 고안하였다. 어휘 의미적 유사도 계산을 위해서 문맥 및 워드넷 기반의 어휘 중의성 해소 시스템과 이 시스템의 출력으로 도출되는 어휘 개념(WordNet synset)의 추상화를 통한 기존 커널의 확장을 시도하였다. 실험에서는 단백질 간 상호작용 추출(PPII, PPIC) 성능의 심층적 최적화를 위해서 기존의 SVM에서 지원되던 정규화 매개변수 외에 구문 트리 커널의 소멸인자와 시맨틱 구문 트리 커널의 어휘 추상화 인자를 새롭게 도입하였다. 이를 통해 구문 트리 커널을 적용함에 있어서 소멸인자 역할의 중요성을 확인할 수 있었고, 시맨틱 구문 트리 커널이 기존 시스템의 성능향상에 도움을 줄 수 있음을 실험적으로 보여주었다. 특히 단백질 간 상호작용식별 문제보다도 비교적 난이도가 높은 상호작용 분류에 더욱 효과적임을 알 수 있었다.

Tree species migration to north and expansion in their habitat under future climate: an analysis of eight tree species Khyber Pakhtunkhwa, Pakistan

  • Muhammad Abdullah Durrani;Rohma Raza;Muhammad Shakil;Shakeel Sabir;Muhammad Danish
    • Journal of Ecology and Environment
    • /
    • 제48권1호
    • /
    • pp.96-109
    • /
    • 2024
  • Background: Khyber Pakhtunkhwa government initiated the Billion Tree Tsunami Afforestation Project including regeneration and afforestation approaches. An effort was made to assess the distribution characteristics of afforested species under present and future climatic scenarios using ecological niche modelling. For sustainable forest management, landscape ecology can play a significant role. A significant change in the potential distribution of tree species is expected globally with changing climate. Ecological niche modeling provides the valuable information about the current and future distribution of species that can play crucial role in deciding the potential sites for afforestation which can be used by government institutes for afforestation programs. In this context, the potential distribution of 8 tree species, Cedrus deodara, Dalbergia sissoo, Juglans regia, Pinus wallichiana, Eucalyptus camaldulensis, Senegalia modesta, Populus ciliata, and Vachellia nilotica was modeled. Results: Maxent species distribution model was used to predict current and future distribution of tree species using bioclimatic variables along with soil type and elevation. Future climate scenarios, shared socio-economic pathways (SSP)2-4.5 and SSP5-8.5 were considered for the years 2041-2060 and 2081-2100. The model predicted high risk of decreasing potential distribution under SSP2-4.5 and SSP5-8.5 climate change scenarios for years 2041-2060 and 2081-2100, respectively. Recent afforestation conservation sites of these 8 tree species do not fall within their predicted potential habitat for SSP2-4.5 and SSP5-8.5 climate scenarios. Conclusions: Each tree species responded independently in terms of its potential habitat to future climatic conditions. Cedrus deodara and P. ciliata are predicted to migrate to higher altitude towards north in present and future climate scenarios. Habitat of D. sissoo, P. wallichiana, J. regia, and V. nilotica is practiced to be declined in future climate scenarios. Eucalyptus camaldulensis is expected to be expanded its suitability area in future with eastward shift. Senegalia modesta habitat increased in the middle of the century but decreased afterwards in later half of the century. The changing and shifting forests create challenges for sustainable landscapes. Therefore, the study is an attempt to provide management tools for monitoring the climate change-driven shifting of forest landscapes.

멀티미디어디자인에서 정보위계 표출방식과 그 활용에 관한 연구 (The Characteristics of Visualizing Hierarchical Information and their Applications in Multimedia Design)

  • 류시천
    • 감성과학
    • /
    • 제9권spc3호
    • /
    • pp.209-224
    • /
    • 2006
  • 트리구조로 명명되는 '위계'는 정보의 구조를 드러내 보이고 복잡성을 감소시킬 수 있기 때문에 시각화하는데 매우 유용한 자원이다. 본 연구는 멀티미디어 환경에서 위계의 개념을 적용한 정보 시각화 방식에 대해 고찰하였고 나아가 그것이 정보 찾기 활동에서 사용자태스크 유형과 어떻게 연계되는지를 파악하고 그 활용 가능성을 탐색하였다. 본 연구에서는 트리맵(Treemap), 하이퍼볼릭(Hyperbolic), 콘트리(Cone Tree), 관심도트리(Degree-Of-Interest Tree)의 4가지 정보위계 표출방식을 적용 사례별로 고찰하고 그 활용상의 장단점을 '시각적 재현 측면'과 '사용자 조작 측면'으로 나누어 제안하였다. 또한 각각의 정보위계 표출방식에서 사용자 정보 찾기 활동과 결부된 '핵심 지원 태스크'와 '주요 관련 지원 태스크'가 무엇인지를 구체적으로 제안하였다. 본 연구를 통한 주요 발견 점은 첫째, 사용자의 정보 찾기 활동과 결부된 주요 지원 태스크는 전체를 총괄적으로 조망하기, 관심 있는 대상을 확대해서 보기, 관심 없는 대상을 걸러내기, 특정 대상에 대한 세부적인 디테일 정보 얻기, 정보 객체 사이의 관계 파악하기, 발생한 이벤트의 히스토리를 유지하기, 수집된 정보를 추출하고 발췌하기 등이다. 둘째, '트리맵'은 사용자에게 전체 정보 그룹에 대한 총체적 의미 파악이 용이하도록 만들기 위해서 각각의 정보 노드의 색상과 크기를 다르게 적용시키는 방식을 핵심지원 태스크로 적용하고 있다. '하이퍼볼릭'과 '관심도트리'는 사용자가 선택한 특정 정보 노드를 중심으로 전체 정보 그룹을 재편성시키거나 의미의 중요도에 따라 각각의 노드 크기에 비례 개념을 적용시키는 기능을 핵심적으로 지원하고 있다. '콘트리'는 정보에 접근한 사용자 로그파일을 발췌하고 분석하여 정보 관리자가 전체 정보 패턴을 분류하고 조직화시킬 수 있도록 하고 있다. 결론적으로 멀티미디어디자인 환경에서 정보위계 표출방식은 정보의 시각적 재현이라는 차원을 넘어 사용자의 정보 찾기 행위와 관련하여 사용자 조작의 다양한 기능적 욕구를 반영하고 있음을 본 연구를 통해 파악할 수 있었다.

  • PDF

구문 트리 가지치기 및 소멸 인자 조정을 통한 트리 커널 기반 단백질 간 상호작용 추출 성능 향상 (Performance Enhancement of Tree Kernel-based Protein-Protein Interaction Extraction by Parse Tree Pruning and Decay Factor Adjustment)

  • 최성필;최윤수;정창후;맹성현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권2호
    • /
    • pp.85-94
    • /
    • 2010
  • 본 논문에서는 기존의 연구에서 시도되었던 것과는 달리, 복잡하고 추출하기가 어려운 다양한 형태의 자질 및 단서 정보가 필요 없는 합성곱 구문 트리 커널 기반의 단백질 간 상호작용 추출 기법을 소개한다. 이 기법의 특징은 단백질 이름 쌍을 포함한 상호작용 포함 후보 문장에 대한 구문 트리만을 이용하여 추출을 시도한다는 것이며 부가적인 자질이나 커널 함수가 불필요하다는 장점이 있다. 이를 기반으로 본 논문의 연구 성과는 다음과 같다. 첫째, 단백질 간 상호작용 추출에 있어서 구문 트리 커널을 적용할 경우 불필요한 문맥 정보를 효과적으로 제거하는 구문 트리 가지치기 작업이 필수적임을 기존 연구 결과와의 성능 비교로써 증명한다. 둘째, 동일한 학습 조건에서 구문 트리 커널의 소멸 인자(decay factor)는 평활 인자(smoothing factor)로서 중요한 역할을 하며, 성능 변화의 핵심 요소임을 보인다. 특히 학습 집합의 규모에 따라서 소멸인자가 성능에 미치는 영향력이 상이한 패턴으로 나타남을 제시하였다. 결론적으로 기존의 최신 연구결과로서 주장한 "단일 커널보다 혼합 커널의 성능이 더 뛰어나다"라는 가설이 항상 성립하는 것은 아니라는 것을 합성곱 구문 트리 커널 단독으로 적용하여 높은 성능을 나타냄으로써 보여주었다. 동일한 조건으로 수행한 실험에서 기존의 두 연구 결과에 비해 19.8%, 14%의 성능 개선을 나타내었다.

서울시 보호수를 대상으로 한 노거수 공간의 문화적 활용 가치 연구 (Utilization of the Old Big Tree and Its Surrounding Space Pertaining to Cultural Value in Seoul)

  • 정욱주;윤상준
    • 한국환경복원기술학회지
    • /
    • 제17권1호
    • /
    • pp.215-233
    • /
    • 2014
  • Seoul is an ancient city with a long history but there is hesitancy over referring to as a historic city due to the lack of traceable historic urban landscape elements which resulted from numerous invasions and general destruction. From a diachronic perspective, the nature which was survived the influence of development, could be the key element that links the past with the city's radically changed image in modern times. Although "old big trees" may be not a dominant influence with regards to the historical authenticity of the city, they are objects which contribute towards the historical authenticity by providing a sense of place in terms of connected narratives, as well as their natural image. However, the protection policy for an "old big tree" would place too much emphasis on the aspect of the ecological value rather than its cultural value. Generally, trees have been protected by installing a fence and a signboard around them as well as receiving additional care. However, it is difficult to find that surrounding space around the "law-protected tree" is connected with its original historical and cultural values. Even though the space around trees are no longer utilized in the same way as was so in the past, they still have high-potential in terms of cultural utilization. Therefore, the subject of this study is the "old big tree" as a natural object which contributed to the historical authenticity of Seoul. The current status of these "old big trees", aged between 100 and 800 years old, currently indicate that there are 215 trees designated as "law-protected tree" by the Seoul metropolitan government. This study aims to investigate the status of protection and utilization of the existing "law-protected trees" in the city of Seoul and find a way to increase both ecological preservation and cultural utilization for the high-potential "law-protected trees" within the city itself. In order to achieve this, previously researched papers shall be reviewed and surveyed pertaining to present usage patterns of the 215 "law-protected trees". In addition, five cases have been reviewed which focus on a few of utilizing the "protected trees" and their surrounding spaces. The results of the research indicate that 21 "old big trees" have high-potential in terms of cultural utilization as well as ecological value. However, it was revealed that there are limitations to pursue the value of preservation and utilization simultaneously throughout current regimental management. In order to cope with the current situation, it is pointed out that management facilities should be designed and installed by creative and flexible methods of organizing with consideration to the surrounding space and context. Even though in the case where there may not be a connecting history or legendary stories, the "old big trees" can serve as the fundamental features of small scale parks -dependent on their location, condition and environment- which will be of value to the local communities. This study could serve as a practical reference for the management and utilization of "old big trees" nationwide with numbers reaching 12,300 besides the city of Seoul.

Linguistic and Educational Factors Affecting TOEFL Scores: Focusing on Three OECD Countries in EFL contexts

  • Lee, Young-Hwa;Kim, Seon-Jae
    • International Journal of Contents
    • /
    • 제6권2호
    • /
    • pp.33-40
    • /
    • 2010
  • This study aims at investigating the linguistic and educational factors affecting TOEFL scores, focusing on three OECD countries, Korea, Japan, and Finland. The data comprise document analysis on curriculums, websites, and literature. The findings reveal that the number of Korean test-takers and their TOEFL scores gradually increased year by year. Finnish test-takers consistently gained greatly high scores, and Japanese examinees showed the lowest scores. The languages Korean, Japanese, and Finnish are all far distant from English and receive little support on historical grounds from the Indo-European family tree. In Finland, however, Swedish which belongs to Indo-European languages is still used as an official language with Finnish. Korea and Finland adopt English education from Year 3 in primary school, whereas English is not an official subject in primary school at present in Japan. Finnish students are taught a foreign language in addition to English from primary school. These seem to support the result of the high TOEFL scores of Finnish test-takers. This study concludes that social context which includes linguistic and educational environments are the main factors which affect TOEFL scores.

Improvement of FTA for Completeness, Review and Knowledge Transfer - Introducing Strategy and Context Nodes in GSN and Reason Node -

  • Yoshioka, Nasa;Shirasaka, Seiko
    • 시스템엔지니어링학술지
    • /
    • 제11권2호
    • /
    • pp.125-135
    • /
    • 2015
  • Various methods have been used for safety and reliability as it becomes more difficult to ensure safety owing to the increasing complexity and scale of systems. This study aims at making it easier and more efficient to discuss risks and countermeasures for completeness, review, and knowledge transfer by improving methods to create fault tree analyses which focus on the GSN [1], which are among the methods used to describe assurance cases. More specifically, the purpose of this study is to incorporate strategy and context, GSN concepts, along with reason, which is a new concept, into FTA; the study focuses on three points. One point is support for the safety designer to draw a mutually exclusive and collectively exhaustive (MECE) FTA. The second is to make it easier to understand diagrams and meanings of FTA compared with the usual methods. The third is to make creating an FTA more efficient and to pass on existing know-how. Eventually, FTA can achieve completeness, review, and knowledge transfer. An introduction is provided in the first section. Next, the methodology covered in this paper is explained in the second section. The third section describes the proposed notation method based on two proposals made in this paper. In the fourth and fifth sections, results and discussion are provided, respectively. Finally, in the sixth section, conclusions are described.

Estimation of the soil liquefaction potential through the Krill Herd algorithm

  • Yetis Bulent Sonmezer;Ersin Korkmaz
    • Geomechanics and Engineering
    • /
    • 제33권5호
    • /
    • pp.487-506
    • /
    • 2023
  • Looking from the past to the present, the earthquakes can be said to be type of disaster with most casualties among natural disasters. Soil liquefaction, which occurs under repeated loads such as earthquakes, plays a major role in these casualties. In this study, analytical equation models were developed to predict the probability of occurrence of soil liquefaction. In this context, the parameters effective in liquefaction were determined out of 170 data sets taken from the real field conditions of past earthquakes, using WEKA decision tree. Linear, Exponential, Power and Quadratic models have been developed based on the identified earthquake and ground parameters using Krill Herd algorithm. The Exponential model, among the models including the magnitude of the earthquake, fine grain ratio, effective stress, standard penetration test impact number and maximum ground acceleration parameters, gave the most successful results in predicting the fields with and without the occurrence of liquefaction. This proposed model enables the researchers to predict the liquefaction potential of the soil in advance according to different earthquake scenarios. In this context, measures can be realized in regions with the high potential of liquefaction and these measures can significantly reduce the casualties in the event of a new earthquake.

개선된 데이터마이닝을 위한 혼합 학습구조의 제시 (Hybrid Learning Architectures for Advanced Data Mining:An Application to Binary Classification for Fraud Management)

  • Kim, Steven H.;Shin, Sung-Woo
    • 정보기술응용연구
    • /
    • 제1권
    • /
    • pp.173-211
    • /
    • 1999
  • The task of classification permeates all walks of life, from business and economics to science and public policy. In this context, nonlinear techniques from artificial intelligence have often proven to be more effective than the methods of classical statistics. The objective of knowledge discovery and data mining is to support decision making through the effective use of information. The automated approach to knowledge discovery is especially useful when dealing with large data sets or complex relationships. For many applications, automated software may find subtle patterns which escape the notice of manual analysis, or whose complexity exceeds the cognitive capabilities of humans. This paper explores the utility of a collaborative learning approach involving integrated models in the preprocessing and postprocessing stages. For instance, a genetic algorithm effects feature-weight optimization in a preprocessing module. Moreover, an inductive tree, artificial neural network (ANN), and k-nearest neighbor (kNN) techniques serve as postprocessing modules. More specifically, the postprocessors act as second0order classifiers which determine the best first-order classifier on a case-by-case basis. In addition to the second-order models, a voting scheme is investigated as a simple, but efficient, postprocessing model. The first-order models consist of statistical and machine learning models such as logistic regression (logit), multivariate discriminant analysis (MDA), ANN, and kNN. The genetic algorithm, inductive decision tree, and voting scheme act as kernel modules for collaborative learning. These ideas are explored against the background of a practical application relating to financial fraud management which exemplifies a binary classification problem.

  • PDF

온라인 게시글의 콘텐츠 특성과 조회 수간의 관계 (The Relationship between Contents Characteristics of On-line Review and Reference Rate)

  • 이원준
    • 한국콘텐츠학회논문지
    • /
    • 제10권2호
    • /
    • pp.241-249
    • /
    • 2010
  • 온라인을 중심으로 마케팅 패러다임이 급격하게 변화함에 따라 기업과 소비자들의 온라인 활동에 대한 관심이 증대되어왔다. 본 연구에서는 내용 분석법(contents analysis)을 통하여 게시 글의 주요한 특성인 총 13개의 변수들을 도출하고, 이들 변수에 따른 조회 수의 차이를 분석하였다. 차이 분석 결과, '브랜드 언급', '말머리 기호', '긍정성', '정보 제공' 등 총 4개의 변수에서 유의한 차이점을 보였다. 유의한 변수중에서 상대적으로 더 큰 영향력을 보이는 변수들을 확인하기 위하여 회귀 나무 분석을 이용한 데이터 분석을 추가적으로 실시한 결과, 그중에서도 '정보 제공'과 '브랜드 언급'이 조회 수를 결정하는 가장 중요한 변수인 것으로 나타났다. 이와 같은 연구 결과들을 바탕으로 기업이 소비자의 온라인 구전 활동을 이해하고 활용할 수 있는 실무적 시사점을 제시하였으며, 더불어 향후 연구 방향을 논의하였다.