• 제목/요약/키워드: Document Expansion

검색결과 95건 처리시간 0.027초

검색 문서의 분류 정보에 기반한 용어 클러스터 질의 확장 모델 (A Term Cluster Query Expansion Model Based on Classification Information of Retrieval Documents)

  • 강현수;강현규;박세영;이용석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.7-12
    • /
    • 1999
  • 정보 검색 시스템은 사용자 질의의 키워드들과 문서들의 유사성(similarity)을 기준으로 관련 문서들을 순서화하여 사용자에게 제공한다. 그렇지만 인터넷 검색에 사용되는 질의는 일반적으로 짧기 때문에 보다 유용한 질의를 만들고자 하는 노력이 지금까지 계속되고 있다. 그러나 키워드에 포함된 정보가 제한적이기 때문에 이에 대한 보완책으로 사용자의 적합성 피드백을 이용하는 방법을 널리 사용하고 있다. 본 논문에서는 일반적인 적합성 피드백의 가장 큰 단점인 빈번한 사용자 참여는 지양하고, 시스템에 기반한 적합성 피드백에서 배제한 사용자 참여를 유도하는 검색 문서의 분류 정보에 기반한 용어 클러스터 질의 확장 모델(Term Cluster Query Expansion Model)을 제안한다. 이 방법은 검색 시스템에 의해 검색된 상위 n개의 문서에 대하여 분류기를 이용하여 각각의 문서에 분류 정보를 부여하고, 문서에 부여된 분류 정보를 이용하여 분류 정보의 수(m)만큼으로 문서들을 그룹을 짓는다. 적합성 피드백 알고리즘을 이용하여 m개의 그룹으로부터 각각의 용어 클러스터(Term Cluster)를 생성한다. 이 클러스터가 사용자에게 문서 대신에 피드백의 자료로 제공된다. 실험 결과, 적합성 알고리즘 중 Rocchio방법을 이용할 때 초기 질의보다 나은 성능을 보였지만, 다른 연구에서 보여준 성능 향상은 나타내지 못했다. 그 이유는 분류기의 오류와 문서의 특성상 한 영역으로 규정짓기 어려운 문서가 존재하기 때문이다. 그러나 검색하고자 하는 사용자의 관심 분야나 찾고자 하는 성향이 다르더라도 시스템에 종속되지 않고 유연하게 대처하며 검색 성능(retrieval effectiveness)을 향상시킬 수 있다.사용되고 있어 적응에 문제점을 가지기도 하였다. 본 연구에서는 그 동안 계속되어 온 한글과 한잔의 사용에 관한 논쟁을 언어심리학적인 연구 방법을 통해 조사하였다. 즉, 글을 읽는 속도, 글의 의미를 얼마나 정확하게 이해했는지, 어느 것이 더 기억에 오래 남는지를 측정하여 어느 쪽의 입장이 옮은 지를 판단하는 것이다. 실험 결과는 문장을 읽는 시간에서는 한글 전용문인 경우에 월등히 빨랐다. 그러나. 내용에 대한 기억 검사에서는 국한 혼용 조건에서 더 우수하였다. 반면에, 이해력 검사에서는 천장 효과(Ceiling effect)로 두 조건간에 차이가 없었다. 따라서, 본 실험 결과에 따르면, 글의 읽기 속도가 중요한 문서에서는 한글 전용이 좋은 반면에 글의 내용 기억이 강조되는 경우에는 한자를 혼용하는 것이 더 효율적이다.이 높은 활성을 보였다. 7. 이상을 종합하여 볼 때 고구마 끝순에는 페놀화합물이 다량 함유되어 있어 높은 항산화 활성을 가지며, 아질산염소거능 및 ACE저해활성과 같은 생리적 효과도 높아 기능성 채소로 이용하기에 충분한 가치가 있다고 판단된다.등의 관련 질환의 예방, 치료용 의약품 개발과 기능성 식품에 효과적으로 이용될 수 있음을 시사한다.tall fescue 23%, Kentucky bluegrass 6%, perennial ryegrass 8%) 및 white clover 23%를 유지하였다. 이상의 결과를 종합할 때, 초종과 파종비율에 따른 혼파초지의 건물수량과 사료가치의 차이를 확인할 수 있었으며, 레드 클로버 + 혼파 초지가 건물수량과 사료가치를 높이는데 효과적이었다.\ell}$ 이었으며 , yeast extract 첨가(添加)하여 배양시(培養時)는 yeast extract

  • PDF

Improving Classification Accuracy in Hierarchical Trees via Greedy Node Expansion

  • Byungjin Lim;Jong Wook Kim
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권6호
    • /
    • pp.113-120
    • /
    • 2024
  • 정보통신 기술이 발전함에 따라 우리는 일상에서 다양한 형태의 데이터를 손쉽게 생성하고 있다. 이처럼 방대한 데이터를 효율적으로 관리하려면, 체계적인 카테고리별 분류가 필수적이다. 효율적인 검색과 탐색을 위해서 데이터는 트리 형태의 계층적 구조인 범주 트리로 조직화되는데, 이는 뉴스 웹사이트나 위키피디아에서 자주 볼 수 있는 구조이다. 이에 따라 방대한 양의 문서를 범주 트리의 단말 노드로 분류하는 다양한 기법들이 제안되었다. 그러나 범주 트리를 대상으로 하는 문서 분류기법들은 범주 트리의 높이가 증가할수록 단말 노드의 수가 기하급수적으로 늘어나고 루트 노드부터 단말 노드까지의 길이가 길어져서 오분류 가능성이 증가하며, 결국 분류 정확도의 저하로 이어진다. 그러므로 본 연구에서는 사용자의 요구 분류 정확도를 만족시키면서 세분화된 분류를 구현할 수 있는 새로운 노드 확장 기반 분류 알고리즘을 제안한다. 제안 기법은 탐욕적 접근법을 활용하여 높은 분류정확도를 갖는 노드를 우선적으로 확장함으로써, 범주 트리의 분류 정확도를 극대화한다. 실데이터를 이용한 실험 결과는 제안 기법이 단순 방법보다 향상된 성능을 제공함을 입증한다.

PLM 기반의 국방 형상관리 정보체계 구축 사례연구 (A Study of Implementation of Defense Configuration Management System based on PLM)

  • 임채오
    • 한국CDE학회논문집
    • /
    • 제13권4호
    • /
    • pp.305-313
    • /
    • 2008
  • A configuration management system was implemented by applying PLM to the defense field. The PLM system has recently been incorporated in a wide range of industries, and it has allowed for improvements in work productivity and expansion of related services by comprehensively managing and securing connection regarding configuration information in the defense field. Implementations include acquisition of configuration related information and reinforcement of BOM-oriented configuration management function, securing compatibility among 3D drawings of different agencies, improvement of drawing and document management functions, comprehensive systematic configuration management focused on product structure, strengthened configuration control functions, a management system according to the work flow and life cycle functions, an integrated configuration management system of 3D model CAD resources and an enhanced management system. This paper covers a case study reviewing the implementation of a PLM-based configuration management information system and its results, so that the information can be made available to other agencies and companies seeking to apply PLM in their organizations.

Local Knowledge on Trees Utilization and Their Existing Threats in Rashad District of Nuba Mountains, Sudan

  • Adam, Yahia Omar
    • Journal of Forest and Environmental Science
    • /
    • 제30권4호
    • /
    • pp.342-350
    • /
    • 2014
  • Rural people of Sudan are endowed with a deep knowledge concerning the utilization of different tree species. However research on the local knowledge related to tree species utilization still lacks adequate attention. The study objectives were to identify the existing local knowledge related to the utilization of the tree species and the existing threats to the availability of the trees. A total of 300 respondents were selected randomly from Rashad district in Nuba Mountains in 2011. Semi-structured interview, direct observation, group discussion, preference ranking and direct matrix ranking were used to collect the data. The study results revealed that people of Nuba Mountains utilize different tree species for food, medicinal purposes, fodder, firewood, construction and cultural ceremonies. The study results also indicated that the availability of trees is negatively influenced by firewood collection, agricultural expansion, drought, overgrazing and charcoal production. The study concluded that local knowledge has crucial role in tree species utilization in Nuba Mountains. Further researches to document and substantiate the local knowledge on useful tree species are highly recommended.

문서 분류에 이용 가능한 벡터 공간의 확장 방법 (An Expansion of Vector Space for Document Classifications)

  • 이상곤;유경석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 춘계학술발표대회
    • /
    • pp.782-784
    • /
    • 2015
  • 본 논문에서는 한국어 문서의 분류 정밀도 향상을 위해 애매어와 해소어 정보를 이용한 확장된 벡터 공간 모델을 제안하였다. 벡터 공간 모델에 사용된 벡터는 같은 정도의 가중치를 갖는 축이 하나 더 존재하지만, 기존의 방법은 그 축에 아무런 처리가 이루어지지 않았기 때문에 벡터끼리의 비교를 할 때 문제가 발생한다. 같은 가중치를 갖는 축이 되는 단어를 애매어라 정의하고, 단어와 분야 사이의 상호정보량을 계산하여 애매어를 결정하였다. 애매어에 의해 애매성을 해소하는 단어를 해소어라 정의하고, 애매어와 동일한 문서에서 출현하는 단어 중에서 상호정보량을 계산하여 해소어의 세기를 결정하였다. 본 논문에서는 애매어와 해소어를 이용하여 벡터의 차원을 확장하여 문서 분류의 정밀도를 향상시키는 방법을 제안하였다.

일제강점기 부산 아미동 화장장의 설립과 변천 (The Establishment and Change of Busan Ami-dong Crematorium in Japanese Colonial Period)

  • 송혜영
    • 대한건축학회논문집:계획계
    • /
    • 제34권5호
    • /
    • pp.89-96
    • /
    • 2018
  • Ami-dong Crematorium in Busan was established as one of the public facilities in 1929(the period of Japanese Occupation). It is the originator of Busan Yeongnak-Park(永樂公園), the funeral facilities of Busan municipality. The crematorium of Busan region was accepted at an earlier stage inside Japanese Concession in accordance with the opening a port. As Ami-dong Crematorium was constructed as a public facilities, the precedent has been maintained so far, providing a background equipped with the leading public corporation facilities in Busan area. This study was based on the expansion construction document founded by National Archives in Korea. Above all things, this research revealed the establishment and change of Busan Ami-dong Crematorium as the historical point for the formation process of recent public funeral facilities.

COVID19 Innate Immunity through Natural Medicine in Palau

  • Christopher U. Kitalong;Tmong Udui;Terepkul Ngiraingas;Pearl Marumoto;Victor Yano
    • 한국자원식물학회:학술대회논문집
    • /
    • 한국자원식물학회 2020년도 추계국제학술대회
    • /
    • pp.15-15
    • /
    • 2020
  • In an internal document, CORONA-VIRUS DISEASE 2019 (COVID-19) PLAN, release developed stated that "on January 22, 2020, Palau Ministry of Health activated its emergency operations center, and since then has prepared and put in place measures in response to this global pandemic." The actions eventually led to the closure of most flights coming into Palau as a method to protect its population. The population of is at high risk with COVID19 due to the very elevated rate of NCD's, as well as the limited access to proper testing and treatment facilities. Increased use of traditional medicines in the population has reduced the co-morbidities by reducing risk factors. Furthermore, the expansion of tradtional NCD therapies, especially that of DAK reduce pressure due to obesity and diabetes therefore allowing for unimpaired immune systems to combat deadly infectious diseases such as COVID19.

  • PDF

XBRL이 전자공시 시스템에 미치는 영향 (The Effect of Disclosure System through XBRL)

  • 신승중;김정일;이태훈
    • 한국인터넷방송통신학회논문지
    • /
    • 제8권5호
    • /
    • pp.229-234
    • /
    • 2008
  • XBRL은 기본적으로 XBRL 한국지부에서 개발한 KGAAP 2.1을 기반으로 기업들이 확장하는 구조로 정의되어 있다. 각 기업은 Taxonomy에서 자신의 업종을 선택하고 각 기업에 맞는 태그들을 확인하여 추가하여야 한다. 문서작성은 태그를 확장하는 등 복잡한 부분이 존재하여 태그확장, 데이터 입력의 단계를 거쳐서 작성해야 하는 어려움이 있다. 스타일의 표현방법은 XBRL기본적으로 제공하는 Presentation구조와 Label구조를 이용하여 표준을 제공하지만, XBRL Processor을 이용해야 하는 복잡한 문제가 있다. 금감원 (Financial Supervisory Service) (DART), 증권선물거래소(Korea Exchange)(KIND, KEDIS)의 전자공시 시스템은 SGML, XML, XBRL의Markup Language을 서식언어로 사용하고 있다. 각 언어의 특성에 따라 문서 정의 절차와 처리 방식이 다르게 나타난다. 본 논문에서는 각 전자공시 시스템의 서식언어에 따른 단계별 영향을 분석하고, 서식언어의 방향에 대해 연구한다.

  • PDF

ER2XML :개체-관계 모델을 기반으로한 XML Schema 생성기의 구현 (ER2XML: An Implementation of XML Schema Generator based on the Entity-Relationship Model)

  • 김창석;손동철
    • 정보처리학회논문지D
    • /
    • 제12D권1호
    • /
    • pp.1-12
    • /
    • 2005
  • XML이 웹 상에서 문서 교환의 표준으로 자리잡고 있으며 피 수요가 나날이 증가하고 있다. 그에 따라 in 데이터나 문서 구조를 모델링하는 XML Schema(W3C XML Schema Spec) 또한 수요가 증가하고 있다. 그러나 XML Schema는 다양한 자료형과 풍부한 표현력을 제공하지만 그 복잡성으로 인해 모델링하기가 어려운 단점이 있다. 본 논문에서는 관계형 데이터베이스 설계의 기본적인 도구인 개체-관계 모델을 이용하여 XML Schema를 간단하게 생성하는 방법을 제시한다. 개체-관계 모델과 변환될 XML Schema의 구조는 서로 일대일로 매핑되지 않아 직접 변환할 수는 없다. 그래서 몇 가지 알고리즘을 이용하여 개체-관계 모델을 계층적 구조모델로 변환을 한다. 이렇게 변환된 계층적 구조 모델을 이용하여 최종적으로 XML Schema를 생성한다. 기존의 XML Schema 생성 방법은 개체 간의 속성이 상위 혹은 하위로 이동하면서 최초 설계시의 개체가 사라지므로 XML Schema의 중요한 특성인 재사용성을 이용할 수 없다는 단점을 가진다. 석기서 제시한 알고리즘은 XML Schema의 중요한 특성들인 재사용성, 전역 및 지역 기능 등을 가진 문서를 생성한다는 것이다.

중첩 클러스터를 이용한 피드백 문서의 재샘플링 기법 (Resampling Feedback Documents Using Overlapping Clusters)

  • 이경순
    • 정보처리학회논문지B
    • /
    • 제16B권3호
    • /
    • pp.247-256
    • /
    • 2009
  • 대부분의 잠정적 적합피드백기법들은 질의에 대해 검색된 상위검색문서들이 적합하다고 가정하고, 그 문서들을 질의 확장을 위한 피드백 문서로 이용하고 있다. 그러나 초기검색결과에는 상당한 양의 부적합 문서를 포함하고 있는 것이 현실이다. 이 논문에서는 보다 좋은 피드백 문서를 선택하기 위해서 중첩클러스터를 이용한 피드백문서의 재샘플링 기법을 제안한다. 주요 아이디어는 질의 중심적인 초기검색문서집합에 대해서 중첩이 허용된 문서클러스터를 이용하여 문서들 사이의 관계를 반영하여 질의에 핵심역할을 하는 지배적 문서를 찾고, 이 문서들을 반복적으로 피드백 하여 질의가 내포하는 핵심 주제를 강조하는 것이다. 대규모 실험집합인 TREC GOV2와 WT10g에 대한 실험비교에서, 최근 잠정적 적합피드백 기법들 중에서 가장 좋은 성능을 보이고 있는 적합모델보다 재샘플링기법이 우수한 성능향상을 보였다. 제안기법에 대한 검증을 위해서 피드백문서에 포함된 적합문서의 정도를 나타내는 적합밀도를 측정하였다. 재샘플링 기법이 TREC 실험집합에 대해서 적합모델에 비해 높은 적합밀도를 보였고, 이 결과 적합피드백에서 검색성능을 향상시키게 되었다. 이는 제안 기법이 잠정적 적합피드백에서 유효한 방법임을 알 수 있다.