• 제목/요약/키워드: Document Frequency

검색결과 303건 처리시간 0.038초

Evaluation Metrics for Class Hierarchy in Object-Oriented Databases: Concurrency Control Perspectives

  • Jun Woo-Chun
    • 한국멀티미디어학회논문지
    • /
    • 제9권6호
    • /
    • pp.693-699
    • /
    • 2006
  • Object-oriented databases (OODBs) have been adopted for managing non-standard applications such as computer-aided design (CAD), office document management and many multimedia applications. One of the major characteristics of OODBs is class hierarchy where a subclass is allowed to inherit the definitions defined on its superclasses. In this paper, I present the evaluation metrics for class hierarchy quality in OODBs. These metrics are developed to determine if a concurrency control scheme can achieve good performance or not on a given class hierarchy. I first discuss the existing concurrency control schemes for OODBs. Then I provide evaluation metrics based on structural information and access frequency information in class hierarchies. In order to discuss significance of the proposed performance metrics, an analytical model is developed. Analysis results show that the performance metrics are important factor in concurrency control performance. I consider both single inheritance and multiple inheritance. The proposed metrics can be used to provide guidelines on how to design class hierarchy of an OODB for maximizing the performance of concurrency control technique.

  • PDF

A Dynamic Ontology-based Multi-Agent Context-Awareness User Profile Construction Method for Personalized Information Retrieval

  • Gao, Qian;Cho, Young Im
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제12권4호
    • /
    • pp.270-276
    • /
    • 2012
  • With the increase in amount of data and information available on the web, there have been high demands on personalized information retrieval services to provide context-aware services for the web users. This paper proposes a novel dynamic multi-agent context-awareness user profile construction method based on ontology to incorporate concepts and properties to model the user profile. This method comprehensively considers the frequency and the specific of the concept in one document and its corresponding domain ontology to construct the user profile, based on which, a fuzzy c-means clustering method is adopted to cluster the user's interest domain, and a dynamic update policy is adopted to continuously consider the change of the users' interest. The simulation result shows that along with the gradual perfection of the our user profile, our proposed system is better than traditional semantic based retrieval system in terms of the Recall Ratio and Precision Ratio.

OPAC에서 서명단어탐색의 문헌순위화에 관한 연구 (An Experimental Study on Ranking Output of Title Word Searching in the Boolean OPAC System)

  • 노정순
    • 정보관리학회지
    • /
    • 제18권2호
    • /
    • pp.7-30
    • /
    • 2001
  • 본 연구는 불질의 기반의 OPAC에서 정렬과 적합성 순위화알고리즘의 효과를 분석하고, 순위화의 성능을 평가하는 척도를 연구하였다. 연구결과 출판년도순 정렬이 저자명순, 서명순, 출판사순 정렬보다 우수하였으나 유의한 차이는 아니었다. 용어빈도수에 기반을 퍼지나 DNF 모델보다는 위치정보에 기반을 둔 알고리즘의 순위화 성능이 더 우수하였다. 6개의 순위화 성능평가척도간에 차이는 없었으며, 순위화시스템에서 정확률 P보다 분별력이 높은 단순 척도의 유용성이 확인되었다.

  • PDF

토픽 레이블링을 위한 토픽 키워드 산출 방법 (A Method of Calculating Topic Keywords for Topic Labeling)

  • 김은회;서유화
    • 디지털산업정보학회논문지
    • /
    • 제16권3호
    • /
    • pp.25-36
    • /
    • 2020
  • Topics calculated using LDA topic modeling have to be labeled separately. When labeling a topic, we look at the words that represent the topic, and label the topic. Therefore, it is important to first make a good set of words that represent the topic. This paper proposes a method of calculating a set of words representing a topic using TextRank, which extracts the keywords of a document. The proposed method uses Relevance to select words related to the topic with discrimination. It extracts topic keywords using the TextRank algorithm and connects keywords with a high frequency of simultaneous occurrence to express the topic with a higher coverage.

ISSUES IN PROBABILISTIC SEISMIC HAZARD ANALYSIS FOR NUCLEAR FACILITIES IN THE US

  • Mcguire, Robin K.
    • Nuclear Engineering and Technology
    • /
    • 제41권10호
    • /
    • pp.1235-1242
    • /
    • 2009
  • Probabilistic seismic hazard analysis (PSHA) is routinely conducted in the US for nuclear plants, for the determination of appropriate seismic design levels. These analyses incorporate uncertainties in earthquake characteristics in stable continental regions (where direct observations of large earthquakes are rare), in estimates of rock motions, in site effects on strong shaking, and in the damage potential of seismic shaking for engineered facilities. Performance goals related to the inelastic deformation of individual components, and related to overall seismic core damage frequency, are used to determine design levels. PSHA has the ability to quantify and document the important uncertainties that affect seismic design levels, and future work can be guided toward reducing those uncertainties.

텍스트 마이닝을 이용한 상황 정보 분석 및 예측 프로세스에 관한 연구 (A novel on Context Information Analysis and Prediction Process using Text Mining)

  • 정세훈;강주희;김종찬;심춘보
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2015년도 추계학술대회
    • /
    • pp.1039-1040
    • /
    • 2015
  • 최근 IoT 및 인공지능 기술을 활용한 상황 정보 예측 서비스가 각광을 받고 있다. 본 논문에서는 특정 메타 데이터(Meta Data)로부터 입력되는 정보를 기반으로 상황 정보 분석 및 예측하는 프로세스를 제안한다. 주성분 분석 및 데이터의 집단화(Corpus), 문서 매트릭스(Document Matrix), 단어 빈도수(Frequency)에 따른 데이터 전처리 과정을 통해 상황정보 데이터를 확보한다. 또한 연관 규칙분석을 통해 분류된 데이터의 연관성을 분석하여 예측 데이터의 연관성을 확보한다. 제안하는 상황정보 분석 및 예측 모델은 R을 적용하여 설계한다.

  • PDF

An Investigation of Automatic Term Weighting Techniques

  • Kim, Hyun-Hee
    • 정보관리학회지
    • /
    • 제1권1호
    • /
    • pp.43-62
    • /
    • 1984
  • 본(本) 연구는 두 개의 중요한 목적(目的)들을 가지고 있다. 첫째 목적(目的)은 새로운 단어(單語) 가중기법(加重技法)을 고안하는 것이다. 두번째 목적(目的)은 제안된 단어(單語) 가중기법(加重技法)과 다른 네개의 단어(單語) 가중기법(加重技法)들의 문헌검색결과들을 평가하는 것이다. 본 연구에서 실행된 실험결과는 비교적 간단한 스파크 죤스(Sparck Jones)의 역문헌빈도 가중기법(加重技法)과 제안된 단어(單語) 가중기법(加重技法)의 검색결과들이 더 복잡한 계산을 요하는 다른 세개의 단어(單語) 가중기법(加重技法)들의 검색결과들보다 더 나았다.

  • PDF

이조시대 사랑방 가구에 대한 현대인의 미의식 (Aesthetic Characteristic of‘Sarangbang’Furniture of The Yi-dynasty Period)

  • 유영희
    • 대한가정학회지
    • /
    • 제24권4호
    • /
    • pp.139-146
    • /
    • 1986
  • The purpose of this study was to identify aesthetic concepts of‘Sarangbang’furniture during the Yi-dynasty period and aesthetic descriptions indicating each concept expressed by experts in traditional furniture. The furniture selected for the study includes desks, table bookcases, document and stationary boxes (mungab), letter holders (Kobi) and inkstone boxes (younsang) with lacquer and oil finish on. The respondents were 72 traditional furniture experts; researchers collectors, sellers and artists related to period furniture. The important points of aesthetic descriptors were collected 123 from related literature. From experts' answers, 47 representative descriptors were selected. Data were analyzed with the SPSS using frequency, Percentage mean, factor analysis, t-test and C2. The results were as follows; 1. The aesthetic concept of sarangbang furniture during the Yi-dynasty can be categorized into 9 aspects; appearance of beauty, stability the interior space, naturalness, nobleness/harmony of lines, detail/refinement, simplicity, diversity solidity and surface division. 2. The characteristics of the Korean traditional furniture can be described using 47 descriptors explaining 9 concepts mentioned above.

  • PDF

문서 분류에서 단어의 통계 정보를 이용한 특징 선택 기법의 비교 (Comparison of Feature Selection Methods using the Statistics of Words in Text Categorization)

  • 임윤택;윤충화
    • 대한안전경영과학회:학술대회논문집
    • /
    • 대한안전경영과학회 1999년도 추계학술대회
    • /
    • pp.209-216
    • /
    • 1999
  • 정보 검색 분야의 문서 분류에 기계 학습 기법을 적용할 때 발생하는 가장 큰 문제는 문서를 패턴으로 표현할 때, 하나의 패턴이 가지는 특징의 수가 기계 학습 기법에서 처리할 수 있는 범위를 넘어서는 것이다. 이러한 문제를 해결하기 위하여 특징 선택 기법은 패턴을 구성하고 있는 특징 중에서 실제 문서 분류에 많은 영향을 주는 특징만을 선택하여, 기계 학습 기법에서 쉽게 처리할 수 있을 정도의 패턴을 구성하게 한다. 본 논문에서는 이러한 특징 선택 기법 중에서 IG(Information Gain), Gini index, Relief-F, DF(Document Frequency)를 비교하였다. 실험 결과 문서들에 포함된 모든 고유 단어를 특징의 길이로 하여 패턴을 구성했을 때보다 특징 선택 기법을 적용하여 고유 단어 중 일부를 특징으로 패턴을 구성할 때 기계학습에서 더 향상된 분류 성능을 보였다

  • PDF

단어 빈도 가중치를 이용한 자동 문서 분류 (Automatic Document Classification Based on Word Frequency Weight)

  • 노현아;김민수;김수형;박혁로
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (상)
    • /
    • pp.581-584
    • /
    • 2002
  • 본 논문에서는 범주 내의 키워드 빈도에 의해 문서를 자동으로 분류하는 방법을 제안한다. 문서 자동분류 시스템에서는 문서와 문서를 비교하기 위해서 분류 자질(feature)에 적절한 가중치를 부여할 필요가 있다. 본 논문에서는 수작업으로 분류된 신문기사를 이용하여 자질의 가중치를 학습하는 방법을 사용하였다. 기존의 용어가중치 방법은 각 범주별로 가장 많이 등장한 명사부터 순서대로 추출하여 가중치를 주는 방법을 사용한 것에 비해 본 논문에서는 명사의 출현 횟수뿐만 아니라 출현위치를 함께 고려하여 가중치를 계산하는 방법을 제안한다. 또한 단어 빈도 가중치 방법의 변형된 방식을 사용함으로써 기존의 단어 빈도 가중치 방법과 비교하여 분류 정확도 측면에서 9%이상 성능 향상을 있음을 보인다.

  • PDF