• Title/Summary/Keyword: 문헌 순위화 기법

Search Result 27, Processing Time 0.021 seconds

An Experimental Study on Feature Ranking Schemes for Text Classification (텍스트 분류를 위한 자질 순위화 기법에 관한 연구)

  • Pan Jun Kim
    • Journal of the Korean Society for information Management
    • /
    • v.40 no.1
    • /
    • pp.1-21
    • /
    • 2023
  • This study specifically reviewed the performance of the ranking schemes as an efficient feature selection method for text classification. Until now, feature ranking schemes are mostly based on document frequency, and relatively few cases have used the term frequency. Therefore, the performance of single ranking metrics using term frequency and document frequency individually was examined as a feature selection method for text classification, and then the performance of combination ranking schemes using both was reviewed. Specifically, a classification experiment was conducted in an environment using two data sets (Reuters-21578, 20NG) and five classifiers (SVM, NB, ROC, TRA, RNN), and to secure the reliability of the results, 5-Fold cross-validation and t-test were applied. As a result, as a single ranking scheme, the document frequency-based single ranking metric (chi) showed good performance overall. In addition, it was found that there was no significant difference between the highest-performance single ranking and the combination ranking schemes. Therefore, in an environment where sufficient learning documents can be secured in text classification, it is more efficient to use a single ranking metric (chi) based on document frequency as a feature selection method.

A Study of Document Ranking Algorithms in a P-norm Retrieval System (P-norm 검색의 문헌 순위화 기법에 관한 실험적 연구)

  • 고미영;정영미
    • Journal of the Korean Society for information Management
    • /
    • v.16 no.1
    • /
    • pp.7-30
    • /
    • 1999
  • This study is to develop effective document ranking algorithms in the P-norm retrieval system which can be implemented to the Boolean retrieval system without major difficulties by using non-statistical term weights based on document structure. Also, it is to enhance the performance by introducing the rank adjustment process which rearranges the ranks of retrieved documents according to the similarity between the top ranked documents and the rest of them. Of the non-statistical term weight algorithms, this study uses field weight and term pair distance weight. In the rank adjustment process, five retrieval experiments were performed, ranging between the case of using one record for the similarity measurement and the case of using first five records. It is proved that non-statistical term weights are highly effective and the rank adjustment process enhance the performance further.

  • PDF

A Study of Indexing Methods with weight-value of Web document (가중치를 가지는 웹문서 색인기법에 관한 연구)

  • Kim, Jong-Young;Kim, Cheol-Su
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11c
    • /
    • pp.2459-2462
    • /
    • 2002
  • 검색된 문헌들에 대한 항해 시간을 줄이기 위해서 검색된 문헌들의 문헌 순위화가 필수적이다. 문헌 순위화를 위해서는 문헌 순위화를 위한 순위화 정보가 필요하다. 본 논문에서는 검색된 문헌들에 대한 순위화를 보다 효율적으로 수행하기 위한 정보를 제공하기 위하여 HTML 문서에 대한 색인 과정에서 다양한 가중치를 가지는 색이어 추출 방법에 관하여 연구하였다. 웹문서들은 태그로 이루어지며 중요한 색인어들은 특정 태그 속에 포함되어 있다는 것에 착안하여 색인어의 중요도에 영향을 줄 수 있는 태그를 선별하고, 선별된 태그들에 대해 휴리스틱 정보를 이용하여 중요도를 부여한 후 선별된 태그에 영향을 받는 문장들에서 추출된 색인어에 대하여 가중치를 부여하는 방법을 이용하였다. 색인어 추출을 형태소 분석기를 이용하였다. 색인어들이 다양한 가중치를 가지므로 검색 과정에서 검색된 문헌들에 대하여 효율적인 순위화가 가능하여 관련 문헌을 보다 빠르게 찾을 수 있는 환경을 제공할 수 있다.

  • PDF

User Query Expansion Through Keyword Similarity Ranking Algorithm Us ins Cluster ing Methods (클러스터링 기법을 이용한 키워드 유사도 순위화 알고리즘에 따른 사용자 질의 확장)

  • 이상훈;김기태
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.479-481
    • /
    • 2003
  • 본 논문에서는 여러 가지 클러스터링 기법들을 사용하여 키워드 유사도롤 순위화하여 사용자의 질의를 확장하는 기법을 제안한다. 클러스터링 기법에는 연관(Association) 클러스터링, 메트릭(Metric) 클러스터링, 스칼라(Scalar) 클러스터링 기법을 사용하고, 이들간의 가중치를 적절히 조절하여 검색 시스템을 만든다. 사용자의 질의가 주어졌을 때, 질의 키워드와 연관된 키워드들을 순위화 하여 사용자에게 보여주고, 사용자의 추가입력을 받아서 질의를 확장한다. 사용자가 적당한 질의어로 판단하여 확장된 질의로 검색을 수행할 때까지 이 과정을 반복한다. 실험에서 사용한 문헌집합은 Korea Herald의 2003년 1월과 2월의 경제 관련 기사들을 수집하여 사용하였고, 실험을 거쳐서 질의를 확장한 결과 만족할 만한 결과가 도출되었다.

  • PDF

A study on prioritizing the application areas for business development of IoT(Internet of Things) (사물 인터넷의 사업화 영역에 대한 우선순위 선정에 관한 연구)

  • Moon, Tae Hee;Kim, Taehoon;Ahn, Hyunchul
    • Journal of Digital Convergence
    • /
    • v.12 no.11
    • /
    • pp.183-195
    • /
    • 2014
  • This study aims at identifying and prioritizing the application areas for business development of IoT(Internet of Things). In specific, we collected the opinions of the experts on IoT in Korea through the survey based on pairwise comparison, and then we analyzed them using AHP(analytic hierarchy process). As a result, we found that 'Public Safety & Security', 'Automotive & Transportation', and 'Utility & Energy' are the most promising area in realizing IoT-related businesses. Also, we found that the experts had different views according to the positions of their industry in IoT value chain. The analysis showed that the device industry prioritizes 'Public Safety & Security', whereas the network industry does 'Automotive & Transportation'. The experts from the service industry were found to regard 'Utility and Energy' as the most promising commercialization area of IoT.

Priority Demand Assessment for Overseas Construction Information Using Clustering Method (클러스터링 기법을 활용한 해외건설 필요정보 우선순위 수요 조사 평가)

  • Choi, Wonyoung;Kwak, Seing-Jin
    • Journal of the Korean BIBLIA Society for library and Information Science
    • /
    • v.29 no.4
    • /
    • pp.57-68
    • /
    • 2018
  • In a situation when domestic construction market is expected to be stagnant, Overseas Information System for Construction Engineering (OVICE) is operated to support the construction SMEs that advance to the global market. In this study, we aimed to improve the quality of information service by providing direction of information provision, by comparing expert questionnaire with information system user statistics. For statistical analysis of information systems, to improve the efficiency of statistical analysis that is difficult to prioritize, K-means clustering is used for more efficient analysis. As a result, analyzing the difference between the survey results and the information system statistics, we were able to identify improvement point of information provision in the system and important contents that were not highlighted during the survey.

Development and Application of Adaptability Assessment Methods for Traffic Assignment Techniques (통행배정지법 적용성 평가방법의 개발 및 적용)

  • 최재훈;박병호
    • Journal of Korean Society of Transportation
    • /
    • v.16 no.2
    • /
    • pp.23-35
    • /
    • 1998
  • 이 연구는 두가지의 목적을 갖는다. 첫 번째는 통행배정결과를 평가하는데 혼동되어 이용되고 있는 방법들을 체계화하여 통합된 철차를 개발하는 것이고, 두 번째는 충북도내 3개 도시(청주, 충주 및 제천시)의 배정결과에 이를 적용시켜 해당 도시별로 신뢰도가 높은 통행배정법을 제안하는 것이다. 분석된 주요 연구결과는 다음과 같다. 첫째, 관련문헌들을 검토하여 평가방법들을 통계학적 관점에서 크게 기술통계법과 추리통계법으로 체계화시키고, 이러한 평가방법들의 결과를 순위자료화하여 종합적인 판단을 내릴 수 있는 방법을 정립함으로써 통합된 일련의 평가절차를 개발하였다. 둘째, 개발된 절차를 이용한 사례연구 결과, 청주시와 충주시에 대해서는 확률배정법, 제천시에 대해서는 분할배정법의 적용성이 우수한 것으로 나타났다. 본 연구를 통해 개발된 평가절차는 해당도시에 적합한 통행배정기법을 선정하는데 이용될 수 있을 뿐만 아니라, 향후 개발되는 통행배정 알고리즘들의 효과를 기존 배정기법들과 비교하여 설명할 수 있는 분석의 틀을 제공할 수 있다.

  • PDF

Priority of Modularization in Weapon System by using Grey Relational Analysis (GRA를 활용한 무기체계 모듈화 우선순위선정)

  • Lee, Kang-Taek;Lee, Jung-Hoon;Cho, Il-Hoon;Jung, Joo-Hyun;Kim, Geun-Hyung
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.17 no.9
    • /
    • pp.647-654
    • /
    • 2016
  • In the defense industry, national security takes priority over economic sense and this has translated into high cost and long-term research and development. However, the exponential growth of technology and rapid changes in the security situation in recent years have resulted in a call for the development of systems at a low cost within a short period of time. In order to implement a modularization strategy in the field of defense, the introduction of line replaceable units in OO systems needs to be prioritized. This study selects six criteria following a literature review and prioritizes 11 modules for OO systems using the project evaluation method, Grey Relational Analysis (GRA). Based on the GRA results, the grey relational grades were derived as 0.83, 0.81 and 0.80 for the M11 (Main board), M8 (EMI module), M3 (Single board computer) modules, respectively. The cost and time of development is expected to be reduced in accordance with the grey relational grade. The results of this research could be utilized for decision making on adopting modularization in similar system development or product improvement programs (PIPs).

A Dam Rehabilitation Assessment Using the Delphi-AHP Method for Climate Change Adaptation (Delphi-AHP기법을 이용한 기후변화 고려 댐 재개발 평가지표 산정)

  • Choi, Ji Hyeok;Kim, Jong Suk;Yoon, Tae Hyung;Moon, Young Il
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2016.05a
    • /
    • pp.170-170
    • /
    • 2016
  • 기후변화로 인한 강우강도의 변화와 국지성 호우로 인한 유역의 수문량의 증가가 전망되고 있는 상황에서 댐 시설물의 고령화에 따른 댐 안전성 문제가 대두되고 있으며, 신규댐 건설보다는 기존 댐의 재개발의 필요성이 부각되고 있다. 기후변화로 인한 집중호우의 강도와 발생빈도의 증가, 태풍의 대형화 등으로 댐으로 유입되는 수문량의 변동폭이 커짐에 따라서 극심한 홍수 및 가뭄의 발생이 빈번하게 일어나고 있어 물관리 어려움이 가중되고 있으며 이에 대한 대비책 마련이 시급한 실정이다. 그러나 아직까지 국내에서는 기후변화에 대한 영향을 고려한 댐 재개발에 대한 연구는 미흡한 상태이며, 기후변화와 신규 수자원 개발사업의 정체, 댐 시설물의 노후화 등 제반여건을 고려할 때 기존 댐 시설물 재개발의 전면적 재검토가 필요하다. 따라서 본 연구에서는 기후변화의 영향과 댐 시설물의 고령화 등에 따른 복합적인 댐 안전성 문제 등에 대비하기 위하여 댐 재개발 평가항목을 개발하였으며, 국내외 사례 및 문헌조사, 그리고 전문가 자문을 통해 각 평가항목에 대한 타당성 및 적합성 검토를 실시하고, 각 세부지표에 대한 평가기준과 댐 관련 분야의 전문도를 고려한 상대적 중요도 평가방법을 제시하고자 한다.

  • PDF

A Study on the Problems and Improvement Solutions for the Ambulance Stretcher (119구급대 주들것의 문제점과 그 개선방안에 관한 연구)

  • Ham, Seung Hee;Song, Woo Seung;Yoon, Myung O
    • Fire Science and Engineering
    • /
    • v.28 no.3
    • /
    • pp.72-79
    • /
    • 2014
  • The purpose of this study is to draw the improvement plan through the analysis of problems of main stretchers that are being used by the 119 EMS. In order to find out the problems, we used the literature review and analysis, survey questionnaire and we also made full use of KJ method (Kawakita Jiro method, affinity diagram), graph method, and priority matrix method to produce the improvement indicators. The problems of main stretchers are summarized as follows. they are being recognized as part of the emergency vehicle, they have the imperfection of performance verification criteria, and they cause the injuries of paramedics and patients accidents in operation. The indicators such as the ease of operation, the high performance, the multi-function, the driving performance, the durability and the lightweight, was produced to improve the problems. The results of the interconnection analysis and the applying priority matrix method on the indicators are the ease of operation ${\rightarrow}$ the multi-function ${\rightarrow}$ the driving performance ${\rightarrow}$ the high performance ${\rightarrow}$ the durability and the lightweight in order of importance.