• Title/Summary/Keyword: 출현정보

Search Result 1,418, Processing Time 0.03 seconds

A Study on the Intellectual Structure Analysis by Keyword Type Based on Profiling: Focusing on Overseas Open Access Field (프로파일링에 기초한 키워드 유형별 지적구조 분석에 관한 연구 - 국외 오픈액세스 분야를 중심으로 -)

  • Kim, Pan Jun
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.55 no.4
    • /
    • pp.115-140
    • /
    • 2021
  • This study divided the keyword sets searched from LISTA database focusing on the overseas open access fields into two types (controlled keywords and uncontrolled keywords), and examined the results of performing an intellectual structure analysis based on profiling for the each keyword type. In addition, these results were compared with those of an intellectual structural analysis based on co-word analysis. Through this, I tried to investigate whether similar results were derived from profiling, another method of intellectual structure analysis, and to examine the differences between co-word analysis and profiling results. As a result, there was a similar difference to the co-word analysis in the results of intellectual structure analysis based on profiling for each of the two keyword types. Also, there were also noticeable differences between the results of intellectual structural analysis based on profiling and co-word analysis. Therefore, intellectual structure analysis using keywords should consider the characteristics of each keyword type according to the research purpose, and better results can be expected to be used based on profiling than co-word analysis to more clearly understand research trends in a specific field.

Automatic Construction of Korean Unknown Word Dictionary using Occurrence Frequency in Web Documents (웹문서에서의 출현빈도를 이용한 한국어 미등록어 사전 자동 구축)

  • Park, So-Young
    • Journal of the Korea Society of Computer and Information
    • /
    • v.13 no.3
    • /
    • pp.27-33
    • /
    • 2008
  • In this paper, we propose a method of automatically constructing a dictionary by extracting unknown words from given eojeols in order to improve the performance of a Korean morphological analyzer. The proposed method is composed of a dictionary construction phase based on full text analysis and a dictionary construction phase based on web document frequency. The first phase recognizes unknown words from strings repeatedly occurred in a given full text while the second phase recognizes unknown words based on frequency of retrieving each string, once occurred in the text, from web documents. Experimental results show that the proposed method improves 32.39% recall by utilizing web document frequency compared with a previous method.

  • PDF

Analysis of Information Education Related Theses Using R Program (R을 활용한 정보교육관련 논문 분석)

  • Park, SunJu
    • Journal of The Korean Association of Information Education
    • /
    • v.21 no.1
    • /
    • pp.57-66
    • /
    • 2017
  • Lately, academic interests in big data analysis and social network has been prominently raised. Various academic fields are involved in this social network based research trend, which is, social network has been actively used as the research topic in social science field as well as in natural science field. Accordingly, this paper focuses on the text analysis and the following social network analysis with the Master's and Doctor's dissertations. The result indicates that certain words had a high frequency throughout the entire period and some words had fluctuating frequencies in different period. In detail, the words with a high frequency had a higher betweenness centrality and each period seems to have a distinctive research flow. Therefore, it was found that the subjects of the Master's and Doctor's dissertations were changed sensitively to the development of IT technology and changes in information curriculum of elementary, middle and high school. It is predicted that researches related to smart, mobile, smartphone, SNS, application, storytelling, multicultural, and STEAM, which had an increased frequency in period 4, would be continuously conducted. Moreover, the topics of robots, programming, coding, algorithms, creativity, interaction, and privacy will also be studied steadily.

Passage Segmentation based on Topic Appearance, Continuity, and Transition (화제 출현.계속.전환 처리를 이용한 한국어 문서의 단락분할)

  • Lim, Su-Jeong;Lee, Won-Hee;Lee, Samuel Sang-Kon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2005.05a
    • /
    • pp.737-740
    • /
    • 2005
  • 복수의 화제가 혼합되어 있는 문서에서 각 화제의 경계부분을 구분하여 결정하는 단락분할 시스템을 개발한다. 이 기술은 정보검색의 분야에만 한정되지 않고 다양한 분야 예를 들면, 문서분류 및 요약 등의 기초연구에서 중요한 역할을 담당할 기술이다. 본 논문에서는 화제의 출현, 계속, 전환 시점을 고려하여 출현하는 각 화제의 단락구분 방법에 대하여 제안한다. 단락 구분 시 문서의 의미적인 실마리가 끊어지지 않도록 단락을 추출하는 방법을 제안한다.

  • PDF

Issue Word Extraction Using Chi-square Statistics (카이제곱 통계량을 이용한 이슈 단어 추출)

  • Shin, Junsoo
    • Annual Conference on Human and Language Technology
    • /
    • 2014.10a
    • /
    • pp.225-227
    • /
    • 2014
  • 최근 온라인 뉴스는 대중의 관심사 및 트렌드에 따라서 다양한 종류의 기사들이 작성된다. 이러한 관심사 및 트렌드는 시간의 흐름에 따라 계속 변한다. 본 논문에서는 온라인 뉴스의 기사 제목을 이용하여 시간에 따라 변하는 관심사 및 트렌드와 관련된 단어를 추출하는 방법을 제안한다. 특정 기간 별 출현하는 뉴스들을 하나의 카테고리로 가정하고 자질 선택 방법에서 널리 사용되는 카이제곱 통계량을 이용하여 각 카테고리의 주요 단어를 추출한다. 실험 결과 특정 기간 별 관심사 및 트렌드와 관련된 단어들이 출현하는 것을 확인하였다.

  • PDF

Automatic Keyword Extraction using Hierarchical Graph Model Based on Word Co-occurrences (단어 동시출현관계로 구축한 계층적 그래프 모델을 활용한 자동 키워드 추출 방법)

  • Song, KwangHo;Kim, Yoo-Sung
    • Journal of KIISE
    • /
    • v.44 no.5
    • /
    • pp.522-536
    • /
    • 2017
  • Keyword extraction can be utilized in text mining of massive documents for efficient extraction of subject or related words from the document. In this study, we proposed a hierarchical graph model based on the co-occurrence relationship, the intrinsic dependency relationship between words, and common sub-word in a single document. In addition, the enhanced TextRank algorithm that can reflect the influences of outgoing edges as well as those of incoming edges is proposed. Subsequently a novel keyword extraction scheme using the proposed hierarchical graph model and the enhanced TextRank algorithm is proposed to extract representative keywords from a single document. In the experiments, various evaluation methods were applied to the various subject documents in order to verify the accuracy and adaptability of the proposed scheme. As the results, the proposed scheme showed better performance than the previous schemes.

Comparison of Species Distribution Models According to Location Data (위치자료의 종류에 따른 생물종 분포모형 비교 연구)

  • Seo, Chang-Wan;Park, Yu-Ri;Choi, Yun-Soo
    • Journal of Korean Society for Geospatial Information Science
    • /
    • v.16 no.4
    • /
    • pp.59-64
    • /
    • 2008
  • We need to use the strength of each Species Distribution Model(SDM) because presence location data were only collected due to time and economic limitations in Korea. This study investigated and compared GAM(Generalized Additive Model) which is one of presence-absence models with Maxent(Maximum Entropy Model) which is one of presence only models according to location data(presence/absence data). The target species was Fisher(Martes pennanti) which is an endangered species in California, USA. We implemented environmental data such as topography, climate and vegetation, and applied models to sub-regions and study area. The results of this study were as follows. Firstly, GAM which used real presence and absence data was better than GAM which used pseudo-absence data and Maxent which used presence-only data. Secondly, Maxent was better than GAM when presence-only data were used. Lastly, each model which applied to different regions didn't predict other area well due to the difference of habitat environment and over-predicted outside of study area. We need to select an optimal model to predict a suitable habitat according to the type and distribution of location data.

  • PDF

외국의 정보검색사 현황

  • An, Gye-Seong
    • Digital Contents
    • /
    • no.4 s.47
    • /
    • pp.14-16
    • /
    • 1997
  • KISEC의 태동으로 국내에서도 정보검색사들의 역할과 책임이 막중해 지고 있다. 한발 먼저 정보검색사가 출현한 외국의 사례를 통해 국내 정보검색사들이 치중해야 할 부분에 대해 살펴봤다.

  • PDF

User Location Inference Using a User Group Model in Smartphone Environment (스마트폰 환경에서 사용자 그룹별 모델을 활용한 사용자 장소 추론)

  • Kim, Young-Ho;Kang, Young-Gil;Lee, Soo-Won
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06a
    • /
    • pp.270-273
    • /
    • 2011
  • 스마트폰의 확산으로 스마트폰에 내장된 다양한 센서를 활용한 상황인지 서비스가 고도화 되어가고 있다. 이와 관련하여 GPS 센서, WiFi AP, Cell Tower 등의 정보를 이용하여 사용자의 위치를 파악하는 연구와 LBS(Location Based Service)에 대한 연구들이 이루어지고 있다. 하지만, 기존의 GPS 등과 같은 위치 센싱 정보를 통한 위치 파악 방법은 인프라를 구축하는 비용이 소요되고, 상대적으로 부정확한 장소 정보를 반환하는 문제점이 있다. 본 연구에서는 스마트폰으로부터 수집된 사용자의 시간, 요일, 장소, 주변 동시 출현 사용자 정보 등과 같은 사용자 상황 로그를 학습하여 사용자의 장소를 추론 하는 연구와 사용자의 프로파일을 이용하여 사용자를 그룹화한 장소 추론 모델을 통해 사용자의 장소 추론 정확도를 개선하는 방법을 제안한다. 제안 방법의 성능 평가를 위해 Reality Mining Project 그룹에서 수집된 데이터셋을 사용하여 전체 사용자를 대상으로 주변 동시 출현 사용자 속성을 이용한 방법과 사용자 주변에서 동시 출현하는 사용자의 빈도가 유사한 사용자별로 그룹화한 장소를 추론하는 방법을 비교 실험하였다. 실험 결과, 전체 사용자를 대상으로 장소를 추론하는 방법에 비해 유사 사용자 군집별로 장소를 추론하는 방법의 분류 정확도가 향상되었음을 확인하였다.

Dataset construction and Automatic classification of Department information appearing in Domestic journals (국내 학술지 출현 학과정보 데이터셋 구축 및 자동분류)

  • Byungkyu Kim;Beom-Jong You;Hyoung-Seop Shim
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2023.01a
    • /
    • pp.343-344
    • /
    • 2023
  • 과학기술 문헌을 활용한 계량정보분석에서 학과정보의 활용은 매유 유용하다. 본 논문에서는 한국과학기술인용색인데이터베이스에 등재된 국내 학술지 논문에 출현하는 대학기관 소속 저자의 학과정보를 추출하고 데이터 정제 및 학과유형 분류 처리를 통해 학과정보 데이터셋을 구축하였다. 학과정보 데이터셋을 학습데이터와 검증데이터로 이용하여 딥러닝 기반의 자동분류 모델을 구현하였으며, 모델 성능 평가 결과는 한글 학과정보 기준 98.6%와 영문 학과정보 기준 97.6%의 정확률로 측정되었다. 향후 과학기술 분야별 지적관계 분석 및 논문 주제분류 등에 학과정보 자동분류 처리기의 활용이 기대된다.

  • PDF