• 제목/요약/키워드: Document Analysis

검색결과 1,182건 처리시간 0.035초

초등융합영재 선발요소의 상관관계 및 그룹 차이 분석 (Analysis of Correlation and Group Difference for Selection of Elementary Fusion Gifted Students)

  • 민미경;김갑수
    • 정보교육학회논문지
    • /
    • 제22권4호
    • /
    • pp.491-500
    • /
    • 2018
  • 4차 산업혁명시대에 필요한 인재는 특정 학문에 종속되는 것이 아니라 여러 학문들을 융합할 수 있어야 한다. 초등학생들의 경우에 다양한 변화의 가능성이 있기 때문에 융합적인 사고를 갖는 것이 중요하다. 따라서 초등학교 영재를 선발할 때에도 융합 영재 학생들을 선발하고 있다. 본 연구에서는 융합 영재 학생들을 선발할 때에 창의적인 문제 해결력, 서류 평가, 면접 요소들이 학생 선발에 어떤 영향을 미치는지 알아본다. 연구 결과 창의적 문제해결력이 선발에 미치는 영향력이 가장 높다. 5학년의 경우에는 창의적인 문제 해결력과 서류 평가가 선발에 영향을 미치고, 4학년의 경우에는 창의적인 문제 해결력과 면접이 선발에 영향을 미치고. 여학생들은 창의적인 문제해결력과 서류 평가가 선발에 영향을 미친다는 것을 알 수 있었다. 그룹별로 차이를 분석한 결과, 성별에서는 서류 평가에서 성별로 차이가 있었고, 학년별 유의미한 차이점이 없다는 것을 알 수 있었다.

텍스트 데이터 분석을 위한 근접성 데이터의 생성과 군집화 (Creation and clustering of proximity data for text data analysis)

  • 정민지;신상민;최용석
    • 응용통계연구
    • /
    • 제32권3호
    • /
    • pp.451-462
    • /
    • 2019
  • 문서-용어 빈도행렬은 텍스트 마이닝 분야에서 보편적으로 사용되는 데이터의 한 유형으로, 여러 개체들이 제공하는 문서를 기반으로 만들어진다. 그러나 대다수의 연구자들은 개체 정보에 무게를 두지 않고 여러 문서에서 공통적으로 등장하는 공통용어 중 핵심적인 용어를 효과적으로 찾아내는 방법에 집중하는 경향을 보인다. 공통용어에서 핵심어를 선별할 경우 특정 문서에서만 등장하는 중요한 용어들이 공통용어 선정단계에서부터 배제될 뿐만 아니라 개별 문서들이 갖는 고유한 정보가 누락되는 등의 문제가 야기된다. 본 연구에서는 이러한 문제를 극복할 수 있는 데이터를 근접성 데이터라 정의한다. 그리고 근접성 데이터를 생성할 수 있는 12가지 방법 중 개체 군집화의 관점에서 가장 최적화된 방법을 제안한다. 개체 특성 파악을 위한 군집화 알고리즘으로는 다차원척도법과 K-평균 군집분석을 활용한다.

주성분 보유수에 따른 중요 용어 추출의 비교 (Comparison of Significant Term Extraction Based on the Number of Selected Principal Components)

  • 이창범;옥철영;박혁로
    • 정보처리학회논문지B
    • /
    • 제13B권3호
    • /
    • pp.329-336
    • /
    • 2006
  • 문서를 구성하는 단어들은 서로 연관이 있다는 정보를 충분히 이용할 수 있는 다변량 분석 방법 중, 주성분분석(Principal Component Analysis)을 이용하여 중요 용어를 추출하고자 한다. 본 논문에서는 주성분분석의 분석 대상을 용어 사이의 공분산행렬이 아닌 상관행렬을 이용한다. 그리고, 중요 용어를 추출하기 위해서, 보유해야 할 주성분 개수와 주성분과 용어 사이의 상관계수에 대한 최적의 임계치를 찾고자 한다. 283건의 신문기사를 대상으로, 추출된 용어에 기반한 문장 추출 실험 결과, 첫 6개까지의 주성분과 상관계수 |0.4|라는 조건에서 가장 좋은 성능을 보였다.

재해분석을 위한 텍스트마이닝과 SOM 기반 위험요인지도 개발 (On the Development of Risk Factor Map for Accident Analysis using Textmining and Self-Organizing Map(SOM) Algorithms)

  • 강성식;서용윤
    • 한국안전학회지
    • /
    • 제33권6호
    • /
    • pp.77-84
    • /
    • 2018
  • Report documents of industrial and occupational accidents have continuously been accumulated in private and public institutes. Amongst others, information on narrative-texts of accidents such as accident processes and risk factors contained in disaster report documents is gaining the useful value for accident analysis. Despite this increasingly potential value of analysis of text information, scientific and algorithmic text analytics for safety management has not been carried out yet. Thus, this study aims to develop data processing and visualization techniques that provide a systematic and structural view of text information contained in a disaster report document so that safety managers can effectively analyze accident risk factors. To this end, the risk factor map using text mining and self-organizing map is developed. Text mining is firstly used to extract risk keywords from disaster report documents and then, the Self-Organizing Map (SOM) algorithm is conducted to visualize the risk factor map based on the similarity of disaster report documents. As a result, it is expected that fruitful text information buried in a myriad of disaster report documents is analyzed, providing risk factors to safety managers.

Text Mining of Wood Science Research Published in Korean and Japanese Journals

  • Eun-Suk JANG
    • Journal of the Korean Wood Science and Technology
    • /
    • 제51권6호
    • /
    • pp.458-469
    • /
    • 2023
  • Text mining techniques provide valuable insights into research information across various fields. In this study, text mining was used to identify research trends in wood science from 2012 to 2022, with a focus on representative journals published in Korea and Japan. Abstracts from Journal of the Korean Wood Science and Technology (JKWST, 785 articles) and Journal of Wood Science (JWS, 812 articles) obtained from the SCOPUS database were analyzed in terms of the word frequency (specifically, term frequency-inverse document frequency) and co-occurrence network analysis. Both journals showed a significant occurrence of words related to the physical and mechanical properties of wood. Furthermore, words related to wood species native to each country and their respective timber industries frequently appeared in both journals. CLT was a common keyword in engineering wood materials in Korea and Japan. In addition, the keywords "MDF," "MUF," and "GFRP" were ranked in the top 50 in Korea. Research on wood anatomy was inferred to be more active in Japan than in Korea. Co-occurrence network analysis showed that words related to the physical and structural characteristics of wood were organically related to wood materials.

외국학술지 지원센터의 학술지 및 원문복사서비스의 만족도 분석 (Assessing Satisfaction on Scholarly Journals and Document Delivery Services at Foreign Journal Supporting Center)

  • 최재황
    • 한국문헌정보학회지
    • /
    • 제42권2호
    • /
    • pp.69-85
    • /
    • 2008
  • 본 연구의 목적은 2007년 K대학교 도서관 내에 설치된 외국학술지 지원센터에서 제공하는 학술지와 원문복사서비스의 이용자 만족도를 분석하는데 있다. 학술지의 품질에 대한 분석에서는 72명, 원문복사서비스의 품질에 대한 분석에서는 69명이 설문에 응하였다. 학술지의 품질에 대한 만족도에서는 학술지의 최신성, 유용성, 전문성에 대한 조사를 하였고, 원문복사서비스의 품질에 대해서는 원문전달의 신속성, 원문신청절차의 용이성에 대한 조사를 하였다. K대학교 외국학술지 지원센터에서 제공하는 학술지 및 원문복사서비스의 품질에 대하여 현재 이용자들의 대부분은 만족하고 있는 것으로 조사되었다.

Automatic Reading System for On-off Type DNA Chip

  • Ryu, Mun-Ho;Kim, Jong-Dae;Kim, Jong-Won
    • Journal of Information Processing Systems
    • /
    • 제2권3호
    • /
    • pp.189-193
    • /
    • 2006
  • In this study we propose an automatic reading system for diagnostic DNA chips. We define a general specification for an automatic reading system and propose a possible implementation method. The proposed system performs the whole reading process automatically without any user intervention, covering image acquisition, image analysis, and report generation. We applied the system for the automatic report generation of a commercialized DNA chip for cervical cancer detection. The fluorescence image of the hybridization result was acquired with a $GenePix^{TM}$ scanner using its library running in HTML pages. The processing of the acquired image and the report generation were executed by a component object module programmed with Microsoft Visual C++ 6.0. To generate the report document, we made an HWP 2002 document template with marker strings that were supposed to be searched and replaced with the corresponding information such as patient information and diagnosis results. The proposed system generates the report document by reading the template and changing the marker strings with the resultant contents. The system is expected to facilitate the usage of a diagnostic DNA chip for mass screening by the automation of a conventional manual reading process, shortening its processing time, and quantifying the reading criteria.

화질 분석을 통한 카메라 문서 영상의 적응적 이진화 (An Adaptive Binarization of Camera Document Image by Image Quality Estimation)

  • 김인중
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권9호
    • /
    • pp.797-803
    • /
    • 2007
  • 카메라 기반 문서 인식을 위해서는 화질 변화에 적응할 수 있는 이진화 기술이 매우 중요하다. 본 논문에서는 화질 분석을 통해 다양한 화질의 카메라 영상에 효과적으로 적응할 수 있는 이진화 방법을 제안한다. 먼저 이진화 파라미터가 이진화 결과에 미치는 영향을 분석하고, 카메라 영상의 화질을 측정하는 방법을 제안한다. 그리고, 측정된 화질과 이진화 파라미터간의 상관 관계를 통계적으로 분석하여 반영함으로써 화질 변화에 자동으로 적응하는 이진화 방법을 제안한다. 실험을 통해 화질과 이진화 파라미터간에는 유의한 상관 관계가 있으며, 제안하는 방법이 화질에 따라 적절한 파라미터를 추정함으로써 화질변화에 적응함을 확인하였다.

자원공유에 대한 대학도서관 사서들의 인식에 관한 연구 (A Study on the Perception Among University Librarians towardes Resource Sharing)

  • 심원식
    • 정보관리학회지
    • /
    • 제25권2호
    • /
    • pp.5-24
    • /
    • 2008
  • 대학도서관에서의 자원공유가 활발해지고 고도화됨에 따라 이 업무를 담당하는 사서들이 자원공유에 대한 인식을 이해할 필요가 있다. 본 연구는 설문지에 기반한 연구방법을 사용하여 78명의 대학도서관 사서들로부터 상호대차, 원문복사, 종합목록구축, 분담수서, 그리고 인적교류와 관련된 인식과 평가에 관한 자료를 수집하였다. 설문결과는 사서들이 이미 잘 구축된 자원공유(상호대차, 원문복사, 종합목록구축)에 대해 그렇지 않은 형태의 자원공유 (분담수서, 인적교류) 보다 더 긍정적으로 평가하는 것으로 나타났다. 서서들의 자원공유에 대한 인식과 도서관/개인 특성과의 상관분석이 수행되었고, 다섯 개 영역의 자원공유 각각에 대한 장애요인 또한 도출되었다.

확장 마크업 언어(XML)를 이용한 정간보 악보 표기법에 관한 연구 (A Study on the Notation of Jeongganbo Score using Extensible Markup Language (XML))

  • 이용주;최근우;박태진;강경옥
    • 한국음향학회지
    • /
    • 제32권5호
    • /
    • pp.446-453
    • /
    • 2013
  • 본 논문에서는 다양한 구조와 기호를 가지는 국악 악보인 정간보를 XML(Extensible Markup Language)을 이용하여 디지털 파일로 저장하는 방법에 대해 제안한다. 이를 위하여 정간보의 구조에 대하여 분석을 하고, 정간보기보에 활용되는 기호를 분류하고, 기호의 사용 형태에 대해 분석을 하였다. 이러한 분석을 기반으로 다양한 정간보의 구조와 기호를 포함하는 정간보 악보 기술 방법을 DTD(Document Type Definition) 로 정의하였다. 제안한 방법의 검증을 위하여, 정간보로 기보된 악보를 제안한 DTD에 따라 XML로 기술하였고, 정간보 악보가 기록된 XML을 해석하고 이를 정간보 형태로 나타내어주는 프로그램을 구현하여, XML로 기술된 정간보 악보가 적절하게 해석되고 정간보 악보 형태로 보여주는 것이 가능함을 보였다.