• 제목/요약/키워드: Word record

검색결과 54건 처리시간 0.029초

비정형 텍스트 데이터 분석을 활용한 기록관리 분야 연구동향 (Research Trends in Record Management Using Unstructured Text Data Analysis)

  • 홍덕용;허준석
    • 한국기록관리학회지
    • /
    • 제23권4호
    • /
    • pp.73-89
    • /
    • 2023
  • 본 연구에서는 텍스트 마이닝 기법을 활용하여 국내 기록관리 연구 분야의 비정형 텍스트 데이터인 국문 초록에서 사용된 키워드 빈도를 분석하여 키워드 간 거리 분석을 통해 국내기록관리 연구 동향을 파악하는 것이 목적이다. 이를 위해 한국학술지인용색인(Korea Citation Index, KCI)의 학술지 기관통계(등재지, 등재후보지)에서 대분류(복합학), 중분류 (문헌정보학)으로 검색된 학술지(28종) 중 등재지 7종 1,157편을 추출하여 77,578개의 키워드를 시각화하였다. Word2vec를 활용한 t-SNE, Scattertext 등의 분석을 수행하였다. 분석 결과, 첫째로 1,157편의 논문에서 얻은 77,578개의 키워드를 빈도 분석한 결과, "기록관리" (889회), "분석"(888회), "아카이브"(742회), "기록물"(562회), "활용"(449회) 등의 키워드가 연구자들에 의해 주요 주제로 다뤄지고 있음을 확인하였다. 둘째로, Word2vec 분석을 통해 키워드 간의 벡터 표현을 생성하고 유사도 거리를 조사한 뒤, t-SNE와 Scattertext를 활용하여 시각화하였다. 시각화 결과에서 기록관리 연구 분야는 두 그룹으로 나누어졌는데 첫 번째 그룹(과거)에는 "아카이빙", "국가기록관리", "표준화", "공문서", "기록관리제도" 등의 키워드가 빈도가 높게 나타났으며, 두 번째 그룹(현재)에는 "공동체", "데이터", "기록정보서비스", "온라인", "디지털 아카이브" 등의 키워드가 주요한 관심을 받고 있는 것으로 나타났다.

딥러닝과 Char2Vec을 이용한 문장 유사도 판별 (The Sentence Similarity Measure Using Deep-Learning and Char2Vec)

  • 임근영;조영복
    • 한국정보통신학회논문지
    • /
    • 제22권10호
    • /
    • pp.1300-1306
    • /
    • 2018
  • 본 연구는 자연어 처리 문제 중 하나인 문장 유사도 판별 문제를 딥러닝으로 해결하는 데에 있어 Char2Vec기반으로 문장을 전 처리하고 학습시켜 그 성능을 확인하고 대표적인 Word Embedding 모델 Word2Vec를 대체할 수 있는 가능성이 있는지 파악하고자 한다. 임의의 두 문장을 비교할 때 쓰는 딥러닝 구조로 Siamese Ma-STM 네트워크를 사용하였다. Word2Vec와 Char2Vec를 각각 기반으로 한 문장 유사도 판별 모델을 학습시키고 그 결과를 분석하였다. 실험 결과 Char2Vec를 기반으로 학습시킨 모델이 validation accuracy 75.1%을 보였고 Word2Vec를 기반으로 학습시킨 모델은 validation accuracy 71.6%를 보였다. 따라서 고 사양을 요구하는 Word2Vec대신 임베딩 레이어를 활용한 Char2Vec 기반의 전처리 모델을 활용함으로 분석 환경을 최적화 할 수 있다.

국가기록원의 국가지정기록물 웹 기반 기록정보서비스 개선방안 연구 - 패싯 기반 디렉토리 서비스를 중심으로 - (Improving the Access Service of National Designated Records in the National Archives of Korea: Focusing on Facet Directory Service)

  • 정미옥;최상희
    • 한국비블리아학회지
    • /
    • 제30권4호
    • /
    • pp.217-234
    • /
    • 2019
  • 국가지정기록물 지정제도는 국가적으로 보존가치가 큰 민간의 기록물을 관리·보존할 수 있게 하고 기록문화의 발전을 도모하기 위한 중요한 제도이다. 이 연구에서는 기존 국가지정기록물 지정 및 국가기록원의 웹 기반 기록정보서비스 현황을 분석하여 국가지정기록물 웹 페이지의 한계를 다음과 같이 지적했다. 첫째, 현재 국가기록원에서 제공하고 있는 국가지정기록물에 관한 정보는 국가기록원 홈페이지와 국가지정기록물 웹 페이지로 분산되어 있다. 둘째, 국가지정기록물로 지정된 기록물에 관한 정보가 컬렉션 수준으로만 제공되고 있어, 이용자가 국가지정기록물 컬렉션 이하 수준의 정보에 접근하기 어렵다. 이에 대한 해결방안으로 국가지정기록물의 활용성을 높이는 구체적인 웹 기반 기록정보서비스 방안을 다음과 같이 제시하였다. 첫째, 국가기록원 홈페이지와 국가지정기록물 웹 페이지에 흩어져 있는 국가지정기록물에 대한 정보를 국가지정기록물 웹 페이지에서 단일화하여 제공해야 한다. 둘째, 이용자가 국가지정기록물 내용과 주제를 직관적으로 탐색할 수 있고, 다각적인 주제와 내용으로 접근할 수 있도록 지원하기 위해 국가지정기록물의 주제 디렉토리와 워드 클라우드 서비스를 제안했다.

MFCC와 DTW에 알고리즘을 기반으로 한 디지털 고립단어 인식 시스템 (Digital Isolated Word Recognition System based on MFCC and DTW Algorithm)

  • 장한;정길도
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2008년도 학술대회 논문집 정보 및 제어부문
    • /
    • pp.290-291
    • /
    • 2008
  • The most popular speech feature used in speech recognition today is the Mel-Frequency Cepstral Coefficients (MFCC) algorithm, which could reflect the perception characteristics of the human ear more accurately than other parameters. This paper adopts MFCC and its first order difference, which could reflect the dynamic character of speech signal, as synthetical parametric representation. Furthermore, we quote Dynamic Time Warping (DTW) algorithm to search match paths in the pattern recognition process. We use the software "GoldWave" to record English digitals in the lab environments and the simulation results indicate the algorithm has higher recognition accuracy than others using LPCC, etc. as character parameters in the experiment for Digital Isolated Word Recognition (DIWR) system.

  • PDF

텍스트마이닝과 동시출현단어 분석을 이용한 국내 조류학 연구동향: 한국조류학회지 논문을 대상으로 (Avian research trends in Korea analyzed by text-mining and co-word analysis: based on articles of the Korean Journal of Ornithology)

  • 진채령;어수형
    • 한국조류학회지
    • /
    • 제25권2호
    • /
    • pp.126-132
    • /
    • 2018
  • 국내 조류학 연구의 발전을 위해서는 지금까지 어떤 분야에서 연구를 해 왔는지 살펴보는 것이 중요하다. 우리는 텍스트마이닝과 동시출현단어 분석을 이용하여 어떤 분류군에서 어떤 주제로 조류학 연구가 진행되어 왔는지를 정량적으로 연구하였다. 한국조류학회지 논문 372편을 분석 대상으로 연구한 결과, 개체군 및 군집 모니터링, 미기록종 보고 및 번식생태, 조류 체내 중금속 오염 등의 주제와 관련한 단어가 연구 논문에서 많이 사용되었다. 또한, 청둥오리, 민물도요, 흰뺨검둥오리 등 특정 조류에 연구가 편중되었다는 것도 본 연구를 통해 알 수 있었다. 국내 조류학의 균형있는 발전을 위하여 지금까지 상대적으로 부족했던 연구 주제와 분류군이 어떤 것인지 파악하였다는 점에서 본 연구는 의미가 있을 것이다.

한국 마라톤의 발전과정과 현황에 관한 연구 (A Study on the Development Process and Status of Korean Marathon)

  • 남상남;어경태
    • 한국융합학회논문지
    • /
    • 제9권4호
    • /
    • pp.357-371
    • /
    • 2018
  • 본 연구의 목적은 한국 마라톤의 기록과 세계마라톤의 기록을 집중 분석함으로써 한국 마라톤의 기록 향상과 발전과정의 기초 자료를 제공하는데 있다. 본 연구는 한국의 3대 마라톤 대회인 동아마라톤, 춘천마라톤, 중앙마라톤의 기록을 토대로 분석 하였으며, 한국 마라톤 기록과 세계마라톤 기록의 비교 분석한 결과는 다음과 같다. 첫째, 세계 주요 마라톤 대회는 주체국이 우승하는 경우는 드물지만 최근 10년 이상 외국 선수들과 기록차이가 커지고 있는 것이 문제이다. 둘째, 올림픽 남 여 기록 비교에서는 남자가 1990년대까지 대등한 우승 기록 경쟁을 벌여왔지만 그 이후 20년 전 기록도 못 찾고 있으며 세계기록과 계속 큰 기록차이를 보이고 있다.

背戍의 硏究 (A Study on Bai Su(背戍))

  • 김진구
    • 복식문화연구
    • /
    • 제5권4호
    • /
    • pp.1-5
    • /
    • 1997
  • This study is concerned with the bai su(背戍) of Koryo period which recorded in Kei Rim Yu Sa(鷄林類事). Results of this research can be summarized as follows : The record of Bai Su(背戍) in Kei Rim Yu Sa(鷄林類事) was correct. It was not a mistake in writing. Thus, this word(背戍) was used by the people of Koryo. The 背戍 of Koryo was related to Aramaic patash and Japanese byets or bats, バツ. It was found that 背戍 of Koryo was very similar to Aramaic patash, legging. It indicates that 背戍 was derived from Aramaic and it was a transliteration of patash. Thus, 背戍 was a borrowed word from Aramaic. Also it was found that 背戍 of Koryo and Japanese byets(ぺツ) or bats(バツ) showed a very close affininty with each other in phonetic value. These words had the same meanings of 襪 one another. It reveals that 背戍 of Koryo and Japanese byets of bats has the same origins. Japanese byets or bats were transliterations of 背戍 of Koryo and they were borrowed words from 背戍 of Koryo.

  • PDF

참여정부 대통령기록 연구 대통령 행사기록을 중심으로 (A Study on the Presidential Records of the Participatory Government : Focusing on the Records of Presidential Events)

  • 이경용
    • 기록학연구
    • /
    • 제71호
    • /
    • pp.131-167
    • /
    • 2022
  • 이 논문은 제16대 대통령기록 중에서 기록관리비서실이 대통령 행사와 관련해서 생산한 '말씀록'의 생산 과정을 둘러싼 기록들의 내용을 분석하였다. 이를 통해 대통령기록관에 이관된 참여정부의 대통령 행사 기록의 생산 맥락을 올바로 이해한 가운데 관련 기록을 연계, 조직하여 적극적으로 활용하는 방안을 제안하였다.

해바라기(향일규(向日葵), 향일화(向日花))의 어원(語源)에 대하여 (The origin of the word of sunflower)

  • 김종덕;고병희
    • 한국의사학회지
    • /
    • 제14권1호
    • /
    • pp.31-47
    • /
    • 2001
  • According to the customary, naming is done after the subject is in existence. But the name "Haebaragi"(Hyangilgyu, Hyangilhwa) has been used as an alias of Hibiscus manihot L, long before Helianthus annuus L was brought in to Korea, and now the usage of the name has been conversed since then. Since the incorrect record of Gyugwak and Gyuhwa as Haebaragi in "Chosunesajun"(Dictionary of Chosun language) published under Chosunchongdokbu in 1920, the mistake has been carried on and this must be corrected from now on. Incorrect record of hollyhock(Chokgyuwha) as Haebaragi in "Mong-u" (1810) took a role in this incorrect trend.

  • PDF

해바라기(향일규(向日葵), 향일화(向日花))의 어원(語源)에 대하여 (The origin of the word of sunflower)

  • 김종덕;고명희
    • 한국한의학연구원논문집
    • /
    • 제7권1호
    • /
    • pp.55-66
    • /
    • 2001
  • According to the customary, naming is done after the subject is in existence. But the name's Hae-ba-ra-gi(해바라기), 향일규(向日葵), 향일화(向日花))' has been used as an alias of Hibiscus manihot L.(닥풀) long before Helianthus annuus L.(sunflower) was brought in to Korea. And now the usage of the name has been conversed since them. Since the incorrect record of '葵藿' and '葵花'as '해바라기' in ${\ulcorner}$조선어사전(朝鮮語辭典)${\lrcorner}$(1920), the mistake has been carried on this must be corrected from now on. Incorrect record of hollyhock(蜀葵花) '해바라기' in ${\ulcorner}$몽유(蒙喩))${\lrcorner}$(1810) took a role in this incorrect trend.

  • PDF