• 제목/요약/키워드: Library Big Data

검색결과 98건 처리시간 0.023초

토픽 모델링 기반 비대면 강의평 분석 및 딥러닝 분류 모델 개발 (Analyzing Students' Non-face-to-face Course Evaluation by Topic Modeling and Developing Deep Learning-based Classification Model)

  • 한지영;허고은
    • 한국문헌정보학회지
    • /
    • 제55권4호
    • /
    • pp.267-291
    • /
    • 2021
  • 2020년 신종 코로나바이러스 감염증(코로나19)으로 인한 전 세계적인 팬데믹으로 교육 현장에도 큰 변화가 있었다. 대학에서는 보조 교육 수단으로 생각했던 원격수업을 전면 도입하였고 비대면 수업이 일상화되어 교수자와 학생들은 새로운 교육환경에 적응하기 위해 큰 노력을 기울이고 있다. 이러한 변화 속에서 비대면 강의의 질적 향상을 위하여 강의 만족도 영향요인에 관한 연구가 필요하다. 본 연구는 코로나 전과 후로 변화된 대학 강의 만족도 영향요인을 파악하기 위해 빅데이터를 활용한 새로운 방법론을 제시하고자 한다. 토픽 모델링을 활용하여 코로나 전과 후의 강의평을 분석하고 이를 통해 강의 만족도 영향요인을 파악하여 대학교육이 나아가야 할 방향성을 제언하였다. 또한, 딥러닝 언어 모델인 KoBERT를 기반으로 0.84의 F1-score를 보이는 토픽 분류 모델을 구축함으로써 강의의 만족, 불만족 요인을 다각도로 파악할 수 있으며 이를 통해 강의 만족도의 지속적인 질적 향상에 기여할 수 있다.

문화적 특성을 고려한 공공도서관 도서 대출수요 분석 : 대구광역시 시립도서관을 사례로 (Analysis of Borrows Demand for Books in Public Libraries Considering Cultural Characteristics)

  • 오민기;김경래;정원웅;김건욱
    • 디지털융복합연구
    • /
    • 제19권3호
    • /
    • pp.55-64
    • /
    • 2021
  • 공공도서관은 거주민들의 광범위한 지식과 이념을 학습하는 공간이며, 삶에 직접적으로 연결되어 있는 만큼 관련된 연구들이 다양하게 수행되어 왔다. 대부분의 선행연구에서 인구, 교통, 접근성, 환경 등의 변수가 도서관 이용에 관련성이 높은 것으로 나타났다. 본 연구에서는 도서대출 이력(1,820,407건)과 회원정보(297,222명) 자료를 기반으로 문화적 특성의 변수를 반영하여 도서 대출수요와 관련성을 분석한 점이 선행연구와의 차별성이라 할 수 있다. 분석결과 기술과학 도서 대비 사회과학, 문학 도서 대출이 증가할수록 도서 대출수요가 증가하는 것으로 분석되었으며, 도서관 충성고객들이 도서 대출수요의 주요한 요인으로 확인되었다. 그 외 다양한 기술통계분석을 활용하여 도서관 도서대출 수요 특성을 분석하였으며, 분석결과를 바탕으로 정책적 시사점과 연구의 한계도 제시하였다. 그리고 문화적 특성이 장소, 시점 등에 따라 변화됨을 감안하면 앞으로 관련연구가 지속되어야 할 것으로 판단된다.

데이터베이스를 활용한 디지털 애니메이션 제작 방법 비교 분석 (A Comparative Study for Digital Animation Production using Database)

  • 이동은
    • 한국멀티미디어학회논문지
    • /
    • 제11권1호
    • /
    • pp.96-105
    • /
    • 2008
  • 디지털 미디어의 도입은 21세기를 데이터베이스 패러다임의 시대로 바꾸어놓았고 데이터베이스 패러다임은 애니메이션의 제작과정과 산업에 큰 변화를 불러일으켰다. 본래 애니메이션은 모든 이미지들을 새롭게 생성해야하는 특징을 가지고 있지만 디지털 기술의 도입으로 애니메이션을 위해 한번 제작된 이미지들은 데이터베이스 시스템에 원본 그대로 저장하게 되었고, 영구 보존된 데이터들은 변형과 합성을 통해 손쉽게 새로운 이미지들을 생성하게 되었다. 즉 디지털 애니메이션은 데이터베이스 시스템을 활용함으로써 무한 판본 생성의 시대를 맞이하며 효율성과 경제성을 추구하게 된 것이다. 이에 본 논문에서는 데이터베이스의 활용이 디지털 애니메이션의 창작기술을 어떻게 변화시켰는지를 구체적인 사례를 통해 살펴보고 그 의미와 함께 차세대 애니메이션의 미래를 전망해보고자 한다.

  • PDF

텍스트 마이닝을 이용한 2012년 한국대선 관련 트위터 분석 (Analysis of Twitter for 2012 South Korea Presidential Election by Text Mining Techniques)

  • 배정환;손지은;송민
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.141-156
    • /
    • 2013
  • 최근 소셜미디어는 전세계적 커뮤니케이션 도구로서 사용에 전문적인 지식이나 기술이 필요하지 않기 때문에 이용자들로 하여금 콘텐츠의 실시간 생산과 공유를 가능하게 하여 기존의 커뮤니케이션 양식을 새롭게 변화시키고 있다. 특히 새로운 소통매체로서 국내외의 사회적 이슈를 실시간으로 전파하면서 이용자들이 자신의 의견을 지인 및 대중과 소통하게 하여 크게는 사회적 변화의 가능성까지 야기하고 있다. 소셜미디어를 통한 정보주체의 변화로 인해 데이터는 더욱 방대해지고 '빅데이터'라 불리는 정보의 '초(超)범람'을 야기하였으며, 이러한 빅데이터는 사회적 실제를 이해하기 위한 새로운 기회이자 의미 있는 정보를 발굴해 내기 위한 새로운 연구분야로 각광받게 되었다. 빅데이터를 효율적으로 분석하기 위해 다양한 연구가 활발히 이루어지고 있다. 그러나 지금까지 소셜미디어를 대상으로 한 연구는 개괄적인 접근으로 제한된 분석에 국한되고 있다. 이를 적절히 해결하기 위해 본 연구에서는 트위터 상에서 실시간으로 방대하게 생성되는 빅스트림 데이터의 효율적 수집과 수집된 문헌의 다양한 분석을 통한 새로운 정보와 지식의 마이닝을 목표로 사회적 이슈를 포착하기 위한 실시간 트위터 트렌드 마이닝 시스템을 개발 하였다. 본 시스템은 단어의 동시출현 검색, 질의어에 의한 트위터 이용자 시각화, 두 이용자 사이의 유사도 계산, 트렌드 변화에 관한 토픽 모델링 그리고 멘션 기반 이용자 네트워크 분석의 기능들을 제공하고, 이를 통해 2012년 한국 대선을 대상으로 사례연구를 수행하였다. 본 연구를 위한 실험문헌은 2012년 10월 1일부터 2012년 10월 31일까지 약 3주간 1,737,969건의 트윗을 수집하여 구축되었다. 이 사례연구는 최신 기법을 사용하여 트위터에서 생성되는 사회적 트렌드를 마이닝 할 수 있게 했다는 점에서 주요한 의의가 있고, 이를 통해 트위터가 사회적 이슈의 변화를 효율적으로 추적하고 예측하기에 유용한 도구이며, 멘션 기반 네트워크는 트위터에서 발견할 수 있는 고유의 비가시적 네트워크로 이용자 네트워크의 또 다른 양상을 보여준다.

NoC 용 고속 데이터 패킷 할당 회로 설계 (Design of a High-Speed Data Packet Allocation Circuit for Network-on-Chip)

  • 김정현;이재성
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.459-461
    • /
    • 2022
  • Network-on-Chip (NoC) 이 오프칩 네트워크 기반의 기존 병렬처리 시스템과 가장 크게 다른 점은 데이터 패킷 라우팅을 중앙 제어 방식(Centralized control scheme)으로 수행한다는 점이다. 이러한 환경에서 Best-effort 패킷 라우팅 문제는 데이터 패킷이 해당 코어에 도달 및 처리되는 시간을 Cost 로 하는 실시간 최소화 할당 문제(Assignment problem)가 된다. 본 논문에서는 할당 문제의 선형 대수 방정식에 대한 대표적인 연산 복잡도 저감 알고리즘인 헝가리안 알고리즘을 하드웨어 가속기 형태로 구현하였다. TSMC 0.18um 표준 셀라이브러리를 이용하여 논리 합성한 결과 헝가리안 알고리즘의 연산과정을 그대로 구현한 하드웨어 회로보다 Cost 분포에 대한 Case 분석을 통하여 구현한 것이 면적은 약 16%, Propagation delay는 약 52% 감소한 것으로 나타났다.

  • PDF

Patent Technology Trends of Oral Health: Application of Text Mining

  • Hee-Kyeong Bak;Yong-Hwan Kim;Han-Na Kim
    • 치위생과학회지
    • /
    • 제24권1호
    • /
    • pp.9-21
    • /
    • 2024
  • Background: The purpose of this study was to utilize text network analysis and topic modeling to identify interconnected relationships among keywords present in patent information related to oral health, and subsequently extract latent topics and visualize them. By examining key keywords and specific subjects, this study sought to comprehend the technological trends in oral health-related innovations. Furthermore, it aims to serve as foundational material, suggesting directions for technological advancement in dentistry and dental hygiene. Methods: The data utilized in this study consisted of information registered over a 20-year period until July 31st, 2023, obtained from the patent information retrieval service, KIPRIS. A total of 6,865 patent titles related to keywords, such as "dentistry," "teeth," and "oral health," were collected through the searches. The research tools included a custom-designed program coded specifically for the research objectives based on Python 3.10. This program was used for keyword frequency analysis, semantic network analysis, and implementation of Latent Dirichlet Allocation for topic modeling. Results: Upon analyzing the centrality of connections among the top 50 frequently occurring words, "method," "tooth," and "manufacturing" displayed the highest centrality, while "active ingredient" had the lowest. Regarding topic modeling outcomes, the "implant" topic constituted the largest share at 22.0%, while topics concerning "devices and materials for oral health" and "toothbrushes and oral care" exhibited the lowest proportions at 5.5% each. Conclusion: Technologies concerning methods and implants are continually being researched in patents related to oral health, while there is comparatively less technological development in devices and materials for oral health. This study is expected to be a valuable resource for uncovering potential themes from a large volume of patent titles and suggesting research directions.

디지털 인문학 연구 동향 분석 - Digital Humanities 학술대회 논문을 중심으로 - (An Investigation on Digital Humanities Research Trend by Analyzing the Papers of Digital Humanities Conferences)

  • 정은경
    • 한국문헌정보학회지
    • /
    • 제55권1호
    • /
    • pp.393-413
    • /
    • 2021
  • 디지털 정보기술과 인문학적 연구 문제의 결합을 통해 새롭고 혁신적인 지식을 창출하는 디지털인문학은 대표적인 다학제적 융합 학문 분야라고 볼 수 있다. 이러한 디지털인문학 분야의 지적구조를 규명하기 Digital Humanities 학술대회 최근 2년간(2019, 2020)의 논문 441건을 대상으로 저자사항과 키워드 동시출현 네트워크 분석을 수행하였다. 저자와 키워드 분석 결과를 살펴보면, 유럽, 북미 지역, 동아시권의 일본 중국의 저자의 활발한 활동을 찾아볼 수 있다. 공저자 네트워크를 통해서는 11개의 분절된 네트워크를 확인할 수 있으며, 이는 폐쇄적인 공저활동의 결과로 볼 수 있다. 키워드 분석을 통해서는 16개의 세부 주제 영역을 규명할 수 있으며, 이는 기계학습, 교육학, 메타데이터, 토픽모델링, 문체, 문화유산, 네트워크, 디지털아카이브, 자연언어처리, 디지털도서관, 트위터, 드라마, 빅데이터, 신경망 네트워크, 가상현실, 윤리으로 구성된다. 이러한 군집 구성은 디지털 정보기술이 주된 세부 주제 영역으로 자리매김하고 있음을 알 수 있다. 또한 출현빈도가 높은 키워드들은 인문학 기반 키워드, 디지털 정보기술 기반 키워드, 융합 키워드으로 구분될 수 있으며, 디지털인문학의 성장과 발전 과정의 역동성을 찾아볼 수 있다.

마르코브 체인을 적용한 유동인구의 매출 및 이동 패턴 분석 (Analyzing Patterns of Sales and Floating Population Using Markov Chain)

  • 김봉균;이원상;이봉규
    • 인터넷정보학회논문지
    • /
    • 제21권1호
    • /
    • pp.71-78
    • /
    • 2020
  • 최근, 젠트리피케이션 현상으로 인하여 도심 내 지역 경제와 커뮤니티 형성에 필수적인 역할을 하는 지역 상권에 대한 체계적인 분석과 이해의 중요성이 커지고 있다. 본 연구에서는 지역 상권에 대한 체계적인 분석과 이해를 위한 방법론을 소개하고 실증적인 사례를 제시하고자 한다. 본 논문에서는 서울의 대표적인 지역상권인 가로수길과 가구거리의 유동인구를 이동통신 기지국 데이터를 통해 추적하고, 유동인구의 매출 패턴과 이동 흐름의 패턴을 파악하였다. 또한, 이동통신사의 기지국 기반 유동인구 데이터에 마르코브 체인을 적용하여 지역 상권 이해의 중요한 요소인 유동인구 흐름을 보다 체계적으로 이해하고자 하였다. 이와 같은 유동인구 흐름에 대한 분석 결과를 바탕으로, 본 논문에서는 상권 내 매출 정보와 결합되어 지역상권의 진화에 대한 시사점을 제공하고자 한다. 궁극적으로 본 연구의 결과가 젠트리피케이션 등에 의해 침체되는 지역 상권의 활성화를 촉진하고 더 나아가 도심 경제의 균형잡힌 성장에 기여할 것으로 기대한다.

텍스트 마이닝을 이용한 감정 유발 요인 'Emotion Trigger'에 관한 연구 (A Study of 'Emotion Trigger' by Text Mining Techniques)

  • 안주영;배정환;한남기;송민
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.69-92
    • /
    • 2015
  • 최근 소셜 미디어의 사용이 폭발적으로 증가함에 따라 이용자가 직접 생성하는 방대한 데이터를 분석하기 위한 다양한 텍스트 마이닝(text mining) 기법들에 대한 연구가 활발히 이루어지고 있다. 이에 따라 텍스트 분석을 위한 알고리듬(algorithm)의 정확도와 수준 역시 높아지고 있으나, 특히 감성 분석(sentimental analysis)의 영역에서 언어의 문법적 요소만을 적용하는데 그쳐 화용론적 의미론적 요소를 고려하지 못한다는 한계를 지닌다. 본 연구는 이러한 한계를 보완하기 위해 기존의 알고리듬 보다 의미 자질을 폭 넓게 고려할 수 있는 Word2Vec 기법을 적용하였다. 또한 한국어 품사 중 형용사를 감정을 표현하는 '감정어휘'로 분류하고, Word2Vec 모델을 통해 추출된 감정어휘의 연관어 중 명사를 해당 감정을 유발하는 요인이라고 정의하여 이 전체 과정을 'Emotion Trigger'라 명명하였다. 본 연구는 사례 연구(case study)로 사회적 이슈가 된 세 직업군(교수, 검사, 의사)의 특정 사건들을 연구 대상으로 선정하고, 이 사건들에 대한 대중들의 인식에 대해 분석하고자 한다. 특정 사건들에 대한 일반 여론과 직접적으로 표출된 개인 의견 모두를 고려하기 위하여 뉴스(news), 블로그(blog), 트위터(twitter)를 데이터 수집 대상으로 선정하였고, 수집된 데이터는 유의미한 연구 결과를 보여줄 수 있을 정도로 그 규모가 크며, 추후 다양한 연구가 가능한 시계열(time series) 데이터이다. 본 연구의 의의는 키워드(keyword)간의 관계를 밝힘에 있어, 기존 감성 분석의 한계를 극복하기 위해 Word2Vec 기법을 적용하여 의미론적 요소를 결합했다는 점이다. 그 과정에서 감정을 유발하는 Emotion Trigger를 찾아낼 수 있었으며, 이는 사회적 이슈에 대한 일반 대중의 반응을 파악하고, 그 원인을 찾아 사회적 문제를 해결하는데 도움이 될 수 있을 것이다.

주요국 국가서지 현황조사를 통한 국가서지의 최신 경향 분석 (Current Trends for National Bibliography through Analyzing the Status of Representative National Bibliographies)

  • 이미화;이지원
    • 한국비블리아학회지
    • /
    • 제32권1호
    • /
    • pp.35-57
    • /
    • 2021
  • 본 연구는 국가서지의 최신 경향을 분석하고자 문헌연구, 홈페이지분석, 사서 대상 설문조사를 실시하였다. 분석 결과 첫째, 한 국가 출판물의 기록이라는 국가서지의 정의에 부합하기 위해서 국가서지에 인쇄에서 전자자원까지 다양한 자료가 수록되도록 하였으나 현실적으로 모든 자료가 포함될 수 없으므로 제외사항이 있었다. 보편적인 국가서지 선정기준을 작성하는 것은 불가능하며, 국가의 특성을 반영하고, 분석을 바탕으로 한 타당하고 포괄적인 수록범위를 마련하는 방안이 필요하다. 둘째, 국가서지를 효율적으로 생성하기 위해 출판사 및 도서관 등과 협력이 이루어지고 있다. 국가서지 생성의 효율성을 위해 표준화 및 일관성, 디지털 자원에 대한 컬렉션 단위 메타데이터 기술, 링크드데이터를 활용한 국가서지 생성 등과 같이 국가서지 발행 및 생성에서 변화가 모색되어야 한다. 셋째, 국가서지는 국가서지 온라인 검색 시스템, 링크드데이터 검색, PDF, OAI-PMH, SRU, Z39.50을 이용한 MARC 다운로드, RDF/XML 형식의 대량 다운로드 형태 등으로 발행되고 있고, 온라인목록과 통합되거나 별도로 구축되기도 한다. 다만, 국가서지와 온라인목록은 통합 도서관 시스템을 이용해 데이터 재사용 방식으로 구축될 필요가 있다. 넷째, 국가서지를 위한 차별화된 기능으로 다양한 브라우징 기능과 함께 이용자 태깅, 국가서지 통계 등 다양한 서비스를 제공하고 있다. 추가적으로 국가서지 빅데이터 분석, 전자 출판물과의 링크, 링크드데이터의 대량 다운로드 서비스가 제공되어야 하며, 차별화된 서비스 개발을 위해서는 이용자의 요구를 파악하고, 이를 반영한 한 개방 서비스를 마련해야 할 것이다. 본 연구에서 분석된 국가서지의 최신 경향 및 고려사항을 통해 국내 및 국외 국가서지의 발전적 변화를 모색할 수 있을 것이다.