• 제목/요약/키워드: Library Big Data

검색결과 98건 처리시간 0.022초

시대적 변화에 따른 경제·금융전문도서관 발전 방향 모색에 관한 연구 - 한국은행 도서관을 중심으로 - (A Study on Establishment of Mid- to Long-Term Comprehensive Development Plan for the Bank of Korea Library)

  • 노영희;고재민;장인호;노지윤
    • 한국도서관정보학회지
    • /
    • 제52권2호
    • /
    • pp.65-84
    • /
    • 2021
  • 본 연구는 국내에 경제·금융전문도서관을 대표하는 한국은행 도서관의 전반적인 운영현황 분석과 이용자 만족도 및 수요를 조사하고, 더불어 국내외 주요 도서관의 외부환경 변화에 따른 대응사례 조사하여 향후 경제·금융전문도서관의 발전 방향을 제안하고자 하였다. 이를 위해 국내외 주요 도서관 외부환경 변화 사례조사, 이용자 설문조사 등을 진행하였다. 그 결과, 향후 과제로 미래지향적 최첨단 도서관으로의 강화에는 스마트 시스템 도입, 일부 도서관 서비스의 로봇화, 시대상을 반영한 비대면 서비스 대응공간 등을, 경제금융인을 위한 특화된 서비스 제공에는 빅데이터 분석서비스 도입, 이용자 맞춤형 시스템 강화, SNS 커뮤니케이션 활성화 등을 제시하였다. 국내외 경제·금융 도서관과 협력 네트워크 구축으로는 클라우드 서비스, 유관기관 간 협력사업 유지 및 확대, 공유체계를 통한 국가 지식정보 망라적 수집 등을, 마지막으로 전문성 강화를 위한 정보서비스를 위해 특성화 장서 개발, 온라인을 활용한 참고 및 연구지원 서비스 확대, 발간물 원문 DB 구축 및 제공을 제안하였다.

파이썬 활용한 데이터 처리 성능 향상방법 제안 (Proposal For Improving Data Processing Performance Using Python)

  • 김효관;황원용
    • 한국정보전자통신기술학회논문지
    • /
    • 제13권4호
    • /
    • pp.306-311
    • /
    • 2020
  • 본 논문은 대량의 데이터를 활용한 모델 개발 시 다양한 라이브러리를 갖춘 파이썬 언의의 성능 향상방법을 다룬다. 파이썬 언어는 엑셀과 같은 스프레드시트 형태 데이터 처리 시 Pandas 라이브러리를 사용한다. 데이터 처리 시파이썬은 기가단위 이하 데이터 처리 시에는 인-메모리로 연산하여 성능 측면에서 크게 이슈가 없다. 하지만 기가단위 이상 데이터 처리 시 성능 이슈가 발생한다. 이에 본 논문은 데이터 처리 시 Pandas와 같이 사용할 수 있는 Dask 라이브러리를 활용하여 단일 클러스터 및 다중 클러스터에서 실행 작업을 분산처리 가능한 방법을 소개한다. 실험은 동일 사양의 하드웨어에서 간단한 지수산출 모델을 Pandas만 사용해서 처리하는 속도와 Dask를 같이 사용해서 처리하는 속도를 비교한다. 본 논문은 파이썬의 장점인 다양한 라이브러리를 쉽게 사용할 수 있다는 점을 유지하면서 성능측면에서도 대량의 데이터를 CPU 코어들이 분산 처리하여 모델을 개발할 수 있는 방법을 제시한다.

Wellness Prediction in Diabetes Mellitus Risks Via Machine Learning Classifiers

  • Saravanakumar M, Venkatesh;Sabibullah, M.
    • International Journal of Computer Science & Network Security
    • /
    • 제22권4호
    • /
    • pp.203-208
    • /
    • 2022
  • The occurrence of Type 2 Diabetes Mellitus (T2DM) is hoarding globally. All kinds of Diabetes Mellitus is controlled to disrupt over 415 million grownups worldwide. It was the seventh prime cause of demise widespread with a measured 1.6 million deaths right prompted by diabetes during 2016. Over 90% of diabetes cases are T2DM, with the utmost persons having at smallest one other chronic condition in UK. In valuation of contemporary applications of Big Data (BD) to Diabetes Medicare by sighted its upcoming abilities, it is compulsory to transmit out a bottomless revision over foremost theoretical literatures. The long-term growth in medicine and, in explicit, in the field of "Diabetology", is powerfully encroached to a sequence of differences and inventions. The medical and healthcare data from varied bases like analysis and treatment tactics which assistances healthcare workers to guess the actual perceptions about the development of Diabetes Medicare measures accessible by them. Apache Spark extracts "Resilient Distributed Dataset (RDD)", a vital data structure distributed finished a cluster on machines. Machine Learning (ML) deals a note-worthy method for building elegant and automatic algorithms. ML library involving of communal ML algorithms like Support Vector Classification and Random Forest are investigated in this projected work by using Jupiter Notebook - Python code, where significant quantity of result (Accuracy) is carried out by the models.

차세대디지털도서관서비스에 대한 Y세대 이용자의 요구분석 연구 (A Study Analyzing Y Generation Users' Needs for Next Generation Digital Library Service)

  • 노영희
    • 정보관리학회지
    • /
    • 제31권3호
    • /
    • pp.29-63
    • /
    • 2014
  • 본 연구에서는 Y세대의 특징을 밝히고 Y세대가 요구하는 차세대디지털도서관서비스를 도출하고자 하였으며, 이들의 요구가 베이비붐세대와 어느 정도 차이를 보이는지를 비교하고자 하였다. 연구결과, 첫째, Y세대가 가장 많이 이용하는 디지털기기는 휴대폰 또는 스마트폰으로 나타났고, 다음으로 데스크탑 PC, 노트북 PC, 디지털 카메라 순으로 나타났으며, 사용비율에 있어서 약간의 차이는 있지만 그 순위는 베이비붐세대와 거의 유사하게 나타났다. 둘째, 이용하는 디지털서비스에 있어서 Y세대와 베이비붐세대는 상당한 차이를 보이고 있는 것으로 분석되었으며, Y세대는 인터넷 포털을 가장 많이 이용하고 베이비붐세대는 이메일서비스를 가장 많이 이용하는 것으로 나타났다. 셋째, Y세대와 베이비붐세대가 차세대디지털도서관에 요구하는 서비스를 클라우드서비스, 무한창조공간, 빅데이터, 증강현실, 구글글래스, 상황인식기술, 시맨틱서비스, SNS서비스, 디지털교과서서비스, RFID 및 QRCode 서비스, 도서관공간구성, 최첨단디스플레이기술, 기타 획기적인 서비스로 구분하여 조사한 결과, Y세대가 가장 높은 요구도를 보인 서비스는 빅데이터서비스였고, 베이비붐세대는 디지털교과서서비스였다.

전자저널 컨소시엄을 둘러싼 학술커뮤니케이션의 쟁점과 대응동향 (Challenges and Recent Movements in Scholarly Communication Concerning Electronic Journal Licensing Consortia)

  • 김성진;정은경;한민혜
    • 정보관리연구
    • /
    • 제39권1호
    • /
    • pp.27-52
    • /
    • 2008
  • 전자저널은 학술커뮤니케이션의 핵심자원으로 자리매김하였다. 그러나 학술시장의 출판 및 가격책정구조가 새롭게 변화한 전자환경에 발맞추어 합리적으로 변모하지 못함으로 인해 전자저널 컨소시엄을 둘러싼 학술커뮤니케이션은 여러 문제점에 봉착하였다. 본 연구는 포괄적인 문헌연구 및 각국의 학술연구 기관 및 단체의 활동 분석을 통해 전자저널 구독 관련 주요 쟁점사항을 빅딜, 가격모형, 라이선스 계약, 아카이빙, 독점 및 저작권 측면에서 검토하였다. 나아가 이러한 이슈들에 대한 국제적인 대응동향을 표준 라이선스 개발, 이용통계의 표준화, 전자저널 아카이빙, 공공접근 활성화 측면에서 살펴보며 변화하는 학술커뮤니케이션 환경에서 국내 도서관 및 컨소시엄이 취해야 하는 전략들을 고찰해보았다.

공공도서관 빅데이터 정보서비스에서 나타나는 윤리적 문제점에 대한 연구 (A Study on Ethical problems of Big Data Information Services in Public Libraries)

  • 박지은;배소영
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2018년도 제25회 학술대회 논문집
    • /
    • pp.149-152
    • /
    • 2018
  • 사회 전반에 걸쳐 많은 영역에서 빅데이터 기반의 기술이 개발되고 활용됨에 따라 이러한 기술이 가져올 다양한 문제들에 대하여 인식하기 시작하였다. 이에 본 연구는 현재 공공도서관이 제공하고 있는 빅데이터 기반 정보서비스 현황에 대해 정리하고, 이러한 정보서비스를 위한 데이터 수집 및 활용 과정에서 일어날 수 있는 전반적인 윤리 문제에 대해 영국의 데이터 프레임워크 등을 적용하여 5가지 측면으로 살펴보았다.

  • PDF

대학도서관 열람실 공간기준에 관한 연구 (Study on the Spatial Standard for Reading Rooms in University Libraries)

  • 임호균
    • 한국실내디자인학회논문집
    • /
    • 제25권5호
    • /
    • pp.140-147
    • /
    • 2016
  • This research aims to establish the size standard of university library's user space, and present the standard and method to calculate total area required in the planning of new building construction and remodeling. Nine university libraries newly constructed or remodeled since 2000 were selected among the libraries of large scale universities with more than 10,000 enrolled students as the target libraries in this research. The target libraries were classified into A group (five cases partially remodeled) and B group (four cases newly constructed or fully remodeled) on the basis of the change of times. A university library can be divided into three spaces (user space, administration space and public space). This research classified the reading room in the user space into bookshelf zone, reading zone, information/office zone and hall/other zone, and analyzed area ratio according to each zone. B group's bookshelf zone decreased 12% more than A group, and B group's reading zone increased 10% more than A group. However, there was no big change in the area ratio of information/office zone and hall/other zone. This can be interpreted that university library changes from book and archive preservation-oriented space to user-oriented space. This research presented a proper reading room area calculation method, based on the capacity of books, by reflecting such a change. Each zone's standard was set up through classification of domestic and international standards, based on which, the calculation method of university library's total floor area required was presented. The reason why there was difference in university library's total floor area required according to domestic standard and international standard was that the number of enrolled students per seat in the reading room was different. The area calculation methods presented in this research can be utilized as useful data upon planning university library construction or remodeling.

국내 도서관 폭소노미 태그의 일반적 패턴 연구 (A Study on the General Patterns of Folksonomy Tag for the University Libraries)

  • 이성숙;정서영
    • 한국비블리아학회지
    • /
    • 제20권1호
    • /
    • pp.137-150
    • /
    • 2009
  • 이 연구에서는 폭소노미를 도입하여 라이브러리 2.0을 구현하고 있는 대학도서관 폭소노미 태그의 일반적인 패턴을 파악하였다. 분석 결과, 평균적으로 하나의 콘텐츠당 약 1.35개의 태그가 사용되었다. 태그의 전형적인 패턴은 사용개수가 증가할수록 사용빈도수가 감소하는 멱함수 분포를 따르며, 전체 79.51%의 태그는 콘텐츠의 주제를 표현하고 있고, 84.61%의 태그는 사회적 동기에 의한 태그이다. 도서관 폭소노미 태그의 집단지성 구현도는 20.83%로 조사되었다. 4분기로 나누어 태그의 증감율을 살펴본 결과 A 대학도서관은 분기별 차이가 큰 반면, B 대학도서관은 분기별 차이가 적었다. 이용자는 평균 5.25개의 태그를 태깅하였고, 태깅 행태에 따라 이용자의 성향을 세그룹으로 구분할 수 있다.

영상콘텐츠분야의 정권별 의미연결망 연구 (A Study on the Semantic Network Structure of the Regime in the Image Contents)

  • 황고은;문신정
    • 한국비블리아학회지
    • /
    • 제28권3호
    • /
    • pp.217-240
    • /
    • 2017
  • 이 연구는 영상콘텐츠분야 연구의 의제설정 경향을 분석하여, 정권별 정책과 연결되는 의미화 과정을 제시했다. 이를 위해 문화산업의 도입시점인 <문민정부(1993년)>부터 <박근혜정부(2016년)>까지의 영상콘텐츠 석박사학위논문 총 2,624편의 초록에서 43,991개의 단어를 추출하고 의미연결망 분석을 실시하였다. 분석방법은 R프로그램의 다양한 패키지를 활용하였으며, 이를 통해, 텍스트 분석과 시각화를 도출하였다. 연구 결과는, 첫째, 영상콘텐츠분야 연구는 출현빈도별, 정권순서별로 '영상', '미디어', '콘텐츠'의 순위와 순서로 진화되었다. 둘째, 정권별로는 3단계 연구흐름을 볼 수 있다. <문민정부>는 '교육'과 '표현', <국민의정부>와 <참여정부>에서는 '미디어', <이명박정부>와 <박근혜정부>에서는 '콘텐츠'관련 연구들이 중심이 되었다. 셋째, 연구대상 기간 또는 정권별 기간 내내 지속적으로 꾸준하게 진행되는 연구주제는 '방송', '디지털', '기술', '제작' 등이며, 향후에도 계속 진행될 것으로 보인다. 마지막으로 각 정권마다 새롭게 등장한 연구대상이 있었다. <문민정부>는 '콤팩트디스크기억장치(CD-ROM)', <국민의정부>는 '워터마크', '고화질', '3D', '가상현실', <참여정부>는 '플랫폼', <이명박정부>는 '모바일', '애플리케이션', <박근혜정부>는 '스마트'이며, '콤팩트디스크기억장치'와 '워터마크' 등은 단기에 소멸되었다. 연구의 의제설정과 산업화 과정에서 트렌드와 미래예측이 필요하다고 보여 진다.

기계학습에 유효한 데이터 요건 및 선별: 공공데이터포털 제공 데이터 사례를 통해 (Valid Data Conditions and Discrimination for Machine Learning: Case study on Dataset in the Public Data Portal)

  • 오효정;윤보현
    • 사물인터넷융복합논문지
    • /
    • 제8권1호
    • /
    • pp.37-43
    • /
    • 2022
  • 인공지능 기술의 가장 큰 근간은 학습 가능한 데이터이다. 최근 정부나 사기업에서 수집·생산하는 데이터의 종류와 양이 기하급수적으로 증가하고 있지만, 실제 기계학습에 활용 가능한 데이터의 확보로는 아직까지 이어지지 않고 있다. 이에 본 연구에서는 기계학습에 실제 활용 가능한 데이터가 갖추어야 할 조건에 대해 논의하고, 실제 사례연구를 통해 데이터 품질을 저하시키는 요인을 파악한다. 이를 위해 공공빅데이터를 활용해 예측 모델을 개발한 대표사례를 선정, 공공데이터포털로부터 실제 문제 해결을 위한 데이터를 수집 후 데이터 품질을 확인하였다. 이를 통해 유효한 데이터 선별 기준을 적용하고 후처리한 결과와의 차이를 보인다. 본 연구의 궁극적인 목적은 인공지능의 핵심인 기계학습 기술 개발에 앞서 가장 근본적으로 선결되어야 할 데이터 품질을 관리하고 유효한 데이터를 축적하기 위한 기반 마련에 있다.