• 제목/요약/키워드: big data service

검색결과 1,019건 처리시간 0.026초

데이터마이닝 기술을 이용한 한국과학기술인용색인DB 활용 방안 연구 (A Study on Utilization of Korea Science Citation Database(KSCD) Based on Data Mining Techniques)

  • 박종현;최선희;김병규
    • 정보관리연구
    • /
    • 제43권4호
    • /
    • pp.191-210
    • /
    • 2012
  • 한국과학기술정보연구원(KISTI)에서는 대량의 학술 정보들을 분류하여 저장하고 관리하기 위한 한국과학기술 인용색인 데이터베이스(KSCD)를 구축한 바 있다. 그러나 학술인용색인데이터들은 그 특성상 단순히 저장만을 위한 자료가 아니다. 즉, 저장된 데이터를 기반으로 사용자들에게 어떠한 서비스를 어떻게 제공할 것인지는 KSCD의 활용 측면에서 매우 중요한 문제이다. 예를 들어 사용자는 단순히 특정 저자가 기술한 학술 자료들을 검색하기를 원할 수도 있지만, 필요에 따라 해당 저자와 유사한 연구를 수행하는 저자들을 검색하기를 원할 것이다. 그러나 단순히 저장된 데이터만으로 이러한 서비스를 제공하기는 어렵다. 그러므로 본 논문에서는 한국과학기술인용색인 데이터베이스(KSCD)를 향후 어떻게 활용할 수 있는가에 대한 해답을 찾기 위해서는 국내외에서 현재 어떠한 서비스들을 제공하고 있는지 살펴보고 이와 관련하여 어떤 방향으로 연구가 진행해야 하는지를 모색한다. 특별히 데이터 마이닝 기술은 다양한 형태의 데이터로부터 데이터 속에 내포되어있는 특징(Feature)들을 추출하고 새로운 데이터 모델을 발견하여 의미 있는 정보를 추출해 내어 결국은 사용자의 의사 결정에 도움을 주는 것을 그 목적으로 한다. 즉 데이터에 숨겨진 패턴과 관계를 찾아내어 유용한 정보를 발견해 내는 것이다. 그러므로 본 논문에서는 이러한 데이터마이닝 기법을 학술인용색인데이터에 적용하여 제공할 수 있는 서비스들이 무엇이 있는지 논의한다.

The Direction of Innovation in Curriculum of Universities in the Fourth Industrial Revolution

  • Hwang, Eui-Chul
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권11호
    • /
    • pp.229-238
    • /
    • 2020
  • 4차 산업혁명의 도래와 포스트 코로나는 국내외 국가들의 정보통신기술(ICT) 시대를 앞당겨 대학의 교육과정·교육내용·교육방법에 대한 혁신적인 변화를 가져오고 있다. 본 논문은 최근 4년(2016.6~2020.5)간 한국언론진흥재단의 BigKinds와 네이버의 DataLab 시스템을 이용하여 대학의 교육과정 변화에 대해 분석하였다. '대학 교육과정 혁신·창의·융합'의 키워드로 검색된 633건의 관계도 분석, 월별 키워드 트렌드, 연관어 분석으로 다음의 3가지 결과를 도출하였다. 첫째, 관계도 분석결과 최근 4년(2016~2020)간 빈도수(1~7위)는 교육부(190), 산업혁명(154), 시스템(137), 진로(136), 글로벌(131), 스마트(97), 재학생(95)순이었다. 둘째, 연관어 키워드 빈도수로는 인재양성(136), 산학협력(119), 교육부(86), 특성화(69), LiNC(62) 순으로 대학의 인재양성을 위해서는 정부(교육부)의 지원과 인재양성, 산학협력, LiNC, 특성화의 중요성을 보여 주었다. 본 연구 결과 교육의 패러다임은 4차 산업혁명의 인공지능 환경으로 특성화·산학협력·스마트·글로벌화의 방향과 4차 산업혁명 시대의 창의인재를 육성하는 미래의 교육방향을 제시하는데 의의가 있었다.

문화콘텐츠 빅데이터를 이용한 주가 변수 선행성 분석 (Analysis of the Precedence of Stock Price Variables Using Cultural Content Big Data)

  • 유재필;이지영;정정영
    • 한국콘텐츠학회논문지
    • /
    • 제22권4호
    • /
    • pp.222-230
    • /
    • 2022
  • 최근 한국의 문화콘텐츠 산업이 발전하고 있는 가운데 전 세계적으로 인지도가 높아질 수 있는 배경에는 과학 기술의 발전으로 글로벌 네트워크 사용자들의 실시간 공유 서비스가 있다. 특히 유튜브의 경우에는 한정적인 사용자가 아닌 모든 사람이 잠재적인 영상 제공자가 될 수 있다는 점에서 그 전파력은 빠르고 강력하다. 국내에도 휴대폰 사용자의 약 80% 이상이 유튜브를 이용하고 있는 것으로 나타난 만큼 유튜브의 정보는 사용자의 심리적 요인이 반영되고 있다는 것을 의미한다. 예컨대 특정 성격을 갖고 있는 채널의 영상 조회 수, 좋아요 수 그리고 댓글 수와 같은 정보는 그 채널이 갖는 성격의 관심도에 대한 척도를 보여준다. 이는 포털 사이트의 키워드 검색 빈도와 같은 정보가 경제 심리학적으로 주가 시장과 밀접한 연관이 있다는 것과 관련성이 높다. 따라서 본 연구에서는 대표 엔터테이먼트 사의 유튜브 정보를 크롤링 알고리즘을 통해 수집하고 이를 주가와 관련된 주요 변수와 인과 관계에 대해서 분석한다. 그 결과 유튜브의 관심도는 주가, 주가 변동성 그리고 거래량에 선행적 인과 관계를 보인다는 것을 입증했다. 본 연구는 4차 산업 시대에 맞게 문화콘텐츠, IT 그리고 금융 분야를 접목해서 연구를 진행했다는 점에서 의의가 있다고 사료된다.

빅데이터 분석을 활용한 웰에이징 요인에 관한 연구 : 신문기사를 중심으로 (A Study on the Factors of Well-aging through Big Data Analysis : Focusing on Newspaper Articles)

  • 이종형;강경희;김용하;임효남;구진희;김광환
    • 한국산학기술학회논문지
    • /
    • 제22권5호
    • /
    • pp.354-360
    • /
    • 2021
  • 사람들은 개인의 삶의 만족을 위하여 일과 삶의 균형을 맞추며 건강하고 행복하게 살아가는 것을 희망하고 있다. 따라서 걱정 없이 행복하고 건강하게 나이가 들어가는 것을 의미하는 웰에이징(well-aging)에 대한 관심이 높아지고 있다. 본 연구는 웰에이징 관련 신문기사를 분석하여 웰에이징과 연관된 요인들을 파악하고자 하였다. 파이썬(Python) 기반의 웹 크롤링(web crawling)을 활용하여 2020년 11월까지 포탈 사이트 다음(daum)의 뉴스 서비스에 게재된 1,199편의 기사를 수집하였으며, 이중 연구 주제에 일치하는 기사 374편을 연구대상으로 선정하였다. 텍스트마이닝의 빈도분석 결과, '노인', '건강', '피부', '웰에이징', '제품', '사람', '노화', '여성', '국내', '은퇴' 등의 순서로 상위 10개의 키워드가 중요하게 파악되었다. 또한 출현 빈도가 높은 45개의 중요 키워드를 기반으로 사회 네트워크 분석을 수행한 결과 '피부-주름', '피부-노화', '노인-건강'이 강한 연결 관계를 나타났다. CONCOR 분석을 수행한 결과 45개의 중요 키워드들은 '삶과 행복', '질병과 죽음', '영양과 운동', '힐링', '헬스산업', '노화와 안티에이징', '건강', '노인서비스'의 8개 군집으로 구성되어, 신문기사들을 기반으로 나타나는 웰에이징과 관련된 요인들을 유추할 수 있었다.

Introducing SEABOT: Methodological Quests in Southeast Asian Studies

  • Keck, Stephen
    • 수완나부미
    • /
    • 제10권2호
    • /
    • pp.181-213
    • /
    • 2018
  • How to study Southeast Asia (SEA)? The need to explore and identify methodologies for studying SEA are inherent in its multifaceted subject matter. At a minimum, the region's rich cultural diversity inhibits both the articulation of decisive defining characteristics and the training of scholars who can write with confidence beyond their specialisms. Consequently, the challenges of understanding the region remain and a consensus regarding the most effective approaches to studying its history, identity and future seem quite unlikely. Furthermore, "Area Studies" more generally, has proved to be a less attractive frame of reference for burgeoning scholarly trends. This paper will propose a new tool to help address these challenges. Even though the science of artificial intelligence (AI) is in its infancy, it has already yielded new approaches to many commercial, scientific and humanistic questions. At this point, AI has been used to produce news, generate better smart phones, deliver more entertainment choices, analyze earthquakes and write fiction. The time has come to explore the possibility that AI can be put at the service of the study of SEA. The paper intends to lay out what would be required to develop SEABOT. This instrument might exist as a robot on the web which might be called upon to make the study of SEA both broader and more comprehensive. The discussion will explore the financial resources, ownership and timeline needed to make SEABOT go from an idea to a reality. SEABOT would draw upon artificial neural networks (ANNs) to mine the region's "Big Data", while synthesizing the information to form new and useful perspectives on SEA. Overcoming significant language issues, applying multidisciplinary methods and drawing upon new yields of information should produce new questions and ways to conceptualize SEA. SEABOT could lead to findings which might not otherwise be achieved. SEABOT's work might well produce outcomes which could open up solutions to immediate regional problems, provide ASEAN planners with new resources and make it possible to eventually define and capitalize on SEA's "soft power". That is, new findings should provide the basis for ASEAN diplomats and policy-makers to develop new modalities of cultural diplomacy and improved governance. Last, SEABOT might also open up avenues to tell the SEA story in new distinctive ways. SEABOT is seen as a heuristic device to explore the results which this instrument might yield. More important the discussion will also raise the possibility that an AI-driven perspective on SEA may prove to be even more problematic than it is beneficial.

  • PDF

예정원가계산에 의한 감사보수 산정 (Calculating the Audit Fee Based on the Estimated Cost)

  • 문태형
    • 경영과정보연구
    • /
    • 제35권1호
    • /
    • pp.189-206
    • /
    • 2016
  • 2014년도 회계감사보고서부터 외감법의 개정에 따라 감사보고서에 관한 7조의 2의 외부감사 참여인원 수, 감사내용 및 소요시간 등 외부감사 실시내용을 적은 서류를 첨부하도록 되었다. 본 연구에서는 개정된 외부감사 실시내용을 반영하여 정부출연기관의 용역예정원가계산에 의하여 감사보수를 산정한다. 본 연구에서는 대상기업(전기 적정의견, 직전년도 자산총액 1,000억원, 제조업, 사전의 의뢰인 수임에서 내부통제위험 및 유의적인 감사위험이 없는 것으로 가정한 상장기업)을 국가계약법의 용역원가계산 체계에 따라 인건비, 경비, 일반관리비, 이윤의 4가지 비목을 합계하여 감사보수를 산출한다. 그리고 회계감사의 참여자와 감사투입시간을 확인하기 위하여 Big-4 회계법인에 예정원가 산정 대상기업에 대한 견적을 의뢰하여 계정된 외부감사 실시내용을 적은 서류에 따라 수집한 결과를 이용하였다. 인건비는 2014년 학술연구용역비 인건비기준단가의 참여율 150% 적용, 경비는 한국은행의 기업경영분석(2013년)의 회계법인등의 평균을 사용, 일반관리비는 국가를 당사자로 하는 계약에 관한 법률 시행규칙 7조1항 용역업의 일반관리비율 5%를 적용, 이윤은 국가를 당사자로 하는 계약에 관한 법률 시행규칙 7조2항 용역업의 이윤율 10%가 적용되었다. 이를 적용한 예정원가 계산에 의한 감사보수는 50,617,769원이 산출되었다. 본 연구의 결과가 최적의 적정감사보수는 아니다 할지라도 기준이 없는 기업의 감사보수를 비교할 수 있는 기본 척도로 사용 할 수 있을 것이다. 그리고 이러한 외감법의 개정은 이전의 총 투입 감사시간만을 공시한 것보다 감사인의 독립성과 회계제도의 투명성을 제고할 수 있을 것이다.

  • PDF

의료기관 경쟁력 향상에 영향을 미치는 핵심 요인 (The Critical Factors on Improvement of Medical institution Competitiveness)

  • 염재광;강창렬
    • 한국병원경영학회지
    • /
    • 제12권1호
    • /
    • pp.1-30
    • /
    • 2007
  • The study carried out a survey with employees of hospitals located in Daejeon, Chungnam, and Chungbuk from Sep. 12 to Sep. 30, 2005 in order to derive primary elements that affect the improvement of hospital's competitiveness. The study investigated and analyzed the employees' recognition on the change of competitive environment caused by the change of medical environment. The study also analyzed the elements that affect the hospital's competitiveness and the competitive strategies of the hospitals. The conclusion of this study can be summarized as follows. 1. Summary 1) Most of the employees responded that there is a rival in the competitive environment and the competitive is intense. Especially when the employees are married, live in urban areas, have an education level of university graduate or are managers, they tend to think the competitive is very intense. Also, they said that the competitive is based upon the quality of medical service. They mentioned the element that has the biggest effect on the competitiveness is the element of medical consumer and they recognized that the medical services in university and general hospitals have more competitiveness than the one-department hospitals. 2) It was investigated that the medical technique service has the most effect on the hospital's competitiveness. Also, the external service of medical techniques also has a large effect on the hospital's competitiveness. 3) When they were asked for the factors that affect the patients' decision on selecting a hospital, most of them responded "capability and technique of the medical staffs." Also, they said that "sufficient explanation from doctors" and "special center and clinic" are the factors that have big effects on the patients' decision. 4) In the SWOT analysis, most of them responded that the strength is the hospital's characteristics and the weakness is insufficient and obsolete equipment. They said the opportunity is the demands for professional medical service and the risk is the intense competitive among the hospitals. 5) In the SWOT strategy, they emphasized the strategy that uses the opportunity and the strength and the strategy that uses the opportunity while overcoming the weakness. 6) As for the basic competition strategy, most of them thought of the strategy of professionalizing the medical service most importantly. Next, they focused on the strategy of distinct service and the strategy of lower prime cost. 2. Conclusion 1) Because service competition between hospitals is happening seriously, need competitiveness security through right awareness transfer and satisfaction upgrade about medical consumer. 2) For medical technique service upgrade that equip Hospital's competitiveness but affects most, must solidify the countermeasure because professionalizing the medical service and newest medical technique induction should be achieved first, and compose task force for the external service of medical techniques improvement. 3) To improve SWOT of hospital, opportunity and the strength strategy choice that rescue hospital's characteristics heightening professionalizing the medical service level is fancied. 4) As for the basic competition strategy, will have to try in phase triangular position of hospital which is trusted medical level upgrade and excellent manpower security and finance independence through upgrade. The study was only done with hospitals in Daejeon, Chungnam and Chungbuk. Also, it is a study from the side of suppliers of medical service so there are limitations. However, the significance of the study is to present the basic data for improvement of hospital's competitiveness by examining the importance of medical techniques and external service of medical techniques that are the main effects on the improvement of hospital's competitiveness.

  • PDF

IoT 스트리밍 센서 데이터에 기반한 실시간 PM10 농도 예측 LSTM 모델 (Real-time PM10 Concentration Prediction LSTM Model based on IoT Streaming Sensor data)

  • 김삼근;오택일
    • 한국산학기술학회논문지
    • /
    • 제19권11호
    • /
    • pp.310-318
    • /
    • 2018
  • 최근 사물인터넷(IoT)의 등장으로 인터넷에 연결된 다양한 기기들에 의해 대규모의 데이터가 생성됨에 따라 빅데이터 분석의 중요성이 증가하고 있다. 특히 실시간으로 생성되는 대규모의 IoT 스트리밍 센서 데이터를 분석하여 새로운 의미 있는 미래 예측을 통해 다양한 서비스를 제공하는 것이 필요하게 되었다. 본 논문은 AWS를 활용하여 IoT 센서로부터 생성되는 스트리밍 데이터에 기반하여 실시간 실내 PM10 농도 예측 LSTM 모델을 제안한다. 또한 제안 모델에 따른 실시간 실내 PM10 농도 예측 서비스를 구축한다. 논문에 사용된 데이터는 PM10 IoT 센서로부터 24시간 동안 수집된 스트리밍 데이터이다. 이를 LSTM의 입력 데이터로 사용하기 위해 PM10 시계열 데이터로부터 30개의 연속된 값으로 이루어진 시퀀스 데이터로 변환한다. LSTM 모델은 바로 인접한 공간으로 이동해 가는 슬라이딩 윈도우 프로세스를 통하여 학습한다. 또한 모델의 성능 개선을 위해 24시간마다 수집한 스트리밍 데이터에 대해 점진적 학습 방법을 적용한다. 제안한 LSTM 모델의 성능을 평가하기 위해 선형회귀 모델 및 순환형 신경망(RNN) 모델과 비교한다. 실험 결과는 제안한 LSTM 예측 모델이 선형 회귀보다 700%, RNN 모델보다는 140% 성능 개선이 있음을 보여주었다.

징병제하에서 왜 군 입대를 늦추는가? : 심리적, 인구통계학적 특성 검토 (Why Do Individuals Postpone Their Enrollments for Military Service under a Conscription System? : Investigating Individuals' Psychological and Demographic Characteristics)

  • 김상훈;김진교;정용균
    • 한국국방경영분석학회지
    • /
    • 제32권2호
    • /
    • pp.188-211
    • /
    • 2006
  • 본 연구에서는 징병제 하에서 군 입대 연기를 가져오는 입대대상자의 개인적 특성변수를 실증적으로 검토한다. 개인적 특성 변수는 군에 대한 태도, 군 생활의 불확실성, 군 생활에 대한 정보탐색, 군 근무환경 개선에 대한 기대, 군 생활에 대한 지각된 위험이라는 5개의 심리차원 변수와 여러 인구통계학적 변수를 사용한다. 개인적 심리차원 변수의 척도를 개발한 후, 군 입대 지연기간의 분석을 위한 기간분석 모형 또한 제안하였다. 군복무 의무를 마친 사람과 군복무를 아직 마치지 않은 사람을 포괄하여 설문조사를 한 후, 제안된 모형을 추정하였다. 추정결과 다섯 개의 심리차원 변수 중 군에 대한 부정적 태도와 군 생활에 대한 지각된 위험이 입대지연에 영향을 주며, 인구통계학적 변수의 경우에는 학력, 소득, 학점, 거주지, 가족 중 군 입대자의 비율이 입대지연에 영향을 미친다는 것이 밝혀졌다. 구체적으로 군에 대한 부정적 태도가 증가할수록, 군 생활에 대한 지각된 위험이 증가할수록, 고학력일수록, 학교성적이 높을수록, 소득수준이 낮거나 높을수록 서울특별시와 광역시에 거주할수록, 가족 중 군 입대자의 비율이 낮을수록, 입대시점이 지연되었다. 이와 같은 추정결과를 바탕으로 대한민국의 병력수급관리를 위한 여러 시사점 또한 제시하였다.

Hybrid CNN-LSTM 알고리즘을 활용한 도시철도 내 피플 카운팅 연구 (A Study on People Counting in Public Metro Service using Hybrid CNN-LSTM Algorithm)

  • 최지혜;김민승;이찬호;최정환;이정희;성태응
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.131-145
    • /
    • 2020
  • 산업혁신의 흐름에 발맞추어 다양한 분야에서 활용되고 있는 IoT 기술은 빅데이터의 접목을 통한 새로운 비즈니스 모델의 창출 및 사용자 친화적 서비스 제공의 핵심적인 요소로 부각되고 있다. 사물인터넷이 적용된 디바이스에서 누적된 데이터는 사용자 환경 및 패턴 분석을 통해 맞춤형 지능 시스템을 제공해줄 수 있어 편의 기반 스마트 시스템 구축에 다방면으로 활용되고 있다. 최근에는 이를 공공영역 혁신에 확대 적용하여 CCTV를 활용한 교통 범죄 문제 해결 등 스마트시티, 스마트 교통 등에 활용하고 있다. 그러나 이미지 데이터를 활용하는 기존 연구에서는 개인에 대한 사생활 침해 문제 및 비(非)일반적 상황에서 객체 감지 성능이 저하되는 한계가 있다. 본 연구에 활용된 IoT 디바이스 기반의 센서 데이터는 개인에 대한 식별이 불필요해 사생활 이슈로부터 자유로운 데이터로, 불특정 다수를 위한 지능형 공공서비스 구축에 효과적으로 활용될 수 있다. 대다수의 국민들이 일상적으로 활용하는 도시철도에서의 지능형 보행자 트래킹 시스템에 IoT 기반의 적외선 센서 디바이스를 활용하고자 하였으며 센서로부터 측정된 온도 데이터를 실시간 송출하고, CNN-LSTM(Convolutional Neural Network-Long Short Term Memory) 알고리즘을 활용하여 구간 내 보행 인원의 수를 예측하고자 하였다. 실험 결과 MLP(Multi-Layer Perceptron) 및 LSTM(Long Short-Term Memory), RNN-LSTM(Recurrent Neural Network-Long Short Term Memory)에 비해 제안한 CNN-LSTM 하이브리드 모형이 가장 우수한 예측성능을 보임을 확인하였다. 본 논문에서 제안한 디바이스 및 모델을 활용하여 그간 개인정보와 관련된 법적 문제로 인해 서비스 제공이 미흡했던 대중교통 내 실시간 모니터링 및 혼잡도 기반의 위기상황 대응 서비스 등 종합적 메트로 서비스를 제공할 수 있을 것으로 기대된다.