• 제목/요약/키워드: Data Curation

검색결과 92건 처리시간 0.026초

유튜브 알고리즘의 역공학설계를 통한 큐레이션 요인 연구 - 성별 키워드 검색을 중심으로 (A Study on the Curation Factors through Reverse Engineering Design of YouTube Algorithm - Focusing on Gender Keyword Search)

  • 배승주;이상호
    • 한국융합학회논문지
    • /
    • 제13권3호
    • /
    • pp.133-146
    • /
    • 2022
  • 전 세계의 인터넷 사용자들이 매일 유튜브를 시청하지만, 검색결과에 대한 추천 알고리즘을 정확히 인지하는 이용자는 극히 드물며, 구글과 유튜브는 이를 공개하지 않고 있다. 연구자들은 공개되어 있지 않은 유튜브의 알고리즘을 역공학설계 방식으로 탐색하고, 핵심적 요인을 찾아 미디어 플랫폼 사업자들이 어떤 논리적 구조로 키워드 검색결과를 추천하고, 화면에 배열하는지 확인하고자 하였다. 따라서 연구자들은 수개월에 걸친 논의와 데이터의 수집을 통해 기초적인 콘텐츠 우선순위 요인을 연구하였으며 수집된 키워드 검색 결과 중에 남, 여 성별에 따른 추천결과를 토대로 영향 요인을 역설계하고자 하였다. 비록 연구자들의 설계는 매시간 수백시간 이상 업로드되고 시청되는 거의 무한한 수준의 데이터 중에서 일부를 분석한 것에 그치지 않지만, 이러한 탐색적 시도가 향후 미디어 플랫폼 알고리즘을 연구하고, 사업자들의 의도를 파악하며, 사용자를 보호할 수 있을 것으로 보았다.

데이터 큐레이터의 핵심 직무 요건 고찰에 관한 연구 (An Investigation on Core Competencies of Data Curator)

  • 이유경;정은경
    • 한국비블리아학회지
    • /
    • 제26권3호
    • /
    • pp.129-150
    • /
    • 2015
  • 디지털 정보기술과 인터넷의 발달로 인해 데이터는 여러 학문과 사회 분야에서 의미 있는 결과를 도출하고 의사결정과 정책을 수립하는 데 있어서 중요하다. 따라서 대규모의 데이터를 축적하고 관리하는 업무를 담당하는 데이터 큐레이터는 데이터 관리의 효율성과 활용성을 높이는데 필수적인 역할을 수행한다. 본 연구는 데이터 큐레이터의 핵심 직무 요건을 규명하고자 한다. 이를 위해 두 종류의 데이터를 수집하여 분석하였다. 첫째는 2011년부터 2014년까지 총 255건의 국외 데이터 큐레이터 구인 공고를 수집하였으며, 둘째는 국내 데이터 관리 실무자 5명과의 심층면담을 실시했다. 수집된 두 가지 데이터는 선행연구에서 제시한 7가지 핵심 직무 요건을 바탕으로 범주화하여 분석하였다. 데이터 분석 결과 데이터 큐레이터의 핵심 직무 요건을 4가지 범주로 구분할 수 있다. 본 연구의 결과 데이터 큐레이터의 핵심 직무 요건은 효율적인 데이터 관리 직무 수행을 위해 이해관계자와 원활하게 소통할 수 있어야 하며, 이와 함께 정보기술 지식을 기반으로 데이터 관리 시스템을 구축하고 운영할 역량이 필요하다. 또한 데이터 관리 지식 및 전략을 이해하고 마지막으로 데이터 관리 이용자 교육 및 데이터 관련 서비스와 도구를 제공할 수 있어야 한다. 이를 통해 데이터 관리에 있어 4가지 범주로 구분되는 다양한 측면의 요건이 요구되고 있음을 도출하였으며, 이를 위한 데이터 관리에 대한 통합된 전문적인 교육과정의 필요성을 제안했다.

데이터사이언스 관련 교과목의 강의 계획서 분석: ALA의 인가를 받은 문헌정보학 프로그램을 중심으로 (An Examination of the Course Syllabi related to Data Science at the ALA-accredited Library and Information Science Programs)

  • 박형주
    • 정보관리학회지
    • /
    • 제39권1호
    • /
    • pp.119-143
    • /
    • 2022
  • 본 연구는 미국도서관협회(American Library Association, ALA)의 인가를 받은 문헌정보학 프로그램에서 제공하는 데이터사이언스와 관련된 수업의 내용을 조사했다. 연구의 목적은 강의 계획서의 내용 분석을 통해 해당 수업에서 다뤄지는 교과목 명, 교과 설명, 학습 목표, 주차 별 주제를 살펴보는 것이다. 문헌정보학 프로그램에서의 데이터사이언스와 관련된 필수 과목 및 선택 과목은, 데이터사이언스 개론, 데이터 마이닝, 데이터베이스, 데이터 분석, 데이터 시각화, 데이터 큐레이션 및 관리, 머신 러닝, 메타데이터, 컴퓨터 프로그래밍 등 데이터사이언스 전 분야에 걸쳐 다양하게 교과목이 개설되어 있었다. 본 연구의 결과는 문헌정보학 프로그램에서 데이터사이언스 교과 과정을 개설 및 개정할 때 논의의 시작점이 될 수 있는 기초 자료가 되어 운영 역량을 강화하는데 활용되기를 기대한다.

금융마이데이터 사용자 행동에 관한 실증 연구: 기관정보투명성, 데이터 보안정책의 조절효과 (Empirical Investigation of User Behavior for Financial Mydata: The Moderating Effects of Organizational Information Transparency and Data Security Policy)

  • 손창용;박현선;김상현
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제32권3호
    • /
    • pp.85-116
    • /
    • 2023
  • Purpose The importance of data as a key resource of the intelligence revolution is being highlighted, among all those phenomena MyData is attracting attention as a key concept by organizations and individuals that eventually leads the data economy. In this regard, this study was started to contribute to the successful settlement and continuous growth of the domestic MyData industry, which has just entered the system. Design/methodology/approach To develop and test all proposed casual relationships within the research model, we used the Value-Attitude-Behavior(VAB) model as a basic framework. A total of 385 copies were used for the final analysis, and for SPSS 25.0, MS-Excel 2016, and AMOS 24.0 to summarize respondent demographic characteristics, measurement model, and structural model. Findings Findings show that all proposed hypotheses were supported with the exception of the moderating effect of organizational information transparency between data controllability and perceived value, and between data controllability and attitude toward MyData service.

시뮬레이션 데이터의 다양성을 고려한 데이터 전처리 프레임워크 설계 (Exploiting Data Diversity in a Simulation data Curation)

  • 안선일;안부영;장지훈;이식;조금원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.81-82
    • /
    • 2017
  • 계산과학 데이터를 공유하는 목적은 데이터의 분석을 통해 의미 있는 정보를 추출하기 위해서이다. 이를 위해서는 계산과학 데이터의 전처리 과정이 요구되며, 핵심 이슈는 계산과학 데이터의 다양성과 복잡성의 해결이다. 본 논문은 계산과학 데이터 저장소의 구축 과정에서 고려하였던 계산과학 데이터의 전처리에 대한 설계 이슈들과 해결 방안들에 대해 설명한다.

국내 학술콘텐트 기반 재난안전분야 전문가 식별 및 분석 (Identification and Analysis of Experts in the Field of Disaster and Safety based on Domestic Scholarly Content)

  • 김병규;신진섭;류범종
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2018년도 제58차 하계학술대회논문집 26권2호
    • /
    • pp.80-82
    • /
    • 2018
  • 전세계적으로 대형 자연재난 및 사회재난의 증가로 재난 대응 체계 고도화에 대한 국가적인 관심과 요구가 급증하고 있다. 다양한 재난유형에 대한 효과적인 대응을 위해서는 사전에 구축된 재난유형별 전문가 Pool의 구축과 활용이 매우 중요하다. 본 논문에서는 학술콘텐트를 활용하여 재난안전분야 전문가들을 식별 및 분석하고 식별된 재난분야 학술정보와 전문가 정보 시범 서비스를 구현하였으며, 주요 연구결과는 재난안전정보 공유 플랫폼에 연계하여 재난 단계별 전문가 추천 및 서비스에 활용될 계획이다.

  • PDF

광역자치단체 정보화 조직 역량 분석과 발전모델 제안: 업무, 구조, 관계를 중심으로 (Task Contents, Organizational Structures and Work Relations of ICT Departments in Korean Local Governments)

  • 조희진;장용석;정명은
    • 정보화정책
    • /
    • 제23권3호
    • /
    • pp.84-116
    • /
    • 2016
  • 본 연구는 지방정부 정보화 조직의 경쟁력 강화를 위해 업무, 구조, 관계적 역량을 진단하고 조직발전 모델을 제시하는 것을 목적으로 한다. 연구 대상은 한국 17개 광역자치단체의 정보화 부서이며, 조직 변화에 대한 통시적 관찰, 조직 간 비교, 심층 인터뷰 등 다각적 방법으로 지방정부 정보화 조직의 현실적 문제를 담아내고자 하였다. 분석결과, 첫째, 업무 측면의 경우, 새로운 정보통신기술의 도입, 업무 구분 및 조정, 창의적 정책 탐색에서 문제를 보였다. 둘째, 구조 측면에서는 부서 위치 및 명칭, 인력, 공식적 권한, 조직문화 등 공식적 비공식적 원인에 의해 조직 위상이 저하되어 있다. 셋째, 관계측면에서는 전담부서-현업부서 간, 정부 간, 정부-민간 간 관계에서의 주도적인 역할 변화가 필요한 것으로 진단되었다. 이와 같은 조직문제를 개선하기 위해 본 연구는 지방정부와 조직이 처한 상황에 따라 적용할 수 있는 'Relation Model, Resource Model, Curation Model, Creation Model'을 구상하고 이의 실현을 위한 업무, 구조, 관계 역량 강화 전략을 제시하였다.

Geoscience 연구데이터 관리를 위한 기능별 세부요소 및 중요도에 관한 연구 (A Study on Functional Details and Importance of Geoscience Research Data Management)

  • 김주섭;김선태;최상기
    • 한국문헌정보학회지
    • /
    • 제54권1호
    • /
    • pp.411-440
    • /
    • 2020
  • 본 연구는 국내에서 Geoscience 분야 연구데이터 관리 시스템 개발에 적용할 수 있는 RDM 기능별 세부요소의 도출을 목적으로 하였다. 연구 목적 달성을 위해 RDM 서비스와 관련된 8개의 기관을 분석하였다. 분석한 결과, Geoscience RDM 기능의 80개 세부요소가 도출되었으며, 도출된 세부요소를 검증하기 위하여 국내 전문가를 대상으로 설문조사를 수행하였다. 조사 결과, Geoscience 분야를 위한 80개의 RDM 기능별 세부요소가 중요도 순으로 제시되었다. 제시된 요소는 국내의 연구 기관 또는 대학도서관에서 Geoscience 분야의 RDM 서비스 구축 및 운영 시 기능별 세부요소로 제시될 수 있으며 순위에 따라 중요도를 판단할 수 있는 참고자료가 될 수 있을 것이다.

빅데이터 마이닝을 위한 점진적 학습 기반 콘텐츠 큐레이션 시스템 설계 (Design of Contents Curation System Based on Incremental Learning Technology for Big Data Mining)

  • 민병원
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2017년도 춘계 종합학술대회 논문집
    • /
    • pp.421-422
    • /
    • 2017
  • 콘텐츠 큐레이션 서비스를 위해서 대용량 데이터를 학습하는 과정에서 발생하는 메모리부족 문제, 학습소요시간 문제 등을 해결하기 위한 "대용량 문서학습을 위한 동적학습 파이프라인 생성기술 중 빅데이터 마이닝을 위한 점진적 학습 모델" 기술이 필요하며, 본 논문에서 제안한 콘텐츠 큐레이션 서비스는 온라인상의 수많은 콘텐츠들 중 개인의 주관이나 관점에 따라 관련 콘텐츠들을 수집, 정리하고 편집하여 이용자와 관련이 있거나 좋아할 만한 콘텐츠를 제공하는 서비스이다. 큐레이션 서비스에서는 개인비서, 금융 분야의 투자, 자율주행, 저널리즘, 효율적인 업무 지시/감독, 제조업의 자동화 공정, 교육, 콘텐츠 유통, 학술정보 등에서 컴퓨터가 방대한 양의 데이터로 부터 학습하여 사람의 일을 대신 처리하거나 의사결정에 도움을 줌으로써 업무의 효율을 높여주는 서비스 산업에 활용이 가능하다.

  • PDF

점진적 빅데이터 학습기반의 전자저널 구독가치 큐레이션 서비스 (Journal Subscription Value Curation Service Based on Incremental Big Data Learning)

  • 이정원;진성일
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2019년도 춘계종합학술대회
    • /
    • pp.409-410
    • /
    • 2019
  • 점진적 빅데이터 학습 기반의 전자저널 구독가치 큐레이션 서비스는 대용량의 학술정보 처리환경을 하드웨어 기반에서 소프트웨어 기반으로 데이터를 학습함에 있어 학습 소요시간 및 메모리 부족 문제 등을 해결하기 위해 널리 사용하는 자질축소 기법에 의존하지 않고 대량의 데이터를 자유롭게 학습하고 증분 데이터 변경요소만을 추가 반영할 수 있는 범용적이고 일반적인 분류기의 구조설계 방법이다. 학술정보의 논문요약과 참고문헌의 데이터 수집 정제 분류 저장 분석을 통해 활용할 수 있는 지표를 생성하여 도서관 학교 공공기관 연구기관 등에 제공하여 기관에서 구독하고 있는 학술지가 연구에 얼마나 활용되고 있는지를 판단하는 정보 가용성을 활용한 양질의 정보원을 확보하여 불필요한 저널 구독을 중단하고 연구자가 요구하는 품질 좋은 학술정보를 제공할 수 있는 서비스로 일반적인 학술문헌 이용도 평가방법과 달리 구독 가치에 대한 지표를 제공하는 큐레이팅 방법이다.

  • PDF