• 제목/요약/키워드: 데이터 중심 모델링

검색결과 301건 처리시간 0.031초

학습분석을 위한 데이터 모델링 연구 (A Study on Data Modeling for Learning Analytics)

  • 김경록
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2016년도 춘계학술발표대회
    • /
    • pp.348-349
    • /
    • 2016
  • 교수자와 학습자 활동에 대한 정보를 피드백하여 사용자 스스로 동기부여와 참여를 증대시키기 위해 학습분석이 활용되고 있다. 이는 교수-학습 지원 시스템(LMS, LCSM 등)에서 교수자와 학습자 상호작용에서 발생한 데이터를 기반으로 한다. 이러한 데이터를 보다 유용하게 활용하기 위해서는 데이터 모델이 필요하다. 이에 본 연구에서는 사용자 중심의 교수-학습 활동 데이터를 표현하기 위한 데이터 모델을 제안한다. 이는 사용자와 교수-학습 활동을 결합하여 표현한 것이다.

온라인 뉴스 빅데이터를 통한 코로나 19 담론과 사회복지 개입방안: 독거노인을 중심으로 (COVID-19 Discourse and Social Welfare Intervention through Online News Big Data: Focusing on the Elderly Living Alone)

  • 여지영
    • 한국노년학
    • /
    • 제41권3호
    • /
    • pp.353-371
    • /
    • 2021
  • 본 연구는 코로나 19 상황의 독거노인에 대한 빅데이터를 토대로 사회전반적인 개입 및 대응의 담론을 밝힘으로써 사회복지적 정책 수립의 실마리를 제공하고자하는데 목적이 있다. 이를 위하여 2020년 1월 1일부터 2020년 9년 25일까지 수집된 온라인 뉴스 데이터를 활용하여 사회관계망 분석, 토픽모델링 분석을 수행하였다. 분석 결과는 다음과 같다. 첫째, 사회관계망 분석결과, 연결정도 중심성, 위세중심성, 매개중심성 모두 지역, 전달, 사회, 지원, 취약을 중심으로 네트워크가 형성됨으로써 독거노인에 대해서는 각종 지원 및 서비스 전달체계의 필요성에 대한 담론이 형성되었음을 확인하였다. 둘째, 토픽모델링 분석 결과 '공공전달체계 구축''지역사회 지원체계 구축''돌봄공백 보전관리''민간 경제적 지원체계 구축''봉사조직체계 구축'등의 주제가 나타나며, 크게 정부, 지역사회, 민간에서의 유기적 역할에 대한 담론이 제시되었다. 연구결과를 바탕으로 코로나 19와 같은 재난상황에서 독거노인에 대한 개입방안에 대한 논의를 제언함으로써 정책적, 실천적 함의를 제시하였다.

K-평균 군집을 이용한 마이크로타겟팅을 위한 SNS 빅데이터 활용 모델링에 관한 연구 (A Study on the Application Modeling of SNS Big-data for a Micro-Targeting using K-Means Clustering)

  • 송재오;이상문
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2015년도 제51차 동계학술대회논문집 23권1호
    • /
    • pp.321-324
    • /
    • 2015
  • 본 논문에서는 SNS에 존재하는 특정 제품과 브랜드 또는 기업에 대한 평가, 의견, 느낌, 사용 후기 등의 소비자 생각을 수집하여 기업에서 향후 신제품 개발이나 시장 진출 및 확대 등의 경영활동에 활용할 수 있도록 SNS 빅데이터를 문석하고, 이를 활용하여 보다 소집단화 되고 개인화 되어가는 Micro-Trend 중심의 마케팅 활동을 할 수 있는 Micro-Targeting 관련 분석 정보를 제공 모델링하는 것을 제안한다. 본 연구에서는 SNS 데이터의 수집, 저장, 분석에 대한 내용을 다루고 있으며, 특히 마이크로타겟팅을 위한 정보를 머하웃(Mahout)의 유클리드 거리 기반의 유사도와 K-평균 군집 알고리즘을 활용하여 구현하고자 하였다.

  • PDF

관계형 데이터베이스 기반의 XML Schema 응용을 위한 설계 방법론 (Design Methodology for XML Schema Application based on RDB.)

  • 임종선;주경수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (중)
    • /
    • pp.793-796
    • /
    • 2003
  • B2B 전자상거래와 같이 XML을 이용한 정보교환이 확산되고 있으며 이에따라 상호 교환되는 정보에 대하여 체계적이고 안정적인 저장 관리가 요구되고 있다. 이를 위해 XML 응용과 데이터베이스 연계를 위하여 다양한 연구가 XML DTD와 관계형 데이터베이스 중심으로 수행되었다. 그러나 XML DTD가 다양한 데이터 타입 및 표현의 한계 때문에 관계형 데이터베이스와 원활한 연계가 불가능하게 되었다. 그러므로 다양한 데이터 타입과 데이터 표현에 강력한 XML Schema에 대한 연구가 필요하게 되었다. 또한 계층구조를 2차원 정보로 변환하는 방법에 의해서 각 구조화된 정보를 관계형 데이터베이스로 저장하기 위한 데이터 모델링과 XML schema 모델링이 요구된다. 본 논문에서는 XML schema로 정의된 XPDL 정의 스키마를 UML로 변환하는 방법론과 UML을 RDB 스키마로 변환하는 방법론을 제시함으로써, 워크플로우 정의 언어인 XPDL 정의 스키마를 토대로 관계형 데이터베이스의 스키마를 확정하는 방법론을 제안하였다.

  • PDF

몽골에 대한 국내 뉴스 토픽 모델링: 한몽 수교 이후 양국 관계 보도 양상 변화를 중심으로 (Modeling Domestic News Topics for Mongolia: Focusing on Changes in Press on Diplomatic Relations between the two countries after the establishment of Diplomatic ties between Korea and Mongolia)

  • 윤지수;김현미
    • 한국콘텐츠학회논문지
    • /
    • 제22권4호
    • /
    • pp.37-46
    • /
    • 2022
  • 본 연구는 한국과 몽골이 수교 이후부터 지금까지 외교관계 격상을 이루는 동안 국내에서는 어떤 분야에 관심을 가져왔는지 확인하고자 몽골과 관련된 국내 언론 보도를 중심으로 빅데이터 분석을 실시하였다. '몽골' 키워드로 검색된 13만여 개의 기사를 분석 대상으로 삼고, 관계 격상일을 기준으로 4개의 시기로 나누어 토픽 모델링을 실시하였다. 시기별 주요 토픽을 도출하여 살펴본 결과, 관계 격상에 따라 사라지는 이슈도 있었으나 초기에 나타났던 이슈들이 상당수 유지되면서 여러 분야의 이슈가 추가되어 나타나는 양상을 보였다. 즉, 기존의 정치, 역사 위주의 협력에서 문화, 교육, 보건, 항공, 기후 등으로 분야가 다양화되고 있었으며, 특히 민간교류 측면에서 토픽이 더욱 세분화되어 발전하는 양상을 보였다. 본 연구는 양국 간 외교 관계 연구에서 기존에 시도되지 않았던 새로운 분석 방법을 시도함으로써 막대한 양의 데이터를 바탕으로 결론의 신뢰성을 높이고 기존 연구에 새로운 시각을 제공하고 있다.

클러스터 기반 퍼지 모델트리를 이용한 데이터 모델링 (Data Modeling using Cluster Based Fuzzy Model Tree)

  • 이대종;박진일;박상영;정남정;전명근
    • 한국지능시스템학회논문지
    • /
    • 제16권5호
    • /
    • pp.608-615
    • /
    • 2006
  • 본 논문에서는 퍼지 클러스터 기법을 이용하여 구간 분할된 퍼지 모델트리의 제안과 이를 이용한 데이터 모델링 기법을 다룬다. 제안된 방법은 먼저 입력과 출력변수의 속성을 고려한 퍼지 클러스터링에 의해 중심벡터를 계산한 후, 중심벡터들과 입력속성간의 소속도를 이용하여 구간 분할된 영역별로 각각의 선형모델을 구축한다. 노드의 확장은 부모노드(parent node)에서 만들어진 모델에서 계산된 오차값과 자식노드(child node)에서 계산된 오차값을 비교하여 이루어진다. 출력값 예측 단계에서는 입력된 데이터와 잎노드에서 계산된 클러스터 중심값과 비교하여 소속도가 높은 선형모델을 선택하여 데이터에 대한 출력값을 예측하게 된다. 제안된 방법의 우수성을 보이기 위해 다양한 데이터를 대상으로 실험한 결과, 기존의 모델트리방식 및 뉴럴 네트워크 기반의 신경회로망 보다 향상된 성능을 보임을 알 수 있었다.

토픽모델링 분석을 활용한 국가연구개발사업과제와 국회 상임위원회 사이의 정책 인식 비교 : ICT 분야를 중심으로 (Comparison of policy perceptions between national R&D projects and standing committees using topic modeling analysis : focusing on the ICT field)

  • 송병기;김상웅
    • 산업융합연구
    • /
    • 제20권7호
    • /
    • pp.1-11
    • /
    • 2022
  • 본 논문에서는 여러 연구기관에서 논의하고 있는 데이터 기반 평가 방법론 중 토픽모델링 기법을 이용하여 계량적인 값을 도출하고 그 과정에서 실제 전문가들이 수행하는 국가연구개발사업과제와 이를 법률과 정책실무에서 다루는 국회 상임위원회 간의 정책적 인식 차이가 있는지 ICT 분야를 중심으로 파악해 보고자 한다. 먼저 HAN 모델로 사업과제 데이터를 학습하여 ICT 문서를 분류하는 모델을 만들고, 해당 모델을 통해 분류된 ICT 문서를 대상으로 LDA 토픽모델링 분석을 수행하여 국가연구개발사업과제 데이터와 국회 상임위원회 회의록에서 도출된 토픽과 분포를 비교한다. 구체적으로 총 26개의 토픽이 도출되었으며, 각 토픽이 포함하는 단어와 문서 분포 비율을 살펴봤을 때, 국가사업과제는 상대적으로 전문적인 주제의 문서가 많았으며, 국회 상임위원회는 상대적으로 사회적이고 대중적인 문제를 다루는 것으로 나타나 인식에 다소 차이가 있는 것으로 보였다. 인식의 차이를 수치적으로 확인할 수 있는 만큼, 향후 정책이나 과제 평가에 사용할 수 있는 지표에 대한 기초연구로 활용 가능할 것이다.

토픽모델링을 활용한 Z세대의 애플리케이션 효용성에 대한 분석: 이용자의 에세이 데이터를 중심으로 (Analysis of the Utilization of Mobile Applications by Generation Z using Topic Modeling :Focusing on Users' Essay Data)

  • 박주연;정도헌
    • 산업융합연구
    • /
    • 제20권1호
    • /
    • pp.43-51
    • /
    • 2022
  • 본 연구는 이용자 중심 관점에서 Z세대의 애플리케이션 사용의 효용성을 분석하여 Z세대에 대한 이해를 돕고 Z세대를 위한 모바일 서비스 마케팅 전략 수립, 교육서비스 개발, 공학교육 등에 필요한 기초 정보를 제공하는데 목적이 있다. 이를 위해 Z세대인 대학생의 애플리케이션 사용경험에 대한 에세이를 177건 수집하였고, 토픽모델링을 활용하여 주요 토픽들을 분석하고, 이를 워드 클라우드 분석을 통해 시각화하였다. 연구 결과 주요 토픽들은 이동, 대중교통 등과 같은 '교통', 일정관리, 금융관리, 음식관리 등과 같은 '개인적 관리', 계산, 모임, 구매, 외식 등과 같은 '거래', 여행, 스터디, 문화 등과 같은 '여가활용' 과 관련된 것으로 나타났다. 그리고 시간, 생각, 사람, 생활, 버스, 정보, 확인, 결제, 카카오톡 등의 용어가 높은 빈도를 보였다. 또한, 단과대학별로 분석한 결과 토픽 간 차이가 나타났다. 본 연구는 비정형데이터인 에세이를 수집하여 애플리케이션 효용성을 토픽모델링을 통해 실증적으로 분석하였다는 점에서 의의가 있다.

3G 이동통신시스템에서 데이터 트래픽의 버스트성과 지연특성을 고려한 큐잉성능 분석 (An Performance Analysis of Queueing for Data Traffic Considering the Burstiness and Delay Characteristics in 3G Mobile Comm. Systems)

  • 김창호;이명훈;이종규;최영민;임석구
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 I
    • /
    • pp.469-472
    • /
    • 2003
  • 음성 중심의 기존 2G CDMA/PCS의 성능 및 용량을 분석하기 위한 트래픽 모델링에서는 시간당 평균 호 발생률, 발생 간격의 분포, 호 유지시간(Holding Time), 그리고 최번시(Busy Hour)를 결정하는 것이 주요 과제였으며, 이를 이용한 트래픽 엔지니어링은 음성호의 Blocking 확률과 지연시간을 최소화 하기위한 충분한 호 자원 확보에 중심을 두었던 것이 사실이다. 그러나 CDMA2000 1X 및 1xEV-DO/DV와 같은 3G 고속 데이터 이동통신 시스템에서의 패킷 데이터 트래픽의 특성은 자기 유사성(Self-similarity)이라는 성질을 가진다는 것은 잘 알려진 사실이다. 이와같은 고속 데이터 이동통신 시스템에서 요구되는 효율적인 망의 설계 및 디멘져닝을 위해서는 무엇보다도 데이터 트래픽의 주요 특성인 버스트함과 자기유사성이 반영된 모델 분석이 요구된다. 이러한 관점에서 본 논문에서는 데이터 트래픽의 자기유사성 및 큐잉 지연을 고려한 유효대역폭 산출식을 유도하여 시뮬레이션 결과와 비교 분석하였다.

  • PDF

RiC을 적용한 아카이브 시스템 데이터 모델링 연구 (A Study in the Data Modeling for Archive System Applying RiC)

  • 신미라;김익한
    • 한국기록관리학회지
    • /
    • 제19권1호
    • /
    • pp.23-67
    • /
    • 2019
  • Records in Contexts(RiC)은 ICA의 네 가지 기술표준을 통합, 정규화하여 개발한 국제적 기술표준이다. RiC은 기록 기술을 다차원적으로 바꾸고 기록의 맥락을 드러내며 이질적 시스템 간 데이터 상호운용성을 확보할 수 있는 장점이 있다. 본 논문에서는 RiC을 아카이브 시스템 설계의 핵심 도구로 설정하고, 데이터베이스 구현을 위한 '논리적 데이터 모델링'을 수행한다. RiC의 개념 모델인 RiC-CM(Conceptual Model)은 데이터 참조 모델로 활용할 수 있기 때문에, 사용자 요구사항에 맞는 데이터 모델로 개발이 가능하다. 이에 본 논문에서는 이를 두 가지 데이터 모델, '관계형 데이터 모델'과 '그래프형 데이터 모델'로 구현하고자 한다. 관계형 데이터 모델은 대부분 레거시 시스템의 데이터베이스가 적용하고 있는 만큼 범용적이다. 한편 그래프형 데이터 모델은 정보 '개체(entity)' 사이의 '관계(relationship)'를 중심으로 개체를 유연하게 확장할 수 있다.