• 제목/요약/키워드: 데이터 종류

검색결과 2,136건 처리시간 0.03초

LDA기반 토픽모델링을 활용한 공공데이터 기반의 교육용 데이터마이닝 연구 (A Study on Educational Data Mining for Public Data Portal through Topic Modeling Method with Latent Dirichlet Allocation)

  • 신승기
    • 정보교육학회논문지
    • /
    • 제26권5호
    • /
    • pp.439-448
    • /
    • 2022
  • 본 연구에서는 공공데이터포털에서 제공하는 교육관련 데이터를 검색하고 토픽모델링 기법을 활용한 분류를 통해 어떠한 데이터의 종류가 구축되어 있으며 활용이 가능한지를 살펴보고자 하였다. 공공데이터포털의 데이터에 대하여 분류체계를 기준으로 교육분야의 파일데이터는 3,072건이 수집되었으며, 검색어를 활용하여 '교육'을 검색하여 나타난 파일데이터 2,361건으로 나타났다. 각각의 데이터셋에 대하여 불용어처리를 실시하고 데이터 전처리를 수행하여 LDA기반 토픽모델링을 활용하여 텍스트마이닝 분석을 실시하였다. 사전에 교육으로 분류된 데이터셋에서는 현재 재학중인 학교급별 학생을 대상으로 지원하는 프로그램과 정보에 대한 내용이 제공되고 있었다. 한편, 교육으로 검색하여 수집된 데이터셋에서는 장애인, 학부모, 노인, 아동 등 평생교육의 관점으로 제공되는 교육 프로그램 및 지원현황이라는 특징이 나타났다. 데이터과학기반의 의사결정 및 문제해결력을 기르기 위해 공공데이터포털이 제공하는 데이터에서 교육과정 및 내용이 충분히 제공되는 것도 좋은 기회가 될 것이다.

농업 빅데이터 수집 및 분석을 위한 플랫폼 설계 (Design of a Platform for Collecting and Analyzing Agricultural Big Data)

  • 뉘엔 반 퀴엣;뉘엔 신 녹;김경백
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권1호
    • /
    • pp.149-158
    • /
    • 2017
  • 빅데이터는 경제개발에서 흥미로운 기회와 도전을 보여왔다. 예를 들어, 농업 분야에서 날씨 데이터 및 토양데이터와 같은 복합데이터의 조합과 이들의 분석 결과는 농업종사자 및 농업경영체들에게 귀중하고 도움되는 정보를 제공한다. 그러나 농업 데이터는 센서들과 농업 웹 마켓 등의 다양한 형태의 장치 및 서비스들을 통해 매 분마다 대규모로 생성된다. 이는 데이터 수집, 저장, 분석과 같은 빅데이터 이슈들을 발생시킨다. 비록 몇몇 시스템들이 이 문제를 해결하기 위해 제안되었으나, 이들은 다루는 데이터 종류의 제약, 저장 방식의 제약, 데이터 크기의 제약 등의 문제를 여전히 가지고 있다. 이 논문에서는 농업데이터의 수집과 분석 플랫폼의 새로운 설계를 제안한다. 제안하는 플랫폼은 (1) Flume과 MapReduce를 이용한 다양한 데이터 소스들로부터의 데이터 수집 방법, (2) HDFS, HBase, 그리고 Hive를 이용한 다양한 데이터 저장 방법, (3) Spark와 Hadoop을 이용한 빅데이터 분석 모듈들을 제공한다.

여객선 센서 및 장비 정보 전송을 위한 ASM 설계 (Design of the protocol for reporting sensor data on passenger ship)

  • 김길용;조기정;이서정
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2016년도 춘계학술대회
    • /
    • pp.62-63
    • /
    • 2016
  • 여객선에는 다양한 종류의 센서와 장비가 설치되어 있다. 이러한 센서와 장비로부터 수집되는 데이터는 여객선의 안전운항 분석을 위해 육상 시스템과 연계가 필요하지만 선박이 LTE 통신을 이용하지 못하는 지역을 운항할 경우 AIS, 위성, MF/HF 등과 같이 다른 대체 통신망을 이용한 정보 전송이 필요하다. 본 논문은 AIS 통신을 이용한 센서정보 전송을 위해 여객선에서 수집되는 센서 데이터의 프로토콜과 종류를 조사하고 선박 센서보고용 ASM 메시지를 설계하였다.

  • PDF

시맨틱 웹 기반 사용자 중심 검색시스템에 관한 연구 (A Study on Semantic Web based User Oriented Retrieval System)

  • 김창수;이종원;정회경
    • 한국정보통신학회논문지
    • /
    • 제19권4호
    • /
    • pp.871-876
    • /
    • 2015
  • 현재의 웹은 점점 늘어가는 데이터로 인해 효율적인 검색과 관리가 어려워지고 있다. 이를 개선하기 위한 방법으로 시맨틱 웹 기술이 개발되고 있다. 그러나 현재 사용되는 검색시스템들은 시맨틱 웹 기술을 도입하지 않음에도 압도적인 국내 사용률을 독점하고 있다. 이로 인해 시맨틱 웹에 대한 개발은 활성화 되지 않고 있으며, 검색시스템을 사용하는 사용자들 역시 시맨틱 웹의 사용률이 저조한 실정이다. 이에 본 논문에서는 현재 사용되고 있는 검색시스템을 분석하고, 제안하는 시스템의 온톨로지 구현 시 사용자가 사용한 데이터의 종류와 웹 서버의 게시판 사용 시 사용한 파일의 종류를 RDF 표현 규칙에 추가 설정하여 사용자 중심의 검색시스템을 설계 및 구현하였다.

계층 발생 프레임워크를 이용한 군집 계층 시각화 (Visualizing Cluster Hierarchy Using Hierarchy Generation Framework)

  • 신동화;이세희;서진욱
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권6호
    • /
    • pp.436-441
    • /
    • 2015
  • 군집화 알고리즘은 그 종류에 따라 만들어낼 수 있는 군집의 종류와 보여줄 수 있는 정보의 수준이 차이가 난다. 밀도기반 군집화 알고리즘은 데이터 분포 상의 임의의 모양을 가진 군집을 잘 잡아내지만 보여줄 수 있는 계층정보가 매우 적거나 없는 수준이고, 반면 계층적 군집화 알고리즘은 자세한 계층 정보를 보여주지만 구 모양의 군집 외에는 잘 잡아내지 못한다. 이 논문에서는 이러한 두 군집화 방식의 대표적 알고리즘인 OPTICS와 응집 계층 군집화 알고리즘의 장점만을 취하는 계층 발생 프레임워크를 제시하고 이와 더불어 효과적 데이터 분석을 위한 여러 시각화, 상호작용 기법을 지원하는 시각적 분석 애플리케이션을 제공한다.

항로표지 시뮬레이터용 데이터베이스 시스템의 설계 및 구현 (Design and Implementation of Database System for AtoN Simulator)

  • 오재용;박세길;김아영;이영주;권오석
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2013년도 추계학술대회
    • /
    • pp.380-381
    • /
    • 2013
  • 국내에는 선박의 안전항해를 위해서 다양한 종류의 항로표지가 설치되어 운영되고 있으며, 각 지방해양항만청에서 개별적으로 관리되고 있다. 현재 운영되고 있는 항로표지의 종류는 유인 등대를 포함하여 등부표, 입표, 음향표지, 전파 표지 등이 있으며, 그 설치 형태와 기능이 너무 다양하기 때문에 일반화 된 형태의 데이터로 통합 관리되지 못하고 있는 실정이다. 한편, 국제항로표지협회(IALA)에서는 항로표지 설계와 배치 계획에 대한 의사 결정을 지원하고 검증할 수 있는 항로표지 시뮬레이터 시스템의 필요성을 제기하고 있으며, 이를 위해서는 국내의 항만별 항로표지 데이터에 대한 통합 데이터베이스 구축이 반드시 필요하다. 본 논문에서는 국내 주요 항만에 설치되어 있는 주요 항로표지의 속성정보를 분석하고, 이를 바탕으로 항로표지 시뮬레이터용 데이터베이스 시스템을 설계하고 구축하는 방법에 대하여 기술한다.

  • PDF

Key Card Arranging 기법을 활용한 핸드폰 기기의 Key Mapping 가이드라인에 대한 연구 (A Study on the Guidelines of Key Mapping for Mobile Devices using the Method of Key Card Arranging)

  • 최진호;강한종;이근민;이경진;김정하
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 2부
    • /
    • pp.275-280
    • /
    • 2006
  • 1990년대 휴대폰이 일반화가 시작된 이후 지금까지 수많은 종류의 휴대폰이 출시되어왔다. 종류가 다양해진 만큼 기능, 목적, 사용방법 또한 다변화 되었고, 이로 인해 매일같이 쏟아져 나오는 휴대폰의 기능 및 사용방법에 대해 유저들은 항상 새로운 방식을 익히도록 강요되고 있다. 이에 본 연구에서는 Key Card Arranging 기법을 활용하여 현재 모바일 기기 사용자들의 멘탈 모델에 적합한 최적의 Key Mapping에 대한 가이드라인을 제시함으로써 최소한의 노력으로 사용자들이 정보기기를 활용할 수 있도록 하는데 그 목적이 있다. 본 연구를 위하여 국내의 대표적인 6개 휴대폰 회사별로 선별된 테스트 서브젝트들을 선정하여 실험을 실시 하였으며, 구체적인 방법론은 다음과 같다. 우선 핸드폰 기기 내의 Hot Key에 대한 Key Mapping을 중심으로 Key Card Arranging 기법과 In-depth Interview 방법론을 활용하여 선정된 서브젝트들을 대상으로 사용자 멘탈 모델에 대한 데이터를 취합하였다. 취합된 자료를 중심으로 정량적 데이터 분석 방법을 활용, 사용자의 휴대폰 키 맵핑에 대한 이상적인 멘탈 모델을 제안하고, 최종적으로 본 연구를 통하여 사용자에게 최적의 경험을 제공하기 위하여 휴대폰 Key Mapping에 대한 가이드라인들을 제시한다.

  • PDF

USN/RFID 환경에서 상황인식이 가능한 통합 미들웨어 System 설계 (Design of Integrated Middleware System to enable context-aware for USN/RFID Environment)

  • 한수;박상현;최용식;전영준;신승호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (D)
    • /
    • pp.174-178
    • /
    • 2006
  • 유비쿼터스 환경을 실현하기 위한 핵심 기술로 RFID가 주목받고 있고 많은 연구가 이루어지고 있다. RFID는 점점 소형화되고 주변의 모든 환경 및 사물에 부착 될 것이다. 이러한 환경에서 RFID Tag가 부착된 개체들의 관리와 Middleware의 중요성이 부각되고 많은 기관에서 연구가 진행되고 있다. USN/RFID 환경 하에서 사용하기 위한 Middleware는 다음과 같은 기능이 필요하다. 첫째, RFID가 부착 된 개체가 주위 환경에 민감한 개체일 경우 Middleware에서 자체적으로 상황을 인지하여 대처해야 한다. 둘째, 방대한 양의 raw 데이터 처리를 부하 없이 처리해야 한다. 셋째, 실제 RFID를 적용했을 경우 한 종류의 RFID 장비만을 사용하는 것이 아니므로 다양한 종류의 RFID 장비를 인식할 수 있는 Middleware가 필요하다. 본 논문에서는 RFID에 센서와 무선통신 기술을 결합하여 상황인식(context-aware)이 가능하고, 분산처리 환경을 도입하여 방대한 양의 데이터를 처리 가능하며, 다양한 프로토콜이나 주파수의 장비를 통합적으로 적용 가능한 Middleware의 설계를 제안한다.

  • PDF

표준기용 Spectroscopic Ellipsometer 제작

  • 조용재;조현모;김현종;신동주;이윤우;이인원
    • 한국결정학회:학술대회논문집
    • /
    • 한국결정학회 2002년도 정기총회 및 추계학술연구발표회
    • /
    • pp.38-39
    • /
    • 2002
  • Spectroscopic ellipsometer(SE)는 박막의 두께, 굴절률, 흡수율, 에너지 갭, 결정상태, 밀도, 표면 및 계면의 거칠기 등에 관한 유용한 정보들을 제공한다. (1-3) SE는 빛을 탐침으로 사용하기 때문에 비파괴적이고 비접촉식 박막물성 측정방법이며 편광변화에 대한 상대적 물리량을 측정함으로써 정밀도와 재연성이 매우 높은 장점들을 갖고 있다. 따라서 SE는 반도체 메모리 소자, 평판 디스플레이, DVD와 CD와 같은 데이터 저장장치 등을 제작하는 공정에서 박막에 관련된 공정계측장비로 사용되고 있다. 특히, 최근의 차세대 반도체 소자 개발에 관한 연구 등(4-6)에서는 수 nm 두께의 다양한 초박막들에 관한 물성연구가 주관심사이기 때문에 최고의 성능을 갖는 계측장비와 기술이 요구되고 있다. 따라서 본 연구에서는 그림과 같은 편광자(polarizer)-시료(sample)-검광자(analyzer)로 구성된 PSA구조의 표준기용 rotating-analyzer SE를 제작하게 되었다. 현재까지 개발된 ellipsometer의 수많은 종류들 중에서 null 형, rotating element 형, 그리고 phase modulation 형이 가장 많이 사용되고 있다. 여기서 element란 polarizer, analyzer, 또는 compensator와 같은 광 부품들을 지칭하는데 이 중 하나 또는 둘을 회전시키기 때문에 그 종류 또한 매우 많다. 이들 중에서 회전검광자형 ellipsometer는 입사각 정렬이 우수하고, 파장에 무관한 편광기만 사용하므로 비교적 넓은 광량자 에너지영역에서 정확도 높은 데이터를 얻을 수 있기 때문에 박막 상수의 정밀측정에 가장 적합하다. 특히, 본 연구에서 제작된 ellipsometer에는 간섭계 장치, polarizer tracking,(2) zone average,(1) 그리고 low-pass filter 등을 사용함으로써 측정오차를 최대한 줄이는 노력을 하였다.

  • PDF

객체 관계형 DBMS를 이용한 XBench 성능평가 (Peformance Evaluation of XBench using an Object-Relational DBMS)

  • 김재욱;송용호;이상원
    • 한국통신학회논문지
    • /
    • 제30권1C호
    • /
    • pp.9-17
    • /
    • 2005
  • XML은 데이터 표현과 교환을 위한 표준으로 급격히 자리잡아가고 있으며, XML 문서는 다양한 응용분야에 도입되고 있다. 이러한 흐름에 따라 데이터베이스 분야에서도 XML 문서 데이터의 효율적인 저장과 검색에 관한 연구가 활발히 진행되어왔다. 최근에 여러 상용 (객체) 관계형 DBMS에서 XML 데이터베이스를 지원하고 있으며, Native XML DBMS도 학계와 산업계에서 지속적으로 개발되고 있는 실정이다. 또한, 이러한 여러 종류의 XML 데이터베이스의 성능을 평가하기 위한 다양한 종류의 벤치마크가 제안되었다. 본 논문에서는 특정 객체 관계형 DBMS를 이용해서 XBench 벤치마크를 수행해서 객체 관계형 데이터베이스의 성능을 평가/분석하는데 향후 개선 방향을 밝히는데 그 목적이 있다.