• 제목/요약/키워드: data scientist

검색결과 86건 처리시간 0.029초

IMPLEMENTATION OF SUBSEQUENCE MAPPING METHOD FOR SEQUENTIAL PATTERN MINING

  • Trang, Nguyen Thu;Lee, Bum-Ju;Lee, Heon-Gyu;Ryu, Keun-Ho
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2006년도 Proceedings of ISRS 2006 PORSEC Volume II
    • /
    • pp.627-630
    • /
    • 2006
  • Sequential Pattern Mining is the mining approach which addresses the problem of discovering the existent maximal frequent sequences in a given databases. In the daily and scientific life, sequential data are available and used everywhere based on their representative forms as text, weather data, satellite data streams, business transactions, telecommunications records, experimental runs, DNA sequences, histories of medical records, etc. Discovering sequential patterns can assist user or scientist on predicting coming activities, interpreting recurring phenomena or extracting similarities. For the sake of that purpose, the core of sequential pattern mining is finding the frequent sequence which is contained frequently in all data sequences. Beside the discovery of frequent itemsets, sequential pattern mining requires the arrangement of those itemsets in sequences and the discovery of which of those are frequent. So before mining sequences, the main task is checking if one sequence is a subsequence of another sequence in the database. In this paper, we implement the subsequence matching method as the preprocessing step for sequential pattern mining. Matched sequences in our implementation are the normalized sequences as the form of number chain. The result which is given by this method is the review of matching information between input mapped sequences.

  • PDF

Implementation of Subsequence Mapping Method for Sequential Pattern Mining

  • Trang Nguyen Thu;Lee Bum-Ju;Lee Heon-Gyu;Park Jeong-Seok;Ryu Keun-Ho
    • 대한원격탐사학회지
    • /
    • 제22권5호
    • /
    • pp.457-462
    • /
    • 2006
  • Sequential Pattern Mining is the mining approach which addresses the problem of discovering the existent maximal frequent sequences in a given databases. In the daily and scientific life, sequential data are available and used everywhere based on their representative forms as text, weather data, satellite data streams, business transactions, telecommunications records, experimental runs, DNA sequences, histories of medical records, etc. Discovering sequential patterns can assist user or scientist on predicting coming activities, interpreting recurring phenomena or extracting similarities. For the sake of that purpose, the core of sequential pattern mining is finding the frequent sequence which is contained frequently in all data sequences. Beside the discovery of frequent itemsets, sequential pattern mining requires the arrangement of those itemsets in sequences and the discovery of which of those are frequent. So before mining sequences, the main task is checking if one sequence is a subsequence of another sequence in the database. In this paper, we implement the subsequence matching method as the preprocessing step for sequential pattern mining. Matched sequences in our implementation are the normalized sequences as the form of number chain. The result which is given by this method is the review of matching information between input mapped sequences.

The Distributed Management System of Moving Objects for LBS

  • Jang, In-Sung;Cho, Dae-Soo;Park, Jong-Hyun
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2002년도 Proceedings of International Symposium on Remote Sensing
    • /
    • pp.163-167
    • /
    • 2002
  • Recently, owing to performance elevation of telecommunication technology, increase of wireless internet's subscriber and diffusion of wireless device, Interest about LBS (Location Based Service) which take advantage of user's location information and can receive information in concerning with user's location is increasing rapidly. So, MOMS (Moving Object Management System) that manage user's location information is required compulsorily to provide location base service. LBS of childhood such as service to find a friend need only current location, but to provide high-quality service in connection with Data Mining, CRM, We must be able to manage location information of past. In this paper, we design distributed manage system to insert and search Moving Object in a large amount. It has been consisted of CLIM (Current Location Information Manager), PLIM (Past-Location Information Manager) and BLIM (Distributed Location Information Manager). CLIM and PLIM prove performance of searching data by using spatiotemporal-index. DLIM distribute an enormous amount of location data to various database. Thus it keeps load-balance, regulates overload and manage a huge number of location information efficiently.

  • PDF

과학기술정보 서비스 플랫폼에서의 빅데이터 분석을 통한 개인화 추천서비스 설계 (Personal Recommendation Service Design Through Big Data Analysis on Science Technology Information Service Platform)

  • 김도균
    • 한국비블리아학회지
    • /
    • 제28권4호
    • /
    • pp.501-518
    • /
    • 2017
  • 연구자들에게 지식을 습득하여 연구 활동에 도입하는데 걸리는 소요시간을 단축하는 것은 연구생산성 향상에 필수적인 요소라고 할 수 있다. 본 연구의 목적은 한민족과학기술자네트워크(KOSEN) 사용자들의 정보 이용 패턴을 군집화하고 그룹화 된 사용자들에게 맞는 개인화 추천서비스 알고리즘의 최적화 방안을 제안하는 것이다. 사용자들의 연구활동과 이용정보에 기반하여 적합한 서비스와 콘텐츠를 식별한 후 Spark 기반의 빅데이터 분석 기술을 적용하여 개인화 추천 알고리즘을 도출하였다. 개인화 추천 알고리즘은 사용자의 정보검색에 소요되는 시간을 절약하고 적합한 정보를 찾아내는데 도움을 줄 수 있다.

여성정보인의 정보화에 대한 기술적 애로사항 및 IT 교육 요구 사항 조사 연구 (A Study on the Technological Difficult Problems and Education Demand for Information Technology Sectors Women)

  • 조영임;정형철;김지현
    • 공학교육연구
    • /
    • 제12권3호
    • /
    • pp.31-40
    • /
    • 2009
  • 본 연구에서는 여성정보인의 여러 인구통계학적 속성과 더불어 여성정보인이 정보화에 대한 기술적 애로사항이 무엇이며, 이에 대한 해결책으로 IT 교육에 대한 수요 및 필요로 하는 IT 교육에 대해 살펴보고, 향후 업무와 관련된 활동에 있어 여성 정보인에게 선행되어야 할 소양이 무엇인가를 설문조사를 통해 분석하였다. 특히, 데이터마이닝 기법의 연관성분석을 사용하여 여성정보인 협회에서 제공하여야 하는 교육프로그램과 기 취업자 관점에서 후배 여성정보인이 취업 시 갖추어야 할 분야에 대한 다양한 분석을 시도하였다. 자료분석은 SAS의 데이터마이닝 툴을 사용하였다.

Direct Geo-referencing for Laser Mapping System

  • Kim, Seong-Baek;Lee, Seung-yong;Kim, Min-Soo
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2002년도 Proceedings of International Symposium on Remote Sensing
    • /
    • pp.423-427
    • /
    • 2002
  • Contrary to the traditional text-based information, 4S(GIS,GNSS,SIIS,ITS) information can contribute to the citizen's welfare in upcoming era. Recently, GSIS(Geo-Spatial Information System) has been applied and stressed out in various fields. As analyzed the data from GSIS arena, the position information of objects and targets is crucial and critical. Therefore, several methods of getting and knowing position are proposed and developed. From this perspective, Position collection and processing are the heart of 4S technology. We develop 4S-Van that enables real-time acquisition of position and attribute information and accurate image data in remote site. In this study, the configuration of 4S-Van equipped with GPS, INS, CCD and eye-safe laser scanner is shown and the merits of DGPS/INS integration approach for geo-referencing is briefly discussed. The algorithm of DGPS/INS integration fur determination of six parameters of motion is eccential in the 4S-Van to avoid or simplify the complicated computation such as photogrammetric triangulation. 4S-Van has the application of Laser-Mobile Mapping System for three-dimensional data acquisition that merges the texture information from CCD camera. The technique is also applied in the fields of virtual reality, car navigation, computer games, planning and management, city transportation, mobile communication, etc.

  • PDF

가속적(加速的)으로 성장(成長)하는 인간지식(人間知識)과 과학정보(科學情報)

  • 오익상
    • 정보관리연구
    • /
    • 제2권4호
    • /
    • pp.3-5
    • /
    • 1964
  • This first part of a series provides some data on the quick growth, high importance and increasing cost of scientific research which leads to a doubling of the amount of research literature in about every eight years. The importance of periodicals is emphasized and some figures on the growth of abstract journals demonstrate how difficult it has become for the scientist to keep up with the current development in his subject field without using documentation. The second part, in KORSTIC's next issue, deals with the scope and methods of scientific documentation, the third part with the devices and machines for information processing and with the problem of automation, whilst the fourth part throws some light on the organization of documentation work all around the world.

  • PDF

빅데이터 기반 디지털 마케터 전문가 양성을 위한 교육과정 개발 관련 연구 (A Study on Curriculum Development for Big Data Driven Digital Marketer)

  • 이명호
    • 디지털융복합연구
    • /
    • 제19권5호
    • /
    • pp.105-115
    • /
    • 2021
  • 개인, 민간, 정부 등 다양한 영역에서 빅데이터 분석을 통한 많은 서비스가 제공되고 있다. 이러한 서비스를 제공하기 위한 데이터 사이언티스트 (Data Scientist) 교육에 대한 관심이 높아지고 있다. 특히 빅데이터 기반 마케팅 교육과정에 대한 관심이 높다. 본 연구는 빅데이터 시대를 맞아 방대하고 다양한 형태의 정보를 마케팅 관점에서 활용하기 위한 국내외 대학 빅데이터 기반 마케팅 관련 교육과정을 분석하였다. 분석 기준에 의해 수집된 디지털마케팅, 빅데이터 마케팅, 데이터 분석, 개발자 관련 과목 3,523개의 분석결과 빅데이터 시대에 필요한 데이터 사이언티스트 양성을 위해 특화된 교과과정이 적절하지 않은 것으로 분석 되었다. 본 연구에서 제안한 교육과정이 디지털 마케팅 및 빅데이터 기반 마케팅 교과과정 개발에 유용하게 참고 될 것으로 기대한다.

국가수준의 과학데이터 시각화 지원체계에 관한 연구 (A Study on the Supporting System for Scientific Data Visualization at the National Level)

  • 박동진;채균식;류범종;이상태
    • 정보관리연구
    • /
    • 제42권2호
    • /
    • pp.85-102
    • /
    • 2011
  • 전통적으로 과학데이터 시각화는 데이터 분석과 관련이 깊은 연구 수행과정 중의 하나로 간주되어 왔다. 그러나 최근 들어서 과학데이터 시각화의 연구영역 자체가 독립적인 학문분야로서 자리를 잡기 시작하면서 시각화의 기술 및 방법들이 점차 고도화되고 복잡해지고 있다. 그러나 과학데이터 시각화 연구가 개인 및 그룹의 연구자들 스스로의 노력으로 시각화 문제를 해결하는 데 있어서 한계가 있다. 따라서 전문집단에 의한 체계적인 지원의 필요성이 대두되고 있으며, 본 연구는 거시적 관점의 국가수준에서 어떻게 과학데이터 시각화를 체계적으로 지원할 것인가를 정책적인 시각에서 분석하였다. 구체적으로 기존 문헌의 조사를 통하여 주요 성공요인들을 파악하였으며, 집중적으로 투자해야 할 연구의 영역을 설정하였다. 다음으로 국가수준의 시각화 연구지원의 전략적인 방향과 전략적 과제를 제언하였다.

스마트폰으로 측정된 사용자의 이동속도분포에 관한 연구 (On the Distribution of the Movement Speed of Smartphone Users)

  • 김우진;장원철;송하윤
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권11호
    • /
    • pp.567-575
    • /
    • 2016
  • 스마트폰의 대중화로 이용자의 위치정보를 이용한 모바일 앱이 늘어나면서 위치정보에 대한 관심이 증가하고 있다. 본 논문에서는 위치정보를 이용한 사용자의 이동속도를 나타내는 간단한 분포함수를 찾고자 한다. 스마트폰에서 제공하는 위치정보는 경우에 따라 큰 오차가 발생할 수 있기 때문에 이를 제거하는 과정이 필요하다. 또한 이동속도 분포의 경우 교통수단에 따라 여러 가지 다른 분포들의 혼합분포로 표현할 수 있다. 속도의 분포함수를 찾기 위하여 혼합분포를 이용하여 꼬리부분에 해당하는 분포를 찾고 이부분을 설명할 수 있는 모수 분포모형을 찾는다.