• 제목/요약/키워드: Analysis of Query

검색결과 457건 처리시간 0.023초

비전공자 대상 기초 데이터과학 실습 커리큘럼 (Curriculum of Basic Data Science Practices for Non-majors)

  • 허경
    • 실천공학교육논문지
    • /
    • 제12권2호
    • /
    • pp.265-273
    • /
    • 2020
  • 본 논문에서는 비전공자들을 위한 교양과목으로 적용할 수 있는 기초 데이터과학 실습 커리큘럼을 제안하고, 엑셀(스프레드시트) 데이터 분석 도구를 활용한 교육 방법을 제안하였다. 데이터 수집, 데이터 가공 및 데이터 분석을 위한 도구에는 엑셀, R, 파이썬, SQL(Structured Query Language) 등이 있다. R, 파이썬 및 SQL은 데이터 과학을 실습하는 데 있어, 프로그래밍 언어와 자료구조를 이해해야 한다. 반면에, 엑셀 도구는 비전공자들에게도 친숙한 데이터 분석도구로서, 프로그래밍 언어에 대한 학습 부담이 없다. 그리고 기초적인 데이터과학 실습을 엑셀로 진행하면, 데이터과학 이론을 습득하는 데 집중할 수 있는 장점이 있다. 본 논문에서는 한 학기 분량의 기초 데이터과학 실습 커리큘럼과 주별 엑셀 실습 내용을 제안하였다. 그리고, 교육 내용 실체를 실증하기위해, 엑셀 데이터분석 도구를 활용하여, 선형 회귀 분석(Linear Regression Analysis) 예제들을 제시하였다.

3D GIS를 위한 3차원 구조화 및 처리기술 분석 (Analysis of 3D Data Structuring and Processing Techniques for 3D GIS)

  • 구흥대;정동기;유환희
    • 한국측량학회:학술대회논문집
    • /
    • 한국측량학회 2004년도 춘계학술발표회논문집
    • /
    • pp.375-382
    • /
    • 2004
  • Lately, 3D GIS begins to be widely used in many application fields. In this research, we proposed a survey and analysis result of research trends for 3D GIS technologies-acquisition of 3D spatial data, 3D features structuring, 3D visualization, data query, and transmission etc. The result is expected to give the helpful information for constructing research road-map on development of 3D GIS technologies.

  • PDF

전자상거래 데이터의 실시간 분석을 위한 데이터 스트림과 다수 릴레이션 간의 효율적인 연속 조인 처리 기법 (Efficient Processing of Continuous Join Queries between a Data Stream and Multiple Relations for Real-Time Analysis of E-Commerce Data)

  • 김해리;이기용
    • 한국전자거래학회지
    • /
    • 제18권3호
    • /
    • pp.159-175
    • /
    • 2013
  • 최근 들어 전자상거래 데이터의 실시간 공급이 가능해지면서, 전자상거래 데이터를 실시간으로 분석하고자 하는 요구가 급증하고 있다. 이를 위해서는 전자상거래 데이터 스트림과 디스크에 저장된 대규모 릴레이션 간의 연속 조인 질의를 효율적으로 처리하는 것이 매우 중요하다. 본 논문에서는 전자상거래 데이터 스트림과 디스크에 저장된 다수 릴레이션 간의 효율적인 연속 조인 질의 기법을 제안한다. 제안 방법은 기존 방법에 비해 서비스율을 크게 향상시키는 한편, 메모리 사용량을 크게 줄인다. 분석과 다양한 실험을 통해, 제안 방법은 기존 방법에 비해 서비스율과 메모리 사용량에서 더 효율적임을 보인다.

텍스트 마이닝을 이용한 2012년 한국대선 관련 트위터 분석 (Analysis of Twitter for 2012 South Korea Presidential Election by Text Mining Techniques)

  • 배정환;손지은;송민
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.141-156
    • /
    • 2013
  • 최근 소셜미디어는 전세계적 커뮤니케이션 도구로서 사용에 전문적인 지식이나 기술이 필요하지 않기 때문에 이용자들로 하여금 콘텐츠의 실시간 생산과 공유를 가능하게 하여 기존의 커뮤니케이션 양식을 새롭게 변화시키고 있다. 특히 새로운 소통매체로서 국내외의 사회적 이슈를 실시간으로 전파하면서 이용자들이 자신의 의견을 지인 및 대중과 소통하게 하여 크게는 사회적 변화의 가능성까지 야기하고 있다. 소셜미디어를 통한 정보주체의 변화로 인해 데이터는 더욱 방대해지고 '빅데이터'라 불리는 정보의 '초(超)범람'을 야기하였으며, 이러한 빅데이터는 사회적 실제를 이해하기 위한 새로운 기회이자 의미 있는 정보를 발굴해 내기 위한 새로운 연구분야로 각광받게 되었다. 빅데이터를 효율적으로 분석하기 위해 다양한 연구가 활발히 이루어지고 있다. 그러나 지금까지 소셜미디어를 대상으로 한 연구는 개괄적인 접근으로 제한된 분석에 국한되고 있다. 이를 적절히 해결하기 위해 본 연구에서는 트위터 상에서 실시간으로 방대하게 생성되는 빅스트림 데이터의 효율적 수집과 수집된 문헌의 다양한 분석을 통한 새로운 정보와 지식의 마이닝을 목표로 사회적 이슈를 포착하기 위한 실시간 트위터 트렌드 마이닝 시스템을 개발 하였다. 본 시스템은 단어의 동시출현 검색, 질의어에 의한 트위터 이용자 시각화, 두 이용자 사이의 유사도 계산, 트렌드 변화에 관한 토픽 모델링 그리고 멘션 기반 이용자 네트워크 분석의 기능들을 제공하고, 이를 통해 2012년 한국 대선을 대상으로 사례연구를 수행하였다. 본 연구를 위한 실험문헌은 2012년 10월 1일부터 2012년 10월 31일까지 약 3주간 1,737,969건의 트윗을 수집하여 구축되었다. 이 사례연구는 최신 기법을 사용하여 트위터에서 생성되는 사회적 트렌드를 마이닝 할 수 있게 했다는 점에서 주요한 의의가 있고, 이를 통해 트위터가 사회적 이슈의 변화를 효율적으로 추적하고 예측하기에 유용한 도구이며, 멘션 기반 네트워크는 트위터에서 발견할 수 있는 고유의 비가시적 네트워크로 이용자 네트워크의 또 다른 양상을 보여준다.

병원약제부의 약품식별업무와 질의응답업무에 관한 업무분석;한 대학병원의 경우 (Analysis on Drug Identification Service and other Drug-related Queries in a Hospital Pharmacy)

  • 최지홍;김정애;스리니바산샨무감;용철순;최한곤;유봉규
    • 약학회지
    • /
    • 제52권4호
    • /
    • pp.283-287
    • /
    • 2008
  • Drug identification service and other drug-related query service are becoming increasingly important in hospital pharmacy. The goal of this research was to investigate current situation of the service in hospital pharmacy, which recently implemented the services as part of provision of advanced hospital pharmacy service in order to assure national health improvement. We investigated the report performed from November 2006 through April 2007 in a university hospital located in Daegu, Korea. Number of drug identification service performed was 81 cases during the first three months period (period I), but it increased to 222 cases during the second three months period (period II), which suggested that the service was welcomed by medical staff in the hospital. Time to process each case was about 30 minutes in the period I while it was only 16 minutes in the period II. Proportion of the unidentifiable cases remained at about 25% during the entire period, which suggests that the system for the identification task appears to have some limitations such as unsatisfactory support from the Korea Pharmaceutical Association, laws, and regulations. A vast majority of drug-related queries were mostly from physicians (60.5%) followed by nurses and pharmacists. Time to process each drug-related query was 10.6 minutes in the period I while it was 6.9 minutes in the period II. Queries answered immediately were about 70% of all queries in the period I, but increased to about 85% in the period II.

워드 임베딩을 이용한 질의 기반 한국어 문서 요약 분석 및 비교 (Analysis and Comparison of Query focused Korean Document Summarization using Word Embedding)

  • 허지욱
    • 한국인터넷방송통신학회논문지
    • /
    • 제19권6호
    • /
    • pp.161-167
    • /
    • 2019
  • 현재 ICT 기반의 웹 서비스 발달과 빠른 최신 기술의 보급으로 인하여 생성되는 정보의 양이 기하급수적으로 증가하고 있다. 이와 더불어 사용자들은 자신이 원하는 정보를 얻기 위해서는 많은 시간과 노력을 필요로 한다. 문서요약기법은 사용자에게 주어진 문서의 문장과 핵심 단어들을 분석하여 효과적으로 요약문을 생성해주는 기술이다. 특히 한국어로 이루어진 문서는 언어의 특성상 기존 언어 분석 기법들을 적용하기 어렵다는 문제점이 있다. 따라서 한국어의 특성을 고려한 문서요약기법에 대한 연구가 필수적이다. 본 논문은 워드 임베딩 기법인 Word2Vec과 FastText를 활용하여 질의 기반의 한국어 문서요약 기법을 제안하고 그 결과를 비교 분석한다.

검색 편의성 향상을 위한 패턴 분석 기반 질의어 확장 (Pattern Analysis-Based Query Expansion for Enhancing Search Convenience)

  • 전서인;박건우;남광우;류근호
    • 한국산업정보학회논문지
    • /
    • 제17권2호
    • /
    • pp.65-72
    • /
    • 2012
  • 21세기 정보화시대에 정보자원의 양은 증대되고 있으며 필요한 정보를 손쉽게 취득하게 해주는 정보검색 시스템의 역할이 중요해지고 있다. 일반적으로 사용자가 원활한 검색을 하기 위해서는 검색하고자 하는 정보에 대한 충분한 사전 파악이 필요하며, 키워드를 식별하는 능력 또한 뛰어나야 한다. 하지만 대부분의 사용자들이 충분한 지식을 갖추고 검색을 수행하지 않으며 질의어에 적합한 효율적인 키워드를 연상하는데 많은 시간을 소비한다. 또한 여러 검색엔진에서 연관검색어 서비스를 제공하고 있지만 이는 검색어와 유사한 의미 내용이 대부분이며 사용자에게 맞는 확장/연관검색어를 제공하여 주지 못한다. 본 논문은 질의어 패턴 분석 기반의 사용자 확장 검색어 추출 및 추천을 통해 사용자의 검색 편의성을 제공하기 위한 시스템을 제안한다.

이동객체궤적에 대한 효율적인 최근접이웃검색 (Efficient Nearest Neighbor Search on Moving Object Trajectories)

  • 김규재;박영희;조우현
    • 한국정보통신학회논문지
    • /
    • 제18권12호
    • /
    • pp.2919-2925
    • /
    • 2014
  • 스마트폰과 같은 이동 통신 매체의 발달과 LTE, NFC, RFID 등 무선통신의 발달로 실시간으로 이동 객체의 위치데이터를 수집하여 활용하는 위치 기반의 서비스들이 다방면의 개발에 이용되고 있다. 이에 따라 대용량의 이동객체 위치 데이터들을 효율적으로 저장하는 방법과 여러 질의를 좀 더 빠르게 처리할 수 있는 방법들에 대한 연구들이 진행 중이다. 본 논문에서는 Douglas-Peucker 알고리즘을 응용하여 대용량의 이동객체궤적 데이터를 단순화하여 색인구조를 생성하고 이 색인 구조를 이용하여 최근접이웃검색 질의를 효율적으로 처리할 수 있는 알고리즘을 제안한다. 제안된 방법으로 대용량의 데이터가 더 적은 양의 데이터로 단순화 되고 얼마나 더 효율적으로 질의를 처리하는지 실험을 통하여 확인하였다.

모빌 컴퓨팅 환경에서 중복 디폴트서버를 이용한 쿼리 프로세싱 기법의 성능 분석 (Performance Analysis of Default Sever Replication Strategy for Query Processing in Mobile Computing)

  • 임성화;임성화;김재훈;김성수
    • 한국통신학회논문지
    • /
    • 제25권8A호
    • /
    • pp.1096-1103
    • /
    • 2000
  • 모빌 컴퓨팅에서는 모빌 호스트의 위치와 상태관리를 위하여 디폴트 서버기법이 널리 사용되는데 모빌 호스트로 전송되는 데이터는 먼저 디폴트 서버에 문의하여 해당 모빌호스트가 위치하는 로컬 서보로 전송된다. 디폴트 서버기법에 기반을 둔 SDN(single Default Notification) 기법에서는 클라이언트가 모빌 호스트와의 연결요청을 하면 쿼리서버를 통해 해당 디폴트 서버에 모빌 호스트의 위치 및 상태를 문의한 후 통신이 이뤄진다. 그러나 퀴리횟수가많고 디폴트 서버와의 거리가 멀거나 기지국의 수가 많을 경우 디폴트 서버와의 통신 오버헤드가 커지며 디폴트 서버에 결함이 발생할 경우 해당 모빌 호스트와의 연결이 불가능해진다 본 논문에서는 위와 같은 문제점을 해결하기 위해 디폴트 서버와의 통신비용을 줄이기 위한 디폴트 서버 중첩 기법에 제안한다.

  • PDF

태그결합을 이용한 불리언 검색에서 순위화된 검색결과를 제공하기 위한 시스템 설계 및 구현 (Design and Implementation of Tag Coupling-based Boolean Query Matching System for Ranked Search Result)

  • 김용;주원균
    • 정보관리학회지
    • /
    • 제29권4호
    • /
    • pp.101-121
    • /
    • 2012
  • 불리언 검색만을 제공하는 정보시스템들은 순위화된 검색 결과를 제공하지 않아 이용자들이 많은 시간을 들여 수많은 결과를 일일이 확인해야하는 단점이 있다. 따라서 본 연구에서는 불리언 검색 모델의 단점을 극복하기 위한 방법으로써 불리언 검색에서 적용되고 있는 색인 가중치 정보 대신에 태그 간의 결합 관계 정보를 이용하여 순위화된 검색 결과를 제공하기 위한 시스템을 제안한다. 본 연구에서 제안하고 있는 방법은 일반적인 키워드 질의 대신에 문서를 질의로 사용하기 때문에 해당 문서에서 질의로 사용하는 핵심태그를 추출한다. 질의 생성 과정에서는 태그결합도에 따라 다양한 그룹의 불리언 질의를 생성하고, 매칭 과정에서는 해당 질의어 그룹 간에 차별성 정보와 태그 중요도 정보를 이용하여 순위화를 처리한다. 본 연구에서 제안하고 있는 방법의 유용성을 평가하기 위하여 선정된 연구정보와 관련된 동향분석정보를 추출하는 과정에 적용하여 실험을 수행하였다. 또한 제안된 방법에 대한 이용자 평가를 위하여 다수의 이용자들을 대상으로 약 1년간 서비스를 제공하였으며 그 결과 높은 이용자 만족도를 확보할 수 있다고 조사되었다.