• 제목/요약/키워드: 개방 데이터 마이닝

검색결과 19건 처리시간 0.033초

시맨틱 기반의 Open API 정보제공을 위한 시맨틱 어노테이션 기법 연구 (A Study on Semantic Annotation Scheme for Providing Open API information Based Semantic)

  • 김상일;김화성
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(B)
    • /
    • pp.175-176
    • /
    • 2011
  • 웹 서비스는 최근 급속한 발전과 함께 기존의 단절적이고 폐쇄적인 서비스에서 벗어나 정보를 개방하고 공유할 수 있는 웹 2.0 시대로 발전하고 있다. 또한 스마트 폰과 같은 휴대용 단말기의 빠른 보급과 함께 웹 서비스는 고정된 장소에서뿐만 아니라 이동 환경 등 다양한 장소에서 사용될 수 있어 웹 서비스에 대한 관심이 더욱 고조되고 있다. 이러한 웹 서비스는 Open API(Application Programming Interface)를 이용한 형태로 제공된다. 따라서 수집한 Open API 정보를 빠르고 쉽게 사용하려면 사용자에게 필요한 정보만을 제공할 수 있는 기술이 필요하다. 본 논문에서는 국외의 타겟 사이트에서 획득한 Open API 데이터를 기반으로 데이터 마이닝을 통한 Open API정보의 시맨틱 어노테이션에 대한 연구를 수행하였다.

공공데이터를 활용한 맞춤형 여행 네비게이션 시스템 구현 (Development of Customized Trip Navigation System Using Open Government Data)

  • 심범수;이한준;유동희
    • 인터넷정보학회논문지
    • /
    • 제17권1호
    • /
    • pp.15-21
    • /
    • 2016
  • 최근 정부는 창조경제라는 패러다임에 따라 다양한 분야의 공공데이터를 개방하고 여러 종류의 대국민 서비스를 구축하는 등 공공데이터 활용을 통한 가치창출에 역점을 두고 있다. 본 논문에서는 여행에 관한 공공데이터와 사용자 정보를 융합하여 사용자에게 맞춤형 여행 정보를 추천하는 시스템을 구현하였다. 본 시스템에서는 사례기반추론(CBR) 방식을 이용하여 사용자별 맞춤형 정보 추천이 가능하도록 하였다. 본 시스템은 사용자 중심의 여행 정보를 제공한다는 측면에서 기존의 여행 시스템들과 차별화된다고 할 수 있으며, 턴키(Turn-key) 방식의 콘텐츠 제공으로 사용자의 편의성을 극대화할 수 있는 유용한 도구로 활용될 수 있을 것으로 판단된다. 본 연구가 공공데이터의 성공적인 활용 사례가 되기를 기대한다.

사물인터넷 동향분석을 통한 Co-creation기반 스마트시티 구축 방안 (A Development Plan for Co-creation-based Smart City through the Trend Analysis of Internet of Things)

  • 박주섭;홍순구;김나랑
    • 한국산업정보학회논문지
    • /
    • 제21권4호
    • /
    • pp.67-78
    • /
    • 2016
  • 최근 세계 각국은 교통난, 주택난, 에너지 부족 등 많은 도시 문제를 해결하고 삶의 질을 높이기 위해 스마트시티 프로젝트를 적극적으로 추진하고 있다. 이는 사물인터넷의 발달로 인해 도시 자원의 효율적 통제 및 재사용을 통한 지속가능성, 편리성 및 친환경성을 갖춘 스마트시티의 구축이 가능해졌기 때문이다. 본 연구의 목적은 사물인터넷 기술 동향을 분석하고 사물인터넷 활용분야 가운데 하나인 스마트시티 구축을 위한 방안을 제시하는 데 있다. 이를 위해 비정형 데이터 분석의 하나인 텍스트마이닝 기법을 활용하여 2013년부터 2015년까지 전자신문 기사를 분석하였고 외국의 스마트시티 구축 사례를 조사하였다. 분석결과 빅데이터, 클라우드, 플랫폼, 센서 등이 스마트시티와 밀접한 관계가 있었다. 스마트시티의 성공적 구축을 위해서는 첫째, 도시내 이해관계자들이 모두 협력하여 가치사슬 전 과정에서 새로운 가치를 창출해내야 한다. 둘째, 빅데이터를 적극 활용하여야 하고 공공분야 데이터를 지금보다 더 적극적으로 개방하여야 한다. 본 연구는 빅데이터 분석 방법을 제시하여 후속 연구를 유발하였다는 학문적 기여도가 있다. 또한 실제 지방정부 및 행정기관에서 스마트시티 구축을 위한 정책 수립의 자료로 활용될 수 있는 실무적인 기여도가 있다. 본 연구에서는 사물인터넷 기술 동향을 분석하기 위해 '전자신문' 기사만을 선정하여 분석하였기 때문에 전체 동향을 반영하는 데 제한이 있을 수 있다.

토픽 모델링 기반의 국내외 공공데이터 연구 동향 비교 분석 (Topic Modeling-Based Domestic and Foreign Public Data Research Trends Comparative Analysis)

  • 박대영;김덕현;김건욱
    • 디지털융복합연구
    • /
    • 제19권2호
    • /
    • pp.1-12
    • /
    • 2021
  • 최근 4차 산업혁명으로 빅데이터의 성장과 가치는 지속적으로 증가하고 있으며, 정부에서도 공공데이터 개방과 활용에 적극적으로 노력하고 있다. 하지만 여전히 시민들의 공공데이터 활용 요구수준에는 미치지 못하는 상황이며, 현 시점에서 공공데이터 분야의 연구동향 파악과 발전 방향을 모색할 필요가 있다. 이에 본 연구에서는 공공데이터와 관련된 연구 동향을 파악하기 위해서 텍스트 마이닝 기법에서 주로 활용되는 토픽 모델링을 활용하여 분석하였다. 이를 위해 국내외 학술논문 중 '공공데이터', 'Public Data'의 키워드가 포함된 논문(국내 1,437건, 국외 9,607건)을 수집하여 LDA 알고리즘 기반의 토픽 모델링을 수행하였으며, 국내외 공공데이터 연구 동향을 비교 분석하여 정책적 시사점을 제시하였다. 분석 결과 국내의 경우 공공분야 정책 연구가 주를 이루고 있으며, 국외는 의료, 건강 관련 연구가 높게 나타났다. 토픽별 시계열로 살펴보면 국내는 '개인정보보호', '공공데이터 관리', '도시 환경' 분야의 연구가 증가하였으며, 국외는 '도시정책', '세포 생물학', '딥러닝', '클라우드·보안' 분야 연구가 활성화되고 있음을 확인할 수 있었다.

공간정보와 통계정보의 융합 활용을 위한 오픈플랫폼 아키텍처에 관한 연구 (A Study on the Open Platform Architecture for the Integrated Utilization of Spatial Information and Statistics)

  • 김민수;유정기
    • 지적과 국토정보
    • /
    • 제46권2호
    • /
    • pp.211-224
    • /
    • 2016
  • 정부 3.0에 근거하여 공공기관이 보유한 공공데이터를 개방하고 민간 활용을 적극 장려하고 있다. 최근, 이러한 공공데이터와 관련하여 다양한 비즈니스에서 기반 정보로서 활용가치가 매우 높은 공간통계정보가 웹상에서 활발히 이용되고 있다. 본 연구에서는 사용자들에게 이러한 대용량 공간통계정보에 대한 조회, 분석, 마이닝, 주제도 생성 등의 다양한 서비스를 안정적으로 제공할 수 있는 고가용성, 고신뢰성, 고성능의 오픈플랫폼 시스템 아키텍처를 제안하고자 한다. 특히, 민간부문과 공공부문의 모든 영역에서 활용도가 매우 높으며 정보의 종류에 따라 보안성이 매우 중요한 공간통계정보의 특성을 반영하여 행정망 기반의 내부 서비스 시스템과 인터넷망 기반의 외부 서비스 시스템 아키텍처를 상호 분리하여 제시한다. 또한, 비용 효율적이며 성능이 우수한 공간통계정보 오픈플랫폼 시스템 아키텍처를 구성하기 위하여 클러스터 기반의 다중화 서버 구성, 클라우드 기반의 가상 서버 구성, 그리고 CDN 기반의 서버 구성 등과 같은 기존의 다양한 서버 아키텍처 구성 방식에 대한 비교 분석을 수행하여 최적의 방식을 제안한다.

토픽모델링 기반의 국내외 미래 자동차 연구동향 비교 분석: CASE 키워드 중심으로 (Analysis of domestic and foreign future automobile research trends based on topic modeling)

  • 정호정;김건욱;김나경;장원준;정원웅;박대영
    • 디지털융복합연구
    • /
    • 제20권5호
    • /
    • pp.463-476
    • /
    • 2022
  • 과거 산업화 이후 자동차 산업은 내연기관 중심의 지속적인 성장을 하였으나, 최근 4차 산업혁명으로 큰 변화를 맞이하고 있다. 대다수의 기업들이 전기 자동차, 자율주행으로의 전환을 준비하고 있으며, 현시점에서 국내와 국외의 미래 자동차 연구동향을 비교 분석할 필요가 있다. 이에 본 연구에서는 미래 자동차 트렌드를 대표하는 CASE(Connectivity, Autonomous, Sharing, Electrification)와 관련된 키워드가 포함된 국내 4,002건, 국외 68,372건 논문을 수집하여 LDA 알고리즘 기반의 토픽모델링을 수행하였으며, 국내외 미래 자동차 연구동향을 비교 분석하여 정책적 시사점을 제시하였다. 분석 결과 국내의 경우 교통 인프라, 도시 내 교통효율, 교통정책 등과 같은 거시적인 측면에서의 연구가 주를 이루는 것으로 나타났으며, 국외는 객체인식, 사물인터넷, 전기자동차 소음 등의 차량기술과 관련된 연구가 활성화되고 있음을 확인할 수 있었다. 이를 통해 국내 공유자동차 부문에 있어 MaaS(Mobility-as-a-Service)와 관련한 정부의 기술지원이 필요하고 교통수단별 데이터 개방 필요성 등에 대하여 제시하였고, 이러한 분석결과는 미래 자동차 산업을 위한 기초자료로 활용될 수 있을 것으로 판단된다.

상황인식형 비즈니스 차트 추천기 개발을 위한 개방형 온라인 텍스트로부터의 시각화 규칙 추출 방법 연구 (A Method of Mining Visualization Rules from Open Online Text for Situation Aware Business Chart Recommendation)

  • ;권오병
    • 한국전자거래학회지
    • /
    • 제25권1호
    • /
    • pp.83-107
    • /
    • 2020
  • 데이터의 성격과 시각화의 목적에 따라 비즈니스 차트를 선택하는 것은 비즈니스 분석에 유용한 지식이다. 그러나 현재 시각화 도구에는 상황에 맞는 비즈니스 차트를 선택할 수 있는 기능이 부족하다. 또한 매번마다 시각화 방법에 대해 전문가의 도움을 요청하는 것은 비용과 시간이 소요된다. 따라서 본 연구의 목적은 온라인으로 게시된 문서로부터 비즈니스 차트 선정 규칙에 대한 지식을 추출하여 비즈니스 차트 생산성을 향상시키는 방법을 제안하는 것이다. 이를 위해 인터넷에서 비즈니스 차트를 묘사하는 한국어, 영어 및 중국어 비정형 데이터를 수집하고 TF-IDF를 사용하여 컨텍스트와 비즈니스 차트 간의 관계를 계산했다. 또한 Galois 래티스를 사용하여 비즈니스 차트 선택 규칙을 생성했다. 제안된 방법으로 생성된 규칙의 품질을 평가하기 위해 실험군과 대조군에 대해 실험을 수행했다. 그 결과 제안된 방법으로 의미 있는 규칙이 추출되었음을 확인했다. 본 연구의 결과물로 시각화 전문가의 도움 없이도 사무직 직원들이 비즈니스 차트를 효율적으로 선택할 수 있을 것으로 기대된다. 또한 작업 중인 문서를 기반으로 비즈니스 차트를 추천함으로 직원 교육에 유용할 것이다.

서울로 7017 방문자들의 이용행태 분석 -텍스트 마이닝과 소셜 네트워크 분석을 중심으로- (Analysis of Behavior of Seoullo 7017 Visitors - With a Focus on Text Mining and Social Network Analysis -)

  • 우경숙;서주환
    • 한국조경학회지
    • /
    • 제48권6호
    • /
    • pp.16-24
    • /
    • 2020
  • 본 연구는 국내 최초의 공중보행로인 서울로 7017의 이용행태를 이용객이 자율적으로 서술한 블로그를 분석하여 이용현황을 파악하고, 서울로 7017의 이용행태 및 개선방안을 제시하는 것을 목적으로 하였다. 이에 서울로 7017이 시민에게 개방된 2017년 6월부터 2020년 5월까지로 검색엔진 NAVER·DAUM의 블로그 제목과 원문에 '서울로 7017'이 포함된 텍스트 데이터를 빅데이터 기법인 텍스트 마이닝(Text Mining)과 소셜 네트워크(Social Network; 사회연결망)분석을 활용하여 분석하였다. 연구결과의 요약은 다음과 같다. 먼저 서울로 7017의 주요 행태는 '야경'과 '걷다'이고, 영향을 미치는 요소는 문화·예술과 관련된 요소로 여러 가지 프로그램 및 축제를 이용객의 요구에 맞는 프로그램을 개설하고 적극적으로 알린다면 주요 행태가 더 활발하게 일어나게 할 수 있을 것이다. 한편, 서울로 7017의 이용객들이 원하는 주요행태는 정적 행태인 '앉다'인데, 앉는 행태가 일어나기에 물리적인 조건이 충분하지 않으므로 그늘, 벤치 등 앉는 행태가 일어날 수 있는 시설을 개선하여 방문객의 요구를 충족시킬 수 있을 것이다. 서울로 7017의 행태변화의 특이점으로 코로나19로 인하여 공공다중이용시설 및 집단 활동이 제한되면서 혼자 여행하기 좋은 곳, 혼자 산책하기 좋은 곳으로 인식되고 있다는 점이다. 이에 코로나19와 같은 상황에서 사람들이 산책 등을 할 수 있는 시설, 여러 가지 볼거리 증대 등을 통하여 더 다양한 행태가 도출될 수 있고, 이용객의 만족도를 높일 수 있다. 서울로 7017은 국내 최초의 공중보행로서 공공공간의 의미를 넘어 주변 지역의 도시재생 및 도시자원의 효율적 활용을 위하여 조성되었으며, 역사, 자연, 복지, 문화, 관광자원 등 다양한 가치를 지니고 있는 장소이다. 그러나 이용행태 분석 결과, 서울로 7017에서 다양한 행태가 일어나지 않고 있으며, 주요 행태를 방해하는 요소가 도출되었다. 이러한 연구 결과를 참고하여 서울로 7017의 이용행태를 파악하고, 공간체계 및 시설 개선의 계획을 수립하여 서울로 7017이 도시민들에게 중요한 장소이자 도시를 활성화하는 동력이 될 수 있도록 발전시켜 나가야 할 것이다.

소셜미디어에 나타난 풍력발전시설의 경관 인식 연구 (A Study on the Landscape Cognition of Wind Power Plant in Social Media)

  • 우경숙;서주환
    • 한국조경학회지
    • /
    • 제50권5호
    • /
    • pp.69-79
    • /
    • 2022
  • 본 연구는 최근 신재생에너지원으로 관광, 여행 등의 목적을 가지며 관광자원의 역할을 할 수 있는 풍력발전시설의 경관 인식을 파악하였다. 이에 지역별로 방문객이 경험한 풍력발전시설의 경관과 관련된 소셜미디어 데이터를 분석하였다. 분석 결과, 풍력발전시설의 경관을 인식할 때 연구대상지에서 공통적으로 풍력발전시설의 규모, 조망점과 풍력발전시설 간의 거리, 조망점에서 풍력발전시설을 볼 때 시각적 개방성, 풍력발전시설이 위치하고 있는 지형에 따라 달라지는 것을 알 수 있다. 또한, 풍력발전시설의 선호는 풍력발전시설의 형태와 주변경관을 파악할 수 있는 장소인 평지나 바다에 설치되어 있는 곳을 더 좋은 경관이라고 인식하고 있다. 특이한 점으로 경관에 대한 부정적인 키워드는 강원도 태백 가덕산, 태백 매봉산, 태기산과 경상도 경주 풍력발전시설에서 나타났다. 부정적인 키워드는 풍력발전시설을 가까이 조망했을 때 조망각이 높아 느껴지는 압도적인 크기와 산의 능선이 함께 보이는 경관에서 심리적 위압감을 느끼고 있음을 알 수 있다. 반면, 평지나 바다가 보이는 경관의 풍력발전시설에서는 긍정적인 경관 형용사가 도출되어 방문객은 경관의 스카이라인이 산 능선과 겹쳐서 보이거나 너무 가까이에서 풍력발전시설을 바라볼 때보다 평지나 바다에서 경관의 시각량이 충분히 확보될 때 그 장소를 대표할 만한 상징적인 요소라고 인식하고 있음을 알 수 있다. 본 연구는 풍력발전시설을 경험한 방문객의 의견을 토대로 경관 인식을 분석하였다. 그러나 풍력발전시설은 설치되는 권역별로 경관특성이 다르고, 시점, 관찰자 등 변수가 많아 연구결과를 일반화시키기 어려운 한계가 있다. 최근 풍력발전시설 조성 시 발생하는 경관훼손이 주요 이슈가 되고 있고, 국내에는 풍력발전시설의 경관을 평가할 수 있는 방법이 미흡하다. 이에 풍력발전시설의 경관을 평가할 시 풍력발전시설의 규모, 풍력발전시설이 설치된 지역 고유의 자연적 특성, 풍력발전시설과 조망점과의 거리가 중요한 구성요소로 나타난 것은 주목할 사항이라 판단된다. 또한, 풍력시설은 보전해야 할 자연환경에 설치되는 시설로 추후 경관적 관점에서 풍력발전시설과 주변 환경을 바라보는 경관의 연구가 필요하다.