• 제목/요약/키워드: 일정 정보 추출

검색결과 378건 처리시간 0.027초

온라인 빅 데이터 분석 결과와 상수도 통계 비교를 통한 데이터 가치 추출 (Data value extraction through comparison of online big data analysis results and water supply statistics)

  • 홍성진;유도근
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.431-431
    • /
    • 2021
  • 4차 산업혁명의 도래로 사회기반시설물의 계획 및 운영관리에 있어 데이터 분석을 통한 가치추출에 대한 관심은 매우 높은 상황이다. 데이터의 가용성과 접근성, 정부 지원 등을 평가하는 공공데이터 개방지수에서 한국은 1점 만점에 0.93점을 획득하여 경제협력개발기구 회원국 중 1위(2019년 기준)를 할 정도로 매우 높은 수준(평균 0.60점)이다. 그러나 공식적으로 발표 및 배포되는 사회기반시설물 관련 정보와 심도 있는 연구 분석이 필요한 정보는 접근이 여전히 제한적이라 할 수 있다. 특히 대표적인 사회기반시설물인 상수도시스템은 대부분 국가중요시설로 지정되어 있어 다양한 정보를 획득하고 분석하는데 제약이 존재하며, 관련 국가통계인 상수도통계에서는 누수사고 등과 같은 비정상적 상황에 대한 사고지점, 원인 등과 같은 세부정보는 제공하고 있지 않다. 본 연구에서는 웹크롤링 및 빅데이터 분석기술을 활용하여 과거 일정기간 발생한 지자체의 상수도 누수사고 관련 뉴스를 전수조사하고 도출된 사고건수를 국가 공인 정보인 상수도통계자료와 비교·분석하였다. 독립적인 누수사고 기사를 추출하기 위해서 중복기사의 제거, 누수 관련 키워드 정립, 상수도분야 이외의 관련기사 제거 등의 절차가 필요하며, 이와 같은 기법은 R프로그래밍을 통해 구현되었다. 추가적으로 뉴스기사의 자연어 처리기반 정보추출기법을 통해 누수사고 건수 뿐만 아니라 사고발생일, 위치, 원인, 피해정도, 그리고 대상 관로의 크기 등을 획득하여 상수도 통계에서 제시하고 있는 정보보다 많은 가치를 추출하여 연계할 수 있는 방안을 제시하였다. 제시된 방법론을 국내 A광역시에 적용하여 누수사고 건수를 비교한 결과 상수도통계에서 제시하고 있는 누수발생건수와 유사한 규모의 사고건수를 뉴스기사분석을 통해 도출할 수 있었다. 제안된 방법론은 추가적인 정보의 추출이 가능하다는 점에서 향후 활용성이 높을 것으로 기대된다.

  • PDF

수식 관계를 이용한 키워드 추출을 통한 검색 과정의 효율성 향상 (Keyword Extraction Using Modifying Relation to Improve Search Experience)

  • 문욱성;이신목
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.228-232
    • /
    • 2007
  • 정보화 시대에 방대한 양의 정보에서 필요한 정보를 효율적으로 찾아내는 것은 그 무엇보다도 중요하다. 이를 위해 많은 검색 엔진이 효율적인 검색 결과 제공을 위해 노력하고 있지만 그 인터페이스의 문제로 인하여 사용자가 검색결과를 효율적으로 받아들이기 어려우며 또한 원하는 정보를 검색하기 위해서는 일정 수준 이상의 검색 능력을 필요로 한다. 이 논문에서는 기존의 검색 엔진의 인터페이스 변경을 통하여 시각적인 연관성 정보를 제공하며 이를 통해 사용자가 검색 능력에 구애받지 않고 정확한 답을 얻을 수 있도록 유도한다. 또한 이 과정에서 기존의 키워드 추출 알고리즘의 문제점을 발견하여 이를 단어간의 수식 관계를 이용하여 해결하였다. 또한 단어간의 수식 관계를 이용하여 효율적으로 문서간의 연관성을 생성할 수 있는 알고리즘을 제시하였다.

  • PDF

시점 불변 게이트 인식을 위한 호모그래피의 추정 (Homography Estimation for View-invariant Gait Recognition)

  • 나진영;강성숙;정승도;최병욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (상)
    • /
    • pp.691-694
    • /
    • 2003
  • 게이트는 사람의 걷는 방법 혹은 그 특성을 나타내는 용어로써, 최근 컴퓨터 비젼 기술을 이용하여 개개인을 분별하기 위한 게이트 특징 정보를 추출하고자 하는 연구가 활발히 진행되고 있다. 그러나 영상을 기반으로 추출한 게이트 정보는 카메라의 시점에 종속적인 단점을 가지고 있다. 이러한 단점을 해결하기 위한 노력으로 3차원 정보를 획득하려는 연구가 진행되고 있으나 이는 카메라와 사람간의 거리, 카메라 파라미터 등 부가적인 정보를 필요로 한다. 본 논문에서는 영상내의 정보만을 이용하여, 카메라 시점에 종속적인 게이트 인식의 단점을 해결할 수 있는 방안을 제안한다. 먼저 실루엣 영상으로부터 걷는 방향을 찾아내고, 간단한 연산을 통해 평면 호모그래피를 추정한다. 추정된 호모그래피를 이용하여 측면 시점의 영상으로 재구성하면, 시점 변화에 비종속적인 게이트 정보를 추출할 수 있다. 본 논문에서 제안한 방법을 평가하기 위하여 실추엣 영상의 폭과 높이 변화를 비교하였다 실험을 통해 제안한 방법을 적용할 경우, 그렇지 않은 경우에 비하여 특징 변화가 적음을 확인하였고, 특히 보폭 통의 게이트 특징 정보가 일정한 값을 유지함을 볼 수 있었다.

  • PDF

래스터 지도상에서 3차원 인접 그래프를 이용한 문자 그룹핑 (Character Grouping using 3-D Neighborhood Graph on Raster Map)

  • 강용빈;옥세영;조환규
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권2호
    • /
    • pp.273-283
    • /
    • 1999
  • 래스터 지도에서 직선 또는 곡선과 중첩되어 있는 경우의 문자는 추출하기가 쉽지 않다. 따라서 본 논문에서는 고립되어 있는 문자뿐만 아니라 문자이외의 요소와 중첩되어 있는 문자도 효과적으로 추출할수 있는 분할 정복(divide and conquer) 개념에 기반한 문자 추출방법을 제시한다. 이를 위해 먼저 이미지의 연결 요소로부터 볼록다각형(convex hull)을 생성한다. 그리고 이 다각형이 충분한게 문자영역만을 포함할때가지 볼록 다각형을 이등분하면서 가장 긴 선분(투사 선분)을 기준으로 두 영역으로 분할한다. 다음으로 문자를 추출하기 위해서 이 선분을 기준으로 연결 요소상의 픽셀의 밀집도를 계산하는 알고리즘(프로파일링)을 적용한다. 또한 지도상에서 추출된 개별적인 문자들을 의미있는 단어들로 묶기(grouping)한 새로운 알고리즘을 소개한다. 특히 지도상에 나타나는 문자의 종류는 매우 다양하고 또한 이 문자들이 놓여있는 방향 역시 일정하지 않기 때문에 이러한 단어를 찾는 kd법은 쉽지 않다. 이를 위해 본 논문에서는 3차원 인접 그래프(3-D neighborhood graph)G를 소개한다. 이 그래프 G에서 각 노드는 하나의 분리된 문자를 나타내며 자신의 크기와 위치에 따라서 3차원 공간상에서 위치하게된다. 따라서, 크기가 큰 (작은)문자들은 보다 큰 (작은) z값을 가지고 되며 이 그래프 G에서 서로 인접한 노드들을 연결함으로써 지도상에 존재하는 서로 다른 종류의 문자 스트링을 추출할수 있다. 실험결과는 서로 다른 지도 이미지에 대해서 약 95% 이상의 단어 추출율을 보여준다.

음성의 특징벡터를 사용한 정규화 인식수법 (Normalized Recognition Method using Characteristic Vector of Speech Signal)

  • 최재승
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2011년도 추계학술대회
    • /
    • pp.616-618
    • /
    • 2011
  • 본 논문에서는 음성의 특징벡터를 추출하여 음성인식을 위한 인식 알고리즘을 제안한다. 본 논문에서 제안하는 방법은 사람의 음성을 정규화하여 시간지연신경회로망을 사용하여 음성인식을 하는 인식 알고리즘이다. 본 논문에서는 시간지연신경회로망을 이용하여 입력되는 음성정보를 일정시간 동안 학습시킨 후에 새로이 입력되는 정보를 인식하는 수법이다. 본 실험에서는 음성인식률에 의하여 본 알고리즘의 유효성을 확인한다.

  • PDF

HSI와 YIQ의 복합 색상정보를 이용한 차량 번호판 영역 추출 (The Extraction of Car-Licence Plates using Combined Color Information of HSI and YIQ)

  • 이화진;박형철;전병환
    • 한국정보처리학회논문지
    • /
    • 제7권12호
    • /
    • pp.3995-4003
    • /
    • 2000
  • 본 논문은 자가용과 영업용 차량의 컬러 영상에서 번호판 영역을 찾는 방법에 대한 연구이다. 번호판 영역 추출을 위해 차량 영상에서 번호판 영역은 차종에 따라 일정한 색상을 가지고 있다는 특징을 이용하였다. 본 논문에서는 단일 색상 정보에만 의존하지 않고, HSI 컬러모델의 색상 성분 H와 YIQ 컬러 모델의 색상 성분 Q를 결합하는 방식을 제안한다. 또한 처리 과정의 효율성을 높이기 위하여 입력 영상 전체를 처리하지 않고, 수평 라인별 탐색을 통해 번호판의 높이 구간을 찾도록 한다. H 성분과 Q 성분을 각각 사용한 경우와 두 색상 성분을 결합하여 추출한 경우를 비교 실험한 결과, H 성분에만 의존한 경우는 53.6%, Q 성분에만 의존한 경우는 82.1%, 결합 색상 성분에 의한 경우에는 94.6%의 추출률을 보였다.

  • PDF

상호주도형 대화 에이전트 구현을 위한 도메인 독립적 스크립트 언어 (Domain Independent Script Language for Constructing Mixed-Initiative Conversational Agent)

  • 임성수;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (B)
    • /
    • pp.269-273
    • /
    • 2006
  • 대화 에이전트의 역할은 사용자 입력으로부터 사용자의 의도를 분석하고 이에 따른 서비스를 제공하는 것이다. 하지만 사용자는 한 번에 서비스 제공에 필요한 모든 정보를 제공하지 않으므로 에이전트는 능동적으로 부가적인 정보를 추출할 수 있어야 한다. 따라서 자연스러운 대화를 진행하기 위해서 에이전트는 사용자주도형 대화와 시스템주도형 대화가 결합된 상호주도형 대화가 가능해야 한다. 본 논문에서는 상호주도형 대화를 제공할 수 있는 대화 에이전트의 스크립트(대화를 위한 데이터베이스) 언어를 제안한다. 제안한 방법은 대상 도메인에 맞춰서 대화 에이전트를 설계할 수 있도록, 도메인 관련 변수와 도메인 함수를 정의하여 사용할 수 있으며, 대화처리 기능으로, 사용자 의도 추론, 대화 흐름 관리, 사용자 입력 정보 추출 등의 기능을 지원한다. 제안한 방법의 가능성을 보이기 위해 일정관리 도메인에 제안하는 방법을 적용한다.

  • PDF

이동 경로 예측을 위한 의미 있는 장소 추출 방법 (Meaningful Location Extraction Method for User Path Prediction)

  • 김재광;이승훈;이지형
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 춘계학술발표대회
    • /
    • pp.321-323
    • /
    • 2012
  • 최근 모바일 기기 보급의 확산과 관련 기술의 발전으로 인해 사용자의 편의를 제공하는 다양한 서비스들이 제공되고 있다. 이러한 서비스 중에서 대표적인 것으로 사용자의 이동 경로를 파악하고 예측하여 알맞은 위치기반서비스(Location-based Service; LBS)를 제공하는 것이다. 위치기반서비스를 제공하기 위한 가장 핵심 기술은 사용자의 이동 경로를 파악하는 것인데, 기존의 이동 경로 파악 기술은 이전의 이동 경로 자료를 기반으로 현재 이동 경로를 유추하였다. 그러나 이전의 이동 경로 자료가 점점 증가함에 따라 방대한 자료를 보관하고 가공하는데 많은 비용이 발생하는 문제점이 있다. 본 논문에서는 이동 경로를 예측하기 위한 방법으로 사용자가 일정 지점에 머무는 시간 정보, 이동 거리 그리고 다른 사용자와의 소통 정보를 활용한다. 이 정보들을 활용하여 사용자에게 의미 있는 장소를 추출하고 이를 기반으로 사용자의 이동 경로를 예측할 때, 기존 방법과 비교하여 적은 비용으로 효과적인 경로 예측을 할 수 있다.

특정 도메인 문서 내 관계 트리플 추출 (The Triple Relationship Extraction from Domain Article)

  • 이효갑;김판구
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 춘계학술발표대회
    • /
    • pp.359-361
    • /
    • 2010
  • 최근 정보의 의미적 검색을 위해 국내외 포털을 중심으로 시멘틱 웹 검색과 관련된 연구가 진행되고 일정부분 사용되고 있다. 이러한 시멘틱 웹 검색은 기존 작성된 정보를 인간이 가장 쉽게 이해할 수 있는 subject, predicate, object로 구성된 RDF Triple형태로 바꾸어 이를 쉽게 접근하고자 하는 연구가 필요하다. 본 논문에서는 정보의 재가공 후 문서 내 트리플 관계를 추출하는 과정을 실험을 통해 제시한다. 이를 통해 웹 도메인과 컨텐츠 정확한 검색을 가능하게 하고 검색 시간을 단축시켜 효율을 높여주는 계기가 될 것이다.

음성인식 텍스트 분석을 통한 자동 일정 관리 시스템 개발에 관한 연구 (A Study on the Development of Automatic Schedule Management System through Speech Recognition Text Analysis)

  • 이해미;조위덕
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.279-282
    • /
    • 2022
  • 컴퓨터가 마이크 등의 소리 센서를 통해 얻은 음향학적 신호를 단어나 문장으로 변환시키는 기술인 음성 인식 기술과 인공지능 기술을 결합한 음성 대화 시스템에 대한 연구 진행 및 제품 출시가 활발하게 이루어지고 있다. 기존의 시스템을 사용하면서 날짜와 시간 외의 정보 추출 정도가 빈약하거나 자동 등록이 되지 않는 문제점을 확인하였다. 음성 인식 기술을 통해 얻은 텍스트에서 보다 많은 정보를 추출하고, 자동 등록 및 알림과 맛집 등 추가 정보 제공 시스템을 구축하는 것을 목표로 하였다.