• 제목/요약/키워드: 자동 수집

검색결과 1,087건 처리시간 0.025초

자동항해를 지원하는 적응형 웹 서핑 시스템 (An Adaptive Web Surfing System for Supporting Autonomous Navigation)

  • 국형준
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권4호
    • /
    • pp.439-446
    • /
    • 2004
  • 사용자 적응형 웹 서핑 시스템 설계를 위해 전체 시스템을 사용자 데이타 수집, 데이타 처리를 통한 사용자 프로파일 구축 및 개선, 그리고 사용자 프로파일의 적용을 통한 적응 등 세 단계로 나누어 접근할 수 있다. 본 연구가 설계한 세 부문의 에이전트들은 이들 각 단계에서 작업하며 상호 유기적인 협동을 통해 적응형 웹 서핑을 지원한다. 이들은 각각 대화식 인터페이스 에이전트(Interactive Interface Agent), 사용자 프로파일 에이전트(User Profile Agent), 그리고 자동항해 에이전트(Autonomous Navigation Agent)이다. 대화식 인터페이스 에이전트는 사용자 인터페이스를 제공하며 이를 통해 데이타를 수집하고 기계적 항해 지원을 수행한다. 사용자 프로파일 에이전트는 수집된 사용자 데이타를 처리하여 사용자 브라우징의 실시간에 사용자 프로파일을 동적으로 구축하고 갱신한다. 자동항해 지원 에이전트는 사용자 프로파일에 기초하여 사용자 관심과 가까운 웹 문서를 자동으로 선별하여 추천하는 자동 항해 모드를 제공한다. 본 연구가 제시하는 접근과 설계 방식은 향후 확장과 보완을 통해 실용 가능한 수준의 사용자 적응형 웹 서핑 시스템 구축에 활용될 수 있다.

클러스터링 방법을 이용한 차종인식 모형 (Recognition Model of the Vehicle Type usig Clustering Methods)

  • 조형기;민준영;최종욱
    • 한국정보처리학회논문지
    • /
    • 제3권2호
    • /
    • pp.369-380
    • /
    • 1996
  • 최근에 이르기까지 교통분야에서 차량에 관한 정보를 수집하기 위하여 사용되고 있는 검지쳬계는 유도식 루프검지기 (Inductive Loop Detector,ILD)이다. 유도식 검지기로 부터 수집되는 교통자료는 점유시간(차량이 검지기를 점유한시간)과 비점유시간(통행 차량과 차량간의 시간차)및 교통량이 기초 수집자료가 된다. 특히 점유 시간은 신호의 현시 길이를 결정 및 과포화제어를 위한 대기행렬예측 등 다양한 관제알고리즘에 있어서 핵심적인 자료이므로 높은 신뢰도가 요구된다. 이러한 신뢰도는 검지로 부터 수집될 수 있는 자료들을 토대로 통행 차종을 식별함으로써 향상시킬 수 있으며, 관련 관제 알고리즘의 신뢰도 향상은 물론 최근 관심이 고조되고 있는 무인자동감시 체계 및 교통정보 자동 수집장치의 개발을 유도할 수 있다. 본 논문에서는 통행하는 차량들에 대하여 수집 되는 기초자료를 기반으로 인식하기 위한 방법으로 통계적 클러스터링 방법 두 가지와 신경망 클러스터링 방법 등 세가지 방법을 제시하고, 결과로서 무인 자동감시 체계에 관한 활용 방법을 제시한다.

  • PDF

심층 웹 문서 자동 수집을 위한 크롤링 알고리즘 설계 및 실험 (Crawling algorithm design and experiment for automatic deep web document collection)

  • 강윤정;이민혜;원동현
    • 한국정보통신학회논문지
    • /
    • 제27권1호
    • /
    • pp.1-7
    • /
    • 2023
  • 심층 웹 수집은 검색 양식에 질의어를 입력하고 응답 결과를 수집하는 것을 의미한다. 심층 웹이 가진 정보는 정적으로 구성되는 표면 웹보다 약 450~550배 이상의 정보를 가지고 있을 것으로 추산한다. 정적인 방식에서는 웹페이지가 새로 고쳐지기 전까지 변화된 정보를 보여주지 못한다. 동적 웹페이지 방식은 실시간으로 필요한 정보가 갱신되어 웹페이지를 새로 불러오지 않아도 실시간 정보 제공이 가능한 장점이 있지만, 일반적인 크롤러는 갱신된 정보에 접근하는 데 어려움이 있다. 따라서 이들 심층 웹에 있는 정보들을 크롤러를 이용해 자동으로 수집할 방안이 필요하다. 이에 본 논문은 스크립트를 일반적인 링크로 활용하는 방법을 제안하였으며, 이를 위해 클라이언트 스크립트를 일반 URL처럼 활용이 가능한 알고리즘을 제안하고 실험하였다. 제안된 알고리즘은, 검색 양식에 데이터를 입력하는 일반적인 방법 대신 메뉴 탐색 및 스크립트 실행으로 웹 정보를 수집하는 데 중점을 두었다.

자동수집 기반 재난안전 기록정보자원 아카이브 설계 및 구축전략 (Design and Construction Strategy for Disaster and Safety Record Information Resources Archives Based on Automatic Acquisition)

  • 한희정;강주연;김용;오효정
    • 한국기록관리학회지
    • /
    • 제17권4호
    • /
    • pp.127-154
    • /
    • 2017
  • 최근 전 세계적으로 대형 복합 재난이 빈번하게 발생할 뿐 아니라 매해 반복되고 있다. 이에 따라 과거의 정리된 재난과 관련한 원시자료 및 가공정보에 대한 체계적인 관리와 활용에 대한 필요성이 증대되고 있다. 이에 본 연구는 범정부 차원에서 재난안전 기록정보자원을 종합적으로 제공하여 재난안전정보의 허브(Hub)로서 중추적 역할을 수행할 수 있는 자동수집 기반의 재난안전 기록정보자원 아카이브 구축 전략을 제안하고자 한다. 이를 위해 국내 외 재난아카이브 사례를 분석하여 재난안전 기록정보자원 아카이브 구축 시 고려할 사항들을 도출하였으며, 1) 재난안전 기록정보자원 전수조사, 2) 자동화 가능성 분석, 3) 아카이빙 대상 선별, 4) 메타데이터 자동수집에 이르는 4단계 구축전략을 제안하였다. 본 연구에서 제안하는 아카이브의 구축은 산발적으로 존재하는 정보의 통합관리와 정보의 공유 및 활용을 촉진하게 될 것이다.

한국어 단어 자동완성 시스템의 성능 분석 및 새로운 평가 방법 (Performance Analysis of a Korean Word Autocomplete System and New Evaluation Metrics)

  • 이성욱
    • Journal of Advanced Marine Engineering and Technology
    • /
    • 제39권6호
    • /
    • pp.656-661
    • /
    • 2015
  • 본 연구의 목적은 스마트폰이나 태블릿 PC와 같이 문자 입력이 수월하지 않은 모바일 기기에서 사용자로 하여금 최소한의 키입력을 통해 최대한 빠르고 정확히 원하는 단어를 얻을 수 있도록 도와주는 단어 자동완성 시스템의 성능을 평가하는 것이다. 우리는 트위터에서 대량의 데이터를 수집하였으며, 수집된 데이터의 사용빈도에 따라 유니그램(unigram) 사전과 바이그램(bigram) 사전을 각각 구축하였다. 구축된 사전을 사용한 단어 자동완성 시스템의 성능을 평가하였으며 기존의 평가방법보다 단어 자동완성 기능의 특성을 잘 반영한 키입력 수익률과 복원율을 새로운 평가 방법으로 제안하였다.

센서를 이용한 자동 실내 온도 제어시스템 설계 및 구현 (Design and Implementation of Automatic Control System in Room using Sensor)

  • 정규태;이은진;김흥수
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2015년도 춘계학술대회
    • /
    • pp.326-328
    • /
    • 2015
  • 건물에서 창문의 기능은 태양 복사열의 유입을 통해 실내의 환경을 조성하고 동절기에는 난방비의 절감을 유도할 수 있으나, 다른 구조체에 비해 단열 성능이 크게 떨어져 5배 이상의 에너지가 손실되어 에너지 취약 부위이다. 또한 하절기에는 태양 복사열 과다로 냉방비가 가중된다. 이에 본 논문에서는 일반 가정에서 온도, 습도, 조도, 일사량 등의 실내 환경 정보를 이용하여 창문 자동 제어시스템을 개발하고자 한다. 이 시스템은 다양한 센서를 이용하여 실내 환경 정보를 수집하고 수집된 정보를 이용하여 모터를 제어하여 창문을 제어 할 수 있는 시스템이다. 가정 내 에너지 절감을 위하여 창호와 블라인드에 환경 자동화 서비스를 제공하여 사용자의 만족도를 높이고 스마트폰을 이용하여 시스템 제어를 통해 생활 속에 편리함을 제공하고자 한다.

  • PDF

메타데이터를 활용한 기록물 자동분류 성능 요소 비교 (Comparison of Performance Factors for Automatic Classification of Records Utilizing Metadata)

  • 김영범;장우권
    • 정보관리학회지
    • /
    • 제40권3호
    • /
    • pp.99-118
    • /
    • 2023
  • 이 연구의 목적은 기록물의 맥락정보를 담고 있는 메타데이터를 활용하여 기록물 자동분류 과정에서의 성능요소를 파악하는데 있다. 연구를 위해 2022년 중앙행정기관 원문정보 약 97,064건을 수집하였다.수집한 데이터를 대상으로 다양한 분류 알고리즘과 데이터선정방법, 문헌표현기법을 적용하고 그 결과를 비교하여 기록물 자동 분류를 위한 최적의 성능요소를 파악하고자 하였다. 연구 결과 분류 알고리즘으로는 Random Forest가, 문헌표현기법으로는 TF 기법이 가장 높은 성능을 보였으며, 단위과제의 최소데이터 수량은 성능에 미치는 영향이 미미하였고 자질은 성능변화에 명확한 영향을 미친다는 것이 확인되었다.

다중 서버 구조를 갖는 Web 기반 음성 수집 시스템

  • 홍문기;강선미;장문수
    • 대한음성언어의학회:학술대회논문집
    • /
    • 대한음성언어의학회 2003년도 제19회 학술대회
    • /
    • pp.230-232
    • /
    • 2003
  • 음성에 관련된 연구분야에 있어서 음성 데이터 수집의 중요성은 매우 크다. 개발된 인식기나 분석기의 성능이 좋다 하더라도 실험에 사용된 음성 데이터의 질과 양에 따라서 실험 결과를 확정짓기가 어려운 점이 있다. 대개의 경우 음성 수집은 오프라인으로 이루어지는데, 실험에서 요구되는 특정 수집자에 대해서 일정 기간과 정해진 장소에서 반복 수집하는 것은 어려움이 많이 따른다. 그러므로 본 연구에서는 Web을 이용하여 음성 데이터 수집자로 하여금 다양한 시간과 장소에서 자유롭게 음성을 수집할 수 있도록 하였다. 이에 대하여 수집된 음성 데이터의 크기가 커짐에 따른 통신상에서 종종 발생하는 문제점을 개선하려는 목적으로 다중 서버를 두어 수집된 데이터는 지역 서버에 일단 저장되었다가 적절한 상황에서 메인 서버로 자동 전송하는 시스템을 구축하였다. 본 시스템은 서로 다른 실험에서 수집되는 데이터를 수집 지역서버를 지정해 줌으로서 수집자가 원하는 특정 지역 서버에서 별도로 관리할 수 있도록 구성되어 있다. 시간, 위치의 제약 없이 인터넷이 연결된 장소에서는 음성을 수집할 수 있고, 웹상 ActiveX 프로그램을 제공함으로써 일관된 끝점처리 및 잡음처리 기능을 반영할 수 있다. 또한 다양한 응용에 적절한 수집기의 인터페이스를 관리자 모드에서 변경하여 사용할 수 있도록 함으로서 넓은 층에서의 활용도를 높였다. (중략)

  • PDF

SVM을 이용한 음성채팅시스템의 성능 향상 방법 (Performance Improvement Methods of a Spoken Chatting System Using SVM)

  • 안혁주;이성희;송영길;김학수
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권6호
    • /
    • pp.261-268
    • /
    • 2015
  • 음성채팅시스템에서 사용자의 음성 질의는 자동음성인식기를 통하여 텍스트 질의로 변환된다. 만약 자동음성인식기의 1순위 결과가 틀린다면 이 오류는 그대로 음성채팅시스템에 전파된다. 자동음성인식기의 1순위 정밀도를 향상시키기 위하여 본 논문에서는 RankSVM을 이용하여 자동음성인식기의 n개 결과를 재순위화하는 후처리 모델을 제안한다. 채팅시스템을 학습하기 위해서는 대용량의 채팅 문장들이 필요하다. 만약 새로운 채팅 문장들이 학습데이터에 자주 추가되지 않는다면 채팅시스템의 응답은 금방 진부해질 것이다. 이러한 문제를 해결하기 위하여 본 논문에서는 SVM을 이용하여 TV와 영화 시나리오로부터 채팅 문장들을 자동으로 선택하는 데이터 수집 모델을 제안한다. 실험에서 제안된 후처리 모델은 후처리를 하지 않은 모델보다 정확률에서 4.4%, 재현율에서 6.4% 더 좋은 결과를 보였다. 그리고 제안된 데이터 수집 모델은 98.95%의 높은 정확률과 57.14%의 재현율을 보였다.

최신 네트워크 응용 분류를 위한 자동화 페이로드 시그니쳐 업데이트 시스템 (Automatic Payload Signature Update System for Classification of Recent Network Applications)

  • 심규석;구영훈;이성호;;김명섭
    • 한국통신학회논문지
    • /
    • 제42권1호
    • /
    • pp.98-107
    • /
    • 2017
  • 오늘날 네트워크 자원을 사용하는 응용이 증대되면서 네트워크 관리를 위한 트래픽 분석에서 현재 연구 단계의 한계가 드러나고 있다. 그런 한계를 해결하기 위한 다양한 연구가 진행되고 있는데 그 중 대표적인 연구인 시그니쳐 자동생성 연구는 응용 트래픽을 입력으로 트래픽의 공통된 패턴을 찾아 출력하는 과정이 자동화된 연구이다. 그러나 시그니쳐 자동생성 연구는 트래픽을 사용자가 수집해야 하는 반자동 시스템이기 때문에 트래픽 수집 단계에서 문제가 발생할 수 있고, 생성된 시그니쳐의 검증 과정이 포함되어있지 않기 때문에 시그니쳐의 정확도를 신뢰할 수 없는 한계가 있다. 본 논문에서는 시그니쳐 자동생성 시스템의 한계를 극복하기 위해 트래픽수집, 시그니쳐 생성, 시그니쳐 검증, 시그니쳐 관리까지 모든 과정이 자동으로 이루어지는 시스템을 제안한다. 제안하는 방법을 학내 망의 실제트래픽에 적용하여 추출한 시그니쳐는 분석률을 유지하며, 오탐률을 0으로 만드는 효과를 보였다.