• 제목/요약/키워드: 유지관리문서

검색결과 163건 처리시간 0.027초

WCTT: HTML 문서 정형화 기반 웹 크롤링 시스템 (WCTT: Web Crawling System based on HTML Document Formalization)

  • 김진환;김은경
    • 한국정보통신학회논문지
    • /
    • 제26권4호
    • /
    • pp.495-502
    • /
    • 2022
  • 오늘날 웹상의 본문 수집에 주로 이용되는 웹 크롤러는 연구자가 직접 HTML 문서의 태그와 스타일을 분석한 후 수집 채널마다 다른 수집 로직을 구현해야 하므로 유지 관리 및 확장이 어렵다. 이러한 문제점을 해결하려면 웹 크롤러는 구조가 서로 다른 HTML 문서를 동일한 구조로 정형화하여 본문을 수집할 수 있어야 한다. 따라서 본 논문에서는 태그 경로 및 텍스트 출현 빈도를 기반으로 HTML 문서를 정형화하여 하나의 수집 로직으로 본문을 수집하는 웹크롤링 시스템인 WCTT(Web Crawling system based on Tag path and Text appearance frequency)를 설계 및 구현하였다. WCTT는 모든 수집 채널에서 동일한 로직으로 본문을 수집하므로 유지 관리 및 수집 채널의 확장이 용이하다. 또한, 키워드 네트워크 분석 등을 위해 불용어를 제거하고 명사만 추출하는 전처리 기능도 제공한다.

표준화된 데이터베이스 구축을 통한 지하철 통신설비의 효율적 관리방안 연구 (A Study on the Maintenance of Communication Facilities using the Standardized Database)

  • 김길동;신정렬;이우동;강승욱
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2004년도 학술대회 논문집 전문대학교육위원
    • /
    • pp.99-102
    • /
    • 2004
  • 21세기 정보화시대에 맞추어, 도시철도운영기관의 전략적 발전과 도시철도의 정보화 기술 축적 및 표준화된 정보 인프라 구축의 일환으로 도시철도 시설물 유지보수체계를 표준화하고 정보화시스템을 구축중에 있다. 이중, 도시철도 통신 설비의 효율적인 유지보수를 위해서 유지보수체계의 표준화 및 정보화시스템 구축을 통한 실시간 정보의 구축 및 기존 유지보수작업 이력정보의 관리가 매우 중요하다. 본 연구에서는 도시철도 통신 설비의 효율적인 유지관리를 위한 데이터베이스 설계 및 구축방안에 대하여 제시하였다. 통신 설비의 데이터베이스 구축을 위하여 표준분류체계를 수립하였고, 관리항목 및 유지보수작업항목을 표준화하였으며, 유지 보수업무절차를 표준화하고 도면 및 각종 문서양식을 표준화하였다. 통신 설비의 데이터베이스는 개체관계모델(ERB)을 사용하여 설계하였고 특히, 통신 설비는 위치정보와 밀접한 관계를 가지고 있으므로 일반 데이터 외에 GIS용 공간 데이터베이스를 구축하여 서로 연관된 Key를 가지고 상호조회가 가능하도록 설계하였다. 그리고, 통신 설비에 대한 기초 데이터를 구축하기 위한 방안으로 엑셀조사 양식을 통하여 방대한 기초 자료를 작성하고, $SQL^*$Loader 등의 데이터 변환프로그램을 활용하여 데이터베이스에 일괄 등록되도록 하는 방안을 제시하였다 또한. 도면반입절차서 및 표준도면작성지침서, 그리고 GIS DB 구축지침서를 통하여 표준화된 데이터베이스 구축이 이루어지도록 하였다.

  • PDF

표준화된 데이터베이스 구축을 통한 지하철 신호장치의 효율적 관리방안 연구 (A Study on the Maintenance of Signal Facilities using the Standardized Database)

  • 김길동;신정렬;이우동;강승욱
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2004년도 학술대회 논문집 전문대학교육위원
    • /
    • pp.130-133
    • /
    • 2004
  • 21세기 정보화시대에 맞추어, 도시철도운영기관의 전략적 발전과 도시철도의 정보화 기술 축적및 표준화된 정보 인프라 구축의 일환으로 도시철도 시설물 유지보수체계를 표준화하고 정보화시스템을 구축중에 있다. 이중, 도시철도 신호 장치의 효율적인 유지보수를 위해서 유지보수체계의 표준화 및 정보화시스템 구축을 통한 실시간 정보의 구축 및 기존 유지보수작업 이력정보의 관리가 매우 중요하다. 본 연구에서는 도시철도 신호 장치의 효율적인 유지관리를 위한 데이터베이스설계 및 구축방안에 대하여 제시하였다. 신호 장치의 데이터베이스 구축을 위하여 표준분류체계를 수립하였고, 관리항목 및 유지보수작업항목을 표준화하였으며, 유지보수업무절차를 표준화하고 도면 및 각종 문서양식을 표준화하였다. 신호 장치의 데이터베이스는 개체관계모델(ERD)을 사용하여 설계하였고 특히, 신호 장치는 위치 정보와 밀접한 관계를 가지고 있으므로 일반 데이터 외에 GIS용 공간 데이터베이스를 구축하여 서로 연관된 Key를 가지고 상호조회가 가능하도록 설계하였다. 그리고, 신호 장치에 대한 기초 데이터를 구축하기 위한 방안으로 엑셀조사 양식을 통하여 방대한 기초 자료를 작성하고, SQL*Loader 등의 데이터 변환프로그램을 활용하여 데이터베이스에 일괄 등록되도록 하는 방안을 제시하였다 또한, 도면반입절차서 및 표준도면작성지침서, 그리고 GIS DB 구축지침서를 통하여 표준화된 데이터베이스 구축이 이루어지도록 하였다.

  • PDF

에서로-웹/$EK^{TM}$: 영한 웹 문서 번역 시스템 (FromTo-$Web/EK^{TM}$: English-to-Korean Machine Translation System for HTML Documents)

  • 심철민;여상화;정한민;김태완;박동인;권혁철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.277-282
    • /
    • 1997
  • 최근 들어 웹 상의 문서를 번역해 주는 번역 시스템이 상용화되고 있다. 일반 문서와 달리 웹 문서는 HTML 태그를 포함하고 있어 번역 시스템에서 문장 단위로 분리하는데 어려움이 있다. 또한 그 대상 영역이 제한되지 않으므로 미등록어 및 구문 분석 실패에 대한 대처 기능이 필요하다. 따라서 웹 문서의 번역 품질이 일반 문서 번역에 비해 현저히 떨어지게 된다. 이 논문에서는 HTML 태그를 보유한 영어 웹 문서를 대상으로 하는 번역 시스템인 "에서로-웹/EK"에 대해 기술한다. 에서로-웹/EK는 HTML 문서의 특성을 고려하여 태그를 분리, 복원하는 태그 관리자를 별도로 가진다. 또한 태그를 유지하면서 영어에서 한국어로 변환되는 과정에서 발생하는 어휘 분리, 어휘 통합, 어순 변환 둥의 다양한 변환 현상을 처리한다. 이 시스템은 변환 방식에 기반한 번역 시스템으로서 영어 해석, 영한 변환, 한국어 생성의 단계를 거친다. 구현된 시스템은 Netscape와 DDE(Dynamic Data Exchange) 방식으로 연동하여 HTML 문서를 번역한다.

  • PDF

WBIS를 이용한 건설공사현황관리시스템 설계 및 구현 (Construction present state managerial system specification and implementation based on the WBIS)

  • 김남곤;강의석;서명배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.397-399
    • /
    • 2003
  • 각 관공서나 공공기관에서 발생되는 각종 공사현황정보와 기술정보를 시설물 전체 수명주기동안 제대로 활용하기 위해서는 시설공사관리 업무를 전자처리체계로 전환하는 것이 시급하며, 사업계획에서 준공까지 일련의 과정에서 발생하는 문서들의 보관이 비체계적이므로 이를 잘 보관하고 재 사용하기 위한 관리체계가 필요하다. 따라서 본 연구는 공공건설분야를 담당하고 있는 지방국토관리청을 대상으로 사업단위별로 업무를 7가지로 세분화하고. 그 중에서도 핵심부분인 공공건설사업에 대한 체계적이고 효과적인 관리체계를 유지할 수 있는 웹 기반의 공사현황 정보시스템을 제안한다.

  • PDF

Ubiquitous-BIM 기술 기반의 철도교량 유지관리 운영체계 구축 전략 및 타당성 평가 (Development Strategies and Feasibility Evaluation of Maintenance Operation System for Railway Bridge Based on Ubiquitous-BIM Technology)

  • 문현석;김현승;강인석
    • 한국철도학회논문집
    • /
    • 제15권5호
    • /
    • pp.459-466
    • /
    • 2012
  • 기존의 철도교량 유지관리체계는 주로 정보누락, 문서위주 관리 및 유선기반의 정보수집 등으로 인하여 다양한 현장의 환경변화에 실시간 대응이 곤란하여 능동적인 철도교량 유지관리 전략 수립에 제약을 갖고 있다. 본 연구에서는 유비쿼터스 기반의 철도교량 유지관리 정보운용체계 구축을 위한 실무 활용모형과 건설 생애주기의 통합 정보관리체계인 BIM (Building Information Modeling) 개념을 적용하여 유지관리 통합 운용모형을 제안하고 있다. 이의 개발 및 실무적 적용의 타당성 확보를 위해 설문분석에 의한 정량적 평가를 수행하였다. 최근 철도교량의 지능형 유지관리 운영체계가 확대될 것을 고려하면, 본 연구의 제안사항은 운영체계 구축을 위한 통합 프레임워크로 활용될 수 있을 것이다.

질의응답문서 검색에서 문서구조를 이용한 질의재생성에 관한 연구 (Query Reconstruction for Searching QA Documents by Utilizing Structural Components)

  • 최상희;서은경
    • 정보관리학회지
    • /
    • 제23권2호
    • /
    • pp.229-243
    • /
    • 2006
  • 질의응답문서는 이용자가 입력한 질의, 질의설명, 답을 아는 다른 이용자가 제시한 응답으로 구성된 구조화된 문서로서, 최근 웹 문서처럼 검색이 일반적으로 일어나고 있는 정보원이다. 이 연구에서는 질의응답문서의 구조적 특성을 기반으로 질의를 재생성하여 질의응답문서의 검색효율을 향상시키고자 하였다. 질의재생성 실험에서 성능이 비교된 문서구조는 질의와 응답내용이다. 질의를 기반으로 질의를 재생성하는 방식에서는 질의응답검색 시스템에 입력되어 있는 유사질의를 활용하여 클러스터링하는 기법이 적용되었다. 응답정보를 기반으로 질의를 재생성하는 방식에서는 가장 유사한 기존 질의에 대해 응답된 내용에서 단락검색으로 적합한 문장들을 선정하여 활용하는 기법이 적용되었다. 실험 결과 응답정보를 활용하여 질의를 재생성하는 방식이 정확률은 유지하면서 더 다양한 검색결과를 제공하는 것으로 나타났다.

XML 라이브러리의 효율적 재사용을 위한 비즈니스 정보 개발 방안 (Research on a Development of Business Information for the Efficient Reuse of XML Libraries)

  • 박찬권;김형도
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2008년도 추계 공동 국제학술대회
    • /
    • pp.656-663
    • /
    • 2008
  • XML 기술의 발전에 따라 확장성 있는 ebXML(Electronic Business eXtensible Markup Language) 기반의 스키마 사용이 확장되면서 점차 기존 EDI 전자문서나 DTD(Document Type Definition) 구조로 되어 있는 전자문서를 XML 스키마 형태로 변환하거나 새롭게 개발해고 있는 추세이다. 한국전자거래진흥원에서는 XML 전자운세 개발 지침과 함께 XML 라이브러리를 개발하여 제시함으로써 표준 XML 전자문서의 개발을 지원하고 있다. XML 전자문서 개발 지침은 ebXML CCTS 기술규격에서 제시하고 있는 방법론을 준용하고, UN/CEFACT ATG 그룹에서 개발한 XML Naming & Design Rule 규격을 국내에 맞게 수정하여 적용하고 있다. 또한 XML 라이브러리는 전자문서 개발지침에 따라 사전에 정의하고 개발해 놓은 핵심 컴포넌트와 비즈니스 정보 개체들로 구성되어 있다. 하지만 전자문서개발 지침상의 일부 규칙들이 의미상 명확하지 않은 상태에서 개발자의 임의적 선택의 폭을 허용하거나 개체의 명명에 대한 뚜렷한 기준을 제시하지 못함으로써 핵심 컴포넌트와 비즈니스 정보 개체의 검색 및 재사용을 제한하고 라이브러리 유지보수를 어렵게 하고 있는 실정이다. 본 연구에서는 XML 전자문서 개발지침 상의 일부 규칙에 대한 문제점을 분석, 규칙을 구제화함으로써 개발자 중립적인 핵심 컴포넌트와 비즈니스 정보 개체의 개발을 지원하고 라이브러리 관리를 효율적으로 수행할 수 있는 방안을 제시하고자 한다.

  • PDF

분산환경하에서의 Web 기반 작업관리기능 연구 (A Study on Web-based Workforce function in distributed Environments)

  • 김태규;이강원;조광문;김태윤
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (하)
    • /
    • pp.1249-1252
    • /
    • 2001
  • 작업관리기능은 서비스 처리의 적절한 흐름유지를 위하여 활용되고 있다. 작업관리는 기업의 업무에 참여하는 구성원들 사이에서 이루어지는 문서와 정보 또는 작업의 절차를 일종의 정의된 규칙에 의하여 자동화하는 것을 의미하며, 정의된 규칙을 수행하기 위하여 사전에 정의된 절차대로 타스크(task)를 생성, 관리하는 기능이다. 본 논문에서는 기업의 조직과 분산된 환경하에서의 작업관리기능을 CORBA 를 기반으로 활용이 편리하도록 Web으로 설계하였다. 타스크 템플릿을 이용하여 정형화된 규칙(rule)에 기반된 작업관리를 유지하였으며 예외처리, 다중 작업처리, 이기종간의 상호운용성은 CORBA 기반을 통하여 해결하였다. 연구된 기능은 이기종간 분산된 환경하에서 작업흐름의 반영이 용이하며, 단순한 상태기반과 사건기반의 흐름에 의한 작업관리기능에 비하여 신속한 서비스 제공이 가능함을 볼 수 있다.

  • PDF

XML Schema를 이용한 병원정보교환시스템 HIES의 확장 (Extension of a Hospital Information Exchange System using XML Schema)

  • 홍동완;노관준;박진만;김종덕;윤지희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.76-78
    • /
    • 2002
  • 최근 XML 문서는 여러 분야의 시스템에서 교환 표준으로 자리 잡고 있다. 의료 사업 분야에서도 병원간 자료를 전송을 하는데 XML을 사용하는 것이 유통하며, HL7에서도 병원 간 외부 교환 표준으로 XML 문서를 선정하였다. 교환 매개인 XML 문서는 DTD를 이용하여 유효성을 검증할 수 있는 있으나, DTD는 구조 표현과 데이터 형식지원의 한계로 인하여 복합 구조치 의료 데이터를 표현하기에 부족한 점이 있다. 병원정보교환시스템 HIES는 기존 병원 내의 시스템 구조론 유지한 채 병원 내 진료과 간이나 외부 병원 사이에 의료 데이터를 전산 공유할 수 있는 시스템으로, 대부분 복합구조의 의료 데이터를 전송하게 된다. 본 논문에서는 XML DTD 기반으로 구축되었던 HIES를 XML Schema를 이용하여 확장함으로써, 전송 문서의 내부 구조 변경, 정보 공유 관리자 및 동적 스키마 처리, 정보 보안 분야에서 얻는 이점을 보인다

  • PDF