• 제목/요약/키워드: 온라인 문서

검색결과 215건 처리시간 0.029초

웹 페이지의 내재 규칙 습득 과정에서 규칙식별 역할에 대한 효과 분석 (Effect of Rule Identification in Acquiring Rules from Web Pages)

  • 강주영;이재규;박상언
    • 지능정보연구
    • /
    • 제11권1호
    • /
    • pp.123-151
    • /
    • 2005
  • 오늘날 자원의 보고라 할 수 있는 웹에는 자연어로 표현된 텍스트와 테이블들로 구성된 무수히 많은 문서들이 존재하고 있다. 이러한 웹 문서들로부터 규칙을 습득하고 습득된 규칙과 웹 문서간의 일관성을 유지하기 위해, 본 논문에서는 확장형 규칙 표식 언어 (extensible Rule Markup Language, XRML) 체계를 개발하였다. XRML은 웹 페이지에 내재되어 있는 규칙을 식별하여 자동으로 정형화된 규칙을 생성할 수 있도록 지원하는 규칙 식별 표식 언어 (Rule Identification Markup Language, XRML)와 구조화된 규칙 표현을 위한 규칙 구조 표식 언어 (Rule Structure Markup Language)로 구성된다. 특히, RIML은 HTML안에 내재되어 있는 규칙을 HTML 문서에 직접 명시할 수 있도록 설계되었기 때문에, RIML을 통해 웹페이지에 있는 규칙들을 식별하고 이 식별된 규칙은 RSML으로 표현된 정형화된 규칙으로 자동 변환될 수 있다. 본 논문에서는 RIML의 설계 시 웹페이지로부터 규칙을 식별하는 과정에서 발생하는 공유되는 변수 (variables) 및 값 (values),생략된 어구 ,동의어와 같은 몇 가지 중요한 현상들을 발견하고 이를 해결하고자 하였다. 제안된 XRML 접근 방법의 성능을 측정하고자, 3개의 대표적인 온라인 서점인 Amazon.com, BarnesandNoble.com, Powells.com의 실제 웹페이지들로부터 배송 및 환불과 관련된 규칙을 습득하여 XRML의 효과를 측정하는 실험을 수행하였다. 실험 결과에 따르면, 웹페이지로부터 규칙은 $97.7\%$의 매우 높은 정확성을 가지고 습득되었으며, 생성된 규칙의 완전성은 $88.5\%$로 측정되어, XRML이 특정 주제에 관한 전문가 시스템을 구축하기 위해 웹페이지로부터 규칙을 추출할 때 효율적인 도구가 될 수 있음이 예시되었다.

  • PDF

텍스트 문서 기반의 감성 인식 시스템 (An Emotion Scanning System on Text Documents)

  • 김명규;김정호;차명훈;채수환
    • 감성과학
    • /
    • 제12권4호
    • /
    • pp.433-442
    • /
    • 2009
  • 요즈음 인터넷을 통해 물건을 구매하는 경향이 증가하고 있다. 또한 물건을 구매한 소비자는 리뷰, 댓글, 비평 또는 블로그 등의 형식으로 온라인에 그들의 사용 후기를 작성한다. 또한 작성된 사용 후기부터 많은 구매자들은 물건을 구매하기 전에 자신이 구입하고자 하는 물건에 대한 정보를 얻는다. 따라서 회사나 공공기관은 대중이 다른 사람의 의견에 관심을 기울인다는 점 때문에 대중의 의견을 수집하고 분석할 필요성에 직면하였다. 그러나 온라인상에 댓글이 너무 많고, 중복적이면서 짧은 경향이 있다. 이러한 환경 속에서 텍스트 문서의 감성을 인식하는 시스템의 필요성이 대두되었다. 텍스트로부터 작성자의 의견이나 주관적인 생각을 추출할 수 있게 영어에서는 단어에 속성이 주어진 GI와 LKB가 있으나 한글은 아직 속성이 주어진 사전이 존재하지 않는다. 이 논문에서는 한글 품사 중 4개의 품사(명사, 동사, 형용사, 부사)에 속성을 주었다. 그리고 학습 군을 만들어서 감성 단어의 패턴을 구성하고, 문장에서 단어 사이의 공기관계를 구성하여 학습 시켰다. 이 학습을 바탕으로, SO-PMI을 이용하여 문서를 긍정과 부정 2가지 극성을 분류하고, 4개의 품사(명사, 동사, 형용사, 부사)를 각각 조합하여 최상의 조건을 구하였다. 마지막으로 사용자 인터페이스를 통해 새로운 감성 표현, 구성형식, 단어 연관성을 반자동적으로 삽입하고 교정할 수 있는 시스템을 설계하였다.

  • PDF

원문정보공개 지원을 위한 민감정보 필터링 요건에 관한 연구 (A Study on Sensitive Information Filtering Requirements for Supporting Original Information Disclosure)

  • 오진관;오세라;최광훈;임진희
    • 한국기록관리학회지
    • /
    • 제17권1호
    • /
    • pp.51-71
    • /
    • 2017
  • 원문정보공개 서비스를 개시한 후 한해 천만 건에 가까운 전자 결재문서가 온라인을 통해 공개되고 있다. 하지만 대량의 전자결재문서를 정보공개 업무담당자가 모두 확인하여 원문정보공개 서비스를 수행하는 것은 현실적으로 불가능한 상황이다. 이에 따라 최근 일부 공공기관에서는 개인정보 필터링 도구를 활용하여 문서 생산단계에서 정형화된 개인정보를 필터링하고 있으나 비정형화된 민감정보는 관리되지 않고 있다. 본 연구에서는 원문정보공개 지원을 위해 사용 중인 필터링 도구 분석을 통해 필터링 도구의 고도화 방향을 설정하였으며, 필터링 도구 활용단계가 추가된 결재문서 본문 작성과 원문정보공개 프로세스를 재설계하였다.

인터넷쇼핑몰의 사업자신원정보 구조화 방안 (An Approach to Structuralizing Business Information for Internet Shopping Malls)

  • 장용식
    • 지능정보연구
    • /
    • 제10권1호
    • /
    • pp.27-45
    • /
    • 2004
  • 온라인 쇼핑이 증가하고 있는 가운데, 우리나라는 "전자상거래 등에서의 소비자보호에 관한 법률"로 사업자신원 정보의 기재를 의무화하고 있다. 인터넷쇼핑몰들은 대부분 홈페이지 하단에 반구조적인 형태로 사업자신원정보를 기재하고 있으나, 기재항목과 표현형식이 구조화되어 있지 않아 사업자의 신원파악이 어렵기 때문에 소비자의 신뢰도에 나뿐 영향을 미칠 수 있다. 이에 본 연구는 사업자신원정보를 정확하게 표현하는 세 가지 구조화 방안 -HTML기반 구조, XML기반 구조, XML data island기반 구조 - 을 제시하고 비교하였으며, HTML기반구조와 XML data island 기반구조의 추출성능을 실험으로 비교하였다. 60개의 인터넷쇼핑몰 표본에 대해 실험결과, XML data island 기반구조는 사업자신원정보 추출시간이 웹문서의 크기와는 관계가 없으나, HTML기반구조는 웹문서의 크기에 비례하였다. 또한, 평균 추출시간을 비교한 결과 XML data island 기반구조가 HTML기반구조보다 정보 추출면에서 더 효율적이며 효과적임을 검정하였다.적임을 검정하였다.

  • PDF

웹 서비스 기반의 클라이언트 OLAP API와 큐브 브라우징에의 응용 사례 (A Web Services-based Client OLAP API and Its Application to Cube Browsing)

  • 배은주;김명
    • 정보처리학회논문지D
    • /
    • 제10D권1호
    • /
    • pp.143-152
    • /
    • 2003
  • 이기종 플랫폼간의 데이터 교환과 통합을 위한 표준 기술로 XML과 웹 서비스 기술이 각광을 받고 있다. 이러한 기술을 지원하는 XML/A는 클라이언트 응용과 데이터 분석 엔진이 인터넷 상에서 데이터를 교환할 수 있도록 하는 SOAP 기반의 XML 통신 API이다. 데이터가 XML 문서 형태로 교환된다는 점에서 XML/A는 플랫폼 독립적이지만, 클라이언트 응용 개발자들은 서버에 데이터를 요청할 때마다 XML 문서를 생성해야 하고, 서버가 보내는 XML 데이터 검색을 위해 별도의 XML 쿼리 언어를 사용해야 하는 단점이 있다. 본 연구에서는 윈도우즈 환경의 클라이언트 응용 개발자들이 XML/A의 OLAP 관련 서비스를 편리하게 사용할 수 있도록 하는 상위 수준의 클라이너트 OLAP API인 XMLMD를 설계하고 구현하였다. XML/A와 XML/A의 관계는 OLEDB for OLAP과 ADOMD의 응용 사례로써 데이터의 다차원적 분석결과를 인터넷을 통해 제공하는 웹 OLAP 큐브 브라우저도 개발하였다. 이 브라우저는 전송된 데이터를 XML, HTML, 엑셀, 그래프 등의 다양한 형태로 제공한다.

기록보존소 발행 교육용 사료집에 관한 고찰 - 호주와 미국, 영국 국립기록보존소를 중심으로 - (A Study on the Teaching Kits Provided by the National Archives in the Australia, the USA, and the UK)

  • 김상호
    • 한국기록관리학회지
    • /
    • 제4권1호
    • /
    • pp.87-100
    • /
    • 2004
  • 본 연구는 국립기록보존소가 발행하는 교육용 사료집의 규모와 형식, 주제를 중심으로 그 특징을 고찰한 것이다. 교육용 사료집은 학교 교육을 지원하는 수단이며, 기록보존소를 홍보하는 매체로 단행본이나 소책자와 같은 인쇄자료 및 인터넷을 통한 온라인 자료의 형태로 염가 또는 무료로 제공된다. 학생들의 관심과 이해를 위해 교육용 사료집은 문서복제본을 중심으로 관련 지식과 정보를 효과적으로 편집해야 한다. 사료집의 주제는 국가별로 차이가 있으나, 일반적인 국가의 역사, 제도뿐만 아니라, 시민의 권리, 이민, 전쟁, 사건, 문화, 문서 자체에 관한 것들로 다양하다. 관련 교과과정에서 흥미로운 테마와 관련 사료를 발굴하는 것이 중요하다. 우리나라의 경우, 국가기록원이 주체가 되어 전국 초중등학생을 대상으로 한 교육용 사료집을 개발할 필요가 있다.

개인 게시판을 활용한 온라인 E-포트폴리오 공유 모델 (Online e-portfolio Sharing Model Utilizing Personal Bulletin Board)

  • 박준현;김선주;송진현;나스리디노프 아지즈
    • 융합정보논문지
    • /
    • 제8권6호
    • /
    • pp.225-230
    • /
    • 2018
  • 최근에 잡코리아나 World Job의 경우와 같은 취업관련 다양한 홈페이지가 존재한다. 하지만 이러한 홈페이지는 기업 관계자와 사용자가 1:1 소통을 취하고 있기 때문에 사용자의 입장에서 볼 때 얻을 수 있는 정보량이 일부 제한될 수밖에 없다. 제안 모델은 사용자가 회원가입을 거쳐 블로그를 생성하고, 블로그에 문서를 업로드 및 작성을 하고 기업 관계자는 첨삭 기능을 수행할 수 있다. 이를 통해 사용자는 원하는 문서를 쉽게 관리할 수 있을 뿐만 아니라 다른 사용자와의 정보공유가 가능하고, 기업 관계자는 첨삭을 원하는 사용자에게 첨삭을 함으로써 기업 관계자와 사용자가 질 좋은 소통을 할 수 있다. 이로 인해서 사용자와 기업 관계자의 정보 공유를 통해 취업 시장에 활발하게 사용될 것으로 생각된다.

감염병 확산에 따른 레스토랑 선택속성 변화 분석: 텍스트마이닝 기법 적용 (Analysis of Changes in Restaurant Attributes According to the Spread of Infectious Diseases: Application of Text Mining Techniques)

  • 유준일;이은지;구철모
    • 경영정보학연구
    • /
    • 제25권4호
    • /
    • pp.89-112
    • /
    • 2023
  • 2020년 3월, 코로나바이러스 팬데믹으로 선포되면서, 다양한 방역 조치가 취해져 왔다. 이에 따라, 관광 및 환대 산업 내의 많은 변화들이 야기되었다. 특히 레스토랑 산업에서는 비대면 서비스 및 좌석 간 거리두기 등 방역 지침이 시행되었다. 전통적으로 레스토랑 선택속성에 대한 연구는 분위기, 서비스 품질, 음식의 품질을 포함한 3가지 속성의 중요성이 강조해 온 데 반해, 코로나19 이후 레스토랑 이용자를 대상으로 레스토랑 선택속성을 탐색한 연구는 미비한 실정이다. 이에 따라, 본 연구에서는 코로나19라는 환대 산업 내의 환경적 변화에 대한 이해에 기반하여, 국내 온라인 리뷰 데이터 상에서 새로운 레스토랑 경험적 속성을 확인하기 위한 탐색적인 접근을 시도하였다. 본 연구는 서울 을지로 지역에 위치한 일반음식점 및 휴게음식점 475개로 네이버 플레이스에 등록된 총 31,115개의 온라인 리뷰를 분석 단위로 고려하였다. 분석 방법은 단어 빈도와 역문서 빈도의 곱으로 산출된 TF-IDF와 잠재적 토픽들을 추출하는 확률적 모델 알고리즘인 LDA 토픽모델링 기법을 통해 온라인 리뷰 내에서 단어들의 군집화를 통해 레스토랑 선택속성을 재분류하고자 하였다. 분석 결과, 분위기, 서비스 품질, 음식 품질과 함께 코로나19 이후 레스토랑의 새로운 속성으로 "감염병 예방"요인이 도출되었다. 본 연구는 기존 레스토랑 선택속성에서 제시하는 세 가지 속성들을 범주화하고, 나아가 새로운 속성을 제시하였다는 점에서 기존 레스토랑 선택속성 문헌을 확장하여 학술적 의의가 있다. 나아가, 분석 결과에 기반하여 레스토랑 운영의 측면 및 정책적 관점에서의 실무적 제언을 시도하였다.

WWW상에서의 온라인 정보통신표준 개발 시스템 설계 및 구현 (Design and Implementation of On-line Standards Development System on the World Wide Web)

  • 구경철;김형준;박기식;송기평;조인준;정회경
    • 한국정보통신학회논문지
    • /
    • 제2권4호
    • /
    • pp.559-573
    • /
    • 1998
  • 정보통신 표준화 기구들은 최근 동 분야가 국가 및 시장 경쟁력제고에 있어 전략적 수단으로 부상됨에 따라 더 많은 새롭고 복잡한 표준들을 보다 짧은 시간 내에 개발해야 한다는 문제에 직면하고 있으며, 이러한 문제 의 해결을 위해 이들은 표준개발절차의 많은 부분들을 전자화 시킨 소위 전자적 표준개발시스템 혹은 전자적 문서처리시스템의 구현을 꾀하고 있다. 본 논문에서는 이러한 정보통신분야의 환경변화에 효율적으로 대처하기 위해 국내 표준화 환경 및 표준화 순기(표준(안)연구개발표준(안)제안의견수렴표준화위원회 승인표준(안)확정)에 따른 Workflow기반 표준(안) 개발 환경을 WWW상에서 설계 구현한 표준정보유통망(SICN : Standards Information Cooperation Network) 시스템을 소개한다 구현된 온라인 표준개발 시스템은 기존의 인터라넷(Intranet)기반의 시스템과는 달리 개념적으로 인터넷의 제3물결이라 할 수 있는 엑스트라넷(Extranet) 개념의 Workflow 기반 시스템이라 할 수 있으며, 이는 향후 '가 상 표준 개발망(VSDN : Virtual Standards Development Network)'으로 확장 구현될 예정이다.

  • PDF

다중 사용자 온라인 게임 개발을 통한 소프트웨어 개발 교육 (Software Development Education through Developing a usable Multiplayer Online Game)

  • 윤일미;게리 앵;권오영
    • 한국실천공학교육학회논문지
    • /
    • 제4권2호
    • /
    • pp.38-45
    • /
    • 2012
  • 게임제작은 전산학을 가르치는 효과적이고 매력적인 방법이다. 다중사용자 게임제작은 기술, 팀웍, 소프트웨어 공학등 중요한 측면들을 요구하고 있다. 전체 클래스를 다수의 팀으로 구성하고, 학생들은 하나 혹은 두 개의 팀에 속하였다. 각 팀은 한학기동안 자신들의 진행상황을 발표하고, 향후 이정표와 트러블슈팅에 대해 논의하고, 명확한 소통을 위해 문서를 갱신하고, SVN(Subversion)을 활용하였다. 다른 클래스 구성과 달리, 모든 학생이 하나의 목적을 달성하려는 회사처럼 서로 협력하여 일을 했다. 한학기동안 학생들은 개념설계부터 시작해서 "deBugger(2009)"와 "World of Balance(2011)"라는 다중사용자 온라인 게임을 완성했다. 더불어 게임설계, 3D 그래픽스, 게임엔진, 서버-클라이언트 구조, 게임프로토콜, 네트워크 프로그래밍, 데이터베이스, 소프트웨어공학, 팀 프로젝트로서 대규모 어플리케이션 제작방법들을 학습할 수 있었다.

  • PDF