• 제목/요약/키워드: Intelligent Web

검색결과 815건 처리시간 0.026초

FCA 기반 계층적 구조를 이용한 문서 통합 기법 (Methods for Integration of Documents using Hierarchical Structure based on the Formal Concept Analysis)

  • 김태환;전호철;최종민
    • 지능정보연구
    • /
    • 제17권3호
    • /
    • pp.63-77
    • /
    • 2011
  • 월드와이드웹(World Wide Web)은 인터넷에 연결된 컴퓨터를 통해 사람들이 정보를 공유할 수 있는 매우 큰 분산된 정보 공간이다. 웹은 1991년에 시작되어 개인 홈페이지, 온라인 도서관, 가상 박물관 등 다양한 정보 자원들을 웹으로 표현하면서 성장하였다. 이러한 웹은 현재 5천억 페이지 이상 존재할 것이라고 추정한다. 대용량 정보에서 정보를 효과적이며 효율적으로 검색하는 기술을 적용할 수 있다. 현재 존재하는 몇몇 검색 도구들은 초 단위로 gigabyte 크기의 웹을 검사하여 사용자에게 검색 정보를 제공한다. 그러나 검색의 효율성은 검색 시간과는 다른 문제이다. 현재 검색 도구들은 사용자의 질의에 적합한 정보가 적음에도 불구하고 많은 문서들을 사용자에게 검색해준다. 그러므로 대부분의 적합한 문서들은 검색 상위에 존재하지 않는다. 또한 현재 검색 도구들은 사용자가 찾은 문서와 관련된 문서를 찾을 수 없다. 현재 많은 검색 시스템들의 가장 중요한 문제는 검색의 질을 증가 시키는 것이다. 그것은 검색된 결과로 관련 있는 문서를 증가시키고, 관련 없는 문서를 감소시켜 사용자에게 제공하는 것이다. 이러한 문제를 해결하기 위해 CiteSeer는 월드와이드웹에 존재하는 논문에 대해 한정하여 ACI(Autonomous Citation Indexing)기법을 제안하였다. "Citaion Index"는 연구자가 자신의 논문에 다른 논문을 인용한 정보를 기술하는데 이렇게 기술된 논문과 자신의 논문을 연결하여 색인한다. "Citation Index"는 논문 검색이나 논문 분석 등에 매우 유용하다. 그러나 "Citation Index"는 논문의 저자가 다른 논문을 인용한 논문에 대해서만 자신의 논문을 연결하여 색인했기 때문에 논문의 저자가 다른 논문을 인용하지 않은 논문에 대해서는 관련 있는 논문이라 할지 라도 저자의 논문과 연결하여 색인할 수 없다. 또한 인용되지 않은 다른 논문과 연결하여 색인할 수 없기 때문에 확장성이 용이하지 못하다. 이러한 문제를 해결하기 위해 본 논문에서는 검색된 문서에서 단락별 명사와 동사 및 목적어를 추출하여 해당 동사가 명사 및 목적어를 취할 수 있는 가능한 값을 고려하여 하나의 문서를 formal context 형태로 변환한다. 이 표를 이용하여 문서의 계층적 그래프를 구성하고, 문서의 그래프를 이용하여 문서 간 그래프를 통합한다. 이렇게 만들어진 문서의 그래프들은 그래프의 구조를 보고 각각의 문서의 영역을 구하고 그 영역에 포함관계를 계산하여 문서와 문서간의 관계를 표시할 수 있다. 또한 검색된 문서를 트리 형식으로 보여주어 사용자가 원하는 정보를 보다 쉽게 검색할 수 있는 문서의 구조적 통합 방법에 대해 제안한다. 제안한 방법은 루씬 검색엔진이 가지고 있는 순위 계산 공식을 이용하여 문서가 가지는 중요한 단어를 문서의 참조 관계에 적용하여 비교하였다. 제안한 방법이 루씬 검색엔진보다15% 정도 높은 성능을 나타내었다.

온라인 주식 포럼의 핫토픽 탐지를 위한 감성분석 모형의 개발 (Development of Sentiment Analysis Model for the hot topic detection of online stock forums)

  • 홍태호;이태원;리징징
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.187-204
    • /
    • 2016
  • 소셜 미디어를 이용하는 사용자들이 직접 작성한 의견 혹은 리뷰를 이용하여 상호간의 교류 및 정보를 공유하게 되었다. 이를 통해 고객리뷰를 이용하는 오피니언마이닝, 웹마이닝 및 감성분석 등 다양한 연구분야에서의 연구가 진행되기 시작하였다. 특히, 감성분석은 어떠한 토픽(주제)를 기준으로 직접적으로 글을 작성한 사람들의 태도, 입장 및 감성을 알아내는데 목적을 두고 있다. 고객의 의견을 내포하고 있는 정보 혹은 데이터는 감성분석을 위한 핵심 데이터가 되기 때문에 토픽을 통한 고객들의 의견을 분석하는데 효율적이며, 기업에서는 소비자들의 니즈에 맞는 마케팅 혹은 투자자들의 시장동향에 따른 많은 투자가 이루어지고 있다. 본 연구에서는 중국의 온라인 시나 주식 포럼에서 사용자들이 직접 작성한 포스팅(글)을 이용하여 기존에 제시된 토픽들로부터 핫토픽을 선정하고 탐지하고자 한다. 기존에 사용된 감성 사전을 활용하여 토픽들에 대한 감성값과 극성을 분류하고, 군집분석을 통해 핫토픽을 선정하였다. 핫토픽을 선정하기 위해 k-means 알고리즘을 이용하였으며, 추가로 인공지능기법인 SOM을 적용하여 핫토픽 선정하는 절차를 제시하였다. 또한, 로짓, 의사결정나무, SVM 등의 데이터마이닝 기법을 이용하여 핫토픽 사전 탐지를 하는 감성분석을 위한 모형을 개발하여 관심지수를 통해 선정된 핫토픽과 탐지된 핫토픽을 비교하였다. 본 연구를 통해 핫토픽에 대한 정보 제공함으로써 최신 동향에 대한 흐름을 알 수 있게 되고, 주식 포럼에 대한 핫토픽은 주식 시장에서의 투자자들에게 유용한 정보를 제공하게 될 뿐만 아니라 소비자들의 니즈를 충족시킬 수 있을 것이라 기대된다.

오피니언 마이닝을 이용한 지능형 VOC 분석시스템 (Intelligent VOC Analyzing System Using Opinion Mining)

  • 김유신;정승렬
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.113-125
    • /
    • 2013
  • 기업 경영에 있어서 고객의 소리(VOC)는 고객 만족도 향상 및 기업의사결정에 매우 중요한 정보이다. 이는 비단 기업뿐만 아니라 대고객, 대민원 업무를 처리하는 모든 조직에 있어서도 동일하다. 때문에 최근에는 기업뿐만 아니라 공공, 의료, 금융, 교육기관 등 거의 모든 조직이 VOC를 수집하여 활용하고 있다. 이러한 VOC는 방문, 전화, 우편, 인터넷게시판, SNS 등 다양한 채널을 통해 전달되지만, 막상 이를 제대로 활용하기는 쉽지 않다. 왜냐하면, 고객이 매우 감정적인 상태에서 고객의 주관적 의사를 음성 또는 문자로 표출하기 때문에 그 형식이나 내용이 정형화되어 있지 않고 저장하기도 어려우며 또한 저장하더라도 매우 방대한 분량의 비정형 데이터로 남기 때문이다. 본 연구는 이러한 비정형 VOC 데이터를 자동으로 분류하고 VOC의 유형과 극성을 판별할 수 있는 오피니언 마이닝 기반의 지능형 VOC 분석 시스템을 제안하였다. 또한 VOC 오피니언 분석의 기준이 되는 주제지향 감성사전 개발 프로세스와 각 단계를 구체적으로 제시하였다. 그리고 본 연구에서 제시한 시스템의 효용성을 검증하기 위하여 의료기관 홈페이지에서 수집한 4,300여건의 VOC 데이터를 이용하여 병원에 특화된 감성어휘와 감성극성값을 도출하여 감성사전을 구축하고 이를 통해 구현된 VOC분류 모형의 정확도를 비교하는 실험을 수행하였다. 그 결과 "칭찬, 친절함, 감사, 무사히, 잘해, 감동, 미소" 등의 어휘는 매우 높은 긍정 오피니언 값을 가지며, "퉁명, 뭡니까, 말하더군요, 무시하는" 등의 어휘들은 강한 부정의 극성값을 가지고 있음을 확인하였다. 또한 VOC의 오피니언 분류 임계값이 -0.50일 때 가장 높은 분류 예측정확도 77.8%를 검증함으로써 오피니언 마이닝 기반의 지능형 VOC 분석시스템의 유효성을 확인하였다. 그러므로 지능형 VOC 분석시스템을 통해 VOC의 실시간 자동 분류 및 대응 우선순위를 도출하여 고객 민원에 대해 신속히 대응한다면, VOC 전담 인력을 효율적으로 운용하면서도 고객 불만을 초기에 해소할 수 있는 긍정적 효과를 기대해 볼 수 있을 것이다. 또한 VOC 텍스트를 분석하고 활용할 수 있는 오피니언 마이닝 모형이라는 새로운 시도를 통해 향후 다양한 분석과 실용 프레임워크의 기틀을 제공할 수 있을 것으로 기대된다.

가젯을 이용한 교통정보 제공기법 기초연구 (Preliminary Study on Traffic Information Broadcasting Using a Gadget Framework)

  • 임관수;남두희
    • 한국ITS학회 논문지
    • /
    • 제6권2호
    • /
    • pp.26-33
    • /
    • 2007
  • 1990년대 초 교통혼잡 비용 및 교통사고로 인한 사회적 비용이 갈수록 증가하게 되었다. 이에 대한 해결 방안으로써 물리적인 도로 및 철도 등 기간시설물의 증가와 논리적인 운영방안의 효율화 두 가지 방법이 제시되었다. 이 중 기간시설물의 증가에는 한계가 있을 뿐만 아니라 많은 비용이 소모되므로 논리적 해결 방안으로서 ITS 도입이 대두되었다. ITS 도입 이후 현재까지 많은 연구와 시범 사업 등으로 인하여 정보의 수집가공 분야는 세계 선진국 대열에 올라섰으나 제공분야에 있어서는 아직 미흡한 실정이다. 제공분야는 수집가공 분야와는 달리 인적, 물적 비용이 상대적으로 적게 소요되며 정보통신 분야의 아이디어를 통해 기본정보 및 부가정보를 얼마든지 활용할 수 있다. 이에 현재 인터넷 환경 변화(웹2.0) 및 기술 발달에 따라 마이크로소프트 윈도우즈 환경(윈도우 비스타)에서 제공되는 사이드바 가젯(gadget)을 활용하고자 하였다. 기본교통정보를 사용자의 편의성에 맞추어 제공하는 기초방안으로 RSS(Really Simple Syndication)방식을 이용하여 교통정보 활성화를 도모하고자 방안을 제시하였다. 이러한 가젯을 제공하기 위해 우선 교통정보를 제공해주는 각 기관별 또는 민간업체 현황을 분석하였으며, 각 사이트의 특성을 파악하고 현재 제공 가능한 정보와 향후 정보 제공시 고려해야 될 사항을 제시하였다.

  • PDF

웹사이트 조회이력자료를 활용한 카셰어링 수요 추정 및 분석 (Demand Estimation of Car-sharing Service Using Web-site Reservation Requesting Log Data)

  • 권오현;최윤영;변완희;이청원
    • 한국ITS학회 논문지
    • /
    • 제14권4호
    • /
    • pp.10-17
    • /
    • 2015
  • 최근 카셰어링 서비스 운영전략 고도화에 대한 연구의 필요성이 점차 높아지고 있으며 이를 위해서는 카셰어링 수요에 대한 상세 정보가 필요하다. 그러나 기존 연구에서는 실적자료 또는 임의가정 수요만을 이용함으로서 이용가능 차량이 부족하여 서비스를 이용하지 못한 상실수요(Spilled Demand)가 누락된 경우가 많았다. 이에 본 연구에서는 카셰어링 서비스 운영업체의 웹사이트 이용기록을 토대로 상실수요(Spilled Demand)를 포함한 값을 추정할 수 있는 방안을 제시하고자 하였다. 분석 결과 LH 행복카 서비스의 경우 이용실적과 조회이력을 통한 추정수요 간에 전반적으로 약 2배 정도의 큰 차이가 발생하는 것으로 나타났다. 특히 운행률이 일정 수준에 도달하면 더 이상의 수요를 수용하지 못하므로 수요가 크게 아무리 증가하더라도 운행률이 더 이상 높아지기 어려운 것으로 나타났다. 즉 단순히 이용실적만을 바탕으로 개별 Station의 수요를 추정할 경우 특히 용량 상태에 근접한 Station에서 상당한 수요의 과소추정 우려가 있음과 함께 본 연구의 추정 방법론을 적용하는 연구를 고려할 필요성이 있음을 확인하였다.

Shareware DBMS를 이용한 모바일 GIS의 개발 (Development of a Mobile GIS Using a Shareware DBMS)

  • 윤재관;이근호;한기준
    • 한국공간정보시스템학회 논문지
    • /
    • 제2권2호
    • /
    • pp.25-37
    • /
    • 2000
  • 최근 들어 컴퓨터의 대용량화 및 고성능화에 따라 WWW(World-Wide-Web)을 기반으로 하는 다양한 형태의 지리정보시스템(GIS: Geographic Information System)이 개발되고 있다. 그러나, 이러한 WWW 기반의 GIS에 대한 연구는 도로망, 지도검색과 같은 정적인 데이타를 주로 관리하기 때문에 아직까지는 실생활에 크게 영향을 미치지 못하고 있다. 그러나 국내의 현실과 기술의 발전상으로 볼 때 모바일 장치 보급률의 증가 추세와 더불어 모바일 장치가 컴퓨터를 대신할 차세대 장치로 부각되고 있고, 소형의 GPS 장치의 모듈식 개발로 인하여 앞으로는 운송수단이나 개개인이 사용하고 있는 장비에 GPS 장치를 부착하여 사용하게 될 것이다. 즉, 모바일 장치를 이용한 동적인 GIS의 사용이 점차 증가하게 될 것이다. 이에 본 논문에서는 무선 네트워크 상에서 GIS 정보를 처리할 수 있게 하기 위하여 Shareware DBMS를 이용한 모바일 지리정보시스템을 설계 및 구현한다. 본 논문에서는 GIS 데이타 서버에 모바일의 개념을 적용하여 클라이언트상에서 공간 데이타의 삽입, 삭제, 갱신, 줌 인, 줌 아웃, 그리고 클라이언트 사용자의 위치가 표시되는 기능을 가진 시스템을 구현한다. 이로 인해 이동하면서 공간 데이타를 처리할 수 있는 동적인 데이타 관리와 미들웨어를 통해 다양한 GIS 서버를 이용할 수 있는 확장성을 제공한다. 아울러 Shareware DBMS를 이용함으로써 구축비용의 절감이라는 이점도 얻을 수 있으며, 지능형 교통 시스템(ITS: Intelligent Transport System)과의 연계도 가능하다.

  • PDF

두 영상검색 시스템의 협력적 이용을 통한 재순위화 (Re-ranking the Results from Two Image Retrieval System in Cooperative Manner)

  • 황중원;김현우;김준모
    • 한국지능시스템학회논문지
    • /
    • 제24권1호
    • /
    • pp.7-15
    • /
    • 2014
  • 영상검색은 컴퓨터 비전과 데이터 마이닝 분야의 주요한 주제 중 하나이다. 현재 상용화된 영상 검색 시스템이 놀라운 성능을 보여주고 있음에도 불구하고, 폭발적으로 증가하는 웹상의 영상정보를 효율적으로 검색하기 위하여, 영상 검색 기술의 성능향상이 꾸준히 요구되고 있다. 재순위화는, 이런 요구를 만족시키기 위한 방법 중 하나로서, 영상 검색 시스템이 도출한 초기 결과를, 독자적인 알고리즘을 통해 연관도를 한 번 더 계산하고, 그에 따라 검색 결과의 성능을 향상시키는 방법이다. 지금까지 제안된 많은 재순위화 알고리즘이, 영상 검색 시스템이 영상의 시각적 정보를 사용하지 않는다는 가정하에 개발되어 왔지만, 현재 Google 과 Baidu 등 많은 상업적 영상 검색 시스템이 영상의 시각적 패턴에 대한 정보를 사용하기 시작함에 따라 이러한 가정이 어긋나고 있다. 또한, 영상 검색 시스템들이 독자적인 환경에서 개발되었기 때문에, 다수의 영상 검색 시스템의 협력으로 성능을 향상시킬 수 있을 것이라 예측되는 상황에도 불구하고, 이에 대한 연구가 부족했다. 본 논문에서는 이 두 가지 문제를 해결하기 위하여, 두 영상 검색 시스템이 사용하는 시각적 특징을 바탕으로, 두 시스템의 상보적인 정보를 이용하는 방법에 대하여 제안한다. 성능에 대한 평가는 가상 모형에서 이루어졌으며, 제안된 방법을 통하여 성능향상이 가능하다는 것을 보여준다.

학습자 참여를 유도하기 위한 얼굴인식 기반 지능형 e-Learning 시스템 (Intelligence e-Learning System Supporting Participation of Students based on Face Recognition)

  • 배경율;정진우;민승욱
    • 지능정보연구
    • /
    • 제13권2호
    • /
    • pp.43-53
    • /
    • 2007
  • e-Learning 시스템은 원격지에 위치하여 학습자의 원격교육 및 멀티미디어 교육을 지원할 수 있는 차세대 교육 기술로 주목받고 있다. 그러나 학습자가 원격지에 위치하기 때문에 학습일탈 여부나 다수의 학습자에 대한 확인이 어려운 문제점을 안고 있어 이러한 문제점들에 대처하기 위하여 실시간 동영상 전달을 통한 학습자의 감시나 실시간 메시지 교환과 같은 대안들이 시도되고 있다. 반면에 이러한 대안들은 학습자의 인권 침해 소지와 다중 사용자의 영상 전달이라는 측면에서 시스템에 커다란 비용을 초래하게 되며, 수시로 전달되는 메시지는 학습의 효과를 반감시킬 수 있다. 따라서 학습자의 상태를 실시간으로 확인하는 동시에 시스템의 비용을 줄일 수 있는 방안으로 얼굴인식기술 기반의 지능형 시스템을 제안하고자 한다. 웹 상에서 이뤄지는 얼굴인식 기반 지능형 e-Learning 시스템은 학습자가 지속적으로 교육에 집중하는 동안 학습자의 얼굴을 이용해 학습일탈 여부를 확인하고, 확인된 학습자의 얼굴 영상은 중앙에서 학습자를 지도하는 교수에게 통보하게 된다. 본 시스템의 실험을 위하여 20명의 학습자와 1명의 교수가 각각 원격지에 위치한 PC를 사용하여 얼굴 등록 및 인식에 참여하였으며, 학습자의 일탈 방지 및 인식 성공을 위한 주의력 향상의 결과를 얻을 수 있었다.

  • PDF

스마트폰 기반 통행 행태 조사 자료 신뢰성 검증: 서울에서 수집된 자료를 바탕으로 (Testing the Reliability of a Smartphone-Based Travel Survey: An Experiment in Seoul)

  • 이제승;;;김대희;강준희
    • 한국ITS학회 논문지
    • /
    • 제15권2호
    • /
    • pp.50-62
    • /
    • 2016
  • 현재 스마트폰은 GPS와 가속도계를 비롯한 센서를 이용하여 인간 행동 자료를 인간의 행동을 간섭하지 않으며 비용을 절감해서 수집할 가능성을 열어주고 있다. 본 연구는 스마트폰 기반 설문 조사의 정확성과 신뢰성을 평가하였다. 스마트폰을 이용하여 수집한 자료와 가구통행실태조사를 기본으로 구성된 전통적인 종이 설문을 이용한 자료를 비교하였다. 46명의 학생이 스마트폰을 이용하여 7일간 통행 기록을 수집하였고, 같은 기간 동안 종이 설문을 수행하였다. 참여자들은 웹페이지를 통해 스마트폰으로 수집된 자신의 통행 기록을 검증하였다. 검증된 스마트폰 자료는 같은 날에 수집된 종이 설문자료와 매칭되었다. 스마트폰 기반 자료는 종이 설문자료보다 짧은 통행을 기록하는 데 효과적이었다. 통행 자료의 통행시간이 종이 자료의 통행시간보다 짧은 경향이 나타났다. 이는 기존의 종이 설문 참여자가 통행시간을 과대평가하는 경향이 있음을 시사한다. 본 연구 결과는 스마트폰 기반의 통행 자료 수집 시스템을 발전시키는 데 이바지할 것이다.

한국고고학 디지털 사전 구축 방안 연구 (Approaches to Creating a Digital Encyclopedia of Korean Archaeology)

  • 이초롱
    • 헤리티지:역사와 과학
    • /
    • 제56권2호
    • /
    • pp.28-45
    • /
    • 2023
  • 디지털 대전환 시대를 맞이했지만 문화유적 조사 결과 생산되는 수많은 고고 디지털 원천 자료를 효율적으로 수집·관리·통합·서비스할 수 있는 활용체계, 즉 고고학술정보의 지능형 통합관리·서비스 플랫폼은 부재한 상황이다. 이와 관련하여, 현재 웹에서 PDF형태로 서비스되고 있는 한국고고학사전의 단순 전산화(Digitization) 문제와 한국고고학사전 발간 및 활용 현황 등을 통해 '한국고고학 디지털 사전 구축' 필요성을 확인하였다. 이에 본 연구에서는 자료 접근의 한계와 어려움에 따른 고고학술 데이터 접근성 제고와 고품질의 지식정보 제공을 중심으로 한 '한국고고학 디지털 사전 구축'의 전반적인 방향을 제안하였다. 2001년부터 발간하고 있는 한국고고학사전의 활용 현황을 분석하여 디지털 전환의 필요성을 확인하였고, 유럽, 미국, 일본 등 국외 고고학 데이터 아카이빙 플랫폼과 국내 전문사전과 관련한 플랫폼 구축 사례를 검토하여 데이터의 체계적인 관리와 보존, 활용에 대해 살펴보았다. 이를 통해 '한국고고학 디지털 사전 구축'을 위한 실행 과제로서 전산화된 기록물에 대한 메타데이터 설계와 생산된 메타데이터 간의 관계 정보를 부여하고 보여주는 시맨틱(semantic, 의미 기반) 데이터로의 확장 등을 제안하였다. 이러한 연구를 바탕으로 향후 고고학술정보의 지능형 통합관리·서비스 플랫폼 구축과 이에 따른 한국고고학에 대한 대중의 관심과 이해를 한 단계 높일 수 있는 발판을 마련하는 계기가 될 것으로 기대한다.