• 제목/요약/키워드: Internet Portal

검색결과 352건 처리시간 0.035초

정확도 높은 검색 엔진을 위한 문서 수집 방법 (A Document Collection Method for More Accurate Search Engine)

  • 하은용;권희용;황호영
    • 정보처리학회논문지A
    • /
    • 제10A권5호
    • /
    • pp.469-478
    • /
    • 2003
  • 인터넷상의 정보 검색 엔진들은 웹 로봇을 이용해서 인터넷에 연결되어 있는 수 많은 웹 서버들을 주기적 또는 비주기적으로 방무나여 자체적인 인텍싱 방법에 따라 자료를 추출하고 분류해서 검색 엔진의 기초가 되는 데이터 베이스를 구축하고 변겨아는 작업을 계속하고 있다. 이런 일련의 작업은 인터넷 상에 분산되어 있는 막대한 정보를 쉽고 정확하게 찾을 수 있는 게이트 사이트로서의 역할을 담당하기 위한 전략적인 목적으로 진행되고 있다. 수천만 이상의 웹 사이트들을 상대로 하는 정보 수집은 검색 엔진 사이트 중심으로 기존 데이터의 수정과 삭제 등과 같은 데이터 베이스 유지 관리와 신규 사이트들에 대한 자료 수집 작업이 이루어지고 있다. 이러한 작업은 웹 서버에 대한 사전 지식 없이 정보 추출을 위해 웹 로봇을 실행하므로 인터넷 상에 수많은 요구가 전송되고 이는 인터넷 트래픽을 증가 시키는 원인이 되고 있다. 따라서 웹 서버가 사전에 자신이 공개할 문서에 대한 변경 정보를 웹 로봇에게 통보하고 웹 로봇은 이 정보를 이용해서 웹 서버의 해당 문서에 대한 정보 수집 작업을 한다면 불필요한 인터넷 트래픽을 감소시킬 수 있을 뿐만 아니라 검색 엔진의 정보의 신뢰도도 높아지고 웹 서버의 해당 문서에 대한 정보수집 작업을 한다면 불필요한 인터넷 트래픽을 감소 시킬 수 있을 뿐만 아니라 검색 엔진의 정보의 신뢰도도 높아지고 웹 서버의 시스템 부하와 검색 엔진의 시스템 부하를 줄일 수 있는 효과를 가질 수 있을 것이다. 본 논문에서는 웹 서버상의 웹 문서 파일의 변동 사항을 자동으로 검사하고 변동 사항들을 종합 정리해서 변경 문서에 대한 정보를 통보 받기 원하는 등록된 각 웹 로봇에게 전송하는 검사 통보 시스템을 설계 구현하였다. 웹 로봇을 운영하는 검색 엔진에서는 통보된 요약 정보를 이용해서 웹 서버로부터 해당 문서를 전송 받아 필요로 하는 인덱스 정보를 추출해서 데이터베이스를 구축하는 효율적인 웹 로봇을 설계 구현하였다.

온라인 언급이 기업 성과에 미치는 영향 분석 : 뉴스 감성분석을 통한 기업별 주가 예측 (Influence analysis of Internet buzz to corporate performance : Individual stock price prediction using sentiment analysis of online news)

  • 정지선;김동성;김종우
    • 지능정보연구
    • /
    • 제21권4호
    • /
    • pp.37-51
    • /
    • 2015
  • 인터넷 기술의 발전과 인터넷 상 데이터의 급속한 증가로 인해 데이터의 활용 목적에 적합한 분석방안 연구들이 활발히 진행되고 있다. 최근에는 텍스트 마이닝 기법의 활용에 대한 연구들이 이루어지고 있으며, 특히 문서 내 텍스트를 기반으로 문장이나 어휘의 긍정, 부정과 같은 극성 분포에 따라 의견을 스코어링(scoring)하는 감성분석과 관련된 연구들도 다수 이루어지고 있다. 이러한 연구의 연장선상에서, 본 연구는 인터넷 상의 특정 기업에 대한 뉴스 데이터를 수집하여 이들의 감성분석을 실시함으로써 주가의 등락에 대한 예측을 시도하였다. 개별 기업의 뉴스 정보는 해당 기업의 주가에 영향을 미치는 요인으로, 적절한 데이터 분석을 통해 주가 변동 예측에 유용하게 활용될 수 있을 것으로 기대된다. 따라서 본 연구에서는 개별 기업의 온라인 뉴스 데이터에 대한 감성분석을 바탕으로 개별 기업의 주가 변화 예측을 꾀하였다. 이를 위해, KOSPI200의 상위 종목들을 분석 대상으로 선정하여 국내 대표적 검색 포털 서비스인 네이버에서 약 2년간 발생된 개별 기업의 뉴스 데이터를 수집 분석하였다. 기업별 경영 활동 영역에 따라 기업 온라인 뉴스에 나타나는 어휘의 상이함을 고려하여 각 개별 기업의 어휘사전을 구축하여 분석에 활용함으로써 감성분석의 성능 향상을 도모하였다. 분석결과, 기업별 일간 주가 등락여부에 대한 예측 정확도는 상이했으며 평균적으로 약 56%의 예측률을 보였다. 산업 구분에 따른 주가 예측 정확도를 통하여 '에너지/화학', '생활소비재', '경기소비재'의 산업군이 상대적으로 높은 주가 예측 정확도를 보임을 확인하였으며, '정보기술'과 '조선/운송' 산업군은 주가 예측 정확도가 낮은 것으로 확인되었다. 본 논문은 온라인 뉴스 정보를 활용한 기업의 어휘사전 구축을 통해 개별 기업의 주가 등락 예측에 대한 분석을 수행하였으며, 향후 감성사전 구축 시 불필요한 어휘가 추가되는 문제점을 보완한 연구 수행을 통하여 주가 예측 정확도를 높이는 방안을 모색할 수 있을 것이다.

댓글 분석을 통한 19대 한국 대선 후보 이슈 파악 및 득표율 예측 (Issue tracking and voting rate prediction for 19th Korean president election candidates)

  • 서대호;김지호;김창기
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.199-219
    • /
    • 2018
  • 인터넷의 일상화와 각종 스마트 기기의 보급으로 이용자들로 하여금 실시간 의사소통이 가능하게 하여 기존의 커뮤니케이션 양식이 새롭게 변화되었다. 인터넷을 통한 정보주체의 변화로 인해 데이터는 더욱 방대해져서 빅데이터라 불리는 정보의 초대형화를 야기하였다. 이러한 빅데이터는 사회적 실제를 이해하기 위한 새로운 기회로 여겨지고 있다. 특히 텍스트 마이닝은 비정형 텍스트 데이터를 이용해 패턴을 탐구하여 의미있는 정보를 찾아낸다. 텍스트 데이터는 신문, 도서, 웹, SNS 등 다양한 곳에 존재하기 때문에 데이터의 양이 매우 다양하고 방대하여 사회적 실제를 이해하기 위한 데이터로 적합하다. 본 연구는 한국 최대 인터넷 포털사이트 뉴스의 댓글을 수집하여 2017년 19대 한국 대선을 대상으로 연구를 수행하였다. 대선 선거일 직전 여론조사 공표 금지기간이 포함된 2017년 4월 29일부터 2017년 5월 7일까지 226,447건의 댓글을 수집하여 빈도분석, 연관감성어 분석, 토픽 감성 분석, 후보자 득표율 예측을 수행하였다. 이를 통해 각 후보자들에 대한 이슈를 분석 및 해석하고 득표율을 예측하였다. 분석 결과 뉴스 댓글이 대선 후보들에 대한 이슈를 추적하고 득표율을 예측하기에 효과적인 도구임을 보여주었다. 대선 후보자들은 사회적 여론을 객관적으로 판단하여 선거유세 전략에 반영할 수 있고 유권자들은 각 후보자들에 대한 이슈를 파악하여 투표시 참조할 수 있다. 또한 후보자들이 빅데이터 분석을 참조하여 선거캠페인을 벌인다면 국민들은 자신들이 원하는 바가 후보자들에게 피력, 반영된다는 것을 인지하고 웹상에서 더욱 적극적인 활동을 할 것이다. 이는 국민의 정치 참여 행위로써 사회적 의의가 있다.

SNS 사진과 사진측량을 이용한 정원유산의 3차원 형상 재현 가능성 연구 - 명승 제40호 담양 소쇄원(潭陽 瀟灑園)을 대상으로 - (A Study on the Reproducibility of 3D Shape Model of Garden Cultural Heritage using Photogrammetry with SNS Photographs - Focused on Soswaewon Garden, Damyang(Scenic Site No.40) -)

  • 김충식;이상하
    • 한국전통조경학회지
    • /
    • 제36권4호
    • /
    • pp.94-104
    • /
    • 2018
  • 본 연구는 사진측량 기술을 과거의 촬영된 사진들에 활용하여 정원유산의 원형 재현 가능성을 검토하였다. 인공물과 자연물이 혼재되어 입체 형상 재현 가능성 검토에 적합한 담양 소쇄원(명승 제40호)을 연구 대상으로 하였다. 소쇄원에서 근거리와 원거리의 $360^{\circ}$ 전방향에서 장애물이 없어 촬영이 가능한 조경시설물인 매대(梅臺), 애양단(愛陽壇), 오곡문(五曲門) 담장, 약작(略?)과 자연경물인 광석(廣石) 5개 조경요소를 선정하였다. 인터넷 포털에서 5개 조경요소에 대해 촬영날짜, 초점길이, 노출 등의 정보가 포함된 151장의 사진을 수집하여 촬영구도를 분석하였다. 수집된 사진들은 요소별로 특정한 구도에서 집중적으로 촬영되는 경향을 발견하였다. 또한 조경요소별로 이용자들이 선호하는 2~3개의 촬영구도가 있음을 발견하였다. 조경요소별로 빈도가 높은 촬영구도 1개를 선정하고 그 구도에서 촬영된 사진들을 이용하여 포토스캔(Photoscan) 프로그램으로 3D 메쉬 모델을 제작하여 입체 형상의 재현 가능성을 분석하였다. 제작결과 오곡문 담장, 매대, 애양단과 같은 인공물은 비교적 입체 형상의 재현이 가능하였으나, 질감이 동일하거나 자연 경물인 약작과 광석은 입체 형상의 재현이 불가능했다. 선정된 촬영구도와 유사하게 현장에서 촬영한 사진으로 입체 형상의 재현을 실험한 결과 수집사진에서 불가능했던 약작과 광석에서 3D 메쉬 모델이 제작되었다. 또한 과거와 현재의 형상 비교를 통해 정확한 크기를 측정할 수 있고 변화를 발견할 수 있었다. 문화재의 관람객이나 조경가 등에 의해 촬영된 과거의 사진들을 확보하게 된다면 그 당시에 입체 형상을 재현할 수 있을 것으로 보인다. 이러한 기술이 확산된다면 정원유산의 과거 형상을 추정하고 변화를 고찰하는데 정확성과 신뢰성을 높일 것이다.

시장공사적협동책략화소비자태도(时装公司的协同策略和消费者态度) (Collaboration Strategies of Fashion Companies and Customer Attitudes)

  • Chun, Eun-Ha;Niehm, Linda S.
    • 마케팅과학연구
    • /
    • 제20권1호
    • /
    • pp.4-14
    • /
    • 2010
  • 协同策略需要信息共享和其他各种对公司和股东都有利益的形式. 本文强调了在时装产业中运用到的特别形式的协同. 并且测试了对时装公司最成功的策略和消费者所感知到的协同的好处. 在本研究中, 我们定义了作为协作方的时装公司和品牌以及他们的合作方或股东. 我们定义协同为发生在至少两个公司, 品牌或个体之间, 在平等的基础上利用他们各自的竞争优势从而获得更大利益的合作关系. 协同策略需要信息共享和其他各种对公司和股东都有利益的形式. 本文强调了在时装产业中运用到的特别形式的协同. 通过合作, 时装公司一直都追求有形的差异例如设计和技术, 以及无形的差异例如对消费者情感和生理的好处. 结果就是, 时装产业中的合作已变成一个重要的创造价值的概念. 本文是一个定性研究, 使用案例研究和深度访谈来测试消费者对时装产业中协作的态度. 从1998年到2008年12月, 在韩国和国际市场中共有173个协同案例. 我们通过文件数据收集案例. 这些文件数据包括网站和产业数据和顶级门户搜索网站. 例如Rankey.com, Naver, Daum, 和Nate. 以及时装信息代表网站Samsungdesignnet 和Firstviewkorea. 我们搜集从2008年11月到2009年2月为止的个案. 个案用来分析有一个或多个合作方的时装产品生产(不包括纺织产品), 零售时装产品或设计服务. 其他在先前研究中的协同案例来自于新闻稿件, 期刊, 互联网门户网站和时装信息网站. 我们共选择了173个案例来进行分析. 清楚的显示了时装公司和股东的协作执行和策略所带来的产出和利益. 结果显示对所有参与协作的合作方(企业和顾客)来说, 最大的好处是通过共享资源降低了成本和风险. 例如设计能力, 形象, 成本, 技术和目标. 并且创造了协同作用. 考虑到协同产出的种类, 产品/设计是最重要的(55%), 紧跟其后的是推广促销(21%), 价格(20%)和地点(4%). 这个结果说明协同对给予产品和设计生命力有重要的作用. 尤其是在追求创造和新颖的时装产业里. 为了使协同可以成功, 本研究中深度访谈的结果确认了时装公司应该对为什么要进行这个协作有清晰的目标. 在设定目标之后, 时装公司应该选择符合产品形象和目标市场的合作方. 使得合作的产品有一定的概念和差异因素. 同时时装公司还要关注提升品牌知名度. 通过对消费者的深度访谈, 相互的利益可以分类为6个因素: 追求个人风格、追求品牌、追求稀有性、追求时尚、追求经济效率和社会性. 在访谈中顾客同时也强调了形象, 声誉和品牌信任. 然而, 在子范畴中, 本研究中的专家和顾客在成功因素认知方面有不同的结果. 因此, 从不同纬度研究目标客户和目标市场从而为成功的协作发展合适的策略.

온라인 구전과 영화 매출 간 상호영향에 관한 연구: 한국 영화 산업을 중심으로 (Simultaneous Effect between eWOM and Revenues: Korea Movie Industry)

  • 배정호;심범준;김병도
    • Asia Marketing Journal
    • /
    • 제12권2호
    • /
    • pp.1-25
    • /
    • 2010
  • 기존 영화 산업에서 구전의 크기는 매출에 영향을 주지만 방향성은 영향을 주지 못하는 것으로 연구되었다(Liu 2006). 하지만, 이러한 분석 방법을 국내 영화 데이터에 동일하게 적용시켜 본 결과, 구전의 방향성도 영화의 매출에 영향을 주는 것으로 밝혀졌다. 이는 아시아 지역의 소비자들에게서 나타나는 독립적 자아관점과 북미 지역의 소비자들에게서 나타나는 상호의존적 자아관점의 차이로 인해 나타난 결과로 보인다. 즉, 국내 소비자의 경우는 영화를 선택/관람함에 있어 타인의 평가가 영향력을 주기 때문에 구전의 방향성도 유의한 양(+)의 값을 가진다. 기존의 연구에서는 구전의 크기가 일방적으로 매출에 영향을 미친다는 가정을 통해 영화 산업의 구전효과를 분석했으나, 이는 발생된 매출이 구전의 크기에 미치는 영향을 간과한 것이다. 따라서 매출이 구전에 미치는 효과까지 고려하여 연립방정식(Simultaneous Equation)을 통해 구전의 크기와 매출 간 상호 관계를 추정한 결과, 구전의 방향성은 위의 분석과 동일하게 영화 개봉 후 지속적으로 매출에 양(+)의 영향력을 미치는 것으로 나타났다. 하지만, 구전의 크기는 매출의 원인이 되는 것이 아니라, 오히려 매출이 증가하여 구전의 크기가 증가하는 것이라는 결과를 보여주었다. 즉, 개봉 후 1주차에는 소비자들이 영화를 선택할 때 구전의 크기와 방향성이 동시에 고려되지만, 2주차 이후로는 구전의 크기는 매출에 영향을 미치는 변수가 아니라, 매출의 증가에 따른 결과라는 사실이 밝혀졌다.

  • PDF

사이버과학교실시스템 설계 및 구현 (The Establishment and Design of the Science Class in Cyber Space)

  • 김미영;권효순;박혜옥
    • 공학교육연구
    • /
    • 제9권4호
    • /
    • pp.28-45
    • /
    • 2006
  • 지식기반 사회로 변화에 따라 교육에 사이버 공간을 도입하는 것은 피할 수 없는 현실이 되었다. 따라서, 이러한 환경을 제공하기 위해 많은 e러닝(e-learning) 시스템이 개발되고 있다. 그러나 현재 개발된 많은 LCMS(Learning Contents Management System)는 세계 e러닝 표준인 SCORM(Sharable Contents Object Reference Model)과 한국교육학술정보원의 전국교육정보공유체계인 KEM을 기반으로 하고 있지 않아, 각기 다른 환경에서 개발된 학습콘텐츠를 공유하기 어렵다. 또한 국립중앙과학관은 비정규교육기관으로 초,중,고에서 개별적으로 해결하기 어려운 과학분야의 교육 전시물을 실제로 혹은 사이버공간에서 제공하고 있다. 이를 통합하여 관리하며 학교 교육에도 활용될 수 있도록 선생님, 학습자, 운영자, 교수자 모듈로 분리하여 기능을 제공하면서 서로 연동되는 시스템이 필요하게 되었다. 이에 이 논문에서는 한국교육학술정보원의 전국교육정보공유체계인 KEM(Korea Educational Metadata)과 세계표준인 SCORM 기반의 선진화 된 LMS(Learnig Management System) 및 LCMS 시스템인 국립중앙과학관 사이버과학교실 웹포털 사이트를 설계 및 구현하였다.

외부개방데이터 연계를 통한 BIM/GIS 상호운용 플랫폼확장에 관한 연구 (A Study for Extension of BIM/GIS Interoperability Platform linked External Open Data)

  • 박승화;홍창희
    • 한국산학기술학회논문지
    • /
    • 제18권3호
    • /
    • pp.78-84
    • /
    • 2017
  • ICT의 발달과 사물인터넷(IoT), 센서 네트워킹 기술 등이 차세대 산업경쟁력으로 자리잡아감에 따라 각 지자체의 스마트시티 도입이 가속화 되고 있다. 스마트시티를 운영하기 위해서는 도시통합운영센터가 요구되어 지고 그 기반에 통합 플랫폼이 존재한다. 기존 스마트시티 플랫폼은 주로 2차원 지도 기반으로 CCTV정보, ITS 교통카메라 정보 등을 이용하여 서비스를 제공하고 있다. 보다 고도화된 스마트시티 서비스 제공을 위해 3차원 지도 정보, 건물과 시설물 단위정보, 대민 서비스를 위한 공공데이터포탈과의 연계 등이 요구되고 있다. 본 논문에서는 스마트시티 통합 플랫폼과 관련된 국내외 관련 개발 현황을 살펴보고, 현재 개발 중에 있는 BIM/GIS 상호운용 플랫폼과 외부데이터 연계방안을 제시하였다. BIM/GIS 플랫폼은 지도기반 위치정보와 건물정보를 연계하여 실내외의 끊임없는 공간정보서비스를 가능하게 한다. 본 플랫폼에 적용된 외부데이터는 V-World, 서울시 열린 데이터, 건축데이터개방이며, BIM/GIS 플랫폼과 연계하여 국토계획 구역정보, 서울시 대기오염정보, 건축물대장정보 등을 확인하였다. 이를 통해 고도화된 신개념 스마트시티 서비스를 제공할 수 있는 BIM/GIS 통합플랫폼의 개발 방향에 대해 제시하고자 한다.

인터넷 검색어를 활용한 계절적 유행성 독감 발생 감지 (Monitoring Seasonal Influenza Epidemics in Korea through Query Search)

  • 권치명;황성원;정재운
    • 한국시뮬레이션학회논문지
    • /
    • 제23권4호
    • /
    • pp.31-39
    • /
    • 2014
  • 계절적 유행성 독감은 매년 전 세계적으로 300만-500만 명이 감염되어 25만-50만 명이 사망에 이르는 무서운 질병이다. 유행성 독감에 대한 통제를 강화하기 위해 독감의 유행을 실시간으로 감시하기 위한 연구들이 제안되고 있다. 우리나라의 질병관리본부는(CDC)는 인플루엔자에 대한 임상 자료를 1주 단위로 발표하고 있으며 질병의 유행과 1-2주 정도의 보고 시차가 존재한다. 조기에 독감의 유행을 감지하기 위해 비임상적 자료(뉴스 리포트, 소셜 미디어)의 검색 정보를 활용하여 유행성 독감 발생을 효과적으로 대비하기 위한 연구들이 최근 이루어지고 있다. 비임상적 자료의 수집은 적은 비용으로 거의 실시간으로 이루어질 수 있는 이점이 있다. 본 연구는 네이버 검색엔진이 제공하는 PC와 모바일 키워드 정보를 활용하여 우리나라의 유행성 독감 활동을 감지하는 회귀모형을 개발하고자 한다. 이를 위해 문헌연구를 통하여 인플루엔자 의사분율(ILI)과 높은 상관성을 가질 것으로 예상되는 키워드를 20개 선정하고 키워드와 ILI와의 관계를 로지스틱 회귀모형과 다중회귀모형으로 가정하고 ILI를 예측하였다. 모형적합성 측면에서 다중회귀모형이 로지스틱모형보다 우수하였으며 모바일-기반 회귀모형이 PC-기반 회귀모형보다 ILI 퍼센티지를 추정하는데 우월한 결과를 보이고 있다.

디지털 환경에서 학술연구자들의 정보요구 및 이용행태에 관한 연구 - 인문사회분야와 과학기술분야의 비교를 중심으로 - (A Study on Information Users' Needs and Information Seeking Behavior of Doctoral Researchers in Digital Age)

  • 김정환;김재훈;황재영
    • 한국도서관정보학회지
    • /
    • 제42권3호
    • /
    • pp.189-208
    • /
    • 2011
  • 인터넷과 정보통신기술이 급변하는 디지털 환경에서 학술연구자들은 종전보다 더 복잡하고, 다양한 매체를 통해 학술정보를 활용하고 있다. 본 연구에서는 달라진 정보환경에서 국내 박사과정 학술연구자들의 정보요구와 정보추구행태를 알아보기 위해 5개의 범주내에서 13개의 질문 항목을 도출하고 이를 통해 집단 면접조사를 하였다. 5가지 범주는 (1) 일반적인 학술정보 활용 패턴 (2) 학술정보 활용 이유(태도), (3) IT Skill과 정보활용능력, (4) 물리적 도서관 이용 대비 전자정보 접근, (5) 전자정보 활용과 관련된 전반적인 견해 등이다. 특히, 인문사회분야 학술연구자들과 과학기술분야 학술연구자들을 균등하게 선발하여 면접조사를 함으로써 두 집단간의 공통점과 차이점을 비교 분석하는데 연구의 주안점을 두었다. 연구결과 학술정보 활용 목적, 정보활용능력, 인쇄자료 대비 전자자료 활용 비율, 연구 아이디어나 지식을 얻는 경로 분야에서는 차이가 없었으며, 학업이나 연구와 관련하여 주로 활용하는 자료, 즐겨찾는 학술 포털사이트 분야에서는 차이가 있는 것으로 나타났다.