• 제목/요약/키워드: web server

검색결과 1,876건 처리시간 0.027초

관심 문자열 인식 기술을 이용한 가스계량기 자동 검침 시스템 (Automatic gasometer reading system using selective optical character recognition)

  • 이교혁;김태연;김우주
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.1-25
    • /
    • 2020
  • 본 연구에서는 모바일 기기를 이용하여 획득한 가스계량기 사진을 서버로 전송하고, 이를 분석하여 가스 사용량 및 계량기 기물 번호를 인식함으로써 가스 사용량에 대한 과금을 자동으로 처리할 수 있는 응용 시스템 구조를 제안하고자 한다. 모바일 기기는 일반인들이 사용하는 스마트 폰에 준하는 기기를 사용하였으며, 획득한 이미지는 가스 공급사의 사설 LTE 망을 통해 서버로 전송된다. 서버에서는 전송받은 이미지를 분석하여 가스계량기 기물 번호 및 가스 사용량 정보를 추출하고, 사설 LTE 망을 통해 분석 결과를 모바일 기기로 회신한다. 일반적으로 이미지 내에는 많은 종류의 문자 정보가 포함되어 있으나, 본 연구의 응용분야인 가스계량기 자동 검침과 같이 많은 종류의 문자 정보 중 특정 형태의 문자 정보만이 유용한 분야가 존재한다. 본 연구의 응용분야 적용을 위해서는 가스계량기 사진 내의 많은 문자 정보 중에서 관심 대상인 기물 번호 및 가스 사용량 정보만을 선별적으로 검출하고 인식하는 관심 문자열 인식 기술이 필요하다. 관심 문자열 인식을 위해 CNN (Convolutional Neural Network) 심층 신경망 기반의 객체 검출 기술을 적용하여 이미지 내에서 가스 사용량 및 계량기 기물번호의 영역 정보를 추출하고, 추출된 문자열 영역 각각에 CRNN (Convolutional Recurrent Neural Network) 심층 신경망 기술을 적용하여 문자열 전체를 한 번에 인식하였다. 본 연구에서 제안하는 관심문자열 기술 구조는 총 3개의 심층 신경망으로 구성되어 있다. 첫 번째는 관심 문자열 영역을 검출하는 합성곱신경망이고, 두 번째는 관심 문자열 영역 내의 문자열 인식을 위해 영역 내의 이미지를 세로 열 별로 특징 추출하는 합성곱 신경망이며, 마지막 세 번째는 세로 열 별로 추출된 특징 벡터 나열을 문자열로 변환하는 시계열 분석 신경망이다. 관심 문자열은 12자리 기물번호 및 4 ~ 5 자리 사용량이며, 인식 정확도는 각각 0.960, 0.864 이다. 전체 시스템은 Amazon Web Service 에서 제공하는 클라우드 환경에서 구현하였으며 인텔 제온 E5-2686 v4 CPU 및 Nvidia TESLA V100 GPU를 사용하였다. 1일 70만 건의 검침 요청을 고속 병렬 처리하기 위해 마스터-슬레이브 처리 구조를 채용하였다. 마스터 프로세스는 CPU 에서 구동되며, 모바일 기기로 부터의 검침 요청을 입력 큐에 저장한다. 슬레이브 프로세스는 문자열 인식을 수행하는 심층 신경망으로써, GPU에서 구동된다. 슬레이브 프로세스는 입력 큐에 저장된 이미지를 기물번호 문자열, 기물번호 위치, 사용량 문자열, 사용량 위치 등으로 변환하여 출력 큐에 저장한다. 마스터 프로세스는 출력 큐에 저장된 검침 정보를 모바일 기기로 전달한다.

선도적 농림기상 국제협력을 통한 농업과 식량안보분야 전지구기후 서비스체계 구축 전략 (Implementation Strategy of Global Framework for Climate Service through Global Initiatives in AgroMeteorology for Agriculture and Food Security Sector)

  • 이병열;페데리카 로씨;레이몬드 모타;로버트 스테판스키
    • 한국농림기상학회지
    • /
    • 제15권2호
    • /
    • pp.109-117
    • /
    • 2013
  • "전지구기후서비스체계" (GFCS)는 2009년 제3차 세계기후회의에서 기후변화 대응 취약 국가와 소외계층에 대해 보다 효율적인 기후정보를 제공하기 위한 전지구차원의 서비스 제공체계 구축 필요성에 대한 공감을 바탕으로 제안되어, 현재 세계기싱기구를 중심으로 관련 UN 및 국제기구간 공조를 통해 향후 약 10년 동안에 걸쳐 이를 이행하기 위한 노력을 기울일 예정이다. GFCS는 과학적 기후정보와 기후예측을 기후변화 적응과 기후위기관리를 상호 연계할 수 있는 기후서비스 개발을 주도하게 된다. GFCS의 기본구조는 5개 주요 요소로 구성되어 있는데, 이에는 관측/모니터링, 연구/모형/예측, 기후서비스정보시스템 및 사용자인터페이스 플랫폼과 함께 이들 모두를 포괄하는 역량개발이 포함되어 있다. 현재 GFCS의 편익분야 중 자연재해경감, 수자원, 보건 분야와 함께 농업/식량안보분야가 4대 우선순위에 포함되어 있는데, WMO의 농업기상위원회(CAgM)은 동분야에 대한 GFCS의 효율적 이행을 지원하기 위해 GFCS의 5개 요소별로 이를 보완하기 위한 전구차원 선도적 협력방안(GIAM)을 제안 추진하고 있다. GIAM의 취지는 기존의 기후서비스체계의 개별적 서비스 구조를 통합하거나 미흡한 부분을 보완하는 방법 등 최소한의 추가적인 자원 투입으로 최대 시너지효과를 도출하는데 중점을 두고 있다. 관측분야는 전구생물계절관측협의체 구축, 연구분야는 지역/전구 농림기상 파일롯프로젝트 도출, 기후서비스분야는 기존 농업기상웹서버인 WAMIS의 지역 및 기능 확대, 사용자인터페이스분야는 기존 사이버농업기상협의체를 보완하기 위한 전구 농림기상학술협의체 구축, 그리고 역량개발분야는 전구농림기상교육훈련센터 구축 등이 추진 중에 있으며, 이들간의 유기적인 연동 지원을 위한 조정기구와 지원사무국의 설립도 기상청에 의해 가시화되고 있으며, 효율적인 운영을 위한 새로운 거버넌스도 미국 조지메이슨대를 중심으로 구축 중에 있다. 한편 GIAM의 성공적인 이행을 위해서는 전산자원 인프라 구축이 선행되어야 함으로 현재 WAMIS를 지원하기 위해서 세계기상기구 정보시스템(WIS)의 자료수집/생산센터(DCPC-WAMIS) 구축 및 회원국간 전산자원공유를 위한 클라우드 및 그리드 환경 구축도 기상청과 KISTI/부경대 등의 협조를 얻어 추진 중에 있다, GIAM의 궁극적인 목표의 하나는 차세대 기후변화 대응 농림기상전문가의 양성에 있는데 이를 구현하는 방안으로 회원국의 추천을 받은 후보자를 전구농림기상 교육훈련센터 대학원 과정에 학비/수업료 면제조건으로 입학시킨 후, 지역 파일롯프로젝트에 연구원으로 참여, 이를 통해 생활비 등 지원을 받는 한편 농림기상 학술협의체 회원 활동, 국내외 실무그룹 활동 등을 통해 농림기상분야 국제전문가로 양성함으로써 향후 회원국 농업/식량안보분야 기후변화 대응에 절대적으로 필요한 핵심정책연구 담당자로서의 역할을 기대할 수 있을 것이다.

에이전트기반 개방병원 간호기록시스템 설계에 관한 연구 (A Study on Design of Agent based Nursing Records System in Attending System)

  • 김경환
    • 지능정보연구
    • /
    • 제16권2호
    • /
    • pp.73-94
    • /
    • 2010
  • 개방병원에 환자의 입원을 의뢰한 담당 의사들은 환자들의 상태와 제대로 된 간호서비스를 받고 있는지에 대한 정보를 간호기록을 열람함으로써 확인할 수 있다. 하지만 간호기록은 병원의 내부자료로써 외부기관에 쉽게 공개할 수 없는 자료이고 표준화가 확립되어 있지 않아 병원별로 다르게 작성되고 있어 필요한 정보를 공유하는데 많은 어려움이 따른다. 따라서 본 연구에서는 개방병원 간호기록의 작성과 공유를 지원하기 위한 시스템을 개발하고자 하였다. 본 시스템은 우선 간호기록을 실제로 작성하는 간호사의 편의성을 고려하여 간호기록항목사전을 설정하게 하고 간호사와 의사간의 지능형 에이전트를 이용한 협상으로 작성과 공개의 항목을 확정하도록 하였다. 이 모든 과정은 의료기관간의 네트워킹을 지원할 수 있도록 웹기반시스템으로 설계되었고 실제 구현을 통하여 실현가능성을 확인하였다.

공개 소프트웨어를 이용한 기록시스템 구축가능성 연구 ICA AtoM을 중심으로 (A Study on Usability of Open Source Software for Developing Records System : A Case of ICA AtoM)

  • 이보람;황진현;박민영;김형희;최동운;최윤진;임진희
    • 기록학연구
    • /
    • 제39호
    • /
    • pp.193-228
    • /
    • 2014
  • 최근 우리나라는 공공의 기록관리 뿐만 아니라 크고 작은 민간 아카이브에 대한 관심이 높아지고 있다. 이러한 흐름에 따라 설립된 민간 아카이브는 설립 및 관리 주체가 상이할 뿐만 아니라 목적, 형태, 기록의 유형 등이 다양하고, 예산과 인력의 부족, 전문적인 기록관리 담당자가 부재하기 때문에 체계적으로 기록을 관리하기는 쉽지 않다. 시스템에 대한 요구는 계속해서 증대되고 있으나, 이를 해결할 수 있는 전문인력과 예산의 부족으로 난항을 겪고 있다. 이에 민간 아카이브의 시스템에 대한 부담감의 돌파구로서 공개 소프트웨어 기록시스템이 가지는 의미와 동향을 소개하고, AtoM 기능을 상세하게 살펴보았다. 공개 소프트웨어인 AtoM은, 웹 기반의 시스템으로서 웹 브라우저를 통해 접속하여 사용하기 때문에 비교적 사용법이 간편하고 웹 서비스 또한 데이터베이스 서버에 요청하는 방식을 통해 가능하다. 무료로 이용가능하다는 장점을 비롯하여 특정 운영체제나 애플리케이션에 의해 제약을 받지 않고 설치와 운영이 편리하며 호환성, 확장가능성 등이 높아 예산과 인력의 부족을 겪고 있는 민간 아카이브에서 유용하게 사용될 수 있을 것이다. 데이터 관리의 측면에서도 공유와 검색, 활용 등에 대한 상호운용성이 뛰어나기 때문에 향후 민간 아카이브 및 기관 간의 네트워크를 통한 기록물 활용에도 유리하게 작용할 수 있을 것으로 보인다. 추가로, Omeka와의 연계를 통한 전시서비스 기능 확장, Archivematica를 통한 장기보존 등 많은 논의가 필요하다. 그간 공공중심으로 이루어지던 기록관리가 민간으로 그 저변이 확대되어 균형을 이루게 될 수 있는 초석으로 공개 소프트웨어로서의 기록시스템이 역할을 할 수 있을 것으로 기대한다.

A Study on the Meaning and Strategy of Keyword Advertising Marketing

  • Park, Nam Goo
    • 유통과학연구
    • /
    • 제8권3호
    • /
    • pp.49-56
    • /
    • 2010
  • At the initial stage of Internet advertising, banner advertising came into fashion. As the Internet developed into a central part of daily lives and the competition in the on-line advertising market was getting fierce, there was not enough space for banner advertising, which rushed to portal sites only. All these factors was responsible for an upsurge in advertising prices. Consequently, the high-cost and low-efficiency problems with banner advertising were raised, which led to an emergence of keyword advertising as a new type of Internet advertising to replace its predecessor. In the beginning of 2000s, when Internet advertising came to be activated, display advertisement including banner advertising dominated the Net. However, display advertising showed signs of gradual decline, and registered minus growth in the year 2009, whereas keyword advertising showed rapid growth and started to outdo display advertising as of the year 2005. Keyword advertising refers to the advertising technique that exposes relevant advertisements on the top of research sites when one searches for a keyword. Instead of exposing advertisements to unspecified individuals like banner advertising, keyword advertising, or targeted advertising technique, shows advertisements only when customers search for a desired keyword so that only highly prospective customers are given a chance to see them. In this context, it is also referred to as search advertising. It is regarded as more aggressive advertising with a high hit rate than previous advertising in that, instead of the seller discovering customers and running an advertisement for them like TV, radios or banner advertising, it exposes advertisements to visiting customers. Keyword advertising makes it possible for a company to seek publicity on line simply by making use of a single word and to achieve a maximum of efficiency at a minimum cost. The strong point of keyword advertising is that customers are allowed to directly contact the products in question through its more efficient advertising when compared to the advertisements of mass media such as TV and radio, etc. The weak point of keyword advertising is that a company should have its advertisement registered on each and every portal site and finds it hard to exercise substantial supervision over its advertisement, there being a possibility of its advertising expenses exceeding its profits. Keyword advertising severs as the most appropriate methods of advertising for the sales and publicity of small and medium enterprises which are in need of a maximum of advertising effect at a low advertising cost. At present, keyword advertising is divided into CPC advertising and CPM advertising. The former is known as the most efficient technique, which is also referred to as advertising based on the meter rate system; A company is supposed to pay for the number of clicks on a searched keyword which users have searched. This is representatively adopted by Overture, Google's Adwords, Naver's Clickchoice, and Daum's Clicks, etc. CPM advertising is dependent upon the flat rate payment system, making a company pay for its advertisement on the basis of the number of exposure, not on the basis of the number of clicks. This method fixes a price for advertisement on the basis of 1,000-time exposure, and is mainly adopted by Naver's Timechoice, Daum's Speciallink, and Nate's Speedup, etc, At present, the CPC method is most frequently adopted. The weak point of the CPC method is that advertising cost can rise through constant clicks from the same IP. If a company makes good use of strategies for maximizing the strong points of keyword advertising and complementing its weak points, it is highly likely to turn its visitors into prospective customers. Accordingly, an advertiser should make an analysis of customers' behavior and approach them in a variety of ways, trying hard to find out what they want. With this in mind, her or she has to put multiple keywords into use when running for ads. When he or she first runs an ad, he or she should first give priority to which keyword to select. The advertiser should consider how many individuals using a search engine will click the keyword in question and how much money he or she has to pay for the advertisement. As the popular keywords that the users of search engines are frequently using are expensive in terms of a unit cost per click, the advertisers without much money for advertising at the initial phrase should pay attention to detailed keywords suitable to their budget. Detailed keywords are also referred to as peripheral keywords or extension keywords, which can be called a combination of major keywords. Most keywords are in the form of texts. The biggest strong point of text-based advertising is that it looks like search results, causing little antipathy to it. But it fails to attract much attention because of the fact that most keyword advertising is in the form of texts. Image-embedded advertising is easy to notice due to images, but it is exposed on the lower part of a web page and regarded as an advertisement, which leads to a low click through rate. However, its strong point is that its prices are lower than those of text-based advertising. If a company owns a logo or a product that is easy enough for people to recognize, the company is well advised to make good use of image-embedded advertising so as to attract Internet users' attention. Advertisers should make an analysis of their logos and examine customers' responses based on the events of sites in question and the composition of products as a vehicle for monitoring their behavior in detail. Besides, keyword advertising allows them to analyze the advertising effects of exposed keywords through the analysis of logos. The logo analysis refers to a close analysis of the current situation of a site by making an analysis of information about visitors on the basis of the analysis of the number of visitors and page view, and that of cookie values. It is in the log files generated through each Web server that a user's IP, used pages, the time when he or she uses it, and cookie values are stored. The log files contain a huge amount of data. As it is almost impossible to make a direct analysis of these log files, one is supposed to make an analysis of them by using solutions for a log analysis. The generic information that can be extracted from tools for each logo analysis includes the number of viewing the total pages, the number of average page view per day, the number of basic page view, the number of page view per visit, the total number of hits, the number of average hits per day, the number of hits per visit, the number of visits, the number of average visits per day, the net number of visitors, average visitors per day, one-time visitors, visitors who have come more than twice, and average using hours, etc. These sites are deemed to be useful for utilizing data for the analysis of the situation and current status of rival companies as well as benchmarking. As keyword advertising exposes advertisements exclusively on search-result pages, competition among advertisers attempting to preoccupy popular keywords is very fierce. Some portal sites keep on giving priority to the existing advertisers, whereas others provide chances to purchase keywords in question to all the advertisers after the advertising contract is over. If an advertiser tries to rely on keywords sensitive to seasons and timeliness in case of sites providing priority to the established advertisers, he or she may as well make a purchase of a vacant place for advertising lest he or she should miss appropriate timing for advertising. However, Naver doesn't provide priority to the existing advertisers as far as all the keyword advertisements are concerned. In this case, one can preoccupy keywords if he or she enters into a contract after confirming the contract period for advertising. This study is designed to take a look at marketing for keyword advertising and to present effective strategies for keyword advertising marketing. At present, the Korean CPC advertising market is virtually monopolized by Overture. Its strong points are that Overture is based on the CPC charging model and that advertisements are registered on the top of the most representative portal sites in Korea. These advantages serve as the most appropriate medium for small and medium enterprises to use. However, the CPC method of Overture has its weak points, too. That is, the CPC method is not the only perfect advertising model among the search advertisements in the on-line market. So it is absolutely necessary that small and medium enterprises including independent shopping malls should complement the weaknesses of the CPC method and make good use of strategies for maximizing its strengths so as to increase their sales and to create a point of contact with customers.

  • PDF

클라우드 환경에서 MongoDB 기반의 비정형 로그 처리 시스템 설계 및 구현 (Design and Implementation of MongoDB-based Unstructured Log Processing System over Cloud Computing Environment)

  • 김명진;한승호;최운;이한구
    • 인터넷정보학회논문지
    • /
    • 제14권6호
    • /
    • pp.71-84
    • /
    • 2013
  • 컴퓨터 시스템 운용 간에 발생하는 많은 정보들이 기록되는 로그데이터는 컴퓨터 시스템 운용 점검, 프로세스의 최적화, 사용자 최적화 맞춤형 제공 등 다방면으로 활용되고 있다. 본 논문에서는 다양한 종류의 로그데이터들 중에서 은행에서 발생하는 대용량의 로그데이터를 처리하기 위한 클라우드 환경 하에서의 MongoDB 기반 비정형 로그 처리시스템을 제안한다. 은행업무간 발생하는 대부분의 로그데이터는 고객의 업무처리 프로세스 간에 발생하며, 고객 업무 프로세스 처리에 따른 로그데이터를 수집, 저장, 분류, 분석하기 위해서는 별도로 로그데이터를 처리하는 시스템을 구축해야만 한다. 하지만 기존 컴퓨팅환경 하에서는 폭발적으로 증가하는 대용량 비정형 로그데이터 처리를 위한 유연한 스토리지 확장성 기능, 저장된 비정형 로그데이터를 분류, 분석 처리할 수 있는 기능을 구현하기가 매우 어렵다. 이에 따라 본 논문에서는 클라우드 컴퓨팅 기술을 도입하여 기존 컴퓨팅 인프라 환경의 분석 도구 및 관리체계에서 처리하기 어려웠던 비정형 로그데이터를 처리하기 위한 클라우드 환경기반의 로그데이터 처리시스템을 제안하고 구현하였다. 제안한 본 시스템은 IaaS(Infrastructure as a Service) 클라우드 환경을 도입하여 컴퓨팅 자원의 유연한 확장성을 제공하며 실제로, 로그데이터가 장기간 축적되거나 급격하게 증가하는 상황에서 스토리지, 메모리 등의 자원을 신속성 있고 유연하게 확장을 할 수 있는 기능을 포함한다. 또한, 축적된 비정형 로그데이터의 실시간 분석이 요구되어질 때 기존의 분석도구의 처리한계를 극복하기 위해 본 시스템은 하둡 (Hadoop) 기반의 분석모듈을 도입함으로써 대용량의 로그데이터를 빠르고 신뢰성 있게 병렬 분산 처리할 수 있는 기능을 제공한다. 게다가, HDFS(Hadoop Distributed File System)을 도입함으로써 축적된 로그데이터를 블록단위로 복제본을 생성하여 저장관리하기 때문에 본 시스템은 시스템 장애와 같은 상황에서 시스템이 멈추지 않고 작동할 수 있는 자동복구 기능을 제공한다. 마지막으로, 본 시스템은 NoSQL 기반의 MongoDB를 이용하여 분산 데이터베이스를 구축함으로써 효율적으로 비정형로그데이터를 처리하는 기능을 제공한다. MySQL과 같은 관계형 데이터베이스는 복잡한 스키마 구조를 가지고 있기 때문에 비정형 로그데이터를 처리하기에 적합하지 않은 구조를 가지고 있다. 또한, 관계형 데이터베이스의 엄격한 스키마 구조는 장기간 데이터가 축적되거나, 데이터가 급격하게 증가할 때 저장된 데이터를 분할하여 여러 노드에 분산시키는 노드 확장이 어렵다는 문제점을 가지고 있다. NoSQL은 관계형 데이터베이스에서 제공하는 복잡한 연산을 지원하지는 않지만 데이터가 빠르게 증가할 때 노드 분산을 통한 데이터베이스 확장이 매우 용이하며 비정형 데이터를 처리하는데 매우 적합한 구조를 가지고 있는 비관계형 데이터베이스이다. NoSQL의 데이터 모델은 주로 키-값(Key-Value), 컬럼지향(Column-oriented), 문서지향(Document-Oriented)형태로 구분되며, 제안한 시스템은 스키마 구조가 자유로운 문서지향(Document-Oriented) 데이터 모델의 대표 격인 MongoDB를 도입하였다. 본 시스템에 MongoDB를 도입한 이유는 유연한 스키마 구조에 따른 비정형 로그데이터 처리의 용이성뿐만 아니라, 급격한 데이터 증가에 따른 유연한 노드 확장, 스토리지 확장을 자동적으로 수행하는 오토샤딩 (AutoSharding) 기능을 제공하기 때문이다. 본 논문에서 제안하는 시스템은 크게 로그 수집기 모듈, 로그 그래프생성 모듈, MongoDB 모듈, Hadoop기반 분석 모듈, MySQL 모듈로 구성되어져 있다. 로그 수집기 모듈은 각 은행에서 고객의 업무 프로세스 시작부터 종료 시점까지 발생하는 로그데이터가 클라우드 서버로 전송될 때 로그데이터 종류에 따라 데이터를 수집하고 분류하여 MongoDB 모듈과 MySQL 모듈로 분배하는 기능을 수행한다. 로그 그래프생성 모듈은 수집된 로그데이터를 분석시점, 분석종류에 따라 MongoDB 모듈, Hadoop기반 분석 모듈, MySQL 모듈에 의해서 분석되어진 결과를 사용자에게 웹 인터페이스 형태로 제공하는 역할을 한다. 실시간적 로그데이터분석이 필요한 로그데이터는 MySQL 모듈로 저장이 되어 로그 그래프생성 모듈을 통하여 실시간 로그데이터 정보를 제공한다. 실시간 분석이 아닌 단위시간당 누적된 로그데이터의 경우 MongoDB 모듈에 저장이 되고, 다양한 분석사항에 따라 사용자에게 그래프화해서 제공된다. MongoDB 모듈에 누적된 로그데이터는 Hadoop기반 분석모듈을 통해서 병렬 분산 처리 작업이 수행된다. 성능 평가를 위하여 로그데이터 삽입, 쿼리 성능에 대해서 MySQL만을 적용한 로그데이터 처리시스템과 제안한 시스템을 비교 평가하였으며 그 성능의 우수성을 검증하였다. 또한, MongoDB의 청크 크기별 로그데이터 삽입 성능평가를 통해 최적화된 청크 크기를 확인하였다.