• 제목/요약/키워드: Intelligent Distribution

검색결과 553건 처리시간 0.03초

텍스트 마이닝 기법을 적용한 뉴스 데이터에서의 사건 네트워크 구축 (Construction of Event Networks from Large News Data Using Text Mining Techniques)

  • 이민철;김혜진
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.183-203
    • /
    • 2018
  • 전통적으로 신문 매체는 국내외에서 발생하는 사건들을 살피는 데에 가장 적합한 매체이다. 최근에는 정보통신 기술의 발달로 온라인 뉴스 매체가 다양하게 등장하면서 주변에서 일어나는 사건들에 대한 보도가 크게 증가하였고, 이것은 독자들에게 많은 양의 정보를 보다 빠르고 편리하게 접할 기회를 제공함과 동시에 감당할 수 없는 많은 양의 정보소비라는 문제점도 제공하고 있다. 본 연구에서는 방대한 양의 뉴스기사로부터 데이터를 추출하여 주요 사건을 감지하고, 사건들 간의 관련성을 판단하여 사건 네트워크를 구축함으로써 독자들에게 현시적이고 요약적인 사건정보를 제공하는 기법을 제안하는 것을 목적으로 한다. 이를 위해 2016년 3월에서 2017년 3월까지의 한국 정치 및 사회 기사를 수집하였고, 전처리과정에서 NPMI와 Word2Vec 기법을 활용하여 고유명사 및 합성명사와 이형동의어 추출의 정확성을 높였다. 그리고 LDA 토픽 모델링을 실시하여 날짜별로 주제 분포를 계산하고 주제 분포의 최고점을 찾아 사건을 탐지하는 데 사용하였다. 또한 사건 네트워크를 구축하기 위해 탐지된 사건들 간의 관련성을 측정을 위하여 두 사건이 같은 뉴스 기사에 동시에 등장할수록 서로 더 연관이 있을 것이라는 가정을 바탕으로 코사인 유사도를 확장하여 관련성 점수를 계산하는데 사용하였다. 최종적으로 각 사건은 각의 정점으로, 그리고 사건 간의 관련성 점수는 정점들을 잇는 간선으로 설정하여 사건 네트워크를 구축하였다. 본 연구에서 제시한 사건 네트워크는 1년간 한국에서 발생했던 정치 및 사회 분야의 주요 사건들이 시간 순으로 정렬되었고, 이와 동시에 특정 사건이 어떤 사건과 관련이 있는지 파악하는데 도움을 주었다. 또한 일련의 사건들의 시발점이 되는 사건이 무엇이었는가도 확인이 가능하였다. 본 연구는 텍스트 전처리 과정에서 다양한 텍스트 마이닝 기법과 새로이 주목받고 있는 Word2vec 기법을 적용하여 봄으로써 기존의 한글 텍스트 분석에서 어려움을 겪고 있었던 고유명사 및 합성명사 추출과 이형동의어의 정확도를 높였다는 것에서 학문적 의의를 찾을 수 있다. 그리고, LDA 토픽 모델링을 활용하기에 방대한 양의 데이터를 쉽게 분석 가능하다는 것과 기존의 사건 탐지에서는 파악하기 어려웠던 사건 간 관련성을 주제 동시출현을 통해 파악할 수 있다는 점에서 기존의 사건 탐지 방법과 차별화된다.

데이터마이닝을 이용한 허위거래 예측 모형: 농산물 도매시장 사례 (Detection of Phantom Transaction using Data Mining: The Case of Agricultural Product Wholesale Market)

  • 이선아;장남식
    • 지능정보연구
    • /
    • 제21권1호
    • /
    • pp.161-177
    • /
    • 2015
  • 정보기술의 빠른 진화, 빅데이터의 등장, 분석기법의 고도화 등으로 인해 다량의 데이터로부터 의미있는 정보를 추출하는 데이터마이닝을 다양한 영역에 활용하고자 하는 시도들이 활발히 진행되고 있다. 그 중의 한 분야가 농산물 유통영역인데, 농산물에 대한 지속적인 수요 증가와 전자경매의 활성화 등으로 수도권 농산물 도매시장에서만도 연간 수천만건 이상의 거래가 이루어 진다. 그러나 급속한 거래량 증가와 더불어 과거로부터 관행적으로 이루어지고 있는 부정거래도 함께 증가하고 있는데 거래참가자들 사이의 결탁에 의해 발생하는 농산물 도매시장의 부정거래는 점차 지능화되는 추세이며, 이들을 감지하고 적발하기가 매우 어려운 실정이다. 이로 인해 농산물 유통환경의 공정거래 질서는 침해되고 시장에 대한 신뢰는 훼손되곤 한다. 따라서 거래투명성을 제고하고 유통비리를 구조적으로 개선하기 위한 과학적이고 자동화된 부정탐지시스템의 필요성이 어느 때보다도 절실히 요구되는 상황이다. 본 연구에서는 데이터마이닝의 의사결정나무를 이용하여 실제 발생하지 않은 거래를 실물 없이 거래한 것처럼 조작하여 대금을 정산하는 행위인 허위거래를 탐지하는 모형을 제시하였다. 이를 위해 실제 농산물 도매시장의 데이터를 수집하였고, 데이터의 정제 및 표준화 등의 선행작업을 수행하였다. 또한 변수 간의 상관관계 및 분포도 분석 등을 통해 데이터의 특성을 파악한 후 예측모형을 구축하여 허위거래와 정상거래를 분류하는 패턴을 도출하였으며, 최종적으로 시험용 데이터를 이용하여 모형을 평가하는 단계를 거쳐 결과의 적합성을 확인하였다. 향후 데이터마이닝을 이용한 부정탐지 모형을 허위거래뿐만 아니라 낙찰부정, 경매조작 등과 같이 다양화되는 부정거래에 적용하게 되면 보다 지대한 효과를 거둘 수 있으리라 사료된다.

개별 기업에 대한 인터넷 검색량과 주가변동성의 관계: 국내 코스닥시장에서의 산업별 실증분석 (The Relationship between Internet Search Volumes and Stock Price Changes: An Empirical Study on KOSDAQ Market)

  • 전새미;정여진;이동엽
    • 지능정보연구
    • /
    • 제22권2호
    • /
    • pp.81-96
    • /
    • 2016
  • 최근 인터넷의 보편화와 정보통신 기술의 발달로 인해 인터넷을 통한 정보검색이 일상화 됨에 따라 주식에 관한 정보 역시 검색엔진, 소셜네트워크서비스, 인터넷 커뮤니티 등을 통해 획득하는 경우가 잦아졌다. 특정 단어에 대한 키워드 검색량은 사용자의 관심도를 반영하기 때문에 다양한 연구에서 개별 기업에 대한 인터넷 검색량은 투자자의 관심도에 대한 척도로서의 사용가능성을 각광받았다. 특정 주식에 대한 투자자의 관심이 증가할 때 일시적으로 주가가 상승하였다가 회복하는 반전현상은 여러 연구를 통해 검증되어 왔지만 그 동안 투자자의 관심도는 주로 주식거래량, 광고 비용 등을 사용해 간접적으로 측정되었다. 본 연구에서는 국내 코스닥 시장에 상장된 기업에 대한 인터넷 검색량을 투자자의 관심의 척도로 사용하여 투자자의 관심에 근거한 주가변동성의 변화를 전체 시장 측면과 산업별 측면에서 관찰한다. 또한 투자자 관심이 야기한 가격압박에 의한 주가 반전현상의 존재를 코스닥 시장에서 검증하고 산업 간의 반전정도의 차이를 비교한다. 실증분석 결과 비정상적인 인터넷 검색량 증가는 주가변동성의 유의적인 증가를 가져왔고 이러한 현상은 IT S/W, 건설, 유통 산업군에서 특히 강하게 나타났다. 비정상적인 인터넷 검색량의 증가 이후 2주 간 주가변동성이 증가하였고 3~4주 후에는 오히려 변동성이 감소하는 것을 확인하였다. 이러한 주가 반전현상 역시 IT S/W, 건설, 유통 산업군에서 보다 극단적으로 발생하는 것으로 나타난다.

18F-FDG 자동분주기 사용에 따른 유용성 평가 (Effectiveness Evalution of 18F-FDG Auto Dispenser (RIID: Radiopharmaceutical Intelligent Dispenser))

  • 유문곤;문재승;김수근;신민용;안성철;이태훈;안승현
    • 핵의학기술
    • /
    • 제22권2호
    • /
    • pp.79-83
    • /
    • 2018
  • $^{18}F-FDG$가 비방사능이 높을 때는 원하는 만큼의 방사능량을 분주하기 어려워 작업시간이 증가하여 분배하는 실내의 공간선량율 및 방사성 오염이 증가하고 있다. 따라서 수동분주 과정에서 환자에게 투여되는 실제 용량을 평가함과 동시에 자동분주기를 이용하여 환자에게 투여되는 실제 용량과의 차이를 비교 분석하여 자동분주기의 유용성에 대하여 알아보고자 한다. 2016년 7월부터 2016년 12월까지 $^{18}F-FDG$를 이용하여 작업종사자가 수동 분주하여 투여한 환자 846명과 2017년 7월 부터 2017년 12월까지 자동분주장치에서 분주된 $^{18}F-FDG$를 투여한 환자 906명을 대상으로 하였으며 환자 체중의 10%에 해당하는 권고용량을 기준으로 실제 투여량과 권고용량 대비 상대오차를 산출하여 두 그룹 간의 평균값을 비교 분석하였다. 수동분주과정에서 환자에게 투여된 용량은 권고용량 대비 평균 $35.41{\pm}27.79%$로 나타났고 자동분주과정에서는 권고 용량 대비 평균 $-2.15{\pm}3.99%$로 나타나 자동분주과정에서의 권고용량에 대한 상대오차가 월등히 작은 것으로 나타났다(p<0.05). 자동분주기에서 분주되는 동안 작업종사자가 직접 방사성 의약품을 만질 필요가 없으며 멀리 떨어져 다른 업무가 가능하므로 피폭을 받는 시간과 거리를 함께 감소시킬 수장점이 있었다. 향후 많은 의료기관에서 도입하여 사용할 경우 환자에게 투여되는 용량을 줄일 수 있을 뿐만 아니라 작업 종사자들의 피폭선량 저감에 도움이 될 것으로 판단된다.

2차 법률정보 전문데이터베이스에 있어서 통제어 색인시스템과 자연어 색인시스템의 검색효율 평가에 관한 연구 (A Study on the Indexing System Using a Controlled Vocabulary and Natural Language in the Secondary Legal Information Full-Text Databases : an Evaluation and Comparison of Retrieval Effectiveness)

  • 노정란
    • 한국문헌정보학회지
    • /
    • 제32권4호
    • /
    • pp.69-86
    • /
    • 1998
  • 본 연구는 2차 법률정보 전문 데이터베이스 구축을 위한 기초연구(권기원, 노정란, 1998, 한국문헌정보학회지, 32(3))에서 밝혀진 법률정보의 특성을 근거로 알고리즘을 개발하고 알고리즘에 의한 모형 통제어 데이터베이스를 구축하여 통제어 색인 시스템과 자연어 색인 시스템의 검색효율을 비교 평가한 것이다. 연구 결과 2차 법률 정보 전문 데이터베이스에서 통제어 색인 시스템은 재현을, 정확률, 자연어 시스템이 검색하지 못한 고유한 적합 문헌을 검색하는 능력에 있어서 자연어 색인시스템보다 높은 효율을 나타내었다. 또한 일반적으로 가중치를 부여하거나 접근점을 추가할 경우 데이터베이스의 정확률이나 재현율의 향상을 가져올 수 있다고 보고 있으나, 2차 법률정보 전문 데이터베이스에서는 법률정보라는 특정 지식 분야의 특성으로 인하여 가중치를 부여하거나 접근점을 추가한 경우에도 재현율과 정확률의 향상을 나타내지 않는다는 사실이 맞혀졌다. 그러므로 정보시스템 설계자는 시스템을 단순히 언어학적, 통계학적 방법으로 접근하기보다는 정보전문가와 주제전문가가 인식하고 있는 각 주제분야의 고유 지식을 시스템에 내장시키는 것이 필요하다고 할 수 있다.

  • PDF

일차전단변형이론을 이용한 복합재료 적층평판의 효율적 열응력 해석 (Efficient Thermal Stress Analysis of Laminated Composite Plates using Enhanced First-order Shear Deformation Theory)

  • 한장우;김준식;조맹효
    • 한국전산구조공학회논문집
    • /
    • 제25권6호
    • /
    • pp.505-512
    • /
    • 2012
  • 본 논문에서는 일차전단변형 평판 이론(FSDT)의 개선을 통한 복합재료 적층평판의 효율적 열응력 해석 기법을 제안한다. 횡방향 응력 성분에 대해서만 변분을 취하는 혼합변분이론(Mixed variational theorem)을 이용하여 횡방향 변형에너지를 개선하였다. 가정된 횡방향 전단응력 성분들은 효율적 고차이론으로부터 구하였으며, 면내 변위 성분들은 일차적층평판 이론의 변위장을 사용하였다. 또한, 열응력 해석에 있어서 횡방향 수직 변형을 효과적으로 고려하기 위해서 횡방향 수직 변위를 두께방향에 대하여 포물선으로 가정하였다. 이 과정을 통하여 얻어진 전단변형 에너지를 본 논문에서는 횡방향 수직 변형이 고려된 개선된 일차전단변형이론(EFSDTM_TN)이라고 명명하였다. 제안된 EFSDTM_TN은 복합재료 적층평판의 열탄성 거동을 해석함에 있어서 횡방향 수직 변형이 고려된 일차전단변형 평판 이론(FSDT_TN)과 비슷한 수준의 계산만을 필요로 하며, 동시에 후처리 과정을 통하여 열변형 및 열응력의 두께방향 분포를 정확하게 예측할 수 있도록 개선하였다. 계산된 결과는 FSDT_TN, 3차원 탄성해 등의 결과와 비교하여 검증하였다.

DESIGN OF AIR SEAT CUSHION ORTHOSIS FOR PLEGIA

  • Hong, Jung-Hwa;Kim, Gyoo-Suk;Kim, Jong-Kwon;Mun, Mu-Seong;Ryu, Jei-Cheong;Lee, In-Huk;Lee, Jong-Keun
    • 한국정밀공학회:학술대회논문집
    • /
    • 한국정밀공학회 2002년도 춘계학술대회 논문집
    • /
    • pp.121-123
    • /
    • 2002
  • The design of an air seat cushion for preventing decubitus ulcer includes many design factors such as the even distribution of interface pressure, the minimization of mean and peak interface pressure values, and the reduction of interface shear force and pressure gradient. It involves the anatomic condition of plegia's buttock as well as air pressure in air cells of cushion. As a result, a suitable design of the cushion satisfying the all requirements is a difficult problem. Therefore, an appropriate and effective numerical tool to develop an air cushion orthosis is required. The purpose of the present study was to develop an air seat cushion orthosis having optimized air cells for evenly distributed interface pressure between the buttock and cushion surface. For the purpose, an advanced finite element (FE) model for the design of air cushion was developed. Since the interface pressure and shear force behavior, as well as stress analyses were primary concern, a FE air cell model was developed and verified by the experiments. Then, the interactions of two cells were checked. Also, the human part of the developed numerical model includes every material property and geometry related to buttock and femoral parts. For construction of dimension data of buttock and femoral parts, CT scans were performed. A commercial FE program was employed for the simulation representing the seating process on the orthosis. Then, sensitive analyses were performed with varying design parameters. A set of optimal design parameters was found satisfying the design criteria of the orthosis. The results were utilized to produce a prototype of the orthosis. Experimentally, the buttock interface pressure distributions from the optimized and previous ones were compared. The new seat orthosis showed a significantly improved interface pressure characteristics compared to the most popular one in the market. The new orthosis will be used for the development of the AI(artificial intelligent) controlled seat orthosis fur prevention of decubitus ulcer fur various plegic patients and the elderly.

  • PDF

LDA 기반 은닉 토픽 추론을 이용한 TV 프로그램 자동 추천 (Automatic TV Program Recommendation using LDA based Latent Topic Inference)

  • 김은희;표신지;김문철
    • 방송공학회논문지
    • /
    • 제17권2호
    • /
    • pp.270-283
    • /
    • 2012
  • 다채널 TV, IPTV 및 Smart TV 서비스의 등장으로 인해 수많은 방송 채널과 방대한 TV 프로그램 콘텐츠가 시청자 단말로 제공됨으로써 시청자들은 자신이 원하는 콘텐츠를 쉽게 찾고 소비하는 것이 어려운 TV 시청 환경을 맞게 되었다. 따라서 TV 사용자들에게 자신이 선호하는 콘텐츠를 자동 추천해 줌으로써 원하는 콘텐츠로의 접근성을 증대시키는 것은 미래의 지능형 TV 서비스에 있어서 주요한 이슈이다. 이에 본 논문에서는 사용자의 선호 취향과 대중의 선호취향을 모두 고려한 협업필터링 개념의 통계적 기계학습 기반 TV 프로그램 추천 모델을 제시한다. 이를 위해 시청한 TV 콘텐츠에 대한 선호 토픽을 사용자의 시청 선호도로 보고, 최근 널리 활용되고 있는 LDA(Latent Dirichlet Allocation)모델을 TV 프로그램 추천 모델에 적용하였다. LDA 기반 TV 프로그램 추천 성능을 개선하기 위해 본 논문에서는 TV시청 이용내역 데이터를 기반으로, TV 사용자들의 관심 토픽을 은닉 변수로 하고, TV 사용자들의 관심 토픽에 대한 다양성을 반영하기 위해 은닉 변수의 확률분포 특성을 비대칭 디리클레(Dirichlet) 분포로 모형화하여 실험에 적용하였다. 제안된 LDA 기반 TV 프로그램 자동 추천 방법의 성능을 검증하기 위해, 유사 시청 특성을 갖는 사용자 그룹에 대해 상위 5개의 TV 프로그램을 일주일 단위로 추천하였을 경우 평균 66.5%, 2개월 단위의 추천에 대해서는 평균 77.9%의 precision 추천 성능을 확인할 수 있었다.

도로 접근성과 기능성을 이용한 통합청주시 농촌지역의 교통 취약성 분석 (Traffic Vulnerability Analysis of Rural Area using Road Accessibility and Functionality in Cheongju City)

  • 전정배;오현교;박진선;윤성수
    • 농촌계획
    • /
    • 제21권2호
    • /
    • pp.11-21
    • /
    • 2015
  • This study carried out evaluation of vulnerability in accessability and functionality using road network that was extracted from Intelligent Transportation System(ITS) and digital map. It was built in order to figure out accessability that locational data which include community center, public facilities, medical facilities and highway IC. The method for grasping functionality are Digital Elevation Model(DEM) and land slide hazard map provided by Korea Forest Service. The evaluation criteria for figure out accessability was set to related comparison of average time in urban area. Functionality value was calculated by the possibility of backing the vehicle possibility of snowfall and landslides. At last, this research computed weighting value through Analytic Hierarchy Process (AHP), calculated a vulnerable score. As the result, the accessability of rural village came out that would spend more time by 1.4 to 3.2 times in comparison with urban area. Even though, vulnerability of the road by a snowfall was estimated that more than 50% satisfies the first class, however, it show up that the road were still vulnerable due snowing because over the 14% of the road being evaluated the fifth class. The functionality has been satisfied most of the road, however, It was vulnerable around Lake Daechung and Piban-ryung, Yumti-jae, Suriti-jae where on the way Boeun. Also, the fifth class road are about 35 km away from the city hall on distance, take an hour to an hour and a half. The fourth class road are about 25 km away from the city hall on distance, take 25 min to an hour. The other class of the road take in 30 min from the city hall or aren't affected of weather and have been analyzed that a density of road is high. In A result that compare between distribution and a housing density came out different the southern and the eastern area, so this result could be suggested quantitative data for possibility of development.

버스정보시스템(BIS) 수집자료를 이용한 경로통행시간 추정 (A Study on Estimating Route Travel Time Using Collected Data of Bus Information System)

  • 이영우
    • 대한토목학회논문집
    • /
    • 제33권3호
    • /
    • pp.1115-1122
    • /
    • 2013
  • 각종 교통정보에 대한 요구수준이 높아지고 있으며 그 중에서도 도시 교통관리나 이용자 측면에서 통행시간 정보는 매우 유용한 것이다. 정확성 높은 통행시간의 추정을 위해서는 신뢰성 높은 교통데이터의 수집이 필수적으로 요구된다. 버스정보시스템(BIS)은 도시 주요도로를 운행하는 시내버스를 대상으로 통행시간 정보를 실시간으로 수집 관리하고 있어 경로통행시간 추정에 매우 유용한 데이터라 할 수 있다. 그러나 기존 BIS수집데이터는 시내버스의 운행과 관련된 정보를 생성하고 안내하는 기능에만 제한적으로 사용되고 있고 다양한 분야에 활용되지 못하고 있는 실정이다. 따라서 본 연구에서는 BIS를 통해 실시간으로 수집되고 있는 데이터를 이용하여 경로통행시간을 추정하기 위한 연구를 수행하였다. 시내버스의 총 통행시간에서 버스정류장서비스시간을 제외한 통행시간을 설명변수로 경로통행시간 추정모형을 구축한 결과 결정계수($R^2$)가 모두 0.950이상이었으며 T-test를 통한 검정결과 통계적으로 유의한 것으로 분석되었다. 따라서 각 가로별로 BIS를 통해 수집되고 있는 시내버스의 통행시간데이터를 설명변수로 이용하면 실시간 경로통행시간 추정이 가능할 것으로 판단된다.