• 제목/요약/키워드: Statistics & Information DB

검색결과 53건 처리시간 0.026초

Bayesian Analysis for Neural Network Models

  • Chung, Younshik;Jung, Jinhyouk;Kim, Chansoo
    • Communications for Statistical Applications and Methods
    • /
    • 제9권1호
    • /
    • pp.155-166
    • /
    • 2002
  • Neural networks have been studied as a popular tool for classification and they are very flexible. Also, they are used for many applications of pattern classification and pattern recognition. This paper focuses on Bayesian approach to feed-forward neural networks with single hidden layer of units with logistic activation. In this model, we are interested in deciding the number of nodes of neural network model with p input units, one hidden layer with m hidden nodes and one output unit in Bayesian setup for fixed m. Here, we use the latent variable into the prior of the coefficient regression, and we introduce the 'sequential step' which is based on the idea of the data augmentation by Tanner and Wong(1787). The MCMC method(Gibbs sampler and Metropolish algorithm) can be used to overcome the complicated Bayesian computation. Finally, a proposed method is applied to a simulated data.

Analysis of Impact Between Data Analysis Performance and Database

  • Kyoungju Min;Jeongyun Cho;Manho Jung;Hyangbae Lee
    • Journal of information and communication convergence engineering
    • /
    • 제21권3호
    • /
    • pp.244-251
    • /
    • 2023
  • Engineering or humanities data are stored in databases and are often used for search services. While the latest deep-learning technologies, such like BART and BERT, are utilized for data analysis, humanities data still rely on traditional databases. Representative analysis methods include n-gram and lexical statistical extraction. However, when using a database, performance limitation is often imposed on the result calculations. This study presents an experimental process using MariaDB on a PC, which is easily accessible in a laboratory, to analyze the impact of the database on data analysis performance. The findings highlight the fact that the database becomes a bottleneck when analyzing large-scale text data, particularly over hundreds of thousands of records. To address this issue, a method was proposed to provide real-time humanities data analysis web services by leveraging the open source database, with a focus on the Seungjeongwon-Ilgy, one of the largest datasets in the humanities fields.

Study on Improving Oriental Medicine Statistical System for Multidimensional Statistical Data

  • Yea, Sang-Jun;Kim, Chul;Kim, Jin-Hyun;Jang, Hyun-Chul;Kim, Sang-Kyun;Song, Mi-Young
    • International Journal of Contents
    • /
    • 제7권3호
    • /
    • pp.13-18
    • /
    • 2011
  • Oriental medicine statistics are essential in research planning, research evaluation, and policy decision based on objective data. However, integrated administration of such statistics is not presently possible in the oriental medicine field, which has been slow in incorporating information communication technology. In an effort to address this problem, the Korea Institute of Oriental Medicine (KIOM) developed an oriental medicine statistical system in 2009, and the system has been offered in the traditional medicine information portal of OASIS. However, according to a 2010 survey targeting OASIS users, those surveys reported that needs for a system where various statistical data can be extracted via an interactive approach to multidimensional data. As a result of an analysis of the functions of the existing system, it was found that it is necessary to array and arithmetically analyze Stats Value, Drill Up & Drill Down, and Pivot. To this end, the existing DB schema should be redesigned. Based on our analysis result, we redesigned the database into a structure that is applicable to the reverse pivot algorithm. We used J2EE/JSP and a Flex framework to design and develop an oriental medicine statistical system that can provide multidimensional statistical data. Considering that the improved oriental medicine statistical system is planned to be offered by OASIS of KIOM, utilization and value of oriental medicine statistical data are expected to be enhanced.

쇼핑몰과 경매의 통합 및 DB 통계에 의한 E-mail 마케팅 구현 (Integration of Internet Shopping Mall and Auction and E-mail marketing by Statistics of Database)

  • 박혜란;김효림;이성용;최영복
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (하)
    • /
    • pp.1489-1492
    • /
    • 2000
  • 요즘 전자상거래의 활성화로 전 세계적으로 인터넷 쇼핑몰과 경매 사이트를 운영하는 곳이 많이 있다. 하지만 사용하던 물건을 팔고 새로운 상품을 구매하려고 한다면 일반적으로 중고 물건을 파는 사이트를 찾아서 그곳에서 물건을 팔고 다시 다른 인터넷 쇼핑몰에서 물건을 사야하는 번거러움이 있다. 그리고 쇼핑몰 사이트의 관리자 입장에서는 판매부진상품이나 이원상품 등을 관리하기 어렵다. 또 기존에 구축되어 있는 맡은 쇼핑몰과 경매사이트의 데이터베이스의 활용도를 보면 저장된 상품을 보여주고. 판매가 되면 삭제되는 역할에 국한된 경우가 많다. 본 논문에서는 전자상거래의 사용자가 인터넷을 보다 간편하게 이용하고 사용자가 등록한 중고물품, 쇼핑몰의 판매부진상품, 이월상품의 경매로 인한 구매자의 참여를 위해 쇼핑몰과 경매 사이트를 통합하여 운영하고, 지금까지의 공통적이고 일반적인 내용의 E-mail 마케팅을 데이터 베이스 통계분석에 의해 차별화 되고 집중적인 E-mail 마케팅으로 구현한다.

  • PDF

A Study on Image Recommendation System based on Speech Emotion Information

  • Kim, Tae Yeun;Bae, Sang Hyun
    • 통합자연과학논문집
    • /
    • 제11권3호
    • /
    • pp.131-138
    • /
    • 2018
  • In this paper, we have implemented speeches that utilized the emotion information of the user's speech and image matching and recommendation system. To classify the user's emotional information of speech, the emotional information of speech about the user's speech is extracted and classified using the PLP algorithm. After classification, an emotional DB of speech is constructed. Moreover, emotional color and emotional vocabulary through factor analysis are matched to one space in order to classify emotional information of image. And a standardized image recommendation system based on the matching of each keyword with the BM-GA algorithm for the data of the emotional information of speech and emotional information of image according to the more appropriate emotional information of speech of the user. As a result of the performance evaluation, recognition rate of standardized vocabulary in four stages according to speech was 80.48% on average and system user satisfaction was 82.4%. Therefore, it is expected that the classification of images according to the user's speech information will be helpful for the study of emotional exchange between the user and the computer.

의료기관 전문 의료용 CRM 프레임 설계 (Medical CRM Frame Design for Medical Institution)

  • 김귀정
    • 한국콘텐츠학회논문지
    • /
    • 제8권12호
    • /
    • pp.20-27
    • /
    • 2008
  • 현재 병원에서는 병원관리시스템(HIS), 의료영상시스템(PACS), 처방전달시스템(OCS), 전자의무기록(EMR), 전사적 자원관리(ERP) 등 각 과별 업무별로 독립적인 시스템을 사용하고 있으며, 각 시스템에 종속적인 각각의 DB를 운용하고 있다. 이에 따라 정보의 원내 통합이 불가능하며, 데이터의 투명성과 일관성을 유지하기 어려운 상황이다. 본 연구는 기존의 타 시스템과의 유연한 연계처리를 통한 데이터 통합환경을 제공하고, 이를 통해 고객이 원하는 최적의 서비스를 최적의 타이밍에 제공할 수 있는 의료 CRM 프레임을 설계하였다. 고객관리 프로세스 표준화에 의해 고객관리, 홍보/마케팅, 서비스관리, 통계/분석의 4가지 의료 CRM 프레임을 설계하였고 개인화된 의료정보 서비스 제공을 위한 모바일 의료 콘텐츠를 확보하여 고객 데이터를 바탕으로 고객의 특성과 건강 상황에 따라 맞춤형 모바일 콘텐츠를 제공할 수 있도록 설계하였다.

빅데이터 기반 골목상권 영역설정 방법론 개발 (Development for establishing Big Data-based alley commercial area)

  • 황동현;고경석;박상준;김완수
    • 한국정보전자통신기술학회논문지
    • /
    • 제11권6호
    • /
    • pp.784-792
    • /
    • 2018
  • 본 연구는 골목상권 영역을 실제 점포 중심으로 영역을 구체화하여 대규모 상점들이 밀집한 발달상권, 전통시장 상권을 제외하고 영역을 설계하였다. 뿐만 아니라 지자체 또는 국가가 관리하고 있는 행정통계 및 조사통계 자료인 사업체조사, 상가업소DB 등 실제 데이터를 활용하여 신뢰성과 합리성이 확보될 수 있는 골목상권의 영역설정 방법을 개발했다. 도로명주소의 동일 '길'주소에 해당하는 점포들의 수를 '길'단위 길이 당 점포수로 변환하여 밀도화 하고, 이를 동질성 있게 분류하여 영역을 설정하는 방법으로 설계를 추진하였다. 특히, 분석 결과를 바탕으로 영역을 설정하는 데 있어서 토지 소유권을 구획하는 필지 연결선인 지적선을 활용함으로써 끊임없이 골목 양쪽을 적용하여 구분할 할 수 있도록 하였다. 도출된 골목상권 영역을 밀집도에 따라 5개 그룹으로 분류하였다. 이는 골목상권에 대한 다양한 활용성을 위해 밀집되지 않은 상권부터 밀집된 상권을 구분하여 이용자들은 본인의 관심 상권에 대해 효용적 접근이 가능할 것이라 판단된다.

한국형 교통사고 심층조사 DB 체계 구축에 대한 연구 (A Study on the Construction of the Database Structure for the Korea In-depth Accident Study)

  • 김시우;이재완;윤영한
    • 한국자동차공학회논문집
    • /
    • 제22권2호
    • /
    • pp.29-36
    • /
    • 2014
  • The accident statistics use the data from police accident reports and statistics. Although the official accident statistics are useful, they provide very limited information about how accidents occur, the cause of the accident and the injury mechanisms. This limitations could be overcome by carrying out the in-depth accident study and analysing investigations, collecting more detailed information. Meanwhile a net of in-depth investigation teams are operating worldwide, such as NASS (National Accident Sampling System) and CIREN (Crash Injury Research and Engineering Network) in US, OTS (On the spot investigation) in UK. In this study, the database structure and variables of Korea in-depth accidents investigation system would be proposed through considering the database structure of GIDAS (Germany In-Depth Accidents Study). GIDAS is one of the best system on the in-depth accident study system in the world. GIDAS was established in 1999 as a cooperation project between Federal Highway Research Institute of Germany (BASt) and research association on automotive engineering of German Car Industry(FAT). The iGLAD (Initiative for the Global Harmonization of Accident Data) was also considered to introduce into the database variables of Korea in-depth accident study. Current police reports were compared with GIDAS and iGLAD. To collaborate of the Worldwide in-depth accident data, this paper proposed that the database of Korea in-depth accident study would be introduced the structure of GIDAS and the core variables of iGLAD. Harmonization of the structures and core variables of Korea in-depth accident study will be better than the making unique ones. The database structure and core variables of KIDAS(Korea In-Depth Accident Study) introduced of GIDAS and iGLAD.

산지 내 풍력발전단지 입지 특성 및 적합성 분석 (Analyzing Site Characteristics and Suitability for Wind Farm Facilities in Forest Lands)

  • 권순덕;주우영;김원경;김종호;김은희
    • 한국지리정보학회지
    • /
    • 제17권4호
    • /
    • pp.86-100
    • /
    • 2014
  • 본 연구의 목적은 산지 내 풍력발전단지 입지 적합성 분석을 통해 입지선정 가이드라인과 산지 훼손 최소화를 위한 제도적 개선방안을 도출하는 것이다. 먼저 풍력발전단지 입지 적합성 분석을 위해 국내외 사례 및 현장조사, 연구문헌 고찰을 통해 산지 내 풍력발전단지 입지선정을 위한 요인을 도출하고, 요인별 세부항목 및 가중치를 결정하여 이를 바탕으로 각 항목별 세부평가기준을 수립함으로써 입지 적합성 모델을 개발하였다. 강원도를 사례지역으로 선정하여 풍력자원 밀도 데이터, 법적 산지보전지역, 입지 기준 요인 항목별 자료를 토대로 공간 DB를 구축하여 산지 내 풍력발전 입지가능지역을 도출하였다. 일정 개수 이상의 풍력발전기가 입지할 수 있는 풍력발전단지 잠재 입지가능면적의 추정을 위해서 본 연구에서는 근린분석방법인 Block Statistics와 Focal Statistics 방법을 이용하였다. 그 결과 Block Statistics 방법에 의한 풍력발전기 잠재적 입지가능 면적은 1,261ha이며, Focal Statistics 방법에 의한 풍력발전기 잠재적 입지가능 면적은 1,411ha으로 나타났다. 본 연구의 결과를 바탕으로 대규모 절성토에 의한 산림재해 발생 우려 및 산지경관 훼손을 방지하기 위한 저감대책이 마련되어야 할 것이다.

기초 및 광역지자체 기후변화 취약성 평가를 위한 웹기반 지원 도구(VESTAP) 개발 (Development of Web-Based Supporting Tool (VESTAP) for Climate Change Vulnerability Assesment in Lower and Municipal-Level Local Governments)

  • 오관영;이명진;한도은
    • 한국지리정보학회지
    • /
    • 제19권1호
    • /
    • pp.1-11
    • /
    • 2016
  • 기후변화는 환경 분야에서 가장 주목받는 화두이며, 인류에게 직면한 가장 도적적인 과제이다. 이러한 문제를 해결하는 방법은 다양하지만, 우리나라의 경우 국가 차원의 1~2차 국가기후변화 적응대책을 수립하고, 각 광역 및 기초 지자체의 기후변화 적응 시행대책 수립을 의무화하고 있다. 기후변화 취약성 평가는 기후변화 적응 시행대책을 수립함에 있어 필수적인 역할을 담당한다. 그러나 취약성 평가는 다양한 영향인자의 복합적 연산을 통해 도출됨으로 개별적인 평가를 수행하기에는 어려움이 있다. 이에 본 연구에서는 기초 및 광역 지자체 차원에서 활용 가능한 웹기반 기후변화 취약성 평가 지원도구(VESTAP)를 개발하였다. VESTAP은 크게 지표 DB와 취약성 평가 및 표출 도구로 구성되어 있다. 지표 DB는 RCP(Representative Concentration Pathways) 4.5와 8.5로 모의된 총 455개의 미래 기후자료, 대기 환경자료, 기타 인문사회통계 자료와 그에 따른 메타데이터 정보를 포함한다. 표출 도구는 각 취약성 평가의 결과에 대한 공간분포, 편향성, 도표화 등 다양한 분석 기능을 제공함으로써 편의성을 극대화 하였다. VESTAP를 활용하여 세종특별자치시에 대한 미세먼지에 의한 건강 취약성 평가를 시범적으로 수행하였으며, 부강면이 상대적으로 취약성이 가장 높은 수치를 나타냈다. 개발된 도구를 활용하여 각 지자체는 보다 쉽고, 편리하게, 그리고 과학적 증거에 기반한 기후변화 적응 시행대책을 수립할 수 있을 것으로 기대한다.