• 제목/요약/키워드: Data dictionary

검색결과 346건 처리시간 0.031초

텍스트마이닝을 활용한 러닝 어플리케이션 사용자 리뷰 분석: Nike Run Club과 Runkeeper를 중심으로 (Analysis of User Reviews of Running Applications Using Text Mining: Focusing on Nike Run Club and Runkeeper)

  • 류기문;김일광
    • 산업융합연구
    • /
    • 제22권4호
    • /
    • pp.11-19
    • /
    • 2024
  • 본 연구의 목적은 텍스트마이닝을 활용하여 러닝 어플리케이션 사용자의 리뷰를 분석하였다. 본 연구는 python3의 selenium 패키지를 이용하여 google playstore의 Nike Run Club, Runkeeper의 사용자 리뷰들을 분석자료로 이용하였으며, okt 분석기를 통해 한글 명사만을 남겨 형태소를 분리하였다. 형태소 분리 후 rankNL 사전을 만들어 불용어(stopword)를 제거하였다. 자료 분석을 위해 텍스트마이닝의 TF(빈도분석), TF-IDF(키워드 빈도-문서 역빈도), LDA 토픽모델링을 통해 분석하였다. 본 연구의 결과는 다음과 같다. 첫째, Nike Run Club, Runkeeper 어플리케이션 사용자 리뷰에서 공통적으로 상위 키워드로 '기록', '앱', '운동'의 키워드가 도출되었으며 TF, TF-IDF의 순위에는 차이가 나타났다. 둘째, Nike Run Club의 LDA 토픽모델링으로 '기본 항목', '추가 기능', '오류 사항', '위치기반데이터'의 토픽이 도출되었고 Runkeeper는 '오류 사항', '음성 기능', '러닝 데이터', '사용 혜택', '사용 동기'의 토픽이 도출되었다. 결과를 통해 제언하면 어플리케이션의 경쟁력 향상을 기여하기 위해 오류 및 개선사항을 보완해야 한다.

REDIS를 활용한 학급경영 웹 애플리케이션 프레임워크의 설계 (Design of Web Application Framework Using REDIS for Class Management)

  • 박준석;전석주
    • 정보교육학회논문지
    • /
    • 제18권3호
    • /
    • pp.381-390
    • /
    • 2014
  • 전통적인 학급경영시스템은 교사의 독단적인 의사에 의해 운영되는 경우가 일반적이다. 그러나 오늘날에는 자질을 갖춘 민주시민을 양성하기 위해 학생과 교사 모두 함께 자치 규범을 만들어 스스로 학급을 운영하도록 요구하고 있다. 그래서 기존의 학급 경영시스템은 이러한 다양성을 가진 오늘날의 학급에 더 이상 적합하지 않다. 본 연구에서는 REDIS를 활용한 학급경영 웹 어플리케이션 프레임워크를 설계한다. REDIS는 일종의 다양한 키 값을 저장하는 데이터 저장소인데 보통 공유 메모리를 가진 웹 어플리케이션을 개발하기 위한 솔루션을 제공한다. 개발될 웹 어플리케이션 프레임워크는 사용의 편의성과 접근성을 최대화하도록 설계되어진다. 이러한 학급경영시스템은 프레임워크에서 기본적으로 제공되는 다양한 템플릿 함수들을 사용하여 효과적으로 시스템의 확장성이 향상될 수 있다.

가상 온스크린 키보드를 이용한 비밀번호 입력의 취약점 분석 (Analysis on Vulnerability of Password Entry Using Virtual Onscreen Keyboard)

  • 보부르;김혜진;이경희;양대헌
    • 정보보호학회논문지
    • /
    • 제26권4호
    • /
    • pp.857-869
    • /
    • 2016
  • 패스워드 기반 인증 시스템은 키 로그 모니터링을 통한 정보 유출 사고에 위협받아 왔다. 최근, 이를 예방하기 위한 한 방안으로 화면 상 가상 키보드를 이용한 키 로깅 방지 방법이 널리 사용되고 있다. 그러나 이러한 가상 키보드 또한 중대한 취약점을 내포하고 있으며, 그 중 대표적인 약점은 마우스 커서의 자취 추적을 통해 쉽게 비밀번호와 같은 주요 정보가 드러날 수 있다는 점이다. 이에 본 논문에서는 가상 키보드의 취약점을 확인하고, 이를 공격할 수 있는 가상의 공격 시나리오와 패스워드를 도출하는 방법을 제시했다. 이 논문에서 제안하는 기법의 성능 입증을 위한 예시로, 한 가상 키보드에 대한 공격과 패스워드 딕셔너리를 이용한 크래킹 실험을 진행하였고, 그 결과를 분석하였다.

A Korean Homonym Disambiguation System Based on Statistical, Model Using weights

  • Kim, Jun-Su;Lee, Wang-Woo;Kim, Chang-Hwan;Ock, Cheol-young
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2002년도 Language, Information, and Computation Proceedings of The 16th Pacific Asia Conference
    • /
    • pp.166-176
    • /
    • 2002
  • A homonym could be disambiguated by another words in the context as nouns, predicates used with the homonym. This paper using semantic information (co-occurrence data) obtained from definitions of part of speech (POS) tagged UMRD-S$^1$), In this research, we have analyzed the result of an experiment on a homonym disambiguation system based on statistical model, to which Bayes'theorem is applied, and suggested a model established of the weight of sense rate and the weight of distance to the adjacent words to improve the accuracy. The result of applying the homonym disambiguation system using semantic information to disambiguating homonyms appearing on the dictionary definition sentences showed average accuracy of 98.32% with regard to the most frequent 200 homonyms. We selected 49 (31 substantives and 18 predicates) out of the 200 homonyms that were used in the experiment, and performed an experiment on 50,703 sentences extracted from Sejong Project tagged corpus (i.e. a corpus of morphologically analyzed words) of 3.5 million words that includes one of the 49 homonyms. The result of experimenting by assigning the weight of sense rate(prior probability) and the weight of distance concerning the 5 words at the front/behind the homonym to be disambiguated showed better accuracy than disambiguation systems based on existing statistical models by 2.93%,

  • PDF

텍스트마이닝 기법을 활용한 한국인의 행복과 불행 탐색연구 (An Exploratory Study of Happiness and Unhappiness Among Koreans based on Text Mining Techniques)

  • 박상현;도강혁;김학영;박가은;윤진혁;김경일
    • 한국콘텐츠학회논문지
    • /
    • 제18권7호
    • /
    • pp.10-27
    • /
    • 2018
  • 본 연구에서는 텍스트 마이닝 분석을 통해 한국 사회에서 행복과 불행이 갖는 의미를 탐색하였다. 자료수집 및 분석을 위하여 온라인 뉴스 포털에서 Word2Vec과 TF-IDF 방법을 사용하여 '행복' 및 '불행' 키워드와 유사한 단어를 추출했다. 또한 K-LIWC 사전을 사용하여 행복 및 불행과 연관된 단어들의 감성 속성에 대해 알아보았다. TF-IDF 분석 결과, 행복과 불행은 사회적 요인과 해당 년도의 사회적 이슈들과 각각 높은 관련성이 있는 것으로 관찰됐다. Word2Vec 분석에서는 '희망'이 6년 연속으로 행복과 유사성이 높은 단어로 나타났다. K-LIWC 분석에서 '돈재정적이슈', '학교', '의사소통'은 행복 및 불행과 모두 관련성이 높았다. 그밖에 '몸 상태와 증상'이 불행과 높은 관련성이 있는 범주로 나타났다. 이러한 결과를 바탕으로 본 연구의 의의, 제한점 및 후속연구에 대한 필요성을 논의하였다.

언해의서 비교고찰을 통한 한의학용어의 번역표준안 - 『언해두창집요』, 『언해구급방』, 『언해태산집요』를 중심으로 (Standard Translation of Terms of Korean Medicine through Consideration of Chinese-Korean Collated Medical Classics - With focus on 『Eonhaegugeupbang』, 『Eonhaetaesanjipyo』 and 『Eonhaetaesanjipyo』 -)

  • 구현희;김현구;이정현;오준호;권오민
    • 한국한의학연구원논문집
    • /
    • 제18권3호
    • /
    • pp.49-61
    • /
    • 2012
  • This article set out to develop an old Chinese - modern Korean collated terminology by analyzing and paralleling Chinese-Korean translational terms relevant to Korean medicine at a minimum meaning unit from "Eonhaegugeupbang", "Eonhaetaesanjipyo" and "Eonhaetaesanjipyo". Those are composed of original Chinese texts and their subsequent corresponding Korean translations. It tries to make a list of translational standards of Korean medicine terms by classifying the cases of translational ambiguity in terms of disease, body position, thumbnail-pressing acupuncture method, and disease-curing method. The above-mentioned ancient books are medical classics written by Huh Jun, the representative medical physician, and published by the Joseon government. Thus, they are appropriate enough as historically legitimate medical documents, from which are drawn out words and terms to form an old Chinese - modern Korean collation dictionary. This collation glossary will contribute to the increased relevance of data ming, or information retrieval. in a database system and information search engine of massive Korean medical records, by means of providing a novel way to obtaining synchronized results between the original writings of old Chinese and the secondary translated ones of modern Korean. The glossary will promote the collective but consistent translation of numerous old archives of Korean medicine and in other related fields as well.

임베디드 시스템 테스팅을 위한 체크리스트로부터 테스트 스크립트 자동 생성 방안 (A Method to Automatically Generate Test Scripts from Checklist for Testing Embedded System)

  • 강태훈;김대준;정기현;최경희
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권12호
    • /
    • pp.641-652
    • /
    • 2016
  • 본 논문은 임베디드 시스템 테스트를 위해 산업현장에서 많이 사용하는 체크리스트를 기반으로 테스트 스크립트를 자동으로 생성하기 위한 방법을 제안한다. 제안하는 방법은 수동 생성에서 발생할 수 있는 오류를 줄일 수 있을 뿐만 아니라, 기존의 체크리스트로는 테스트하지 못하는 다양한 모드 조합을 테스트하기 위한 테스트 스크립트도 생성할 수 있다. 체크리스트에 있는 테스트 명령어는 테스트 명령어 사전에 정의된 신호 값을 참조하여 테스트 스크립트로 변환된다. 또한, 체크리스트를 정의된 일련의 연관된 동작의 집합인 모드들 간의 동작을 확인할 수 있게 하는 순차적, Double permutation 및 무작위 방법으로 테스트 스크립트를 생성할 수 있는 방법을 제안한다. 제안된 방법은 구현되었고, 실험을 통해 그 가능성을 보여준다.

A method of X-ray source spectrum estimation from transmission measurements based on compressed sensing

  • Liu, Bin;Yang, Hongrun;Lv, Huanwen;Li, Lan;Gao, Xilong;Zhu, Jianping;Jing, Futing
    • Nuclear Engineering and Technology
    • /
    • 제52권7호
    • /
    • pp.1495-1502
    • /
    • 2020
  • A new method of X-ray source spectrum estimation based on compressed sensing is proposed in this paper. The algorithm K-SVD is applied for sparse representation. Nonnegative constraints are added by modifying the L1 reconstruction algorithm proposed by Rosset and Zhu. The estimation method is demonstrated on simulated spectra typical of mammography and CT. X-ray spectra are simulated with the Monte Carlo code Geant4. The proposed method is successfully applied to highly ill conditioned and under determined estimation problems with a good performance of suppressing noises. Results with acceptable accuracies (MSE < 5%) can be obtained with 10% Gaussian white noises added to the simulated experimental data. The biggest difference between the proposed method and the existing methods is that multiple prior knowledge of X-ray spectra can be included in one dictionary, which is meaningful for obtaining the true X-ray spectrum from the measurements.

Hybrid model을 이용한 건강불감증의 개념분석 (Concept Analysis of Health Insensitivity using Hybrid Model)

  • 이동숙;이은옥
    • 보건교육건강증진학회지
    • /
    • 제20권3호
    • /
    • pp.145-170
    • /
    • 2003
  • The purpose of this study was to clarity the concept of health insensitivity using Hybrid model, which consists of three phases: theoretical, empirical, and analytic. In the theoretical phase, the definitions of health insensitivity were searched in korean dictionary and examples used in the websites because the concept of health insensitivity has never been studied before. Two dimensions of health insensitivity emerged out from this investigation were cognitive and behavioral. And then a working definition of health insensitivity was established. The sub-concepts and related factors of health insensitivity were identified through the extensive reviews of the literature focusing on two dimensions of cognitive and behavioral. In the empirical phase, in order to obtain description of health insensitivity, face-to-face in-depth interviews were conducted with nine persons who are not related to professional health care. Grounded theory approach was applied to analyze these qualitative data. In the final analytic phase, theoretical results and empirical results were analyzed in the integrated way and a theoretical framework of health insensitivity was established. A refined definition of health insensitivity was that decreased health risk perception in cognitive dimension and conduction of the unhealthy behaviors in behavioral dimension. Sub-concepts of decreased health risk perception were optimistic bias and decreased general fear. Sub-concepts of unhealthy behavior were doing health threatening behavior and not doing desirable health behavior. The contact of health information was a causal condition of health insensitivity. Optimistic disposition, health locus of control, and avoidance coping style were intervening conditions of health insensitivity. Three types of health insensitivity were identified: unconcern or ignorance type, optimistic bias type, and cognitive dissonance type. Finally, The implications of these findings for further research and nursing practice are discussed.

전북 서해안권 국가지질공원 지질명소 안내 표지판에 사용된 용어 분석 (An Analyses of the Terms used in the Information Boards of Geosites at Jeonbuk West Coast National Geopark)

  • 신영준;조규성
    • 한국지구과학회지
    • /
    • 제41권1호
    • /
    • pp.40-47
    • /
    • 2020
  • 본 연구는 전북 서해안권 국가지질공원 지질명소의 안내 표지판에 기술된 용어를 분석하였다. 안내 표지판에 기술된 용어들 중 명사만을 추출하여 표준국어대사전, 지구과학 학술용어집, 2015개정 교육과정에 따른 교과용 도서 개발을 위한 편수 자료를 기준으로 등재 여부를 확인하여 8가지 유형으로 분류하였다. 추출된 용어 중 71개(10.8%)의 용어는 어느 용어집에도 등재되지 않은 [유형 8]에 해당하는 용어들이었다. 이 유형의 용어들은 대부분이 [명사]+[명사] 또는 [명사]+[접사]가 결합하여 파생된 합성어로 그 의미를 명확하게 해석하여 이해하기란 쉽지 않은 것으로 판단되었다. 또한 256개(46%)의 용어가 전문 분야에서 사용되는 전문 용어로 확인되었다. 따라서 국가지질공원 안내 표지판의 제작에 있어 일반인들과 학생들이 더 쉽게 읽고 이해할 수 있도록 전문 용어를 가급적 쉽게 풀어서 기술하고 전문 용어를 사용할 경우에는 용어에 대한 주석을 달아 부연 설명을 통해 충분한 교육적 효과를 얻을 수 있도록 해야 할 것이다.