• 제목/요약/키워드: data dictionary

검색결과 350건 처리시간 0.028초

외래어의 발음 실태와 발음 규정 (A Study on the Actual Pronunciation of the Words of Foreign Origin and the Related Rules)

  • 차재은
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2006년도 춘계 학술대회 발표논문집
    • /
    • pp.17-20
    • /
    • 2006
  • The purpose of this paper is to investigate the actual pronunciation of the words of foreign origin on TV news programs, and to review the regulations related to it. To investigate the actual pronunciation of the foreign words, the frequency data of the National Korean Language Institute is used as the subject of investigation. There is a big gap between the actual pronunciation and the orthography of the words of foreign origin. And received pronunciation of foreign words is need to teach or learn Korean efficiently. I suggest the pronunciation of foreign words is marked on Korean dictionary instead of revising the related regulations.

  • PDF

도서관 CRM 시스템의 효율적 추진에 관한 연구 (A Study on the Efficent Propulsion of Customer Relationship Management System for Library)

  • 유양근
    • 한국도서관정보학회지
    • /
    • 제35권3호
    • /
    • pp.251-270
    • /
    • 2004
  • 본 논문에서는 이용자중심의 정보서비스를 제공하는 도서관경영과 사서와 이용자간의 관계를 통해 고객 만족도를 높이는 정보서비스 방안을 제시하기 위하여 CRM을 수행하였다. 또한 도서관 고객의 요구사항의 특성과 일반적인 CRM 시스템의 설계를 고찰하고, 도서관에서의 CRM 시스템에 대한 개념적 모델링 설계와 데이터사전, 이벤트 클레스를 작성하여 도서관 CRM 구축 방안을 제시하였다.

  • PDF

MPEG-21의 DRM 기술 표준화 현황 분석 (Standardization of DRM Technologies in MPEG-21)

  • 정상원
    • 정보관리연구
    • /
    • 제35권2호
    • /
    • pp.107-130
    • /
    • 2004
  • MPEG-21은 상호운용성이 확보되고 저작권이 보호되는 방법으로 디지털 콘텐츠가 생성, 배포, 소비될 수 있도록 하기 위한 개방형 표준 프레임워크이다. 이 글은 DRM 기술을 중심으로 MPEG-21의 각 분야별-거래와 배포의 기본단위인 디지털 아이템 선언(DID), 디지털 아이템 식별(DII), 저작권 관리 및 보호(IPMP), 권리데이터사전(RDD), 권리표현언어(REL), 영구연결기술(PAT), 이벤트 리포팅(ER)-기술 표준화의 개념과 내용을 살펴본다.

Text Mining and Sentiment Analysis for Predicting Box Office Success

  • Kim, Yoosin;Kang, Mingon;Jeong, Seung Ryul
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권8호
    • /
    • pp.4090-4102
    • /
    • 2018
  • After emerging online communications, text mining and sentiment analysis has been frequently applied into analyzing electronic word-of-mouth. This study aims to develop a domain-specific lexicon of sentiment analysis to predict box office success in Korea film market and validate the feasibility of the lexicon. Natural language processing, a machine learning algorithm, and a lexicon-based sentiment classification method are employed. To create a movie domain sentiment lexicon, 233,631 reviews of 147 movies with popularity ratings is collected by a XML crawling package in R program. We accomplished 81.69% accuracy in sentiment classification by the Korean sentiment dictionary including 706 negative words and 617 positive words. The result showed a stronger positive relationship with box office success and consumers' sentiment as well as a significant positive effect in the linear regression for the predicting model. In addition, it reveals emotion in the user-generated content can be a more accurate clue to predict business success.

강교량 상부구조물의 파트라이브러리 시스템 지원을 위한 데이터사전 구축 방법 (A Method of Constructing Data Dictionary for Part Library Systems of Super Structures in Steel Bridges)

  • 양문수;안현정;이상호
    • 한국전산구조공학회:학술대회논문집
    • /
    • 한국전산구조공학회 2011년도 정기 학술대회
    • /
    • pp.239-242
    • /
    • 2011
  • 본 연구에서는 모듈러 강교량의 상부구조 구성요소에 대한 정보의 교환, 검색, 공유가 가능한 데이터사전을 구축하였다. 표준모듈의 계층정의를 위해 기존 교량분류체계를 기반으로, PLIB Part 42에서 제시하는 패밀리 조직 방법론을 적용하였다. 분류된 구성요소와 모듈에 대한 정보의 쉬운 검색 및 접근을 위하여 이름, 동의어, 정의 등과 같은 속성을 정의하였다. 또한 모듈의 형상표현이 가능하도록 속성을 정의하여, 파트라이브러리 시스템의 구성요소인 라이브러리 컨텐츠에 저장된 모듈라이브러리의 사용성을 용이하게 하였다.

  • PDF

공동주택 하자소송 균열쟁점을 통한 전문감정인 제도 개선방안 (Improvement Plan on Appraisal System of Defect Disputes about Cracks on Apartment Buildings)

  • 김법수;박준모;김옥규;서덕석
    • 한국건축시공학회:학술대회논문집
    • /
    • 한국건축시공학회 2011년도 춘계 학술논문 발표대회 1부
    • /
    • pp.185-186
    • /
    • 2011
  • The latest domestic construction sector is receiving economic damage because of defect litigation. The Concrete Crack among them has the largest component in expense of apartment house defect. Also, contradictory suggestion of appraiser is problem. To improve these problem, need objective plan that people concerned can recognize about decision sequence. Therefore, in this study, compared general defect investigation and defect decision of appraiser taking advantage of Data Dictionary analysis method. Also, deduced current problem and amelioration plan.

  • PDF

소셜 데이터의 감성 분석을 위한 신조어 및 이모티콘 감성 사전 구축 (Building a Newly-coined Words and Emoticon Emotional Dictionary for Emotional Analysis of Social Data)

  • 양진솔;윤경일;조영훈;정광식
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.914-917
    • /
    • 2019
  • SNS 의 발전으로 기업이나 공공단체는 소셜 데이터가 가지고 있는 감성이나 의견, 여론 등을 분석해서 신흥 가치를 창출하려 한다. 소셜 데이터를 기반으로 하는 감성 분석은 사람들의 소비 측면 및 제품 평가 파악은 물론 기업 매출 및 정책 수립 등에서 도움이 된다. 하지만 소셜 데이터는 각종 신조어 및 이모티콘이 다수 포함되어 있어 기존 감성 분석 방법으로는 정확한 분석을 하기 어렵다. 이러한 문제를 해결하기 위해 본 논문에서는 신조어 및 이모티콘 감성 사전을 구축하고, 분석 과정에서 기존 감성 사전과 본 논문에서 구축된 신조어 및 이모티콘 감성 사전을 사용하여 감성 분석 정확도를 비교한다.

Modeling Topic Extraction-based Sentiment Analysis Based on User Reviews

  • Kim, Tae-Yeun
    • 통합자연과학논문집
    • /
    • 제14권2호
    • /
    • pp.35-40
    • /
    • 2021
  • In this paper, we proposed a multi-subject-level sentiment analysis model for user reviews using the Latent Dirichlet Allocation (LDA) method targeting user-generated content (UGC). Data were collected from users' online reviews of hotels in major tourist cities in the world, and 30 hotel-related topics were extracted using the entire user reviews through the LDA technique. Six major hotel-related themes (Cleanliness, Location, Rooms, Service, Sleep Quality, and Value) were selected from the extracted themes, and emotions were evaluated for sentences corresponding to six themes in each user review in the proposed sentiment analysis model. Sentiment was analyzed using a dictionary. In addition, the performance of the proposed sentiment analysis model was evaluated by comparing the emotional values for each subject in the user reviews and the detailed scores evaluated by the user directly for each hotel attribute. As a result of analyzing the values of accuracy and recall of the proposed sentiment analysis model, it was analyzed that the efficiency was high.

오피니언 마이닝을 이용한 지능형 VOC 분석시스템 (Intelligent VOC Analyzing System Using Opinion Mining)

  • 김유신;정승렬
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.113-125
    • /
    • 2013
  • 기업 경영에 있어서 고객의 소리(VOC)는 고객 만족도 향상 및 기업의사결정에 매우 중요한 정보이다. 이는 비단 기업뿐만 아니라 대고객, 대민원 업무를 처리하는 모든 조직에 있어서도 동일하다. 때문에 최근에는 기업뿐만 아니라 공공, 의료, 금융, 교육기관 등 거의 모든 조직이 VOC를 수집하여 활용하고 있다. 이러한 VOC는 방문, 전화, 우편, 인터넷게시판, SNS 등 다양한 채널을 통해 전달되지만, 막상 이를 제대로 활용하기는 쉽지 않다. 왜냐하면, 고객이 매우 감정적인 상태에서 고객의 주관적 의사를 음성 또는 문자로 표출하기 때문에 그 형식이나 내용이 정형화되어 있지 않고 저장하기도 어려우며 또한 저장하더라도 매우 방대한 분량의 비정형 데이터로 남기 때문이다. 본 연구는 이러한 비정형 VOC 데이터를 자동으로 분류하고 VOC의 유형과 극성을 판별할 수 있는 오피니언 마이닝 기반의 지능형 VOC 분석 시스템을 제안하였다. 또한 VOC 오피니언 분석의 기준이 되는 주제지향 감성사전 개발 프로세스와 각 단계를 구체적으로 제시하였다. 그리고 본 연구에서 제시한 시스템의 효용성을 검증하기 위하여 의료기관 홈페이지에서 수집한 4,300여건의 VOC 데이터를 이용하여 병원에 특화된 감성어휘와 감성극성값을 도출하여 감성사전을 구축하고 이를 통해 구현된 VOC분류 모형의 정확도를 비교하는 실험을 수행하였다. 그 결과 "칭찬, 친절함, 감사, 무사히, 잘해, 감동, 미소" 등의 어휘는 매우 높은 긍정 오피니언 값을 가지며, "퉁명, 뭡니까, 말하더군요, 무시하는" 등의 어휘들은 강한 부정의 극성값을 가지고 있음을 확인하였다. 또한 VOC의 오피니언 분류 임계값이 -0.50일 때 가장 높은 분류 예측정확도 77.8%를 검증함으로써 오피니언 마이닝 기반의 지능형 VOC 분석시스템의 유효성을 확인하였다. 그러므로 지능형 VOC 분석시스템을 통해 VOC의 실시간 자동 분류 및 대응 우선순위를 도출하여 고객 민원에 대해 신속히 대응한다면, VOC 전담 인력을 효율적으로 운용하면서도 고객 불만을 초기에 해소할 수 있는 긍정적 효과를 기대해 볼 수 있을 것이다. 또한 VOC 텍스트를 분석하고 활용할 수 있는 오피니언 마이닝 모형이라는 새로운 시도를 통해 향후 다양한 분석과 실용 프레임워크의 기틀을 제공할 수 있을 것으로 기대된다.

변이음 HMM을 이용한 고립단어 인식 (Isolated Word Recognition Using Allophone Unit Hidden Markov Model)

  • 이강성;김순협
    • 한국음향학회지
    • /
    • 제10권2호
    • /
    • pp.29-35
    • /
    • 1991
  • 본 논문에서는 변이음 단위의 Hidden Markov Model (HMM)을 이용하여 고립단어를 인식하는 방법을 논한다. 변이음 단위로 HMM을 구성하여 변이음 사전을 만들고, 이 변이음 사전을 이용하여 단어 사전을 구성한다. 변이음 HMM을 이용하여 단어를 구성하려면 변이음 간의 천이확률이 계산되어야 하므로 본 연구에서는 변이음 간의 천이 확률의 영향을 측정하여 그 변이음으로 이루어지는 임의의 단어를 적응없이 적은 수의 적응 데이터로 단어모델을 구성 인식하는 것을 설명한다. 비교를 위하여 단어인식 HMM으로 인식 실험을 한 결과, 변이음 단위 HMM이 적은 기억 용량과 적은 데이터의 훈련으로 단어단위 HMM 이상의 인식률을 얻을 수 있음을 보였다.

  • PDF