• 제목/요약/키워드: Text consistency

검색결과 52건 처리시간 0.025초

텍스트 마이닝을 이용한 소비자 소비패턴 분석 기법 설계 (An Analysis Scheme Design of Customer Spending Pattern using Text Mining)

  • 정은희;이병관
    • 한국정보전자통신기술학회논문지
    • /
    • 제11권2호
    • /
    • pp.181-188
    • /
    • 2018
  • 본 논문에서는 텍스트 마이닝을 이용한 소비자의 소비패턴 분석 기법을 제안하였다. 제안하는 소비패턴 분석기법에서는 첫째, 피어슨의 상관계수를 이용하여 사용자의 평가점수에 대한 유사도를 분석하고, 둘째, 텍스트 마이닝 기법 중의 하나의 TD-IDF의 코사인 유사도를 이용하여 사용자의 리뷰들간의 유사도를 분석하고, 셋째, Sentiwordnet를 이용하여 평가점수와 리뷰의 일치성을 분석하였다. 그리고 제안하는 소비패턴 분석 기법은 평가점수의 유사도와 리뷰의 유사도를 이용하여 근접이웃들을 선정하고, 선정된 이웃에 소비패턴에 적합한 추천리스트를 제공하였다. 추천리스트의 정확도는 피어슨 상관계수가 0.79, TD-IDF가 0.73, 그리고 제안하는 소비패턴분석기법이 0.82로 나타났다. 즉, 제안하는 소비패턴분석기법은 소비자의 정량적인 평가점수와 정성적인 리뷰를 모두 이용하므로 소비 패턴을 좀 더 정확하게 분석할 수 있었다.

게임 관련 이슈 분석을 통한 관련 정책 발전 방향에 관한 연구: 운형함수와 텍스트마이닝 분석을 활용하여 (A Study on the Direction of Development of Related Policies with Game-related Issue Analysis: Using Text Mining and Spline Function Analysis of Newspaper Articles)

  • 장유미;유한별
    • 한국콘텐츠학회논문지
    • /
    • 제22권3호
    • /
    • pp.513-528
    • /
    • 2022
  • 본 연구는 한국의 게임 관련 이슈에 대한 분석과 게임 관련 계획·예산 등 정책에 대한 분석을 진행하여, 향후 관련 정책의 실효성을 높이고, 해당 정책의 사회적 통념과의 일치성을 높이고자 하는데 목적이 있다. 한국은 '음반·비디오물 및 게임물에 관한 법률'로 최초 게임을 규정하고 관련 법제를 확립한 이후 게임산업 진흥과 이스포츠 진흥 등 다양한 법제를 확립해왔다. 하지만 게임산업은 지속적으로 발전하고 있으며, 그 변화 속도는 4차 산업과 AI, 메타버스(metaverse) 등의 등장으로 더욱 빨라지고 있다. 본 연구에서는 이러한 배경에 따라 한국의 신문기사의 변동을 운형함수와 텍스트마이닝 방법으로 분석하여 관련 이슈화를 분석하고, 이슈의 증폭이 나타난 시점에서의 신문기사 내용을 분석해봄으로써 게임 관련 정책에 대한 환류(feedback)를 진행하여 향후 게임 관련 정책에서 다루어야 할 주요 쟁점과 발전방향을 제시한다. 분석결과, 게임 관련 이슈는 다양하게 나타났으며, 게임 관련 규제(과세, 도박 규제, 게임중독 질병화, 수수료 확대 저지) 등과 정부와 지자체의 지원이 공존하였다. 정부는 규제에도 불구하고 지원의 증대와 게임진흥정책에 따라 본 연구에서는 메타버스, NFT 등이 게임에 적용됨으로써 나타나는 문제의 선제적 대응과 게임 관련 전문가 육성, 스타트업 지원, 인력이탈 방지 지원 등을 정책적 함의로 제시한다.

텍스트마이닝을 활용한 교통영향평가 교통개선대책 분석 : 경기도 도시개발사업을 대상으로 (Analysis of Traffic Improvement Measures in Transportation Impact Assessment Using Text Mining : Focusing on City Development Projects in Gyeonggi Province)

  • 양은혜;강희찬;안우영
    • 한국ITS학회 논문지
    • /
    • 제22권2호
    • /
    • pp.182-194
    • /
    • 2023
  • 교통영향평가는 도시·교통 사업 시행 시에 발생할 수 있는 교통문제를 사전에 해결하는 주요한 역할을 하는 제도이지만 사업의 특성을 고려한 작성 지침과 명확한 심의 기준이 없어 심의 결과의 일관성이 떨어지는 문제점이 있다. 본 연구에서는 교통영향평가에서 심의 의결된 교통개선대책을 분석하여 심의 결과의 핵심 키워드를 찾고 교통영향평가에서 주요하게 검토해야 하는 항목을 제시하고자 한다. 이를 위해 경기도에서 심의 의결된 도시개발사업의 교통개선대책을 중심으로 TF-IDF 및 N-gram 분석을 활용한 텍스트마이닝을 하였다. 도시개발사업에 주요하게 고려되는 사항은 도로, 교차로 등 교통 기반시설의 신설이 주요한 키워드였으며 다음으로 진출입구 위치 설정, 보행 동선 연결이 주요한 사항이었다. 향후 교통영향평가 지침과 심의 기준 마련 시 본 연구에서 제시한 주요 항목을 반영함으로써, 교통영향평가의 일관성과 객관성을 높이는 심의 운영에 이용할 수 있을 것으로 기대한다.

비정형화된 문서간 추적성 분석에 관한 연구 (A Study on the Traceability Analysis between Non-standardized Documents)

  • 김은희;안경익;송덕용
    • 한국CDE학회논문집
    • /
    • 제20권4호
    • /
    • pp.328-336
    • /
    • 2015
  • We proposed a methodology to automatically extract the requirements from the documents and check the consistency and traceability among them. The documents include not only text but also PDF or image files. We also suggest a method to visualize the result with maps, numbers, and graphs. By comparing the results with those of manual reviews from experts, we show that it is necessary to use knowledge-based method in future instead of the wordbased method for improving the reliability. The results can be applied effectively for already existing documents.

하이텔 메뉴검색용 시소러스의 개발에 관한 연구 (Thesaurus Development for HiTEL Service)

  • 최석두
    • 정보관리학회지
    • /
    • 제13권1호
    • /
    • pp.227-241
    • /
    • 1996
  • 정보검색시스템의 성능을 향상시키고 정보검색의 효율성을 높이는 데 활용할 지식베이스로서의 한글시소러스 개발알고리즘을 제시하고, 이 방법에 의한 실체개발사례를 제시한다. 본 연구를 위하여 개발된 시소러스 구축시스템의 기능과 함께 용어의 수집, 분류, 관계의 정의 등의 구축과정에서 사용한 하이텔 메뉴, 용어사전의 이용방법등에 대하여 논한다.

  • PDF

준지도학습 방법을 이용한 한국어 서답형 문항 반자동 채점 (Semi-Automatic Scoring for Short Korean Free-Text Responses Using Semi-Supervised Learning)

  • 천민아;서형원;김재훈;노은희;성경희;임은영
    • 인지과학
    • /
    • 제26권2호
    • /
    • pp.147-165
    • /
    • 2015
  • 서답형 문항은 학생들의 종합적인 사고력을 평가할 수 있다는 장점이 있으나, 채점 비용이 많이 들고 채점자의 주관이 개입될 수 있다는 단점이 있다. 이런 단점을 개선하기 위해 영어권에서는 자동채점 시스템을 개발하여 사용하고 있으나, 한국어의 경우에는 아직 여전히 연구 단계에 있다. 본 논문에서는 준지도학습 방법을 이용한 한국어 서답형 문항의 채점 시스템을 제안한다. 제안된 시스템은 모범답안을 초기 모델로 학생답안의 일부를 채점하고 그 결과를 이용해서 점진적으로 학생답안의 채점을 늘려가는 준지도학습 방법을 이용한다. 제안된 시스템을 평가하기 위해서 2013학년도 학업성취도 평가의 국어 및 사회 과목의 서답형 문항을 사용했다. 채점 시간과 일관성에 관해서 매우 좋은 결과를 얻었다. 그 결과 채점 시간을 크게 단출할 수 있었으며 다양한 채점 방법을 적용하여 객관성을 확보한다면 현장에서 바로 적용할 수 있을 것으로 기대된다.

WTO의 FTA룰에 관한 연구 (A Study on FTA Rules of WTO)

  • 이균
    • 한국중재학회지:중재연구
    • /
    • 제17권1호
    • /
    • pp.183-215
    • /
    • 2007
  • The purpose of this paper is to study of WTO regulations related FTA such as Understanding on the Interpretation of Article XXIV of the General Agreement on Tariffs and Trade(GATT) 1994 and General Agreement on Trade in Service(GATS). In this study, the First introduced FTA rules of WTO in the chapter 2. The WTO agreement includes the "General Agreement on Tariffs an Trade(GATT) 1994". This instrument, known as "GATT 1994", is based on upon the original General Agreement on Tariffs and Trade referred to as "GATT 1947". The Second analyzed the relations between FTA and Article XXIV of GATT 1994 in the chapter 3. The Article XXIV of GATT 1994 is an agreement between the distinctive members for liberalizing trade. The Article XXIV of GATT 1994 is consist of three parts such as customs unions, free-trade area, and interim agreements that WTO is referred to as "Regional Trade Agreement(RTA)". There is a difference between the customs unions and the free-trade area. In the customs unions rules, the members should have the same tarifficatio and the same trade provision against non-members, but in the free-trade are a rules, the member is not necessary to have the same tarifficatio and the same trade provision against non-members. But, the both rules have a liberalization of trade in a common as a revoking tariffs and the government regulations for interfering with trade. In this case, however, the both rules include an inconsistency ele ment under WTO rules such as Most-Favoured-Nation Treatment(MFN) and National Treatment on Internal Taxation and Regulation(NTITR). This study reviewed neither inconsistency nor consistency on the both rules with the RTA of WTO under Article XXIV of GATT 1994. The Third analyzed the relations between FTA and Article V of GATS under WTO in the chapter 4. The GATS is a rule of WTO for the growing importance of trade in services for the growth and development of the world conomy. The GATS is a new rule rather than GATT's rule for concerning goods trade. The Article V of GATS under WTO is a rule that makes based on upon the Article XXIV of GATT. Therefore, If it is to be examined the Article V of GATS, it should be referred to a and an interpretation of the text of the Article XXIV of GATT. However, the Article V of GATS is on the undeveloped stage compare to the Article XXIV of GATT. Because, the statistics of WTO showed that the RTAs under the Article XXIV of GATT have 150 cases completed between nations, but the RTAs under the Article IV of GATS have 10 cases completed between nations. The Forth examined the interpretation of FTA rules under WTO in the chapter 5. Concerning the consistency issue of customs unions and free-trade area under the Article XXIV of GATT, the working parties in customs unions and in free-trade area have been reviewed the consistency is sue which had been not if to GATT. However, the parties finished to get up with one accord the both that are a consistency of argument and an inconsistency of argument with the interpretation of the Article XXIV of GATT. The interpretation of the Article XXIV of GATT has been raised as the issues when EEC by Rome Treaty established in 1957. However, the consistency is sue only agreed 6 working parties out of 69 working parties finished the reviewing of the interpretation up to the end of 1994. Also the consistency issue concerned with the special privilege measure of the customs unions and tree-trade area under the Article XXIV of GATT discussed only 3 cases between working parties up to now and did not accepted as an issue for working parties' report. In conclusion in the chapter 6, this study raised the issues of WTO that are a conference of a new round under WTO and the issues of clarity between FTA rule and WTO regulation.

  • PDF

낚시성 인터넷 신문기사 검출을 위한 특징 추출 (Feature Extraction to Detect Hoax Articles)

  • 허성완;손경아
    • 정보과학회 논문지
    • /
    • 제43권11호
    • /
    • pp.1210-1215
    • /
    • 2016
  • 스마트 기기의 발달로 많은 사람들이 인터넷 신문기사를 이용하고 있다. 하지만 인터넷 언론사간의 치열한 경쟁으로 조회수를 올리기 위한 낚시성 기사가 범람하고 있다. 낚시성 신문기사는 제목을 통해 올바른 기사의 줄거리가 제공되지 않았을 뿐만 아니라, 독자로 하여금 잘못된 내용을 떠올리게 한다. 낚시성 신문기사는 핵심에서 벗어난 유명인사 인용, 애매한 문장의 마무리, 제목과 내용의 불일치 등의 특징을 갖는다. 본 논문에서는 이러한 낚시성 기사를 분류하기 위한 특징을 추출하고 성능을 검증해 본다. 기사에 달린 댓글의 키워드를 활용하여 대용량 학습데이터를 생성하고 이를 기반으로 다섯 가지 분류 특징을 추출하였다. 추출된 특징들은 서포트 벡터 머신 분류기를 이용한 실험에서 92%의 정확도를 보여 낚시성 인터넷 신문기사를 분류하는데 적합하다고 판단된다. 뿐만 아니라 제목과 본문의 일관성을 측정하기 위한 전처리 방법으로 고안한 선택적 바이그램 모델은 낚시성 인터넷 신문기사 분류 외에도 일반적인 단문 분석을 위한 전처리 방법으로 유용할 것으로 기대된다.

PC-SAN: Pretraining-Based Contextual Self-Attention Model for Topic Essay Generation

  • Lin, Fuqiang;Ma, Xingkong;Chen, Yaofeng;Zhou, Jiajun;Liu, Bo
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권8호
    • /
    • pp.3168-3186
    • /
    • 2020
  • Automatic topic essay generation (TEG) is a controllable text generation task that aims to generate informative, diverse, and topic-consistent essays based on multiple topics. To make the generated essays of high quality, a reasonable method should consider both diversity and topic-consistency. Another essential issue is the intrinsic link of the topics, which contributes to making the essays closely surround the semantics of provided topics. However, it remains challenging for TEG to fill the semantic gap between source topic words and target output, and a more powerful model is needed to capture the semantics of given topics. To this end, we propose a pretraining-based contextual self-attention (PC-SAN) model that is built upon the seq2seq framework. For the encoder of our model, we employ a dynamic weight sum of layers from BERT to fully utilize the semantics of topics, which is of great help to fill the gap and improve the quality of the generated essays. In the decoding phase, we also transform the target-side contextual history information into the query layers to alleviate the lack of context in typical self-attention networks (SANs). Experimental results on large-scale paragraph-level Chinese corpora verify that our model is capable of generating diverse, topic-consistent text and essentially makes improvements as compare to strong baselines. Furthermore, extensive analysis validates the effectiveness of contextual embeddings from BERT and contextual history information in SANs.

"황제내경태소(黃帝內經太素)"의 특징(特徵) 및 양상선(楊上善)의 의학이론(醫學理論)에 대한 연구(硏究) (A Study on the Distinctive Features of "Hwangjenaegyeongtaeso(黃帝內經太素)" by Yang Sangseon and his Medical Theory)

  • 이상협;김중한
    • 대한한의학원전학회지
    • /
    • 제22권2호
    • /
    • pp.35-69
    • /
    • 2009
  • Yang Shangseon(楊上善)'s "Hwangjenaegyeongtaeso(黃帝內經太素)" was the first commentary book of "Hwangjenaegyeong(黃帝內經)", its importance often mentioned in level with Wang Bing (王冰)'s "Somun(素問)" "Yeongchu(靈樞)". The distinctive feature of Yang Sangseon(楊上善)'s commentary is that it is easy to comprehend in accordance with an organized classification, and that the explanations are simple and clear. Despite strict application of the Eumyang(陰陽, Yinyang) theory and Five phases[五行] theory throughout the text, should there be sentences which fall out of consistency with the basic theories, he added his own substantial commentary. His medical theory gives attention to the Meridian system[經絡], lays emphasis on developing the soul[神], and has a unique opinion about the Opening closing and pivot[開闔樞] theory along with the Myeongmun(命門). To explain the methods for preserving health[養生], he adopted the Nojang philosophy(老莊思想); to enrich the vitality he adopted the Buddhist philosophy(佛敎思想); and to analyze physiologic and pathogenic factors, he adopted the Confucian philosophy(儒家思想).

  • PDF