• 제목/요약/키워드: text base

검색결과 211건 처리시간 0.023초

가변 적응형 사전을 이용한 텍스트 압축방식의 병렬 처리를 위한 VLSI 구조 (A Novel VLSI Architecture for Parallel Adaptive Dictionary-Base Text Compression)

  • 이용두;김희철;김중규
    • 한국정보처리학회논문지
    • /
    • 제4권6호
    • /
    • pp.1495-1507
    • /
    • 1997
  • 컴퓨터 통신망의 발달로 다량의 텍스트(Text) 또는 영상(Image) 정보의 전달이 이루어 지고 있다. 텍스트 압축과정에서 주어진 어휘를 이전에 나타난 같은 어휘를 가리키는 포인터로 대치시키는 원리에 준하여 설계된 LZ77 알고리즘은 가변적응형(adaptive) 사전을 이용한 텍스트 압축 방식으로 실제적으로 가장 많이 사용되는 알고리즘이다. 본 논문은 LZ77의 병렬 처리를 위해 LZ77의 Parallelism에 대한 분석 결과를 보여주며, 그 분석 결과를 적용한 병렬 LZ77 알고리즘의 설계, 그리고 그러한 병렬 LZ77 알고리즘을 처리하도록 고안된 VLSI 시스템 구조에 관한 연구 내용을 기술한다. 이전의 유사한 연구 내용과 비교하여, 본 논문에서 제안된 VLSI 시스템은 사전 윈도우(dictionary window)의 크기에 제한이 없으므로 확장성이 뛰어난 장점을 갖으며, 입력 텍스트의 길이가 (N)일때, 사전 윈도우의 크기에 관계없이 그 처리속도가 O(N)이며 VLSI 구현시 다른 유사한 시스템보다 향상된 집적도를 갖는다.

  • PDF

자동 초록을 위한 지식 기반 시스템 설계에 관한 연구 (A Study on the Knowledge-Based System for Automaic Abstracting)

  • 최인숙
    • 정보관리학회지
    • /
    • 제6권1호
    • /
    • pp.93-117
    • /
    • 1989
  • 본 연구에서는 자연언어 텍스트 분석을 통해 초록을 생성하기 위하여 특정 주제분 야의 지식에 입각하여 운영되는 지식 기반 시스템을 설계하였다. 주제 영역은 상표법 관계 대법원 판결서를 대상으로 하였으며 지식 베이스는 판결서의 내용을 담을 수 있는 틀과 상 표법 조문 지식, 상품 구분 지식을 프레임과 의미 네트워크로 표현하여 구성하였다. 초록을 생성하는 과정은 (1) 텍스트를 이해하기 위하여 필요한 주제분야지식을 미리 체계적으로 조 직하여 지식 베이스를 구성하고 주요 정보가 들어갈 자리를 괄호로 둔 채 그 정보들을 연결 하는 일반적인 내용만 기술한 예비 초록을 각 경우별로 준비한 다음 (2) 이러한 지식에 입 각하여 입력 테스트를 분석하고 초록에 필요한 주요 정보를 추출하며 (3) 입력 테스트에 해 당하는 예비 초록을 호출하여 그의 괄호 안에 필요한 정보를 채워 초록을 완성하는 3 단계 로 구성된다.

  • PDF

텍스트마이닝을 활용한 자살 관련 논문 토픽 모델링 (Topic Modeling of Suicide Papers using Text Mining)

  • 조경원;김하영;김미리;우영운
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2019년도 춘계학술대회
    • /
    • pp.275-277
    • /
    • 2019
  • 본 연구에서는 지금까지 게재된 자살 관련 논문들을 대상으로 주제를 분류하고 주요 주제들의 비중과 20년 동안의 주제들의 변화 추이를 파악하는 것을 연구 목적으로 한다. 이를 위해 등재지 논문에 대한 정보 공유가 가장 활발하게 이루어지는 한국학술지인용색인(KCI)을 자료원으로 빅데이터 분석에 활용되는 텍스트마이닝 기법을 시행하였다. 이러한 시대적 변화에 따른 자살 관련 연구 주제 추이를 파악하는 연구는 향후 자살과 관련한 학문적 방향을 시대 흐름에 적응할 수 있는 전략을 수립하는 데 있어 기초자료가 될 것이다.

  • PDF

텍스트마이닝과 워드 클라우드를 활용한 VR 게임 트렌드 분석 -스팀(steam) 리뷰 데이터를 중심으로- (Analysis of VR Game Trends using Text Mining and Word Cloud -Focusing on STEAM review data-)

  • 나지영
    • 한국게임학회 논문지
    • /
    • 제22권1호
    • /
    • pp.87-98
    • /
    • 2022
  • 4차 산업혁명 관련 기술의 발전과 비대면 서비스 수요 증가로 VR 게임이 주목받고 있다. 본 연구는 VR 게임의 리뷰 데이터를 온라인 게임 플랫폼 스팀(STEAM)에서 수집하고 텍스트 마이닝과 워드 클라우드 분석을 적용해 시대별 트렌드를 분석했다. 연구 결과, 프레즌스와 FPS는 시기와 상관 없이 VR 게임의 특징으로 나타났고, 2016~2017년은 체험과 지각된 비용, 2018~2019년은 FPS와 리듬게임의 수요 증가, 2020~2021년은 스토리와 몰입감이 주요 트렌드로 나타났다. 본 연구는 VR 게임 사용자들이 관심을 보이는 키워드를 시기별로 파악해 VR게임 저변 확대에 기여하고자 한다.

XML 웨어하우스에 대한 다차원 분석 프레임워크 (A Multidimensional Analysis Framework for XML Warehouses)

  • 박병권;이종학
    • Asia pacific journal of information systems
    • /
    • 제15권4호
    • /
    • pp.153-164
    • /
    • 2005
  • Nowadays, large amounts of XML documents are available in the Internet. Thus, we need to analyze them multidimensionally in the same way as relational data. In this paper, we propose a new framework for multidimensional analysis of XML documents, which we call XML-OLAP. We base XML-OLAP on XML warehouses where all fact and dimension data are stored as XML documents. We build XML cubes from XML warehouses. We propose a new OLAP language for XML cubes, which we call XML-MDX. XML-MDX statements target XML cubes and use XQuery expressions to designate measure, axis and slicer. They incorporate text mining operations for aggregating text data. We apply XML-OLAP to the United States patent XML warehouse to demonstrate multidimensional analysis of XML documents.

HITS알고리즘을 적용한 개념그래프 기반검색시스템의 성능개선 (Improved Concept-base Search System Using HITS algorithm on Conceptual Graph)

  • 배환국;박호성;이상준;김기태
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.470-472
    • /
    • 2003
  • 본 논문에서는 개념 그래프 기반 검색 시스템의 검색의 성능을 개선시키고자 Hits 알고리즘을 적용하였다. 기존 개념 그래프 기반 검색 시스템의 anchor text분석을 통하여 개념을 추출하고 있는 시스템에서 더 나아가 하이퍼 링크의 선호도의 특성을 살려 하이퍼링크에 문서가 얼마나 연결되어 있는지, 참조하고 있는지에 따라 해당 검색된 문서들의 중요도를 찾아서 순위를 매기는 실험을 하였다. 종래에는 해당 검색어의 빈도순으로 개념의 결과를 나타내 주었는데, 본 시스템 구현 후에 랭킹알고리즘을 적용하여 해당검색에 유용한 정보를 가지고 있는 페이지들(authorities)과 유용한 정보를 보유하고 있는 페이지의 링크를 보유하고 있는 페이지들(hubs)를 각각 순위 순으로 보여주게 되었다. 그리하여 사용자는 실제 검색시에 개념상으로 분류된 문서 중에 중요도가 높은 문서를 사용자에게 우선으로 접하게 되었으며, hub어 의해서 중요도가 높은 문서를 한눈에 볼 수도 있을 뿐 아니라, anchor text 어서 나타나지 않은 중요한 정보를 가진 문서도 검색할 수 있었다.

  • PDF

XML 큐브를 이용한 다차원 XML 문서 분석 (Multidimensional Analysis of XML Documents using XML Cubes)

  • 박병권
    • 한국정보시스템학회:학술대회논문집
    • /
    • 한국정보시스템학회 2005년도 춘계학술대회 발표 논문집
    • /
    • pp.65-78
    • /
    • 2005
  • Nowadays, large amounts of XML documents are available on the Internet. Thus, we need to analyze them multi-dimensionally in the same way as relational data. In this paper, we propose a new frame-work for multidimensional analysis of XML documents, which we call XML-OLAP. We base XML-OLAP on XML warehouses where every fact data as well as dimension data are stored as XML documents. We build XML cubes from XML warehouses. We propose a new multidimensional expression language for XML cubes, which we call XML-MDX. XML-MDX statements target XML cubes and use XQuery expressions to designate the measure data. They specify text mining operators for aggregating text constituting the measure data. We evaluate XML-OLAP by applying it to a U.S. patent XML warehouse. We use XML-MDX queries, which demonstrate that XML-OLAP is effective for multi-dimensionally analyzing the U.S. patents.

  • PDF

Recommended Chocolate Applications Based On The Propensity To Consume Dining outside Using Big Data On Social Networks

  • Lee, Tae-gyeong;Moon, Seok-jae;Ryu, Gihwan
    • International Journal of Advanced Culture Technology
    • /
    • 제8권3호
    • /
    • pp.325-333
    • /
    • 2020
  • In the past, eating outside was usually the purpose of eating. However, it has recently expanded into a restaurant culture market. In particular, a dessert culture is being established where people can talk and enjoy. Each consumer has a different tendency to buy chocolate such as health, taste, and atmosphere. Therefore, it is time to recommend chocolate according to consumers' tendency to eat out. In this paper, we propose a chocolate recommendation application based on the tendency to eat out using data on social networks. To collect keyword-based chocolate information, Textom is used as a text mining big data analysis solution.Text mining analysis and related topics are extracted and modeled. Because to shorten the time to recommend chocolate to users. In addition, research on the propensity of eating out is based on prior research. Finally, it implements hybrid app base.

AE 진폭분포를 이용한 고장력강의 파괴특성평가 (Evaluation of Fracture Behavior of High Tension Steel by AE Amplitude Distribution)

  • 서정원;석창성;김영진;박지우
    • 한국정밀공학회지
    • /
    • 제16권5호통권98호
    • /
    • pp.175-185
    • /
    • 1999
  • Acoustic emission(AE) measurement was carried out to evaluate the fracture behavior of high tension steel. Fracture toughness $K_{AE}$ could be determined reasonably by using the load value corresponding to an abrupt change of the accumulated AE counts AE emitted from the test specimens. AE characteristics of the base metal, the weld metal and the heat-affected zone could be distinguished using a constant value b which represented the AE amplitude distribution, Consequently the structure integrity can be evaluated by variation of the constant b at the load level. In addition it was found that AE signals due to crack growth have high amplitude but low rise time and duration.

  • PDF

환자 정보 통합 관리 시스템의 개발 (Integrated Patient Information Management System)

  • 정석희;박승훈;우응제
    • 대한의용생체공학회:학술대회논문집
    • /
    • 대한의용생체공학회 1996년도 추계학술대회
    • /
    • pp.45-47
    • /
    • 1996
  • we developed an information management system that manages various types of medical information such as text, image, sound, and laboratory data. We also developed a multimedia description system, in which medical doctors can describe his findings and interpretations with text and speech. The descriptions include the references to the data items stored in the information management systems. The communication between the description system and the information management systems is carried out using OLE/COM mechanism. The information management system was implemented by using Microsoft Open Data Base Connectivity(ODBC).

  • PDF