• 제목/요약/키워드: text file

검색결과 195건 처리시간 0.023초

Building Hybrid Stop-Words Technique with Normalization for Pre-Processing Arabic Text

  • Atwan, Jaffar
    • International Journal of Computer Science & Network Security
    • /
    • 제22권7호
    • /
    • pp.65-74
    • /
    • 2022
  • In natural language processing, commonly used words such as prepositions are referred to as stop-words; they have no inherent meaning and are therefore ignored in indexing and retrieval tasks. The removal of stop-words from Arabic text has a significant impact in terms of reducing the size of a cor- pus text, which leads to an improvement in the effectiveness and performance of Arabic-language processing systems. This study investigated the effectiveness of applying a stop-word lists elimination with normalization as a preprocessing step. The idea was to merge statistical method with the linguistic method to attain the best efficacy, and comparing the effects of this two-pronged approach in reducing corpus size for Ara- bic natural language processing systems. Three stop-word lists were considered: an Arabic Text Lookup Stop-list, Frequency- based Stop-list using Zipf's law, and Combined Stop-list. An experiment was conducted using a selected file from the Arabic Newswire data set. In the experiment, the size of the cor- pus was compared after removing the words contained in each list. The results showed that the best reduction in size was achieved by using the Combined Stop-list with normalization, with a word count reduction of 452930 and a compression rate of 30%.

재설계 기능을 갖는 냉간단조 공정설계용 전문가시스템 개발 (Expert System for Process Design of Cold Forging with Redesigning Scheme)

  • 김홍석;임용택
    • 대한기계학회논문집
    • /
    • 제18권8호
    • /
    • pp.2039-2052
    • /
    • 1994
  • In this study, an expert system for multi-stage cold forging process design of axisymmetric parts is developed. The available geometries are axisymmetric shape and cylinder with a hold in one end. The overall system is composed of knowledge-based system for process sequence design, output module interfaced with CAD system and material data-base. In the developed system, designed process can be modified in order to reduce the number of processes and make the distribution of forming load be almost equal at various deforming stages within the machine capacity. After process sequence design is completed, results can be stored as a text file or a commercial CAD system file. The capabilities of the developed system are illustrated through various examples of process design.

Power-Flow Simulator with Visualization Function Based on IEEE Common Data Format

  • Sugino, Shohei;Sekiya, Hiroo
    • Journal of Multimedia Information System
    • /
    • 제3권4호
    • /
    • pp.161-168
    • /
    • 2016
  • In this paper, a power flow simulator, which visualizes power flow and system configuration, is proposed and implemented. Generally, it is necessary to prepare a text file with power-system descriptions, which is one of the barriers for power-flow simulations. The proposed simulator has a function of automatic generations of IEEE common data format files from user-drawn power-system diagrams. Therefore, it is possible for users to carry out simulations only by drawing power system on display. In addition, the proposed simulator also has a function that power-system diagram is illustrated automatically from an IEEE common data format file. By using this function, it is possible to visualize amounts and directions of power flows on the bus-system diagram, which helps users to comprehend network dynamics intuitively. Because the proposed simulator allows including renewable-resource generators in power systems, it is useful to evaluate the power distribution system. It is shown in this paper that the proposed simulator can make IEEE common data format files correctly and illustrate intuitive power flow.

Development and Application of Image Analysis Program for Investigation of Pore Characteristics in Transverse Surface of Hardwoods

  • Kwon, Oh-Kyung;Lee, Phil-Woo
    • Journal of the Korean Wood Science and Technology
    • /
    • 제26권2호
    • /
    • pp.29-37
    • /
    • 1998
  • An image analysis program with the function of measuring various quantitative characteristics in the transverse surface of wood was developed using Delphi 2.0. Data on pore characteristics (conditions for image processing, proportion of pores in relationship to other elements, tangential diameter, area, tangential and radial diameter, x and y coordinates of pore center, and geometric coefficients) were saved in text file format. In addition, the pore area histogram in the tangential and radial directions was saved as a BMP (bitmap) type file. Analyses indicated that quantitative characteristics such as the relative radial distribution of pores in a growth ring, pore tangential area histogram, and proportion of pore in lumen area appear to be useful in separating four diffuse-porous woods and four ring-porous woods on the species level.

  • PDF

컴퓨터 네트워크의 데이터 보호방식 (A Method for Data Security in Computer Network)

  • 류수항;최병욱
    • 대한전자공학회논문지
    • /
    • 제22권3호
    • /
    • pp.6-10
    • /
    • 1985
  • 본 논문에서는 컴퓨터 네트워크 상에서 전송되는 데이타 또는 다수이용자 시스템 (multi-user system)에서 file을 보호하기 위해 이용되고 있는 cryptography에 대하여 논한다. 본 system은 conventional cry-ptography의 키를 Public key cryptography로 관리함으로서 처리속도가 빠르고 키의 관리가 용이하며 새로운 인증자 함수에 의해 확실한 서명문을 얻을 수 있다.

  • PDF

비디오를 위한 효율적인 프록시 서버 캐쉬의 관리 (Efficient Management of Proxy Server Cache for Video)

  • 조경산;홍병천
    • 한국시뮬레이션학회논문지
    • /
    • 제12권2호
    • /
    • pp.25-34
    • /
    • 2003
  • Because of explosive growth in demand for web-based multimedia applications, proper proxy caching for large multimedia object (especially video) has become needed. For a video object which is much larger in size and has different access characteristics than the traditional web object such as image and text, caching the whole video file as a single web object is not efficient for the proxy cache. In this paper, we propose a proxy caching strategy with the constant-sized segment for video file and an improved proxy cache replacement policy. Through the event-driven simulation under various conditions, we show that our proposal is more efficient than the variable-sized segment strategy which has been proven to have higher hit ratio than other traditional proxy cache strategies.

  • PDF

STEP AP214 자동차 설계 데이터 정리 시스템 (Healing of STEP AP214 Automotive CAD Data)

  • 양정삼;한순흥
    • 한국CDE학회논문집
    • /
    • 제7권3호
    • /
    • pp.170-176
    • /
    • 2002
  • To exchange CAD data between heterogeneous CAD systems, we generally use a neutral format especially STEP, which is the international standard (ISO-10303) for product model data exchange. AP214 (Application Protocol) for the automotive industry not only takes into account geometry and organizational data, but also provides a classification mechanism for product modeling. When reading a STEP file during a design process that is exported from other CAD systems, it is a burden to a designer to go through the tedious process of removing duplicate or non-manifold entities, adjusting parts, and rearranging text. We analyze the structure of AP214 and develop a healing tool to solve the following problem. Without the assembly information in the Master workspace of CATIA, or to read a STEP file from Pro/Engineer, a designer should do a repetitive process of disintegrating an assembly into parts one by one. We have developed a post-processing tool for STEP AP214 that separates out a part from an assembly model and adjusts superfluous or useless entities using the ACIS kernel.

웹기반 청각장애인용 수화 웹페이지 제작 시스템 (Web-based Text-To-Sign Language Translating System)

  • 박성욱;왕보현
    • 한국지능시스템학회논문지
    • /
    • 제24권3호
    • /
    • pp.265-270
    • /
    • 2014
  • 소리가 잘 들리지 않는 청각장애인은 소리를 표시하는 글자를 익히고 복잡한 개념을 전달하는 글을 이해하는 데 어려움이 많다. 그래서 자연스럽게 표정, 몸짓, 손짓으로 의사를 전달하는 수화가 청각장애인들의 주요 의사소통수단으로 자리잡아왔지만 사회에서는 글과 말이 주요 정보전달 수단으로 이용되고 있어 청각장애인이 정보에 접근하고 지식을 넓혀 직업을 갖는데 큰 어려움이 있다. 특히 근래에 인터넷이 보편화됨에 따라 정상인의 정보 습득량은 크게 늘었지만, 글로 표현된 인터넷을 이해하기 어려운 청각장인들은 인터넷 정보에 접근하는데 어려움이 많다. 본 연구에서는 청각장애인을 위한 수화 웹페이지를 제작할 수 있는 수화 웹페이지 제작시스템을 개발하였다. 수화 웹페이지 제작 시스템은 청각장애인용 수화 웹페이지 제작자가 통상적인 인터넷 사용에 필요한 하드웨어 및 소프트웨어 환경만 갖추면 운영할 수 있도록 웹기반으로 개발하였다. 수화용 웹 페이지 제작자는 게시판 형태의 인터페이스를 이용하여 변역하고자하는 문장을 서버에 전송할 수 있다. 서버는 수신된 문장을 수화로 번역하여 3D 아바타 기반의 수화 그래픽 애니메이션을 랜더링한다. 수화 그래픽 애니메이션은 MP4 형식의 동영상으로 변환되며, 스트리밍 서버의 저장소에 보관된다. 저장된 수화 동영상의 이름과 주소는 수화 웹페이지 제작자가 처음 문장을 입력하였던 게시판에 표시되도록 하여 향후 청각장애인용 웹 페이지를 제작할 때 활용할 수 있도록 하였다. 또한 본 연구에서는 웹페이지 제작자가 공공기관의 웹페이지를 제작할 수 있도록, 이들 기관에서 현재 사용된 글들을 수화로 번역할 때 필요한 수화 단어를 수화 웹페이지 제작 시스템의 수화 사전에 추가하였다. 수화 단어를 추가함으로써 웹기반 수화 웹페이지 제작 시스템이 공공부문에 보다 더 많이 활용될 수 있을 것이다.

SOM 기반 웹 이미지 분류에서 고수준 텍스트 특징들의 효과 (The Effectiveness of High-level Text Features in SOM-based Web Image Clustering)

  • 조수선
    • 정보처리학회논문지B
    • /
    • 제13B권2호
    • /
    • pp.121-126
    • /
    • 2006
  • 본 논문에서는 웹 이미지의 분류 효과를 높이기 위해 이미지 자체에서 추출된 저수준의 비주얼 특징뿐만 아니라 이미지와 관련된 텍스트 정보로부터 나온 고수준 시맨틱 특징들을 이용하는 분류 방법을 제안한다. 이 고수준의 텍스트 특징들은 이미지 URL, 파일명, 페이지 타이틀, 하이퍼링크 및 이미지 주변 텍스트로부터 얻어진다. 분류 엔진으로는 Kohonen의 SOM(Self Organizing Map)을 사용한다. 고수준의 텍스트 특징들과 저수준의 비주얼 특징들을 동시에 사용하는 SOM 기반의 이미지 분류에서는 10개의 카테고리로부터 수집된 200개의 테스트 이미지들이 사용되었다. 분류 성능을 평가하기 위해 간단하면서도 새로운 두 가지 척도, 즉 동일 카테고리 이미지들의 산포 정도와 집적 정도를 나타내는 각각의 척도를 정의하고 사용하였다. 실험결과, SOM기반의 웹 이미지 분류에서는 고수준의 텍스트 특징들이 보다 유용한 것임이 밝혀졌다.

JPEG를 확장한 멀티 콘텐츠 저장 포맷 All-in-JPEG에 관한 예비 연구 (Preliminary Study on All-in-JPEG with Multi-Content Storage Format extending JPEG)

  • 김유진;김경미;유송연;박채원;황기태;정인환;이재문
    • 한국인터넷방송통신학회논문지
    • /
    • 제23권5호
    • /
    • pp.183-189
    • /
    • 2023
  • 본 논문은 JPEG 포맷을 확장하여 여러 장의 사진과 오디오, 텍스트 등 다양한 미디어를 담을 수 있는 새로운 JPEG 포맷, All-in-JPEG을 제안한다. All-in-JPEG는 기존 JPEG 파일에 이미지, 오디오, 텍스트를 추가 저장하고, APP3 세그먼트를 활용하여 메타 정보를 저장한다. All-in-JPEG을 사용하면, 스마트폰 사용자들이 연속 촬영한 많은 사진을 한 개의 파일에 저장할 수 있고, 연사된 사진들을 다른 사람과 공유하는 것도 매우 편리하다. 또한 사진 촬영 당시의 짧은 오디오를 함께 저장하거나 사진의 일부분을 움직이는 사진 등 생동감 있는 사진을 만들기 쉽다. 뿐만 아니라, 한 장의 All-in-JPEG 파일 속에 이미지와 음성, 그리고 일기 텍스트를 모두 저장하는 사진 일기 앱 등 다양한 응용에 활용할 수 있다. 본 논문에서는 All-in-JPEG 파일을 생성 편집하는 앱과 사진 일기 앱, 매직 사진 기능을 개발하여 All-in-JPEG의 실현 가능성을 검증하였다.