• 제목/요약/키워드: Language Networks Analysis

검색결과 93건 처리시간 0.025초

Deep-Learning Approach for Text Detection Using Fully Convolutional Networks

  • Tung, Trieu Son;Lee, Gueesang
    • International Journal of Contents
    • /
    • 제14권1호
    • /
    • pp.1-6
    • /
    • 2018
  • Text, as one of the most influential inventions of humanity, has played an important role in human life since ancient times. The rich and precise information embodied in text is very useful in a wide range of vision-based applications such as the text data extracted from images that can provide information for automatic annotation, indexing, language translation, and the assistance systems for impaired persons. Therefore, natural-scene text detection with active research topics regarding computer vision and document analysis is very important. Previous methods have poor performances due to numerous false-positive and true-negative regions. In this paper, a fully-convolutional-network (FCN)-based method that uses supervised architecture is used to localize textual regions. The model was trained directly using images wherein pixel values were used as inputs and binary ground truth was used as label. The method was evaluated using ICDAR-2013 dataset and proved to be comparable to other feature-based methods. It could expedite research on text detection using deep-learning based approach in the future.

The Adaptive SPAM Mail Detection System using Clustering based on Text Mining

  • Hong, Sung-Sam;Kong, Jong-Hwan;Han, Myung-Mook
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제8권6호
    • /
    • pp.2186-2196
    • /
    • 2014
  • Spam mail is one of the most general mail dysfunctions, which may cause psychological damage to internet users. As internet usage increases, the amount of spam mail has also gradually increased. Indiscriminate sending, in particular, occurs when spam mail is sent using smart phones or tablets connected to wireless networks. Spam mail consists of approximately 68% of mail traffic; however, it is believed that the true percentage of spam mail is at a much more severe level. In order to analyze and detect spam mail, we introduce a technique based on spam mail characteristics and text mining; in particular, spam mail is detected by extracting the linguistic analysis and language processing. Existing spam mail is analyzed, and hidden spam signatures are extracted using text clustering. Our proposed method utilizes a text mining system to improve the detection and error detection rates for existing spam mail and to respond to new spam mail types.

Breaking Limitations: Constraints and Strategies of Indonesian Migrant Entrepreneurship in Taiwan

  • Rita Pawestri Setyaningsih;Paulus Rudolf Yuniarto;Yuherina Gusman
    • 수완나부미
    • /
    • 제15권2호
    • /
    • pp.187-213
    • /
    • 2023
  • As migrants develop businesses abroad, entrepreneurship needs specific strategies due to some barriers when establishing and doing businesses. This paper examines the kinds of problems that have been faced in Indonesian migrant entrepreneurships in Taiwan and how the entrepreneurs cope with the difficulties. They use structural and cultural strategies for survival, seize the opportunities for self-development, and develop future careers. Research result shows that the limitations of Indonesian entrepreneurships in Taiwan are related to institutional issues, migrant status, business regulations, resource-providing institutions, language barriers, competition among migrants and locals, and capital. Hence, migrant entrepreneurs must conduct strategic actions to continue their businesses by developing innovations to grow and survive. Some measures include changing from offline to online marketing especially when the COVID-19 pandemic hit, product diversification using migrants and local people's assistance and networks, and setting competitive prices. This paper is based on qualitative research. The data were obtained through interviews in East Java-Indonesia and in Taiwan in 2022. The data were analysed using the descriptive analysis with sociological perspectives.

키워드 기반 주제중심 분석을 이용한 비정형데이터 처리 (Unstructured Data Processing Using Keyword-Based Topic-Oriented Analysis)

  • 고명숙
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권11호
    • /
    • pp.521-526
    • /
    • 2017
  • 데이터는 데이터 형식이 다양하고 방대할 뿐만 아니라 그 생성 속도가 매우 빨라 기존의 데이터 처리 방식이 아닌 새로운 관리 및 분석 방법이 요구된다. 소셜 네트워크 상의 온라인 문서에서 인간의 언어로 쓰여진 비정형 텍스트에서 Text Mining기법을 사용하여 유용한 정보를 추출할 수 있다. 소셜미디어에 남긴 정치, 경제, 문화에 대한 메시지에 대한 경향을 파악하는 것이 어떤 주제에 관심을 가지고 있는지를 파악할 수 있는 요소가 된다. 본 연구에서는 주제 중심 분석 기법을 이용하여 주어진 키워드에 관한 온라인 뉴스를 대상으로 텍스트 마이닝을 수행하였다. LDA(Latent Dirichiet Allocation)를 이용하여 웹문서로부터 정보를 추출하고 이로부터 사람들이 실제로 주어진 키워드에 대하여 어떤 주제에 관심이 있고 관련된 핵심 가치 중 어떤 주제를 중심으로 전파되고 있는지를 분석하였다.

Identification and Functional Analysis of Differentially Expressed Genes Related to Metastatic Osteosarcoma

  • Niu, Feng;Zhao, Song;Xu, Chang-Yan;Chen, Lin;Ye, Long;Bi, Gui-Bin;Tian, Gang;Gong, Ping;Nie, Tian-Hong
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제15권24호
    • /
    • pp.10797-10801
    • /
    • 2015
  • Background: To explore the molecular mechanisms of metastatic osteosarcoma (OS) by using the microarray expression profiles of metastatic and non-metastatic OS samples. Materials and Methods: The gene expression profile GSE37552 was downloaded from Gene Expression Omnibus database, including 2 human metastatic OS cell line models and 2 two non-metastatic OS cell line models. The differentially expressed genes (DEGs) were identified by Multtest package in R language. In addition, functional enrichment analysis of the DEGs was performed by WebGestalt, and the protein-protein interaction (PPI) networks were constructed by Hitpredict, then the signal pathways of the genes involved in the networks were performed by Kyoto Encyclopaedia of Genes and Genomes (KEGG) automatic annotation server (KAAS). Results: A total of 237 genes were classified as DEGs in metastatic OS. The most significant up- and down-regulated genes were A2M (alpha-2-macroglobulin) and BCAN (brevican). The DEGs were significantly related to the response to hormone stimulus, and the PPI network of A2M contained IL1B (interleukin), LRP1 (low-density lipoprotein receptor-related protein 1) and PDGF (platelet-derived growth factor). Furthermore, the MAPK signaling pathway and focal adhesion were significantly enriched. Conclusions: A2M and its interactive proteins, such as IL1B, LRP1 and PDGF may be candidate target molecules to monitor, diagnose and treat metastatic OS. The response to hormone stimulus, MAPK signaling pathway and focal adhesion may play important roles in metastatic OS.

차세대지능망 응용 프로토콜 분석/설계 및 검증 (A Design and Analysis, Simulation of Intelligent Network Application Protocol)

  • 도현숙
    • 한국정보처리학회논문지
    • /
    • 제4권6호
    • /
    • pp.1576-1588
    • /
    • 1997
  • 차세대 지능망에서는 서비스와 하부 통신망에 투명한 범용 지능망 응용 프로토콜(INAP)을 지향하고 있다. 본 논문에서는 차세대 지능망에 적합한 표준화된 INAP 구조를 도입하여, 이에 추가적으로 기능 요소들을 정의함으로써 INAP설계구조를 본 논문에서 제안하였다. 또한 객체지향 방법론을 적용하여 IN CS-1의 목표 서비스 중의 하나인 AAB서비스를 대상으로 INAP을 분석하고 설계하였다. 분석 단계에서는 ObjectGEODE에서 제공하고 있는 변형된 형태의 OMT방법을 적용하였으며, 설계 단계에서는 SDL을 사용하여 설계하였다. 설계된 시스템을 구현하는 것에 앞서 이 시스템이 제대로 설계되었는가를 검증하였으며 그에 대한 과정과 결과를 보이고 있다.

  • PDF

스파크 기반 딥 러닝 분산 프레임워크 성능 비교 분석 (A Comparative Performance Analysis of Spark-Based Distributed Deep-Learning Frameworks)

  • 장재희;박재홍;김한주;윤성로
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권5호
    • /
    • pp.299-303
    • /
    • 2017
  • 딥 러닝(Deep learning)은 기존 인공 신경망 내 계층 수를 증가시킴과 동시에 효과적인 학습 방법론을 제시함으로써 객체/음성 인식 및 자연어 처리 등 고수준 문제 해결에 있어 괄목할만한 성과를 보이고 있다. 그러나 학습에 필요한 시간과 리소스가 크다는 한계를 지니고 있어, 이를 줄이기 위한 연구가 활발히 진행되고 있다. 본 연구에서는 아파치 스파크 기반 클러스터 컴퓨팅 프레임워크 상에서 딥 러닝을 분산화하는 두 가지 툴(DeepSpark, SparkNet)의 성능을 학습 정확도와 속도 측면에서 측정하고 분석하였다. CIFAR-10/CIFAR-100 데이터를 사용한 실험에서 SparkNet은 학습 과정의 정확도 변동 폭이 적은 반면 DeepSpark는 학습 초기 정확도는 변동 폭이 크지만 점차 변동 폭이 줄어들면서 SparkNet 대비 약 15% 높은 정확도를 보였고, 조건에 따라 단일 머신보다도 높은 정확도로 보다 빠르게 수렴하는 양상을 확인할 수 있었다.

A context-Aware Smart Home Control System based on ZigBee Sensor Network

  • Khan, Murad;Silva, Bhagya Nathali;Jung, Changsu;Han, Kijun
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권2호
    • /
    • pp.1057-1069
    • /
    • 2017
  • The applications of Wireless Sensor Networks (WSN) are progressively adopting for various smart home services such as home automation, controlling smart home household appliances, constrained application services in a smart home, etc. However, enabling a seamless and ubiquitous WSN communication between the smart home appliances is still a challenging job. Therefore, in this paper, we propose a smart home control system using an Actuator based ZigBee networking (AZNET). The working of the proposed system is further divided into three phases, 1) an interference avoidance system is adopted to mitigate the effect of interference caused due to the co-existence of IEEE 802.11x based wireless local area networks (WLAN) and WSN, 2) a sensor-based smart light control system is used to fulfill the light requirement in the smart home using the sunlight with light source, and 3) an autonomous home management system is used to regulate the usage time of the electronic appliances in the smart home. The smart is tested in real time environment to use the sunlight with light sources in a various time of the day. Similarly, the performance of the proposed smart home is verified through simulation using C# programming language. The results and analysis revealed that the proposed smart home is less affected by the interference and efficient in reducing the energy consumption of the appliances available in the smart home scenario.

능동 시각을 이용한 이미지-텍스트 다중 모달 체계 학습 (Active Vision from Image-Text Multimodal System Learning)

  • 김진화;장병탁
    • 정보과학회 논문지
    • /
    • 제43권7호
    • /
    • pp.795-800
    • /
    • 2016
  • 이미지 분류 문제는 인간 수준의 성능을 보이지만 일반적인 인식 문제는 어려운 점들이 남아있다. 실내 환경은 다양한 정보를 담고 있어 정보 처리의 양을 효율적으로 줄일 필요성이 있다. 정보의 양을 효율적으로 줄일 수 있도록 대상 객체의 위치 측정을 위한 변분 추론, 변분 베이지안 등의 방법이 소개되었지만, 모든 경우에 대한 주변(marginal) 확률 분포를 구하기 어렵기 때문에 현실적으로 계산하기 어렵다. 본 연구에서는 공간 변형 네트워크(Spatial Transformer Networks)을 응용하여 능동 시각을 이용한 이미지-텍스트 통합 인지 체계를 제안한다. 이 체계는 주어진 텍스트 정보를 바탕으로 이미지의 일부를 효율적으로 샘플링 하도록 학습한다. 이를 통해 전통적인 방법으로 해결하기 어려운 문제를 상당한 격차로 성능을 향상 시킬 수 있다는 것을 보인다. 제안하는 모델을 통해 샘플링 된 이미지를 정성적으로 분석하여 이 모델이 가지는 특성도 함께 살펴본다.

Rete 알고리즘의 병렬 및 분산 처리에 관한 기존 연구 분석 (An Analysis of Existing Studies on Parallel and Distributed Processing of the Rete Algorithm)

  • 김재훈
    • 한국정보기술학회논문지
    • /
    • 제17권7호
    • /
    • pp.31-45
    • /
    • 2019
  • 현재 지능적 서비스의 핵심 기술은 딥러닝 즉 신경망, 그리고 GPU 병렬 컴퓨팅 및 빅 데이터와 같은 병렬 분산 처리 기술이다. 하지만 미래의 전 세계적으로 공유된 온톨로지를 통한 지능적 서비스 및 지식 공유 서비스에서는 지식의 표현 및 추론을 위하여 신경망보다 더 나은 방법이 있다. 그것은 시맨틱 웹의 표준 규칙 언어인 RIF 혹은 SWRL의 IF-THEN의 지식 표현이며, 이러한 규칙을 rete 알고리즘을 이용하여 효율적으로 추론할 수 있다. 하지만 단일 컴퓨터에서 동작하는 rete 알고리즘의 처리 규칙 수가 100,000개가 될 경우 그 성능이 수 십 분으로 매우 안 좋아지며, 분명한 한계가 존재한다. 따라서 본 논문에서는 rete 알고리즘의 병렬 및 분산 처리에 대한 과거로부터 현재까지의 연구 내용을 정리 분석하며, 이를 통해 효율적인 rete 알고리즘의 구현을 위해 어떤 측면들이 고려되어야 하는지를 살펴본다.