• 제목/요약/키워드: efficient translation

검색결과 172건 처리시간 0.031초

통계 정보와 유전자 학습에 의한 최적의 문장 분할 위치 결정 (Determination of an Optimal Sentence Segmentation Position using Statistical Information and Genetic Learning)

  • 김성동;김영택
    • 전자공학회논문지C
    • /
    • 제35C권10호
    • /
    • pp.38-47
    • /
    • 1998
  • 실용적인 기계번역 시스템을 위한 구문 분석은 긴 문장의 분석을 허용하여야 하는데 긴 문장의 분석은 높은 분석의 복잡도 때문에 매우 어려운 문제이다. 본 논문에서는 긴 문장의 효율적인 분석을 위해 문장을 분할하는 방법을 제안하며 통계 정보와 유전자 학습에 의한 최적의 문장 분할 위치 결정 방법을 소개한다. 문장 분할 위치의 결정은 분할 위치가 태그된 훈련 데이타에서 얻어진 어휘 문맥 제한 조건을 이용하여 입력문장의 분할 가능 위치를 결정하는 부분과 여러 개의 분할 가능 위치 중에서 안전한 분할을 보장하고 보다 많은 분석의 효율 향상을 얻을 수 있는 최적의 분할 위치를 학습을 통해 선택하는 부분으로 구성된다. 실험을 통해 제안된 문장 분할 위치 결정 방법이 안전한 분할을 수행하며 문장 분석의 효율을 향상시킴을 보인다.

  • PDF

해양자료 객체 DB 모델링 연구 (Study on Object Modelling for Oceanic Data)

  • 박종민;서상현
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 1999년도 추계종합학술대회
    • /
    • pp.454-457
    • /
    • 1999
  • 해양분야의 정보들은 대부분 지리정보와 관련되어 있으며 또한 응용 분야 및 시스템에 따라 표현 방식이 상이하여 시스템 차원의 개발 비용이 증가하고 있다 이러한 문제를 해결하기 위한 근본적인 방법은 해양정보에 대한 단일 개념의 데이터 모델을 기반으로 한 자료 이용체계를 확립하는 것이다. 본 논문에서는 해양정보의 GIS 기반 객체 데이터 모델 정의를 위한 가이드라인을 설정하고 이에 따른 객체 데이터 모델을 설계한다. 이러한 GIS 기반 객체 데이터모델을 설계하여 데이터베이스 시스템을 구축함으로서 데이터 통합, 관리 및 응용시스템 개발 전반에 관한 효율성 증진을 예상할 수 있을 것이다.

  • PDF

Ardulink 기반 MQTT를 이용한 센서 데이터 저장을위한 IoT 게이트웨이 설계 (Design of IoT Gateway for Storing Sensor Data using Ardulink based MQTT)

  • 라이오넬;장종욱
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2017년도 추계학술대회
    • /
    • pp.744-747
    • /
    • 2017
  • The Internet of things (IoT) needs to be an event-driven approach for efficient real time response and processing. An IoT gateway is sometimes employed to provide the connection and translation between devices and the cloud. Storing data in the local database, and then forwarding it on the cloud is a task to be relegated to a gateway device In this paper, we propose the design of the IoT gateway with Fog computing for storing data from sensors into a local database. In the procedure of designing storing tasks, we propose to use the interfacing software known as Ardulink MQTT bridge. MQTT is a protocol for sensors to publish data to the clients. When it comes to needing historical data, MQTT connector can push MQTT data into SQL database. We write an MQTT client and based on the message topic insert the values into a SQL Database The design of IoT gateway with Fog computing adds value because it provides processing of the data across multiple devices before it sends to the cloud.

  • PDF

유리건을 이용한 족관절 외측 인대 재건술의 적응증과 근거 (Indications of Lateral Ankle Ligament Reconstruction with a Free Tendon and Associated Evidence)

  • 강화준;정홍근
    • 대한족부족관절학회지
    • /
    • 제22권3호
    • /
    • pp.91-94
    • /
    • 2018
  • Ankle sprain is one of the most common musculoskeletal injuries. Although most ankle sprains respond well to conservative measures, chronic instability following an acute sprain has been reported to occur in 20% to 40% of patients. Some individuals are eventually indicated for a lateral ankle ligament reconstruction due to persistent ankle instability. More than 80 surgical procedures have been described to address lateral ankle stability. These range from direct repair of the anterior talofibular ligament (ATFL) and of the calcaneofibular ligament (CFL) to reconstructions based on the use of autograft or allograft tissues. However, the best surgical option remains debatable. The modified $Brostr{\ddot{o}}m$ procedure is most widely used for direct ligament repair, but not always possible because of the poor ATFL or CFL quality or deficiency of these ligaments, which prevents effective shortening imbrication. Furthermore, the importance of a CFL reconstruction has been emphasized recently. On the other hand, it is difficult to achieve an efficient CFL reconstruction during the $Brostr{\ddot{o}}m$ procedure. Others have reported that an anatomic reconstruction of injured ligaments restores the normal resistance to anterior translation and inversion without restricting subtalar or ankle motion, and as a result, anatomic reconstructions for lateral ankle instability utilizing an autograft or allograft tendon have gained popularity.

Block Unit Mapping Technique of NAND Flash Memory Using Variable Offset

  • Lee, Seung-Woo;Ryu, Kwan-Woo
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권8호
    • /
    • pp.9-17
    • /
    • 2019
  • In this paper, we propose a block mapping technique applicable to NAND flash memory. In order to use the NAND flash memory with the operating system and the file system developed on the basis of the hard disk which is mainly used in the general PC field, it is necessary to use the system software known as the FTL (Flash Translation Layer). FTL overcomes the disadvantage of not being able to overwrite data by using the address mapping table and solves the additional features caused by the physical structure of NAND flash memory. In this paper, we propose a new mapping method based on the block mapping method for efficient use of the NAND flash memory. In the case of the proposed technique, the data modification operation is processed by using a blank page in the existing block without using an additional block for the data modification operation, thereby minimizing the block unit deletion operation in the merging operation. Also, the frequency of occurrence of the sequential write request and random write request Accordingly, by optimally adjusting the ratio of pages for recording data in a block and pages for recording data requested for modification, it is possible to optimize sequential writing and random writing by maximizing the utilization of pages in a block.

Shape Description and Retrieval Using Included-Angular Ternary Pattern

  • Xu, Guoqing;Xiao, Ke;Li, Chen
    • Journal of Information Processing Systems
    • /
    • 제15권4호
    • /
    • pp.737-747
    • /
    • 2019
  • Shape description is an important and fundamental issue in content-based image retrieval (CBIR), and a number of shape description methods have been reported in the literature. For shape description, both global information and local contour variations play important roles. In this paper a new included-angular ternary pattern (IATP) based shape descriptor is proposed for shape image retrieval. For each point on the shape contour, IATP is derived from its neighbor points, and IATP has good properties for shape description. IATP is intrinsically invariant to rotation, translation and scaling. To enhance the description capability, multiscale IATP histogram is presented to describe both local and global information of shape. Then multiscale IATP histogram is combined with included-angular histogram for efficient shape retrieval. In the matching stage, cosine distance is used to measure shape features' similarity. Image retrieval experiments are conducted on the standard MPEG-7 shape database and Swedish leaf database. And the shape image retrieval performance of the proposed method is compared with other shape descriptors using the standard evaluation method. The experimental results of shape retrieval indicate that the proposed method reaches higher precision at the same recall value compared with other description method.

Characterization of L-asparaginase-producing Trichoderma spp. Isolated from Marine Environments

  • Woon-Jong, Yu;Dawoon, Chung;Yong Min, Kwon;Seung Sub, Bae;Eun-Seo, Cho;Hye Suck, An;Grace, Choi
    • 한국해양생명과학회지
    • /
    • 제7권2호
    • /
    • pp.121-128
    • /
    • 2022
  • L-asparaginase (ASNase) is a therapeutic enzyme used to treat acute lymphoblastic leukemia. Currently, the most widely used ASNases are originated from bacteria. However, owing to the adverse effects of bacterial ASNases, new resources for ASNase production should be explored. Fungal enzymes are considered efficient and compatible resources of natural products for diverse applications. In particular, fungal species belonging to the genus Trichoderma are well-known producers of several commercial enzymes including cellulase, chitinase, and xylanase. However, enzyme production by marine-derived Trichoderma spp. remains to be elucidated. While screening for extracellular ASNase-producing fungi from marine environments, we found four strains showing extracellular ASNase activity. Based on the morphological and phylogenetic analyses using sequences of translation elongation factor 1-alpha (tef1α), the Trichoderma isolates were identified as T. afroharzianum, T. asperellem, T. citrinoviride, and Trichoderma sp. 1. All four strains showed different ASNase activities depending on the carbon sources. T. asperellem MABIK FU00000795 showed the highest ASNase value with lactose as a carbon source. Based on our findings, we propose that marine-derived Trichoderma spp. are potential candidates for novel ASNase production.

한국어 분류를 위한 효율적인 서브 워드 분절 (Efficient Subword Segmentation for Korean Language Classification)

  • 서현진;남정재;김민석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.535-540
    • /
    • 2022
  • Out of Vocabulary(OOV) 문제는 인공신경망 기계번역(Neural Machine Translation, NMT)에서 빈번히 제기되어 왔다. 이를 해결하기 위해, 기존에는 단어를 효율적인 압축할 수 있는 Byte Pair Encoding(BPE)[1]이 대표적으로 이용되었다. 하지만 BPE는 빈도수를 기반으로 토큰화가 진행되는 결정론적 특성을 취하고 있기에, 다양한 문장에 관한 일반화된 분절 능력을 함양하기 어렵다. 이를 극복하기 위해 최근 서브 워드를 정규화하는 방법(Subword Regularization)이 제안되었다. 서브 워드 정규화는 동일한 단어 안에서 발생할 수 있는 다양한 분절 경우의 수를 고려하도록 설계되어 다수의 실험에서 우수한 성능을 보였다. 그러나 분류 작업, 특히 한국어를 대상으로 한 분류에 있어서 서브 워드 정규화를 적용한 사례는 아직까지 확인된 바가 없다. 이를 위해 본 논문에서는 서브 워드 정규화를 대표하는 두 가지 방법인 유니그램 기반 서브 워드 정규화[2]와 BPE-Dropout[3]을 이용해 한국어 분류 문제에 대한 서브 워드 정규화의 효과성을 제안한다. NMT 뿐만 아니라 분류 문제 역시 단어의 구성성 및 그 의미를 파악하는 것은 각 문장이 속하는 클래스를 결정하는데 유의미한 기여를 한다. 더불어 서브 워드 정규화는 한국어의 문장 구성 요소에 관해 폭넓은 인지능력을 함양할 수 있다. 해당 방법은 본고에서 진행한 한국어 분류 과제 실험에서 기존 BPE 대비 최대 4.7% 높은 성능을 거두었다.

  • PDF

인공지능을 이용한 과일 가격 예측 모델 연구 (Fruit price prediction study using artificial intelligence)

  • 임진모;김월용;변우진;신승중
    • 문화기술의 융합
    • /
    • 제4권2호
    • /
    • pp.197-204
    • /
    • 2018
  • 현재 우리가 사는 21세기에서 가장 핫한 이슈중 하나는 AI이다. 농경사회에서 산업혁명을 통해 육체노동의 자동화를 이루었듯이 정보사회에서 SW혁명을 통해 지능정보사회가 도래햇다. Google '알파고'의 등장으로 인해 컴퓨터가 스스로 학습하고 예측하는 machine learning (머신러닝) 사례를 보면서 이제 바둑의 세계 까지 인간이 컴퓨터를 이길 수 없는, 다시 말하면 컴퓨터가 인간을 뛰어넘는 시대가 왔다. 기계학습ML(machine learning)은 인공 지능 분야로, 인공지능 컴퓨터가 인간을 뛰어넘는 시대가 도래했다. 기계학습ML(machine learning)은 인공지능의 분야로, 인공지능 컴퓨터가 혼자 학습 하도록 알고리즘 기술 개발을 하는 뜻을 의미하는데, 많은 기업들이 머신러닝을 바둑의 세계까지 인간이 컴퓨터를 이길 수 없는, 다시 말하면 컴퓨터가 인간을 뛰어넘는 시대가 왔다. 많은 기업들이 머신러닝을 용하는데 그 예로는 Facebook에서 이미지를 계속 학습하여 나중에 그 이미지가 누구인지 알려주는 것도 머신러닝의 한 사례이다. 또한 구글의 데이터 센터 최적화를 위해서 효율적인 에너지 사용 모델 구축을 위해 neural network(신경망)을 활용하였다. 또 다른 사례로 마이크로소프트의 실시간 통역 모델은 번역 학습을 통해 언어관련 인풋 데이터가 증가할수록 더 정교한 번역을 해주는 모델이다. 이처럼 많은 분야에 머신러닝이 점차 쓰이면서 이제 우리 21세기 사회에서 앞으로 나아가려면 AI산업으로 뛰어들어야 한다.

묵시적 참조 무결성을 고려한 관계형 스키마 모델의 XML 스키마 모델 변환 알고리즘 (An Algorithm for Translation from RDB Schema Model to XML Schema Model Considering Implicit Referential Integrity)

  • 김진형;정동원;백두권
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권5호
    • /
    • pp.526-537
    • /
    • 2006
  • XML 데이타의 효율적인 저장을 위한 가장 대표적인 접근방법은 XML 데이타를 관계형 데이타베이스에 저장하는 것으로 대부분의 데이타가 여전히 관계형 데이타베이스에 저장되어 있다는 현실적 상황을 쉽게 수용할 수 있다는 장점을 지닌다. 이러한 접근 방법은 XML 데이타를 관계형 데이타로 혹은 관계형 데이타를 XML 데이타로 변환 과정이 필수적으로 요구하며, 변환 과정에서 가장 중요한 점은 관계형 스키마 모델의 구조적, 의미적 관계 정보를 XML 스키마 모델에 정확히 반영하는 것이다 지금까지 많은 변환 방법들이 제안되었으나 구조적 의미를 반영하지 못하거나 단순히 명시적으로 정의된 참조 무결성 관계(Referential Integrity Relations)만을 지원하는 문제점을 지닌다. 이 논문에서는 관계형 스키마 모델의 XML 스키마 모델로의 변환 시 초기 관계형 데이타베이스의 묵시적 참조 무결성 관계를 자동적으로 추출하여 이를 변환에 반영할 수 있는 알고리즘을 제안한다. 제안된 알고리즘은 초기 관계형 데이타베이스에 명시적으로 정의되어 있는 참조 무결성 관계는 물론 묵시적인 참조 무결성 관계까지 변환 과정에 반영함으로써 보다 정확한 XML 데이타 모델 생성을 가능하게 한다.